Вопрос по RAID-5
По-моему брехня.
В качестве проверки на вшивость поставил свой 4х750 массив, на котором лежит около тера торрентов на простую проверку - проверка контрольных сумм торрентов.
Где-то к вечеру расскажу о результатах.
В качестве проверки на вшивость поставил свой 4х750 массив, на котором лежит около тера торрентов на простую проверку - проверка контрольных сумм торрентов.
Где-то к вечеру расскажу о результатах.
Для твоего массива вероятность куда ниже, какой смысл в таком эксперименте? 

Для твоего массива вероятность куда ниже, какой смысл в таком эксперименте?если он запустит такую проверку 10 раз, то вроде бы порядок будет нужный.
Я так понял, что описана проблема с железом, то есть она либо есть, либо нет...
Массив я уже раз десять пересобирал (по ресету, вот ещё недавно диск поменял) - Данные на ФС почти не менялись: 800Gb -> 1Tb, так что к требуемой вероятности в 10% я по идее должен был приблизиться.
А вообще надо подробнее почитать об этом параметре. В частности, как на него реагируют (должны реагировать) контроллеры дисков.
А вообще надо подробнее почитать об этом параметре. В частности, как на него реагируют (должны реагировать) контроллеры дисков.
Я так и думал. В статье не учитывается, что в любом диске на посекторном уровне работает ECC, которая в 100% случаев может восстановить неправильно прочтенный бит, а в некоторых - и того больше. Теоретически, жопа может настать, когда в пределах одного сектора не прочитаются 2 бита так, что ECC не сможет их восстановить.
Это случится с вероятностью около 10^-30, или, в переводе на терабайты, 125000000000000000000Tb.
Дальше не вникал, но скорее всего после возникновения этой ситуации сектор считается плохим, о чем начинает ругаться SMART.
Это случится с вероятностью около 10^-30, или, в переводе на терабайты, 125000000000000000000Tb.
Дальше не вникал, но скорее всего после возникновения этой ситуации сектор считается плохим, о чем начинает ругаться SMART.
Теоретически, жопа может настать, когда в пределах одного сектора не прочитаются 2 бита так, что ECC не сможет их восстановить.Если ошибка будет retryable, то тада ваще пох
Как тут уже сказали, неправильно прочитанный бит выявится CRC, после чего ты попробуешь прочитать его ещё раз. Ну или должно очень сильно не повезти (гораздо сильнее, чем с одним битом на сто терабайт чтобы и CRC не совпал так же.
Однако в данном случае сбой будет означать не потерю файла, а потерю массива.Это почему ещё?
т.е. получается, что в спецификациях указана вероятность сбоя, который никак не проявляет себя для э.. пользователя? (точнее - проявляет себя как чуть более медленный блок) а смысл?
(это ж не маркетинговый текст на тему "сохраним вашу информацию при любой жопе"..)
(это ж не маркетинговый текст на тему "сохраним вашу информацию при любой жопе"..)
Как тут уже сказали, неправильно прочитанный бит выявится CRC, после чего ты попробуешь прочитать его ещё раз.насколько я понимаю, это - стандартный и постоянно используемый механизм, в результате использования которого можно наблюдать "медленные" блоки?
В спецификации сказано, что с вероятностью 10^-15 для чтения блока придется использовать корректировку с помощью ECC. Блок от этого не становится ни на йоту медленнее.
о, спасибо, так понятно.
но вот с этим - "не становится ни на йоту медленнее" - не согласен.
но вот с этим - "не становится ни на йоту медленнее" - не согласен.
ECC вычисляется аппаратно, никаких мозгов для этого не используется.
вполне возможно, что это блок, которому на вход подают пакет, на выходе - пакет и биты "no error" "ECC recovered" "BAD" ну или что-то в этом духе.
Сектор в таком разрезе медленнее не становится.
вполне возможно, что это блок, которому на вход подают пакет, на выходе - пакет и биты "no error" "ECC recovered" "BAD" ну или что-то в этом духе.
Сектор в таком разрезе медленнее не становится.
вполне возможно, что это блок, которому на вход подают пакет, на выходе - пакет и биты "no error" "ECC recovered" "BAD" ну или что-то в этом духе.И, если говорят "BAD" - придётся попробовать прочитать ещё раз.
Хотя медленнее сектор окажется только один раз (когда произошла ошибка); это не означает, что в следующие миллион раз, когда кто-то будет считывать этот блок, произойдёт ошибка.
Оставить комментарий
elena-kotenok75
встретил в интернетах (http://forum.hdtracker.ru/showthread.php?t=8232) такие рассуждения:оцените, плз, верны ли такие рассуждения?
т.е. - "6 двухтерабайтников в пятом рейде, после выхода из строя одного диска - в одном из 10 случаев массив не восстановится штатным образом"