Как рассчитать вероятность поломки устройства хранения данных?

Есть много разных носителей. Назвать несколько:

  • DVD,
  • компакт-диск
  • Нормальные жесткие диски
  • SSD жесткие диски
  • Флешки

Допустим, я сохранил некоторые файлы на определенном носителе. Как бы я рассчитал вероятность того, что носитель / устройство сломается в течение X единиц времени, и я не смогу получить доступ к содержимому?

Есть ли хорошие источники, которые предоставляют такую ​​статистику и формулы для различных устройств и типов носителей?

Я хочу цифры и формулы, если это возможно. Идея "использовать схему резервного копирования типа" сын, папа и дедушка ", когда дед дублируется и хранится в двух разных безопасных местах", может быть действительно хорошим советом. Но я хочу иметь возможность рассчитать вероятность отказа устройства / носителя на основе некоторых реальных статистических данных.

1 ответ

Решение

Начнем с жестких дисков. Есть три хороших исследования, дающих реальные статистические данные о достаточно большом количестве интересующих их: Карнеги-Меллон, Google и Netapp. Статистические данные, которые что-то значат, представляют собой ежегодную частоту отказов (AFR), как часто происходит сбой диска в течение данного года. Один неудивительный результат, который показывают эти исследования, заключается в том, что спецификации производителя, такие как Mean Time Before Failure, сильно занижают вероятность сбоя диска через год. Числа варьируются в зависимости от условий, из которых я извлек из них эмпирическое правило: при лучших условиях с хорошим оборудованием вы можете достичь AFR 2%, но вы должны ожидать AFR в худшем случае ближе к 10%.

Если у вас есть два устройства с копиями одних и тех же данных и их шансы на сбой являются статистически независимыми, вы можете просто умножить проценты вместе, чтобы получить вероятность того, что оба устройства выйдут из строя. Например, учитывая два жестких диска с 5% отказов (разумная середина дорожного значения), шансы, что вы потеряете оба из них в данном году, составляют 5% * 5% = 0,25%. Теперь, если оба диска находятся в одной и той же системе, вероятность того, что что-то вытеснит оба диска, намного выше - они далеки от независимости - поэтому реальные шансы здесь находятся где-то между 5% и 0,25%; невозможно приблизиться к этому, не углубляясь в статистику таких вещей, как отказ контроллера и блока питания. Посмотрите Стандартные уровни RAID для большего количества примеров и фона здесь.

Возвращаясь к исходному вопросу, а как насчет других типов медиа? Несмотря на то, что показатель MTBF оказался очень оптимистичным для жестких дисков, для многих других типов носителей это лучший рейтинг, который вы найдете. Вы можете объединить MTBF или его двоюродного брата MTTF из нескольких устройств с помощью онлайн-калькулятора надежности. Возможно, вам удастся найти некоторые реальные исследования других типов носителей, которые вы рассматриваете, которые помогут вам найти более реалистичные показатели MTBF для них, а не использовать номера производителей.

Другие вопросы по тегам