Как использовать диск с большим количеством перераспределенных секторов?

После трех лет работы в режиме 24x7 корпоративный накопитель Seagate Barracuda ES.2 емкостью 1 ТБ демонстрирует признаки отказа. SMART количество перераспределенных секторов велико.

Статья в Википедии предполагает, что диск все еще можно использовать для менее чувствительных целей, таких как "чистое" хранилище вне массива, если переназначенные сектора не используются.

A workaround which will preserve drive speed at the expense of capacity 
is to create a disk partition over the region which contains remaps and 
instruct the operating system to not use that partition.

Для создания такого раздела необходимо получить список переназначенных секторов. Однако в операционной системе нет видимых проблем. Т.е. badblocks возвращает пустой список

Есть ли способ восстановить список перераспределенных секторов?

Изменить: этот диск из массива. Некоторые из них терпят неудачу каждый год, и просто выбрасывать их, кажется, пустая трата времени. Я думаю дать второй шанс лучшим частям блюд.

Вот как выглядит отчет SMART.

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda ES.2
Device Model:     ST31000340NS
Serial Number:    **********
Firmware Version: SN05
...
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   056   054   044    Pre-fail  Always       -       164293299
  3 Spin_Up_Time            0x0003   099   099   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       14
  5 Reallocated_Sector_Ct   0x0033   005   005   036    Pre-fail  Always   FAILING_NOW 1955
  7 Seek_Error_Rate         0x000f   076   060   030    Pre-fail  Always       -       8677183434
  9 Power_On_Hours          0x0032   072   072   000    Old_age   Always       -       24893
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   037   020    Old_age   Always       -       14
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   097   097   000    Old_age   Always       -       3
190 Airflow_Temperature_Cel 0x0022   050   043   045    Old_age   Always   In_the_past 50 (0 6 50 32)
194 Temperature_Celsius     0x0022   050   057   000    Old_age   Always       -       50 (0 18 0 0)
195 Hardware_ECC_Recovered  0x001a   021   010   000    Old_age   Always       -       164293299
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       21
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       21
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0

7 ответов

Решение

Вы не

Вы идете купить другой диск, чтобы заменить его, если вы просто не любите потерять данные.

Я хотел бы поблагодарить вас за совет и поделиться некоторыми деталями, которые я получил от экспериментов.

Короче говоря, не существует простого способа получить список перераспределенных секторов, и даже статистические методы сопоставления диска сильно обременены необходимостью играть против логики прошивки.

Чтобы проверить диск я побежал badblocks -wv со стандартным размером блоков и отслеживал количество перераспределенных секторов в процессе. Я сделал несколько замечаний.

  1. Я заметил резкое увеличение количества перераспределенных секторов при записи в начало диска. Затем с первых 10G до 700G не было никаких изменений. Это может быть объяснено тем фактом, что некоторые данные по хранению данных RAID хранились в начале диска, поэтому износ в области небольших адресов был выше, чем в остальной части диска.

  2. Затем после одной ошибки диск перешел в заблокированный режим. Это каждая команда ATA, даже IDENTIFY DRIVE возвращенный ABRT, Хотя стоимость перераспределенных секторов все еще оставалась положительной. Чтобы объяснить это поведение, как предложил Дэвид Шварц, я предположил, что зарезервированные сектора каким-то образом распределены по адресному пространству диска. Это означает, что диск может иметь зарезервированные секторы, но у части его могут закончиться сектора для переназначения. В этой ситуации прошивка просто блокирует диск.

  3. Привод возвращается из заблокированного режима только после выключения питания привода. Когда старые накопители позволяют программному обеспечению отслеживать неисправные блоки и избегать их использования, современные накопители не дают такой возможности. Когда микропрограмма считает, что она не может справиться с ошибками, это делает привод непригодным для использования.

  4. Запустив значение перераспределенных секторов до 02, я заключаю, что на этом диске 2048 зарезервированных секторов.

  5. Так называемое низкоуровневое форматирование или запись нулей в каждый доступный сектор диска для перераспределения секторов из менее надежных частей диска не будет работать, потому что, когда у диска заканчиваются зарезервированные сектора, он меняет способ обработки ошибок таким образом, это делает его менее удобным в использовании, чем традиционный диск, который не выполняет прогнозный анализ сбоев и просто сообщает об ошибке.

Если у вас есть бизнес-данные, которые стоят меньше, чем стоимость диска, используйте их для этого, если нет, то отбросьте их или раздайте людям из отдела, которые понимают риски. Свяжитесь с производителем и узнайте, предлагают ли они переработку.

Если на диск все еще распространяется гарантия, вы можете вернуть его производителю через процесс RMA для бесплатной замены, предварительно очистив его. (Безопасное стирание уничтожит весь диск, включая перераспределенные или иным образом недоступные сектора.) (Я совершенно удивлен, что никто не предложил этого.) В противном случае вы делаете то, что сказал @SpacemanSpiff, и покупаете новый диск.

На самом деле улучшенное безопасное стирание лучше, поскольку оно охватывает и зарезервированные блоки.

Однако: если на самом деле очень много плохих секторов, диск - это пресс-папье. То же самое, если он не перераспределяет их или не объявляет их нормально (ожидающие секторы возникают, когда возникает проблема чтения. Большинство из них являются "мягкими" ошибками, обычно вызванными внешней вибрацией.)

У меня было много таких накопителей, хотя бы с инструментами производителя после смены стартовой позиции, если именно там находятся большинство неисправных секторов и они берут 5-10% от емкости накопителя. Если это приличный контроллер и программное обеспечение, он будет использовать нераспределенные как запасные. Я без проблем запустил WD 1800 до 160 ГБ в течение 5 лет, пока контроллер не сгорел из-за неисправного источника питания. В настоящее время я использую Samsung аналогично для телевизионных колпачков, удалил 100 ГБ из 2 ТБ, больше ошибок в транспортном потоке, чем можно было бы ожидать от накопителя, так что это не проблема на некоторое время.

Инструменты Hitachi, Samsung и WD 11, похоже, хорошо справляются с задачей переотображения, пока не знают о Seagate, поскольку они либо вышли из употребления, либо потерпели немедленный катастрофический отказ.

* Делать эти вещи теперь намного проще с отличным загрузочным диском.

Если вы действительно хотите рисковать своими данными на этом диске (я бы не стал), используйте dd записать диск целиком в нули.

dd if=/dev/zero of=/dev/sdX

Это заставит диск перераспределить ожидающие секторы, и вся поверхность диска будет пригодна для использования. Какое-то время;-)

Другие вопросы по тегам