Как использовать диск с большим количеством перераспределенных секторов?
После трех лет работы в режиме 24x7 корпоративный накопитель Seagate Barracuda ES.2 емкостью 1 ТБ демонстрирует признаки отказа. SMART количество перераспределенных секторов велико.
Статья в Википедии предполагает, что диск все еще можно использовать для менее чувствительных целей, таких как "чистое" хранилище вне массива, если переназначенные сектора не используются.
A workaround which will preserve drive speed at the expense of capacity
is to create a disk partition over the region which contains remaps and
instruct the operating system to not use that partition.
Для создания такого раздела необходимо получить список переназначенных секторов. Однако в операционной системе нет видимых проблем. Т.е. badblocks
возвращает пустой список
Есть ли способ восстановить список перераспределенных секторов?
Изменить: этот диск из массива. Некоторые из них терпят неудачу каждый год, и просто выбрасывать их, кажется, пустая трата времени. Я думаю дать второй шанс лучшим частям блюд.
Вот как выглядит отчет SMART.
=== START OF INFORMATION SECTION ===
Model Family: Seagate Barracuda ES.2
Device Model: ST31000340NS
Serial Number: **********
Firmware Version: SN05
...
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 056 054 044 Pre-fail Always - 164293299
3 Spin_Up_Time 0x0003 099 099 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 14
5 Reallocated_Sector_Ct 0x0033 005 005 036 Pre-fail Always FAILING_NOW 1955
7 Seek_Error_Rate 0x000f 076 060 030 Pre-fail Always - 8677183434
9 Power_On_Hours 0x0032 072 072 000 Old_age Always - 24893
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 037 020 Old_age Always - 14
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 097 097 000 Old_age Always - 3
190 Airflow_Temperature_Cel 0x0022 050 043 045 Old_age Always In_the_past 50 (0 6 50 32)
194 Temperature_Celsius 0x0022 050 057 000 Old_age Always - 50 (0 18 0 0)
195 Hardware_ECC_Recovered 0x001a 021 010 000 Old_age Always - 164293299
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 21
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 21
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
7 ответов
Вы не
Вы идете купить другой диск, чтобы заменить его, если вы просто не любите потерять данные.
Я хотел бы поблагодарить вас за совет и поделиться некоторыми деталями, которые я получил от экспериментов.
Короче говоря, не существует простого способа получить список перераспределенных секторов, и даже статистические методы сопоставления диска сильно обременены необходимостью играть против логики прошивки.
Чтобы проверить диск я побежал badblocks -wv
со стандартным размером блоков и отслеживал количество перераспределенных секторов в процессе. Я сделал несколько замечаний.
Я заметил резкое увеличение количества перераспределенных секторов при записи в начало диска. Затем с первых 10G до 700G не было никаких изменений. Это может быть объяснено тем фактом, что некоторые данные по хранению данных RAID хранились в начале диска, поэтому износ в области небольших адресов был выше, чем в остальной части диска.
Затем после одной ошибки диск перешел в заблокированный режим. Это каждая команда ATA, даже
IDENTIFY DRIVE
возвращенныйABRT
, Хотя стоимость перераспределенных секторов все еще оставалась положительной. Чтобы объяснить это поведение, как предложил Дэвид Шварц, я предположил, что зарезервированные сектора каким-то образом распределены по адресному пространству диска. Это означает, что диск может иметь зарезервированные секторы, но у части его могут закончиться сектора для переназначения. В этой ситуации прошивка просто блокирует диск.Привод возвращается из заблокированного режима только после выключения питания привода. Когда старые накопители позволяют программному обеспечению отслеживать неисправные блоки и избегать их использования, современные накопители не дают такой возможности. Когда микропрограмма считает, что она не может справиться с ошибками, это делает привод непригодным для использования.
Запустив значение перераспределенных секторов до 02, я заключаю, что на этом диске 2048 зарезервированных секторов.
Так называемое низкоуровневое форматирование или запись нулей в каждый доступный сектор диска для перераспределения секторов из менее надежных частей диска не будет работать, потому что, когда у диска заканчиваются зарезервированные сектора, он меняет способ обработки ошибок таким образом, это делает его менее удобным в использовании, чем традиционный диск, который не выполняет прогнозный анализ сбоев и просто сообщает об ошибке.
Если у вас есть бизнес-данные, которые стоят меньше, чем стоимость диска, используйте их для этого, если нет, то отбросьте их или раздайте людям из отдела, которые понимают риски. Свяжитесь с производителем и узнайте, предлагают ли они переработку.
Если на диск все еще распространяется гарантия, вы можете вернуть его производителю через процесс RMA для бесплатной замены, предварительно очистив его. (Безопасное стирание уничтожит весь диск, включая перераспределенные или иным образом недоступные сектора.) (Я совершенно удивлен, что никто не предложил этого.) В противном случае вы делаете то, что сказал @SpacemanSpiff, и покупаете новый диск.
На самом деле улучшенное безопасное стирание лучше, поскольку оно охватывает и зарезервированные блоки.
Однако: если на самом деле очень много плохих секторов, диск - это пресс-папье. То же самое, если он не перераспределяет их или не объявляет их нормально (ожидающие секторы возникают, когда возникает проблема чтения. Большинство из них являются "мягкими" ошибками, обычно вызванными внешней вибрацией.)
У меня было много таких накопителей, хотя бы с инструментами производителя после смены стартовой позиции, если именно там находятся большинство неисправных секторов и они берут 5-10% от емкости накопителя. Если это приличный контроллер и программное обеспечение, он будет использовать нераспределенные как запасные. Я без проблем запустил WD 1800 до 160 ГБ в течение 5 лет, пока контроллер не сгорел из-за неисправного источника питания. В настоящее время я использую Samsung аналогично для телевизионных колпачков, удалил 100 ГБ из 2 ТБ, больше ошибок в транспортном потоке, чем можно было бы ожидать от накопителя, так что это не проблема на некоторое время.
Инструменты Hitachi, Samsung и WD 11, похоже, хорошо справляются с задачей переотображения, пока не знают о Seagate, поскольку они либо вышли из употребления, либо потерпели немедленный катастрофический отказ.
* Делать эти вещи теперь намного проще с отличным загрузочным диском.
Если вы действительно хотите рисковать своими данными на этом диске (я бы не стал), используйте dd
записать диск целиком в нули.
dd if=/dev/zero of=/dev/sdX
Это заставит диск перераспределить ожидающие секторы, и вся поверхность диска будет пригодна для использования. Какое-то время;-)