В настоящее время не читаемые сектора на диске Linux 5 Linux

Question

В настоящее время не читаемые сектора на диске Linux 5 Linux

У меня каждые 30 минут умные сообщения в / var / log / messages:

smartd [3588]: устройство: /dev/sdc, 176 в настоящее время не читаемые (ожидающие) сектора

Этот диск (sdc) является частью RAID 5, настроенного с помощью mdadm. Монитор Mdadm говорит, что RAID в порядке, но я хочу знать, нужно ли мне сменить диск или нет. Также, если это необходимо, чтобы пометить как плохие, то эти сектора или ОС уже сделали это. Если мне нужно сменить диск, как я могу выбрать запасной? Я не могу найти количество блоков в спецификации жесткого диска, поэтому, если я выберу один с меньшим количеством блоков, чем в оригинале, у меня будут проблемы. Благодарю.

1

hard-drive mdadm smart bad-blocks

Источник

Abraham 03 сен '13 в 11:01

2 ответа

Решение

Принятый ответ в целом хорош, но начиная с mdadm 3.3 вы можете заменить диск в массиве, не удаляя сначала неисправный. Если неисправный диск в основном доступен для чтения, это защитит вас от большинства двойных сбоев.

Предполагая, что SDD — это новый диск, вместо пунктов 3 и 4 сделайте следующее:

Добавьте новый диск в массив и замените неисправный диск новым:mdadm /dev/mdX -add /dev/sdd --replace /dev/sdc --with /dev/sdd

Это запустит восстановление со всеми возможными доступными данными и удалит неисправный/старый диск, когда он будет готов.

Кроме того, при создании нового массива рекомендуется создавать по одному большому разделу на каждом физическом устройстве и создавать RAID-массив на разделах, а не на необработанном устройстве.

2

Источник

Daniel Papp 03 авг '23 в 12:05

Другие вопросы по тегам hard-drive mdadm smart bad-blocks

Hennes 03 сен '13 в 11:09 2013-09-03 11:09 · Accepted Answer · 2013-09-03 11:09

Да, сменить диск.

Нечитаемые (ожидающие) сектора - это сектора, содержимое которых не может быть прочитано. В обычной ситуации, отличной от RAID, которая может привести к ошибке чтения или длительной задержке, пока накопитель пытается снова и снова считывать сектор, пока он не преуспеет (или пока он в конечном итоге не сдастся).

С RAID происходят две вещи:

Ваш диск, вероятно, настроен с коротким значением TLER. Таким образом, он откажется от попыток прочитать этот сектор в разумные сроки. (Таким образом предотвращая длинные зависания).
Ваш RAID-массив замечает сбой и считывает данные с другого диска. Это преимущество RAID 5; у вас есть запасная копия.

Что вы хотите сделать, это:

Проверьте свои резервные копии. Вы не должны нуждаться в них, если все идет хорошо.
Извлечь запасной диск равного или большего размера. Вы можете проверить размер с smartctl -a /dev/sdc, Не думайте, что все диски размера X имеют одинаковую емкость. Производители любят круглые числа; Один диск на 500 ГБ вполне может быть меньше, чем другой диск на 500 ГБ.
Вывести диск с проблемами в автономном режиме. (mdadm --manage --remove /dev/mdX /dev/sdc)
Замените диск новым оборудованием, и пусть массив перестроится сам. (mdadm --add /dev/mdX /dev/sdc)

Если вы использовали большие диски, это займет много времени. Иногда быстрее просто восстановить массив RAID с нуля и восстановить его из резервных копий. (Сначала проверьте эти резервные копии!)

Пока RAID восстанавливается, у вас нет избыточности. Таким образом, если другой диск выходит из строя (например, из-за стресса восстановления), то у вас есть проблема. Это иногда случается с большими дисками (длительное время восстановления) и партиями дисков с той же даты.