Как удалить неисправный диск из группы дисков LSI MegaRAID?

Один из дисков в группе 0 (EID: Слот 252:4, DiskID 12) начинает сбоить, это смарт-тесты:

  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       1837
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       57

но я не могу найти документацию, как удалить диски из группы дисков.

Должен ли я

storcli /c0/e252/s4 set offline

или скорее

storcli /c0/e252/s4 spindown

или оба? В чем разница между "spindown" и "offline"? Как насчет

storcli /c0/s4 set missing

Что это делает? Что значит "пропустить"?

А как насчет восстановления? Это начинается автоматически?

Если нет, то я думаю, что команда "start rebuild" - мой друг, но почему я должен указать для этого один диск? Было бы гораздо разумнее указать группу дисков или том для восстановления, не так ли?

1 ответ

Решение

Согласно https://www.45drives.com/wiki/index.php?title=How_do_I_replace_a_failed_drive_with_LSI_9280_cards%3F правильная последовательность:

storcli /c0/e252/s4 set offline
storcli /c0/e252/s4 set missing
storcli /c0/eall/s4 spindown     // Note: /eall instead of /e252. No idea why.

После первой команды вывод storcli /c0/e252/s4 должен показать Offln, После последней команды это было UGood (Ненастроенный хорошо) для меня.

Обратите внимание, что вторая команда (set missingУ меня не получилось.

После этого перестройка должна начаться, если у вас есть выделенный или глобальный горячий резерв (DHS или GHS) и включена автоматическая перестройка. Чтобы убедиться в этом, запустите

storcli /c0/eall/sall show rebuild

Это напечатает что-то вроде этого:

Controller = 0
Status = Success
Description = Show Drive Rebuild Status Succeeded.


----------------------------------------------------------
Drive-ID    Progress% Status          Estimated Time Left 
----------------------------------------------------------
/c0/e252/s0 -         Not in progress -                   
/c0/e252/s1 -         Not in progress -                   
/c0/e252/s2 -         Not in progress -                   
/c0/e252/s3 -         Not in progress -                   
/c0/e252/s4 -         Not in progress -                   
/c0/e252/s6 18        In progress     -                   
/c0/e252/s7 -         Not in progress -                   
----------------------------------------------------------

Обратите внимание на значение "Выполняется" для слота 6 (s6). Во втором столбце указан процент восстановления (18%).

Я использую этот небольшой скрипт для мониторинга прогресса:

while true ; do clear ; date ; storcli /c0/e252/s6 show rebuild ; sleep 5 ; done

Чтобы найти неисправный диск, вы можете использовать эту команду:

storcli /c0/e252/s4 start locate

Это должно заставить индикатор вашего привода мигать.

Другие вопросы по тегам