Не удается восстановить массив RAID 5

В предыдущем сообщении я спросил, как восстановить неисправный диск в массиве RAID 5 с 4 дисками. Я установил новый диск (диск 4) вместо неисправного и начал восстановление. Во время восстановления другой диск (диск 2) начал выдавать ошибки и тайм-ауты ECC. При 95% процесса восстановления компьютер перезагружается и зависает на начальном экране, при этом контроллер (3ware 9500s) показывает ошибку (диск 2 не найден) и типичный шум от неисправного диска (диск 2) может быть слышал. Я выключил и включил ПК несколько раз, без изменений. Затем я оставил компьютер выключенным на час. Включил снова, его время отсутствующего диска (диск 2) вернулся на место. Я мог бы загрузить операционную систему, ожидающую восстановления, которая автоматически запускалась с контроллера. В определенный момент запущенный контроллер выдал ошибку восстановления и остановил процесс восстановления. Сервер теперь работает с диском 2 с ошибками и диском 4 со статусом OK, но он не работает, поскольку процесс восстановления не может быть завершен. Похоже, я зашел в тупик: по крайней мере, 3 диска должны быть исправны, но на одном диске есть ошибки, а на одном диске нет восстановления. Что я могу попробовать?

4 ответа

Лучше всего восстанавливать из резервных копий. Но я предполагаю, что у вас их нет, иначе вы бы не задавали вопрос.

Таким образом, при неудачном резервном копировании ваша следующая лучшая ставка - скопировать как можно большую часть данных (из звуков вещей у вас будет хотя бы пара нечитаемых секторов, которые не будут копироваться) любым предпочитаемым вами способом - file копирование, образ диска, копирование на уровне диска и т. д. Затем, получив данные, вы можете заменить неисправные диски, создать новый массив RAID и скопировать данные обратно.

В противном случае вы можете пройти дорогой процесс профессионального восстановления данных или просто принять потерю данных и двигаться дальше, в зависимости от того, сколько ваши данные стоят для вас.

Самым простым будет восстановление из резервной копии. Но вы, вероятно, задаете этот вопрос, потому что у вас его нет. В этом случае вы позвоните в центр восстановления дисков и узнаете, что они могут для вас сделать.

Когда вы, наконец, получите это восстановленное, вы узнаете реальную ценность системы резервного копирования, которая работает.

Можете ли вы показать вывод twcli /c0 show all?

Если диск 2 находится в ECC-ERROR состояние, вы можете продолжить восстановление, приказав контроллеру игнорировать ошибки ECC на диске 2.

@ Ответ Сергея Василова в этой теме Что означает tw_cli в 3Ware под диском "DEGRADED" против "ECC-ERROR"? имеет правильную информацию. (Раньше я знал это случайно, но мне приходилось искать команды, и ответ Сергея был первым, кто попал в поиск в Google, поэтому я буду ему благодарен). Потому что всегда лучше процитировать ответ:

/cx/ux start rebuild disk=p [ignoreECC]
/cx/ux set ignoreECC=on|off

Даже если это позволяет перестроить массив, у вас все равно может быть повреждение файловой системы или потеря данных. Или вы не можете.

@Daniel это вывод из tw_cli

Unit  UnitType  Status         %RCmpl  %V/I/M  Stripe  Size(GB)  Cache  AVrfy
------------------------------------------------------------------------------
u0    RAID-5    DEGRADED       -       -       64K     698.461   ON     ON

Port   Status           Unit   Size        Blocks        Serial
---------------------------------------------------------------
p0     OK               u0     233.76 GB   490234752     V503YE9G
p1     ECC-ERROR        u0     233.76 GB   490234752     V503Y7VG
p2     OK               u0     233.76 GB   490234752     V503Y4GG
p3     DEGRADED         u0     465.76 GB   976773168     WD-WCAYUJ776908

Name  OnlineState  BBUReady  Status    Volt     Temp     Hours  LastCapTest
---------------------------------------------------------------------------
bbu   On           Yes       OK        OK       OK       255    18-Nov-2006
Другие вопросы по тегам