Диск вышел из строя в процессе восстановления 3ware RAID 5

У меня есть RAID-контроллер 3ware 9650SE с массивом RAID 5, содержащим 15 дисков Seagate ST31000340NS. Заметив ошибки ECC на диске с портом 10, я заменил его запасным и начал перестраивать RAID. В процессе восстановления диска порта 5 произошел полный сбой, из-за чего массив стал неработоспособным, поскольку новый диск в порту 10 был неполным. Массив оставался в использовании во время восстановления до сбоя диска 5 порта. Я надеялся восстановить данные, вернув исходный диск порта 10, но контроллер RAID не добавил их обратно в массив. Вместо этого он был указан как "доступный". У меня вопрос, как я могу заставить контроллер распознавать оригинальный диск порта 10 в его первоначальном расположении? В интерфейсе 3dm2 нет опции "добавить диск".

* ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ * Спасибо за все комментарии и предложения, касающиеся моей первоначальной публикации. Я должен был упомянуть ранее, что массив был смонтирован только для чтения во время перестройки. Я не знаю, имеет ли это какое-то значение для шансов заставить контроллер принять исходный диск обратно. Между прочим, нет резервной копии. Что бы ни случилось, я, конечно, усвоил свой урок. RAID5.

5 ответов

Я верю, что тебе не повезло. Это одна из опасностей RAID5. Поскольку массив использовался, все остальные диски теперь не синхронизированы с исходным диском порта 10.

updated: Относительно обновления только для чтения... Работает ли это на самом деле, будет деталью реализации 3ware. Даже если вы подключили только для чтения, контроллер raid мог обновить некоторые метаданные на дисках и решил, что эта конфигурация не подлежит восстановлению. Это то, что я ожидал.

Лучший вариант - восстановить из резервной копии. Поскольку массив использовался, данные будут не синхронизированы на диске 10.

RAID 5 больше не рекомендуется для использования, так как размеры дисков увеличиваются; Вероятность возникновения неисправимой ошибки на дисках возрастает и обычно не обнаруживается до тех пор, пока у вас не произойдет сбой диска в массиве RAID 5 (то есть, когда найден второй диск и его скрытая неисправность).

Вам может повезти, если ошибка на втором диске находится в той части диска, которая не используется файловой системой. Поэтому, если у вас нет резервных копий, вы можете попробовать перестроить с установленным флагом "игнорировать ошибки ECC при перестроении". Затем вы захотите выполнить некоторую форму проверки целостности вашей файловой системы, и вам, возможно, придется ожидать некоторого повреждения данных в худшем случае. Тем не менее, может быть предпочтительнее потерять весь объем.

Если ваш массив оставался в сети и получал записи после того, как вы удалили неисправный диск на порту 10, это означает, что диск несовместим с остальной частью массива, и даже если вы можете принудительно подключить его к сети, любые тома в массиве будут повреждены.

Не спрашивайте меня, откуда я это знаю...

Восстановление из резервных копий, вероятно, единственный возможный вариант.

В сегодняшних размерах дисков вероятность сбоя другого диска, когда один диск уже вышел из строя, составляет 62%, если используются потребительские диски: http://talkback.zdnet.com/5208-12694-0.html?forumID=1&threadID=36299&messageID=1008171

Не используйте рейд 5, никогда. Если вам необходимо обеспечить высокую доступность и дешевое хранилище, воспользуйтесь raid6 и горячим резервом.

Другие вопросы по тегам