После потери питания мой конфиг RAID изменился, некоторые диски помечены как чужие, но все данные все еще там
У меня Perc 5/i в Dell Precision 590. Контроллер имеет резервный аккумулятор, и контроллер сообщает, что его состояние исправно. К контроллеру подключено пять дисков SATA емкостью 1 ТБ. Мой оригинальный конфиг выглядел так:
- VD0: RAID5
- PD0
- PD1
- PD2
- VD1: RAID1
- PD5
- PD7
Довольно простая настройка. На прошлой неделе у нас был сбой питания, и я был уведомлен, что оба VD были ухудшены. Итак, я исследовал. Конфигурация изменилась. Вот новая конфигурация:
- VD0: RAID5
- PD0
- PD1
- PD5
- VD1: RAID5
- PD0
- PD1
- PD5
Это не имеет никакого смысла. Как это вообще возможно!?
Примечание. Экран PD Mgmt сообщает, что диски 0, 1 и 5 находятся в режиме онлайн, а 2 и 7 - "чужие" (что это вообще означает???).
Очень странно, к моему большому удивлению: оба виртуальных диска кажутся полностью работоспособными, и все мои данные не повреждены, и моя система работает нормально. Я в недоумении для слов.
У меня есть резервные копии данных, поэтому я не потеряю их, и мне придется их восстанавливать. Но я бы предпочел, чтобы этого не случилось. Если бы это был нормальный сбой диска, я бы знал, что делать. Но это состояние настолько странное, что я боюсь даже прикоснуться к нему. Помогите?
Вот несколько "скриншотов" (из-за отсутствия лучшего слова), которые, надеюсь, добавят некоторый контекст / дополнительную информацию, если это необходимо.
2 ответа
Хотя конфигурация, показанная в PERC BIOS, выглядит неправильно, она все равно может правильно использовать правильную конфигурацию, потому что у вас есть доступ к данным. Нечетные данные, отображаемые в BIOS, скорее всего, вызваны ошибкой прошивки, вызванной некоторым повреждением данных конфигурации на некоторых дисках.
Никогда не следует импортировать внешнюю конфигурацию на контроллер PERC, если вы можете видеть все данные из ОС (без отсутствующих / автономных виртуальных дисков), независимо от того, как странные вещи выглядят из PERC BIOS.
Внешний конфиг обычно встречается в двух сценариях:
- Данные конфигурации были каким-то образом повреждены на одном или нескольких дисках, и контроллер обнаруживает несоответствие с копией данных конфигурации, которые он хранит в кэше.
- Контроллер загрузился и обнаружил, что его кэшированная конфигурация полностью отсутствует или повреждена, и ему пришлось обратиться к дискам для определения конфигурации (обычно это приводит к тому, что все диски отображаются как чужие)
Импорт по существу берет данные конфигурации на "чужом" диске и использует их для замены данных конфигурации на других дисках, которые он утверждает, что является частью виртуального диска. В некоторых сценариях это может оставить вас с автономным виртуальным диском вместо просто ухудшенного.
Я бы порекомендовал вам убедиться, что прошивка вашего PERC обновлена. Нет никаких шагов, которые вы можете предпринять, чтобы решить эту проблему, и в этом случае нет риска того, что вам придется восстанавливать данные из резервной копии на этом этапе, поэтому вы также можете рассмотреть возможность получения этих резервных копий в актуальном состоянии...
По сути, внешний означает, что система RAID не распознает элемент (будь то физический диск или виртуальный диск или что-то еще). Это может произойти, если вы удалите диски с одного сервера и поместите их на другой с помощью аналогичного контроллера RAID. Новый RAID-контроллер будет видеть эти диски как "чужие", но вы можете импортировать сторонний конфиг, и он будет работать нормально.
На основании того, что вы показали, похоже, что VD0 работает, потому что присутствуют диски 0 и 1, а VD1 работает, потому что присутствует диск 5. Меня смущает то, что контроллер считает VD1 RAID-5.
Моя рекомендация - удалить всю конфигурацию RAID и перестроить ее на основе исходной реализации. RAID-массивы на удивление устойчивы при импорте внешних конфигов таким образом (я уже делал подобные операции раньше. Это страшно, потому что кажется, что вы стираете диски, но это не так).
Импортировать чужую конфигурацию - все равно что заставить RAID просто пожать плечами и поверить вам, как его настроить. Если вы уверены в том, как он был настроен изначально, он будет работать нормально.