P4500 Левый SAN-отчет ухудшается на одном узле, когда все диски исправны "НОРМАЛЬНО"

Я испытываю странное состояние с нашим левым кластером SAN HP G1. Кластер состоит из 4 узлов в двух узлах, два узла (узлы 1 и 2) в каждом узле представляют собой RAID5 по всей паре, и они отражаются на нашем сайте DR (узлы 3 и 4).

Узел 3 на сайте DR сообщает об ухудшении в CMC, однако при проверке дисков в CMC все диски сообщают о "нормальном состоянии" со статусом "активный"

/ dev / cciss / c0d1 в настройке RAID сообщает об ухудшении, а диски на этом контроллере сообщают "безопасно удалить" как "нет"

Кто-нибудь знает, что может происходить, устройство не имеет гарантийного срока.

3 ответа

Исходя из моего опыта, вы должны войти на страницу управления System Insight.

https://xxx.xxx.xxx:2381/ x= IP-адрес узлов пользователя "sanmon", пароль "sanmon"

Проверьте состояние дисков и статус контроллеров.

Я думаю, вы найдете там свою проблему.

Если устройство /dev/cciss/c0d1 ухудшается, это означает, что у вас есть проблемы с оборудованием на дисках.

Служба поддержки должна проверить отчет ADU и выяснить, какие диски сообщают об ошибках чтения.

Если у вас есть несколько дисков с ошибкой и их необходимо заменить, служба поддержки может перевести этот узел хранения в режим восстановления, заменить неисправные диски, перенастроить RAID и, наконец, перезаписать узел из оставшихся в живых узлов кластера (полагайте, что у вас нет томов NRAID0)

Это похоже на проблему с микропрограммой на диске, объединительной плате или RAID-контроллере. У вас плохой диск, но что-то мешает правильно сообщить о сбое.

Я рекомендую вам проверить прошивку сверху вниз и обновить ее при необходимости. У HP есть документ, в котором перечислены поддерживаемые и рекомендуемые уровни прошивки для их оборудования. Документ похоронен на их сайте, поэтому лучше всего получить его и попросить последнюю версию. Будьте очень осторожны с порядком применения обновлений прошивки. Есть несколько конкретных шагов по обновлению, которые, если не будут выполнены, приведут к блокировке материнской платы или контроллера.

Если вы чувствуете себя авантюрным, просто перезагрузите рассматриваемый узел. Плохой диск, вероятно, будет обнаружен во время инициализации RAID.

Другие вопросы по тегам