P4500 Левый SAN-отчет ухудшается на одном узле, когда все диски исправны "НОРМАЛЬНО"
Я испытываю странное состояние с нашим левым кластером SAN HP G1. Кластер состоит из 4 узлов в двух узлах, два узла (узлы 1 и 2) в каждом узле представляют собой RAID5 по всей паре, и они отражаются на нашем сайте DR (узлы 3 и 4).
Узел 3 на сайте DR сообщает об ухудшении в CMC, однако при проверке дисков в CMC все диски сообщают о "нормальном состоянии" со статусом "активный"
/ dev / cciss / c0d1 в настройке RAID сообщает об ухудшении, а диски на этом контроллере сообщают "безопасно удалить" как "нет"
Кто-нибудь знает, что может происходить, устройство не имеет гарантийного срока.
3 ответа
Исходя из моего опыта, вы должны войти на страницу управления System Insight.
https://xxx.xxx.xxx:2381/ x= IP-адрес узлов пользователя "sanmon", пароль "sanmon"
Проверьте состояние дисков и статус контроллеров.
Я думаю, вы найдете там свою проблему.
Если устройство /dev/cciss/c0d1
ухудшается, это означает, что у вас есть проблемы с оборудованием на дисках.
Служба поддержки должна проверить отчет ADU и выяснить, какие диски сообщают об ошибках чтения.
Если у вас есть несколько дисков с ошибкой и их необходимо заменить, служба поддержки может перевести этот узел хранения в режим восстановления, заменить неисправные диски, перенастроить RAID и, наконец, перезаписать узел из оставшихся в живых узлов кластера (полагайте, что у вас нет томов NRAID0)
Это похоже на проблему с микропрограммой на диске, объединительной плате или RAID-контроллере. У вас плохой диск, но что-то мешает правильно сообщить о сбое.
Я рекомендую вам проверить прошивку сверху вниз и обновить ее при необходимости. У HP есть документ, в котором перечислены поддерживаемые и рекомендуемые уровни прошивки для их оборудования. Документ похоронен на их сайте, поэтому лучше всего получить его и попросить последнюю версию. Будьте очень осторожны с порядком применения обновлений прошивки. Есть несколько конкретных шагов по обновлению, которые, если не будут выполнены, приведут к блокировке материнской платы или контроллера.
Если вы чувствуете себя авантюрным, просто перезагрузите рассматриваемый узел. Плохой диск, вероятно, будет обнаружен во время инициализации RAID.