Хосты ESX теряют связь с iSCSI SAN LUN
Я уже несколько месяцев испытываю эту проблему, когда мои хосты ESX теряют связь с томами iSCSI SAN vmfs.
В результате хосты ESX переходят в режим без ответа, связанные с ним виртуальные машины отключаются, и единственным выходом является перезагрузка хоста.
Эта проблема происходит случайно. Я обострил эту проблему с VMWare, но у меня еще не было никакого решения проблемы.
Я не вижу ошибок на своих коммутаторах, а также нет проблем с оборудованием. Моя инфраструктура SAN надежна, и для каждого тома vmfs есть 2 пути.
Кто-нибудь еще сталкивался с подобной проблемой?
редактировать: вот еще несколько деталей:
Программное обеспечение iSCSI SAN - Datacore Sanmelody 2.0.4.2, работающее на 2 серверах HP Proliant G5. Хранилище, подключенное к каждому из серверов, - это HP MSA70, и все тома iSCSI SAN, представленные на моих 4 хостах ESX, являются зеркальными.
У меня есть две пары iSCSI HP Procurve 1800G-24, соединенные вместе. Мои серверы SANLELODY используют сетевые карты NC360T. Я объединяю две сетевые карты и подключаю один кабель к каждому коммутатору iSCSi. Каждый сервер ESX также использует две сетевые карты для сети iSCSI.
4 ответа
Давайте попробуем немного более сложный способ. Попробуйте использовать другое решение iSCSI, чтобы проверить, не является ли это проблемой ESX или самим iSCSI.
Я верну тебе StarWind. Вы можете скачать пробную версию там.
Нам нужно знать версию ESX, чтобы правильно диагностировать этот сценарий.
Некоторое время назад мы столкнулись с этой проблемой в ESX 3.5 Update 3, и в этой статье базы знаний было разрешено обновлять / исправлять узлы. После обновления до Обновления 4 (и далее) проблема не возникла.
Если вы уже прошли этот патч, можете ли вы предоставить дополнительную информацию о версиях и, возможно, некоторые диагностические данные с одного из хостов ESX? Обычно vmkernel.log - хорошее место для начала.
У меня была очень похожая проблема с ESXi 4, коммутаторами HP Procurve и HP Lefthand SAN. Наша проблема заключалась в том, что хотя аппаратные инициаторы iSCSI работали, они работали только 99% времени, вызывая случайные блокировки, разъединения и т. Д. Как оказалось, сетевые адаптеры Broadcom (с аппаратным iSCSI) не совместимы с левосторонними SAN. С помощью программного обеспечения инициаторы iSCSI решили нашу проблему.
Может быть, вы должны отключить пинги iscsi, как объяснено здесь