Живая миграция Hyper V идет только в одном направлении (ошибка 21502)

Недавно у нас возникла проблема с одним из наших стеков серверов. Наши два сервера 2008 R2 работают в кластере, настроенном на динамическую миграцию виртуальных машин между собой в случае обнаружения неисправности.

Серверы точно такие же аппаратные; они были заказаны специально для этой цели. Прямая миграция работала нормально до тех пор, пока пару месяцев назад мы не заметили, что VIR001 не может перейти на VIR002. Я изучил эту проблему и знаю, что, как правило, она вызвана неправильными именами ресурсов, но здесь это не так.

VIR002 продолжит миграцию любой из своих виртуальных машин на VIR001. VIR001 не будет преобразовывать виртуальные машины в VIR002. Не знаю, с чего начать, я заметил пару ошибок Time-Server на VIR001, но если проблема была из-за проблемы синхронизации, не будут ли оба сервера испытывать одну и ту же проблему?

Щас ищу идеи на что проверить. Спасибо,

(Обновление: я запустил инструмент проверки отказоустойчивого кластера, и он не обнаружил проблем. Я не смог запустить проверку диска, так как наш кластер все еще подключен к кластеру. Оба рассматриваемых сервера также установлены в качестве возможных владельцев ресурсов кластера)

1 ответ

Решение

Ну наконец-то нашел проблему:

Я заметил, что некоторые из созданных кластерных сетей не были законными (то есть, они содержали только один NIC или были объединены с NIC в другой подсети). Я отключил это. Мои коллеги сказали мне, что привязка к физическим серверам может иметь значение. Я изменил это. Я проверил кластер, убедился, что на всех узлах оба сервера указаны в качестве возможных владельцев, и, в довершение, я нашел вкладку "Сеть для динамической миграции" в свойствах ресурса виртуальной машины.

Я упорядочил кластерные сети в "Сети для прямой миграции" таким образом, чтобы сначала была кластерная сеть Live Migration, а затем все активные сети с отключенными сетями внизу. Нет любви. Сегодня после изменения привязки и отсутствия изменений я решил отключить все кластерные сети на вкладке Live Migration, кроме трех внутренних сетей (LM, host, Cluster Domain). Теперь это работает.

Не уверен, с чего это началось. Мы не вносили никаких физических изменений в оборудование за последний год. Это работало по крайней мере 4 месяца назад. Похоже, что менеджер кластеров не всегда слушает свои собственные настройки.

Спасибо за ответы на этот вопрос.

Другие вопросы по тегам