Почему добавление кроссовера private nic приводит к сбою ресурса IP-адреса?

  • Двухузловой кворумный кластер Win 2008 R2
  • Настроил 192.168.0.0/24 "Публичная сеть"
  • Настроен кластер MSDTC
  • Установленный экземпляр кластера SQL 2008 R2
  • Отказоустойчивые группы вручную - ОК
  • Перезагрузка сервера без сбоя по группам - восстановление после сбоя ОК
  • Вытащите общий сетевой кабель из одного узла - аварийное переключение в норме
  • Добавлен кроссовер 10.2.0.0/24 "Частная сеть"
  • Проверен пинг в частной сети
  • Проверенный общий доступ к файлам в частной сети для общих ресурсов C$ admin
  • Извлеките кабель общедоступной сети из одного узла - ресурс IP-адреса MSDTC не работает на исходном хосте, а не при сбое
  • Вручную переместил группу MSDTC на другой узел - все в сети нормально
  • Переустановите кабель общедоступной сети на узле 1 и проверьте все онлайн на узле 2
  • Извлеките общедоступный сетевой кабель из узла 2 - ресурсы MSDTC и IP-адреса SQL не будут работать при сбое на исходном хосте
  • Переустановите кабель общедоступной сети на узле 2 и вручную переведите все ресурсы назад и вперед - ОК
  • Перезагрузка сервера без сбоя по группам - восстановление после сбоя ОК
  • Удалена кроссоверная частная сеть и отключены сетевые адаптеры частной сети (остается только одна общая сеть)
  • Отсоедините кабель общедоступной сети от одного узла - все, включая MSDTC, нормально переходит

В последствии несколько человек сказали мне не проводить тест на вытягивание кабеля - у кого-нибудь есть какая-либо документация о причинах и возможном воздействии? Просто сказать, что MVP говорит, что не будет летать с менеджером без документации.

Что еще более важно, почему добавление перекрестного кабеля будет иметь такой эффект?

2 ответа

Частное соединение между двумя узлами кластера служит двойной цели: проверить, что узлы могут видеть друг друга, и убедиться, что у каждого узла есть работающее частное соединение.

Служба MS Cluster требует, чтобы обе эти проверки прошли, или она объявит узел ненадежным и откажется от сбоя, рассуждая (вполне правильно), что не менять ничего в неизвестной ситуации лучше, чем отказ в отказе в неизвестной ситуации - возможно, чтобы отказавший узел.

Если частная сетевая карта дает сбой, этот узел автоматически считает себя неподходящим для аварийного переключения и эффективно выходит из кластера.

Если оба конца частного соединения подключены к коммутатору, эти тесты становятся независимыми друг от друга, и каждый узел может безопасно прервать свое частное соединение, в то время как другой узел также отказывает.

Мораль истории: кроссоверные кабели плохие, и лучше оставить их любителям.

Если это перекрестный кабель непосредственно между узлами кластера, конечно, ресурс IP-адреса потерпит неудачу - разрыв соединения с одного узла также приведет к тому, что другой узел увидит, что сетевой адаптер переходит в состояние "отключен" - поэтому как он может привести IP ресурс на другом узле?

Другие вопросы по тегам