Почему добавление кроссовера private nic приводит к сбою ресурса IP-адреса?
- Двухузловой кворумный кластер Win 2008 R2
- Настроил 192.168.0.0/24 "Публичная сеть"
- Настроен кластер MSDTC
- Установленный экземпляр кластера SQL 2008 R2
- Отказоустойчивые группы вручную - ОК
- Перезагрузка сервера без сбоя по группам - восстановление после сбоя ОК
- Вытащите общий сетевой кабель из одного узла - аварийное переключение в норме
- Добавлен кроссовер 10.2.0.0/24 "Частная сеть"
- Проверен пинг в частной сети
- Проверенный общий доступ к файлам в частной сети для общих ресурсов C$ admin
- Извлеките кабель общедоступной сети из одного узла - ресурс IP-адреса MSDTC не работает на исходном хосте, а не при сбое
- Вручную переместил группу MSDTC на другой узел - все в сети нормально
- Переустановите кабель общедоступной сети на узле 1 и проверьте все онлайн на узле 2
- Извлеките общедоступный сетевой кабель из узла 2 - ресурсы MSDTC и IP-адреса SQL не будут работать при сбое на исходном хосте
- Переустановите кабель общедоступной сети на узле 2 и вручную переведите все ресурсы назад и вперед - ОК
- Перезагрузка сервера без сбоя по группам - восстановление после сбоя ОК
- Удалена кроссоверная частная сеть и отключены сетевые адаптеры частной сети (остается только одна общая сеть)
- Отсоедините кабель общедоступной сети от одного узла - все, включая MSDTC, нормально переходит
В последствии несколько человек сказали мне не проводить тест на вытягивание кабеля - у кого-нибудь есть какая-либо документация о причинах и возможном воздействии? Просто сказать, что MVP говорит, что не будет летать с менеджером без документации.
Что еще более важно, почему добавление перекрестного кабеля будет иметь такой эффект?
2 ответа
Частное соединение между двумя узлами кластера служит двойной цели: проверить, что узлы могут видеть друг друга, и убедиться, что у каждого узла есть работающее частное соединение.
Служба MS Cluster требует, чтобы обе эти проверки прошли, или она объявит узел ненадежным и откажется от сбоя, рассуждая (вполне правильно), что не менять ничего в неизвестной ситуации лучше, чем отказ в отказе в неизвестной ситуации - возможно, чтобы отказавший узел.
Если частная сетевая карта дает сбой, этот узел автоматически считает себя неподходящим для аварийного переключения и эффективно выходит из кластера.
Если оба конца частного соединения подключены к коммутатору, эти тесты становятся независимыми друг от друга, и каждый узел может безопасно прервать свое частное соединение, в то время как другой узел также отказывает.
Мораль истории: кроссоверные кабели плохие, и лучше оставить их любителям.
Если это перекрестный кабель непосредственно между узлами кластера, конечно, ресурс IP-адреса потерпит неудачу - разрыв соединения с одного узла также приведет к тому, что другой узел увидит, что сетевой адаптер переходит в состояние "отключен" - поэтому как он может привести IP ресурс на другом узле?