RedHat 6 отказоустойчивого кластера
Я тестирую инструмент администрирования кластера RedHat, описанный здесь: https://access.redhat.com/site/documentation/en-US/Red_Hat_Enterprise_Linux/6/html/Cluster_Administration/index.html
У меня есть две виртуальные машины под управлением CentOS 6.4. Я тестировал сценарии отработки отказа; перезапуск основного компьютера и постепенное выключение основного компьютера успешно переносят ресурсы на дополнительный компьютер (такие как DRBD, Tomcat, MySQL, Apache).
Тем не менее, я хотел имитировать полный сбой питания или принудительное отключение. В клиенте XenCenter я принудительно выключаю основной компьютер и наблюдаю журналы на дополнительном компьютере. Короче говоря, кажется, что ресурсы НИКОГДА не мигрируют на вторичное устройство, а интерфейс управления кластером, похоже, считает, что службы все еще работают на первичном сервере.
Вот вывод из журналов вторичной машины: http://pastebin.com/gsi6uBct
Он жалуется в основном на фехтование. Но я не понимаю: если основной узел полностью умирает сам по себе, нечего оградить.
Идеи?
1 ответ
Фехтование должно происходить вне группы. Если вы теряете сеть между двумя хостами, нет среды, на которой можно было бы проверить живучесть, поэтому следует ли вторичному хосту запускать службы? Нет, поскольку это приведет к повреждению данных, эти службы все еще работают на основном хосте.
Таким образом, включается ограждение, просто чтобы убедиться, что основной хост действительно не работает, и после выполнения команды забора будет считаться безопасным запускать службы на дополнительном хосте.