Настроить Heartbeat на Centos Linux - сообщение об ошибке

Я установил Heartbeat на моем Centos Linux, и он, кажется, частично работает.. но я пытаюсь отслеживать службу без успеха. только когда я перезагружаю главный сервер, резервный сервер вступает во владение. в логах я получаю:

heartbeat[30476]: 2012/03/20_18:51:57 WARN: string2msg_ll: node [node1] failed authentication
heartbeat[30476]: 2012/03/20_18:51:58 WARN: string2msg_ll: node [node02] failed authentication

authkeys идентичен (копируется из одного в другой). это мой ha.cf:

logfile /var/log/ha-log
logfacility local0
keepalive 2
deadtime 30
initdead 120
bcast eth0
udpport 694
auto_failback on
node server01.com 
node server02.com

зайцы:

server01.com 38.108.117.3 aim chat

Любая идея, как решить эту проблему, так что если служба останавливает другой сервер, возьмите на себя Спасибо! E.

2 ответа

Решение

Вы используете синтаксис heartbeat v1. Если вы используете это, здесь не будет мониторинга (по умолчанию). Если вы также хотите осуществлять мониторинг, вам придется преобразовать его в синтаксис v2 (XML) и добавить методы мониторинга.

Некоторые другие замечания о вашей конфигурации:

  • Автооткат не всегда хорошая идея. Вы можете создать хороший "пинг-понг" с этим
  • Вещание не очень хорошая идея с двумя узлами. Вместо этого используйте ucast.
  • Просто одно сетевое соединение? Веселитесь с большим количеством сплит-мозгов.

Теперь вернемся к вашему первоначальному вопросу: похоже, что другие узлы (из разных кластеров?) Пытаются обмениваться данными по одному и тому же широковещательному IP-адресу и одному и тому же UDP-порту.

"Ваши" узлы - "server01.com" и "server02.com" - вы видите два других узла ("node1" и "node02").

  • Используйте разные UDP-порты для каждого кластера
  • Используйте одноадресную рассылку вместо трансляции (см. Выше).

Обновление: Как настроить одноадресную рассылку:

RTFM (прочитайте прекрасное руководство) от rpm -qd|grep "ha.cf":

#       Set up a unicast / udp heartbeat medium
#       ucast [dev] [peer-ip-addr]
#
#       [dev]           device to send/rcv heartbeats on
#       [peer-ip-addr]  IP address of peer to send packets to
#
#ucast eth0 192.168.1.2

Для мониторинга и восстановления после отказа сервисов (а не только ящиков) вам понадобится полная настройка Pacemaker/Corosync/Heartbeat, а не только базовое Heartbeat. Если вы используете haresources, вы используете основной Heartbeat.

Установку от EPEL можно найти здесь:

http://www.clusterlabs.org/wiki/Install#Installing_on_EPEL-5_Compatible_Distributions:_RHEL.2C_CentOS.2C_etc

В вики ClusterLabs будет другая документация по настройке Pacemaker для конкретных сервисов.

Другие вопросы по тегам