Шт. ошибка состояния httpd_monitor_5000 на сервере "не работает" (7):
Сообщение об ошибке
Failed actions:
httpd_monitor_5000 on abc-zabserver-b 'not running' (7): call=65, status=complete, last-rc-change='Wed Jul 15 21:44:43 2015', queued=0ms, exec=8ms
шт статус
[root@abc-zabserver-b ~]# pcs status
Cluster name: abc-zabvip
Last updated: Wed Jul 15 21:50:52 2015
Last change: Wed Jul 15 20:38:07 2015
Stack: cman
Current DC: abc-zabserver-b - partition with quorum
Version: 1.1.11-97629de
2 Nodes configured
3 Resources configured
Online: [ abc-zabserver-a abc-zabserver-b ]
Full list of resources:
Resource Group: zabbix-cluster
ClusterIP (ocf::heartbeat:IPaddr2): Started abc-zabserver-b
zabbix-server (lsb:zabbix-server): Started abc-zabserver-b
httpd (lsb:httpd): Started abc-zabserver-b
Failed actions:
httpd_monitor_5000 on abc-zabserver-b 'not running' (7): call=65, status=complete, last-rc-change='Wed Jul 15 21:44:43 2015', queued=0ms, exec=8ms
Конфигурация ресурса
pcs resource create ClusterIP ocf:heartbeat:IPaddr2 ip=10.99.122.69 cidr_netmask=24 op monitor interval=5s
pcs property set stonith-enabled=false
pcs resource create zabbix-server lsb:zabbix-server op monitor interval=5s
pcs resource create httpd lsb:httpd op monitor interval=5s
pcs resource group add zabbix-cluster ClusterIP zabbix-server httpd
pcs property set no-quorum-policy=ignore
pcs property set default-resource-stickiness="100"
шт конфигурации
[root@abc-zabserver-b ~]# pcs config show
Cluster Name: abc-zabvip
Corosync Nodes:
abc-zabserver-a abc-zabserver-b
Pacemaker Nodes:
abc-zabserver-a abc-zabserver-b
Resources:
Group: zabbix-cluster
Resource: ClusterIP (class=ocf provider=heartbeat type=IPaddr2)
Attributes: ip=10.99.122.69 cidr_netmask=24
Operations: start interval=0s timeout=20s (ClusterIP-start-timeout-20s)
stop interval=0s timeout=20s (ClusterIP-stop-timeout-20s)
monitor interval=5s (ClusterIP-monitor-interval-5s)
Resource: zabbix-server (class=lsb type=zabbix-server)
Operations: monitor interval=5s (zabbix-server-monitor-interval-5s)
Resource: httpd (class=lsb type=httpd)
Operations: monitor interval=5s (httpd-monitor-interval-5s)
Stonith Devices:
Fencing Levels:
Location Constraints:
Ordering Constraints:
Colocation Constraints:
Cluster Properties:
cluster-infrastructure: cman
dc-version: 1.1.11-97629de
default-resource-stickiness: 100
no-quorum-policy: ignore
stonith-enabled: false
cluster.conf
[root@abc-zabserver-b ~]# cat /etc/cluster/cluster.conf
<cluster config_version="9" name="abc-zabvip">
<fence_daemon/>
<clusternodes>
<clusternode name="abc-zabserver-a" nodeid="1">
<fence>
<method name="pcmk-redirect">
<device name="pcmk" port="abc-zabserver-a"/>
</method>
</fence>
</clusternode>
<clusternode name="abc-zabserver-b" nodeid="2">
<fence>
<method name="pcmk-redirect">
<device name="pcmk" port="abc-zabserver-b"/>
</method>
</fence>
</clusternode>
</clusternodes>
<cman expected_votes="1" port="5405" transport="udpu" two_node="1"/>
<fencedevices>
<fencedevice agent="fence_pcmk" name="pcmk"/>
</fencedevices>
<rm>
<failoverdomains/>
<resources/>
</rm>
</cluster>
2 ответа
Я исправил это, раскомментировав URL-адрес статуса в httpd.conf и создав таким образом ресурс. Убедитесь, что http://localhost/server-status доступен, прежде чем добавлять ресурс
pcs resource create httpd apache configfile="/etc/httpd/conf/httpd.conf" statusurl="http://localhost/server-status" op monitor interval=5s --group zabbix-cluster
Ресурс httpd, по-видимому, работает (в зависимости от вывода статуса ПК, который вы показали). Возможно, что-то остановило службу, пока Pacemaker отслеживал ее, что привело бы к ошибке, которую вы видели выше, и запустило восстановление.
Если вы выполняете grep ваши журналы (на DC: "Текущий DC: vda-zabserver-b - раздел с кворумом") для "LogActions", вы должны увидеть любые действия Start/Stop/Recover/Restart/Leave, выполненные Pacemaker над ресурсами.
Если это так, то вы должны быть уверены, что Pacemaker не управляет этими кластерными службами; Предполагается, что кардиостимулятор будет единственным, кто запускает и останавливает эти услуги.
Вы можете устранить ошибку, выполнив следующую команду:
# pcs resource cleanup httpd
Код возврата 7 обычно означает, что служба не работала, когда Pacemaker проверил свой статус.
http://clusterlabs.org/doc/en-US/Pacemaker/1.0/html/Pacemaker_Explained/ap-lsb.html http://refspecs.linuxbase.org/LSB_3.1.0/LSB-Core-generic/LSB-Core-generic/iniscrptact.html