Linux-HA Pacemaker. Ресурс NFS запускается "неуправляемо"
Мой кластер, над которым я работаю, только начинает действовать из ниоткуда... Похоже, у меня проблема с ресурсом exportfs.
Любые идеи о том, как решить эту проблему? Я не могу найти ничего для кода возврата "-2"
============
Last updated: Mon Jan 7 09:18:18 2013
Last change: Fri Jan 4 16:02:13 2013 via crmd on emserver1
Stack: openais
Current DC: emserver1 - partition with quorum
Version: 1.1.6-9971ebba4494012a93c03b40a2c58ec0eb60f50c
2 Nodes configured, 2 expected votes
9 Resources configured.
============
Online: [ emserver1 emserver2 ]
Master/Slave Set: ms_drbd_nfs [p_drbd_nfs]
Masters: [ emserver1 ]
Slaves: [ emserver2 ]
Clone Set: cl_lsb_nfsserver [p_lsb_nfsserver]
Started: [ emserver1 emserver2 ]
Resource Group: g_nfs
p_fs_nfs (ocf::heartbeat:Filesystem): Started emserver1
p_exportfs_nfs (ocf::heartbeat:exportfs): Started emserver1 (unmanaged) FAILED
p_ip_nfs (ocf::heartbeat:IPaddr2): Stopped
Clone Set: cl_exportfs_root [p_exportfs_root]
Started: [ emserver1 ]
Stopped: [ p_exportfs_root:1 ]
Failed actions:
p_drbd_nfs:1_promote_0 (node=emserver2, call=22, rc=-2, status=Timed Out): unknown exec error
p_exportfs_root:1_start_0 (node=emserver2, call=10, rc=-2, status=Timed Out): unknown exec error
p_exportfs_nfs_stop_0 (node=emserver1, call=32, rc=-2, status=Timed Out): unknown exec error
p_drbd_nfs:0_demote_0 (node=emserver1, call=19, rc=1, status=complete): unknown error
1 ответ
Решение
Серверный пакет ubuntu имел устаревшие агенты ресурсов. В агенте ресурса exportfs произошла ошибка, из-за которой nfs rmtab увеличился до огромного размера (именно поэтому произошел тайм-аут).
Я обновил ресурсы агентов из github и удалил 2 ГБ rmtab. После этого все было хорошо.