Кардиостимулятор сбрасывает действия автоматически
Я создал активный / пассивный кластер, используя Pacemaker / Corosync / drbd и "симулировал" сбой Apache pkill httpd
и хотя кардиостимулятор восстановился после "сбоя" и запустил httpd сейчас при выполнении pcs status
Я получил:
Failed Actions:
* apache_monitor_60000 on server1 'not running' (7): call=39, status=complete, exitreason='none',
last-rc-change='Wed May 9 09:55:45 2018', queued=0ms, exec=0ms
Разве кардиостимулятор не очищает неудачное действие после успешного восстановления? Или есть какой-то другой способ очистить неудачное действие, кроме ручного?
Заранее спасибо!
2 ответа
Это по замыслу. Некоторым администраторам, включая меня, нравится видеть ошибку, чтобы мы знали, когда она произошла, и могли расследовать. Кроме того, кардиостимулятор должен отслеживать эти ошибки, чтобы он мог решить, где лучше всего запустить ресурс.
Тем не менее, у кардиостимулятора есть способ сбрасывать сбои по истечении заданного времени, если новых сбоев не было. Это известно как время ожидания отказа. Это может быть настроено для каждого ресурса, но ниже вы можете указать его как ресурс кластера по умолчанию в оболочке crm. Я ожидаю, что у ПК также будет метод для его определения.
crm configure rsc_defaults failure-timeout=15m
Обратите внимание, что это проверяется только по кластеру-recheck-интервал, который по умолчанию каждые 15 минут. При установленном тайм-ауте сбоя 15 м, в зависимости от того, когда именно произошел сбой, это может занять 29 минут 59 секунд для очистки.
Вы также можете очистить состояние ошибки вручную («очистка»):
crm_resource -C -r apache -N server1 -n monitor
Очевидно, вы указываете имя ресурса , узел и операцию .
В случае возникновения локальной проблемы на узле состояние ошибки предотвращает повторные попытки и неудачу операции на неисправном узле. При выполнении ручных тестов ручная очистка более естественна, чем автоматическая очистка (по запросу).
Хорошая привычка — время от времени проверять кластер на наличие ошибок. И, конечно же, попытка исправить это создаст «хороший кластер».