Сторожевой таймер HP ProLiant DL360 G7
У меня есть серверы dl360 G7. несколько раз ядро паниковало. Я понял, что на сервере есть аппаратный сторожевой таймер.
dmesg | grep wdt
[ 6.344992] hpwdt 0000:02:00.0: PCI INT A -> GSI 16 (level, low) -> IRQ 16
[ 6.345563] hpwdt: New timer passed in is 30 seconds.
Сервер уже находится в производстве. Вопрос: как я могу это включить? Нужно ли мне программное обеспечение для установки в системе тоже? На сервере запущен Debian. Я понял, что мне нужно в системе какое-то программное обеспечение, которое сообщает сторожу, что система жива. Или я не прав? Спасибо!
1 ответ
В этом контексте сторожевой таймер сбрасывает систему или предпринимает какие-либо действия, если он теряет "импульс". Серверы HP ProLiant имеют аппаратный сторожевой таймер, который связан с функцией автоматического восстановления сервера (ASR). ASR перезагружает сервер, если обнаруживает зависание в течение определенного периода времени (по умолчанию 10 минут).
В вашей системе Debian hpwdt == сторожевой таймер HP. Это модуль ядра. Инструкции по его использованию содержатся в документации к ядру.