Сторожевой таймер HP ProLiant DL360 G7

У меня есть серверы dl360 G7. несколько раз ядро ​​паниковало. Я понял, что на сервере есть аппаратный сторожевой таймер.

dmesg | grep wdt [ 6.344992] hpwdt 0000:02:00.0: PCI INT A -> GSI 16 (level, low) -> IRQ 16 [ 6.345563] hpwdt: New timer passed in is 30 seconds.

Сервер уже находится в производстве. Вопрос: как я могу это включить? Нужно ли мне программное обеспечение для установки в системе тоже? На сервере запущен Debian. Я понял, что мне нужно в системе какое-то программное обеспечение, которое сообщает сторожу, что система жива. Или я не прав? Спасибо!

1 ответ

В этом контексте сторожевой таймер сбрасывает систему или предпринимает какие-либо действия, если он теряет "импульс". Серверы HP ProLiant имеют аппаратный сторожевой таймер, который связан с функцией автоматического восстановления сервера (ASR). ASR перезагружает сервер, если обнаруживает зависание в течение определенного периода времени (по умолчанию 10 минут).

В вашей системе Debian hpwdt == сторожевой таймер HP. Это модуль ядра. Инструкции по его использованию содержатся в документации к ядру.

Другие вопросы по тегам