Монитор для мертвого диска в Linux

У меня проблема с резервными копиями дисков, которые не являются частью RAID или чего-либо подобного (поэтому нет уведомлений от raid-контроллера, если диск умирает). Бывает, что диск полностью умирает, и единственная вещь, которая остается в точке монтирования, недоступна, если вы попытаетесь перейти на него.

Есть ли способ для меня контролировать / получать уведомления, если диск умирает? У меня есть zabbix, и я нашел несколько умных сценариев, которые можно использовать, но я не уверен, что это будет работать, так как не будет /dev/sdb или же /dev/sda использовать смарт, когда диск умирает.

Если у кого-нибудь есть какой-нибудь сценарий или идея, я был бы признателен за это.

2 ответа

Решение

/var/log/syslog должен содержать некоторую информацию, связанную с отключением устройства; даже без построения стеков, таких как ELK (ElasticSearch, Logstash, Kibana) для анализа журнала, вы сможете отслеживать такие события с помощью таких инструментов, как sec.

Я написал плагин для nagios, который вы можете адаптировать к Zabbix. Я написал это, когда у нас было несколько серверов Linux, работающих только для чтения из-за случайных ошибок на диске. Это помогло нам выявить проблемы на ранних этапах, и есть код для тестирования-записи файла, но мы отключили его, чтобы проверка могла выполняться как root,

Другие вопросы по тегам