Ошибка системы. Помогите мне интерпретировать последние сообщения консоли (снимок экрана).

Этот сервер выполняет несколько процессов обработки спутниковых изображений, имеет 256 ГБ оперативной памяти, диск емкостью 12 ТБ, 64 ядра процессора Intel(R) Xeon(R) Gold 6226R с частотой 2,90 ГГц. С этим зарядом он не должен выходить из строя, но иногда это происходит. Это снимок экрана типичного htop.

В случае сбоя системы я могу перехватить ее последнее консольное сообщение с помощью пульта дистанционного управления IPMI. Последнее это:

Поскольку systemd не может предоставить эти услуги, сервер не может работать, и мы не можем войти, чтобы исправить это по ssh, нам придется выполнить его полную перезагрузку. Что нам следует сделать, чтобы предотвратить эту проблему?

РЕДАКТИРОВАТЬ: Сервер имеет один диск M.2 240 ГБ для операционной системы в / и диск 12 ТБ для /data. Система...

      Linux tsom02 5.10.0-12-amd64 #1 SMP Debian 5.10.103-1 (2022-03-07) x86_64 GNU/Linux

M2 разделен только на 28 ГБ для /. Может быть, в этом причина? Должен ли я использовать больше места для /?

Вывод vmstat 5 5:

0 ответов

Другие вопросы по тегам