memtest86+ сбой на сервере
У нас есть несколько серверов DELL 1950. Один из этих серверов имеет CentOS6.3, и он случайно перезагружается, поэтому я подозревал, что это аппаратное обеспечение (журнал не генерируется). Другие четыре сервера не перезагружаются случайным образом.
Мы запустили memtest86+ на пяти серверах, и на трех из них происходит сбой memtest86+ (отображается странный и красочный экран, как будто видеокарта вышла из строя).
Я протестировал старый memtest86 (не +), и ни один из серверов не вышел из строя. Я также проверил другие утилиты для тестирования оперативной памяти, но ни один из них не вышел из строя.
Кто-нибудь из вас, ребята, испытал это?
3 ответа
В случае сбоя memtest велика вероятность, что у вас плохая память. Попробуйте заменить память с не сбойных серверов и перезапустить memtest. Скорее всего, виновником является память. Вы также можете уменьшить объем памяти вдвое (если позволяет система; минимальные требования к памяти) и попробовать запустить memtest. Как только пройдет, попробуйте заменить память другой половиной и посмотреть.
UBCD - это еще один инструмент, который очень полезен для тестирования и диагностики. это включает memtest и memtest+. В новой версии даже есть тестер памяти для графических процессоров. Это пригодится, если вы подозреваете, что у видео также есть проблемы.
Если у вас есть сервер Linux, который перезагружается, это обычно означает, что это аппаратная проблема. Проверьте журналы в Dell OMSA (управляемый узел системного администратора Dell Open Manager). или через DRAC (карта удаленного доступа Dell).
Обратитесь в службу технической поддержки Dell, чтобы помочь вам в расследовании проблемы.