Ошибка сервера на диске: состояние: { DRDY ERR }, ошибка: { ABRT }, сбой команды: READ DMA EXT

У меня есть сервер из Red Barn, который выдает ошибки при доступе к локальному флеш-накопителю SATA. Вот несколько фактов:

  • Я использую Ubuntu 15.10, хотя два других аналогичных сервера Supermicro также работают без проблем.
  • Корневой диск является флэш-накопителем SATA.
  • Если я перезагружу систему, это будет нормально, по крайней мере, через день, а затем застревает, постоянно выкидывая эти ошибки.
  • Мы попытались переустановить все ОЗУ и запустить memtest86 в течение нескольких дней, без проблем.
  • Мы загрузили систему с USB-накопителя, с корневым диском, не подключенным, и наблюдали, что у него нет проблем в течение многих дней.
  • Мы загрузились с USB, подключили диск и каждые 5 секунд запускали скрипт на файл. Это длилось несколько дней без ошибок.

Мы думали о повреждении ОС, но почему бы так долго ждать, прежде чем проявиться? Если диск выходит из строя, почему SMART ничего не сообщает и почему он работает долгое время, прежде чем странно работать?

Что еще мы можем сделать, чтобы исследовать эту неудачу? Мы немного застряли.

Вот скриншот с удаленной консоли. Я вижу это, если я пытаюсь войти в систему, и тогда это возвращает меня к проблеме входа в систему.

0 ответов

Другие вопросы по тегам