Ошибка сервера на диске: состояние: { DRDY ERR }, ошибка: { ABRT }, сбой команды: READ DMA EXT
У меня есть сервер из Red Barn, который выдает ошибки при доступе к локальному флеш-накопителю SATA. Вот несколько фактов:
- Я использую Ubuntu 15.10, хотя два других аналогичных сервера Supermicro также работают без проблем.
- Корневой диск является флэш-накопителем SATA.
- Если я перезагружу систему, это будет нормально, по крайней мере, через день, а затем застревает, постоянно выкидывая эти ошибки.
- Мы попытались переустановить все ОЗУ и запустить memtest86 в течение нескольких дней, без проблем.
- Мы загрузили систему с USB-накопителя, с корневым диском, не подключенным, и наблюдали, что у него нет проблем в течение многих дней.
- Мы загрузились с USB, подключили диск и каждые 5 секунд запускали скрипт на файл. Это длилось несколько дней без ошибок.
Мы думали о повреждении ОС, но почему бы так долго ждать, прежде чем проявиться? Если диск выходит из строя, почему SMART ничего не сообщает и почему он работает долгое время, прежде чем странно работать?
Что еще мы можем сделать, чтобы исследовать эту неудачу? Мы немного застряли.
Вот скриншот с удаленной консоли. Я вижу это, если я пытаюсь войти в систему, и тогда это возвращает меня к проблеме входа в систему.