HP Proliant G6 сообщает о сбое SSD-накопителя - альтернативные стратегии для мониторинга?

Я хотел бы получить обратную связь о спорной ситуации я нашел себя в несколько дней назад. Мне было поручено использовать HP Proliant G6 в целях разработки с двумя новыми (< 2 месяца, никогда ранее не использовавшимися) твердотельными накопителями не HP, используемыми в конфигурации RAID1. Они используются для интенсивных задач, ориентированных на разработку (около 500 Гбайт в день); в RAID5 также есть обычные жесткие диски, но мы обсудим здесь массив RAID1.

  • Samsung SSD 840 PRO Series
  • PLEXTOR PX-256M5Pro

Вывод smartctl для обоих доступен здесь: https://gist.github.com/anonymous/cf8a5208a7315440f796

Соответствующие прошлые проблемы

Привод Plextor всегда подвергался воздействию перегрева, о котором сообщалось, что, как я полагаю, связано с тем, что это не оригинальная деталь

Я видел, как однажды RAID1 перестраивался после случайной перезагрузки сервера, и не мог объяснить причину этого.

Событие провала

Несколько дней назад диск Plextor был объявлен в обычном состоянии "Ошибка": physicaldrive 1I:1:1 (port 1I:box 1:bay 1, Solid State SATA, 256.0 GB, Failed)

Ложно положительный?

Таким образом, я отключил его, проверил вывод SMART и запустил полный тест (см. Выводы smartctl выше). Тест пройден, и еще хуже, если сидеть на спине накопителя, можно получить совершенно функциональный массив RAID1.

Это неудобно.

Альтернативный мониторинг?

Я не знаю, как позволить P410i сообщить мне, в чем заключается конкретная причина статуса "Сбой" (я думаю, что это невозможно), и я знаю, что это неоригинальные запчасти HP (что делает мою платную поддержку HP недействительной), но для этого сервера, не являющегося критически важным, я хотел бы посмотреть, можно ли продолжать использовать диски, не принадлежащие HP, и по-прежнему иметь какой-то мониторинг состояния их работоспособности.

Каково твое мнение? У меня есть 3 вопроса:

  • следует ли доверять статусу мониторинга контроллера HP только при использовании с оригинальными деталями? (это просто)
  • объективно ли эти твердотельные накопители (абсолютно не высокого качества) здоровы?
  • Должен ли я на 100% доверять результатам тестов SMART?

заранее спасибо

1 ответ

Решение

Ваши твердотельные накопители, вероятно, исправны, но RAID-контроллер HP Smart Array P410 несовместим с каждым твердотельным накопителем.

В частности, некоторые твердотельные накопители сообщают о неправильных атрибутах температуры контроллеру, которые вызывают проблемы с вентилятором корпуса и температурой системы. Кроме того, любое SATA-устройство, используемое на этом контроллере, будет разогнано до скоростей 3 Гбит / с до 3 Гбит / с. Таким образом, вы теряете потенциал пропускной способности.

Очевидно, что эта комбинация компонентов плохо соответствует. Вы можете использовать хорошо зарекомендовавший себя твердотельный накопитель, предназначенный для использования с контроллером (под маркой HP Sandisk/Pliant/Intel/Samsung/STEC), или поэкспериментировать с накопителями сторонних производителей, пока не найдете подходящий. Я рекомендую Intel и OWC.

Я рассмотрел некоторые варианты дисков, которые хорошо работают здесь:

Являются ли SSD-накопители такими же надежными, как и механические (2013)?

и здесь:

Массивы хранения HP - несколько каналов?

Другие вопросы по тегам