HP Proliant G6 сообщает о сбое SSD-накопителя - альтернативные стратегии для мониторинга?
Я хотел бы получить обратную связь о спорной ситуации я нашел себя в несколько дней назад. Мне было поручено использовать HP Proliant G6 в целях разработки с двумя новыми (< 2 месяца, никогда ранее не использовавшимися) твердотельными накопителями не HP, используемыми в конфигурации RAID1. Они используются для интенсивных задач, ориентированных на разработку (около 500 Гбайт в день); в RAID5 также есть обычные жесткие диски, но мы обсудим здесь массив RAID1.
- Samsung SSD 840 PRO Series
- PLEXTOR PX-256M5Pro
Вывод smartctl для обоих доступен здесь: https://gist.github.com/anonymous/cf8a5208a7315440f796
Соответствующие прошлые проблемы
Привод Plextor всегда подвергался воздействию перегрева, о котором сообщалось, что, как я полагаю, связано с тем, что это не оригинальная деталь
Я видел, как однажды RAID1 перестраивался после случайной перезагрузки сервера, и не мог объяснить причину этого.
Событие провала
Несколько дней назад диск Plextor был объявлен в обычном состоянии "Ошибка":
physicaldrive 1I:1:1 (port 1I:box 1:bay 1, Solid State SATA, 256.0 GB, Failed)
Ложно положительный?
Таким образом, я отключил его, проверил вывод SMART и запустил полный тест (см. Выводы smartctl выше). Тест пройден, и еще хуже, если сидеть на спине накопителя, можно получить совершенно функциональный массив RAID1.
Это неудобно.
Альтернативный мониторинг?
Я не знаю, как позволить P410i сообщить мне, в чем заключается конкретная причина статуса "Сбой" (я думаю, что это невозможно), и я знаю, что это неоригинальные запчасти HP (что делает мою платную поддержку HP недействительной), но для этого сервера, не являющегося критически важным, я хотел бы посмотреть, можно ли продолжать использовать диски, не принадлежащие HP, и по-прежнему иметь какой-то мониторинг состояния их работоспособности.
Каково твое мнение? У меня есть 3 вопроса:
- следует ли доверять статусу мониторинга контроллера HP только при использовании с оригинальными деталями? (это просто)
- объективно ли эти твердотельные накопители (абсолютно не высокого качества) здоровы?
- Должен ли я на 100% доверять результатам тестов SMART?
заранее спасибо
1 ответ
Ваши твердотельные накопители, вероятно, исправны, но RAID-контроллер HP Smart Array P410 несовместим с каждым твердотельным накопителем.
В частности, некоторые твердотельные накопители сообщают о неправильных атрибутах температуры контроллеру, которые вызывают проблемы с вентилятором корпуса и температурой системы. Кроме того, любое SATA-устройство, используемое на этом контроллере, будет разогнано до скоростей 3 Гбит / с до 3 Гбит / с. Таким образом, вы теряете потенциал пропускной способности.
Очевидно, что эта комбинация компонентов плохо соответствует. Вы можете использовать хорошо зарекомендовавший себя твердотельный накопитель, предназначенный для использования с контроллером (под маркой HP Sandisk/Pliant/Intel/Samsung/STEC), или поэкспериментировать с накопителями сторонних производителей, пока не найдете подходящий. Я рекомендую Intel и OWC.
Я рассмотрел некоторые варианты дисков, которые хорошо работают здесь:
Являются ли SSD-накопители такими же надежными, как и механические (2013)?
и здесь: