Диагностическая система, которая постоянно распознает диски SATA, но отказывается распознавать диск SAS или его замену?

Я сделал немало проблем, но совершенно не уверен, что может произойти.

Аппаратное обеспечение / платформа

  • Supermicro X10SRi-F материнская плата
  • EVGA 850W G2 PSU (один из самых высоких по качеству питания на Jonnyguru.com)
  • 128 ГБ Crucial DDR4 RDIMM
  • LSI 9211-8i PCIe HBA прошил до последней P20-IT (с сайта LSI/Avago)
  • Соединительный кабель 8087-quad-SAS (новый: см. Этот рисунок, вид кабеля, на котором сторона питания принимает разъем SATA PSU)
  • Привод Seagate 6TB SAS (новый: ST6000NM0054)
  • Различные другие жесткие диски Seagate 3 ТБ - 6 ТБ (для тестирования)

Проблема / устранение неполадок до сих пор

Это новый настраиваемый сервер, поэтому все компоненты новые, хотя некоторые из них уже были протестированы.

При загрузке HBA не распознала или не сообщила о диске SAS 6 ТБ (через основной BIOS или через собственную топологию OROM -> SAS), а диск 6 ТБ был холодным и не раскручивался. Другие диски не были подключены. Остальная часть системы работает нормально, поэтому на первый взгляд проблема сводится к одному или нескольким плохим HBA, плохому кабелю или плохому диску.

Действия по устранению неполадок до сих пор:

  1. Подключил накопитель SAS 6 ТБ с использованием другого терминатора на четырехъядерном кабеле и четырехъядерного кабеля к обоим портам 8087. Без изменений - подразумевается, что проблема не в одном конкретном терминаторе или порте.
  2. Подключал различные SATA-диски Seagate 3TB - 6TB с помощью одного и того же кабеля (того же производителя и аналогичного современного диапазона для устранения незначительных проблем совместимости, если таковые имеются). Все распознаются, сообщаются и работают нормально при загрузке, на обоих портах 8087 и на всех 4 терминаторах, а также при многократных перезагрузках - подразумевается, что HBA и кабель работают нормально, по крайней мере, для SATA. (Было бы странно, если бы они отлично работали на SATA, но не на SAS.)
  3. Сохранял идентичные соединения, но заменял диски SATA диском SAS 6 ТБ, ничего не меняя. Как и прежде, накопитель SAS емкостью 6 ТБ не был распознан или сообщен HBA и не раскручен.
  4. Точно так же пробовал с другой картой и платформой m- LSI 9260-8i RAID контроллер на настольном компьютере на базе ASUS. Снова все диски SATA сразу же распознаются и раскручиваются, но диск SAS 6 ТБ не является / не работает.
  5. Неохотно пришел к выводу, что, однако, маловероятно, что наиболее вероятной проблемой был 6-ТБ диск SAS DOA и RMA. ("Неохотно", потому что у меня никогда ранее не было DOA, диски обычно надежны, и если он не работает, то гораздо более обычным / ожидаемым будет то, что он, по крайней мере, распознается, но не работает. Я просто не мог " не думаю, что более вероятная проблема, чем полный DOA.)
  6. Только что получил гарантийную замену, а также получил точно такие же симптомы при замене: (a) Когда диск SAS 6 ТБ и любой диск SATA подключены к двум терминаторам и система загружается, диск SATA немедленно распознается, регистрируется и запускается в то время как накопитель SAS 6 ТБ остается холодным и неподвижным. (b) Когда SAS 6 ТБ и любой диск SATA подключены к карте RAID 9260-8i на другом настольном компьютере ASUS, диск SATA также немедленно распознается, но диск SAS 6 ТБ остается холодным.
  7. В качестве последнего шага перечитайте руководство пользователя HBA 9211-8i на случай, если я что-то пропустил в первый раз, и перепроверили BIOS. Не могу найти ничего, что могло бы объяснить это, или любое утверждение о том, что диски SAS не будут распознаны до тех пор, пока <не будет выполнено <действие / содержимое>

На самом деле не верил, что это был DOA в первый раз. Определенно не верю, что это DOA сейчас. Но если нет, то что это, и что я могу пропустить?

Я проверил все (AFAIK) в цепочке компонентов, HBA просто не имеет большого количества интерфейса OROM, который может работать неправильно, или каких-либо опций для распознавания SATA/SAS/ обоих, или чего-то в этом роде, и основного ПК / сервера в обоих случаях просто оставьте обнаружение на карте HBA/RAID. Я провел тестирование на двух совершенно разных платформах, с двумя разными моделями плат контроллеров, с дисками SAS и SATA, и я совершенно ошеломлен.

(Примечание: я немного ограничен, поскольку начинаю переходить с SATA на SAS с намерением заменить SATA на SAS по мере их износа, поэтому на данный момент у меня нет других дисков или кабелей SAS для тест с, который я в противном случае сделал бы тоже. Но я думаю, что я, вероятно, покрыл это, тестируя карты + кабели при изменении SATA/SAS)

Обновлено для более точного названия, чтобы помочь другим, теперь больше информации получено. Смотри ответ.

3 ответа

Решение

Я говорил с техподдержкой LSI (сейчас Avago) по хранению данных в Германии. Они посчитали, что если 2 разных вида "заведомо исправного" контроллера на 2 разных машинах распознают все sata, но не этот sas-диск (на любом порту и разъеме), то это, скорее всего, диск.

Они также предложили провести дополнительный тест - подключить только сторону питания накопителя (НЕ HBA/ материнская плата / кабели данных) и включить сервер. (Он предупредил меня, что это будет "звучать безумно"!) Похоже, что SATA, диски SAS раскручиваются при первом включении, если сторона данных не подключена (я не знал, интересно, как тогда работает пусковой запуск?), очень хороший тест, основанный только на блоке питания и подаче питания на привод, и больше ничего.

Конечно же, все диски SATA раскручиваются, этого нет. Он чувствовал, что этого достаточно, чтобы быть "почти уверенным", это второй плохой ход, хотя и маловероятный, без траты денег. Серийный номер также был практически идентичен оригинальному дисководу (изменение на 1 цифру); поэтому он также предложил поговорить с производителем и задать вопрос, есть ли у них другие подобные отчеты для этого накопителя, поскольку это может быть плохая партия.

Обновление Апрель 2017:

Некоторое время я думал, что проблема в том, что нужно отключить BIOS LSI 9211, основываясь на онлайн-потоке. Я отключил биос, и он работал... но позже, когда я переместил коробку, она перестала работать, и я не мог понять, почему. Я взял эту информацию обратно в техподдержку LSI, и они сказали, что не возможно, что BIOS может быть проблемой, или отключение может помочь. Они чувствовали, что перемещение коробки, вероятно, отменило бы случайную работу кабеля, и вернули его обратно к работе.

Они сказали попробовать новый "прямой" или "разветвленный" кабель и, в частности, Adaptec (на стороне, поскольку это конкурент!), Который является более надежным, чем большинство для SAS. Они сказали, что не всегда было ясно или помечено, был ли кабель правильным видом или нет, и тщательно проверить.

Точный кабель SAS, который понадобится, будет зависеть от того, какой интерфейс имеет жесткий диск и карта. 9211 имеет соединение SFF-8087, а мой жесткий диск имеет соединение SFF-8082 (немного похоже на SATA, но порты питания и данных объединены).

Я сомневался в том, что это кабель (так как кабель действительно работает на электрически схожих SATA), но продолжил и связался с Adaptec, который сказал, что правильно подобрать кабель может быть довольно сложно, в том смысле, что точно определить, какой именно кабель необходимо. Они проверили спецификации карт и жестких дисков и порекомендовали их 2275300-R на Amazon, и, к моему большому изумлению, это сработало в первый раз, так что я думаю, они должны были знать, о чем они говорили.

не уверен, пытаетесь ли вы заменить диски sata в существующем массиве на sas, но если это так, это не сработает, вы не можете заменить sata на sas или sas на sata в активном массиве, вам придется сделать резервную копию массива , удалите его, удалите диски и замените, затем заново создайте массив и восстановите его из резервной копии. может быть проще просто оставить это в покое.

На самом деле настоящая причина этого горя связана с изменениями в стандарте питания SATA / SAS. Контакт 3 является проблемой.

Использование питания в стиле Molex устранит эту проблему при использовании новых дисков SAS (выпущенных после 2016 года).

Так что не имеет значения, если это кабели (если он не использует Molex для питания), HBA или диски все это указывает на это. Весело а?

https://www.hgst.com/sites/default/files/resources/HGST-Power-Disable-Pin-TB.pdf

Другие вопросы по тегам