PCIex линии на Supermicro X10SRH-CF

Я пытаюсь настроить 5 графических процессоров на X10SRH-CF для запуска Tensorflow, но, похоже, не могу загрузить плату при подключении более 3-х карт. В какой-то схеме я загружаю ее с 4-мя картами, кроме ОС (Ubuntu server 16.04) видит только 3 подключенные карты. Если я перемещаю одну карту среди всех слотов, она работает нормально, поэтому отдельные слоты, похоже, не являются проблемой.

Насколько я вижу, это может быть проблема с использованием CPU/PCH PCIe, но я не очень опытен с этими типами материнских плат.

Только подключенные периферийные устройства - это графические процессоры и 2 твердотельных накопителя, которые не включены в RAID.

1 ответ

Supermicro X10SRH-CF поддерживает следующие конфигурации PCIE:

  • 1 разъем PCI-E 3.0 x4 (в x8)
  • 1 разъем PCI-E 3.0 x8 (в x16)
  • 2 разъема PCI-E 3.0 x8
  • 1 разъем PCI-E 2.0 x2 (в x4)
  • 1 разъем PCI-E 2.0 x4 (в x8)

Итак, первое, что нужно проверить - сколько линий PCIE требуют ваши карты? Это одна и та же модель видеокарты? Как вы можете видеть, размер слотов НЕ соответствует количеству дорожек, доступных для этого слота. Например. в слоте размера 16 доступно только 8 линий, поэтому, если вы вставите карту, для которой требуется 16 линий, она будет работать только на половине скорости, что может быть или не быть проблемой для определенных типов карт с графическим процессором. Таким образом, вам нужно убедиться, что у вас достаточно доступных линий PCIE для поддержки всех ваших карт

РЕДАКТИРОВАТЬ: также убедитесь, что у вас достаточно источника питания для питания вашей платы, процессора, других периферийных устройств и 5 ваших карт GTX 1080. Похоже, каждая карта претендует на 180 Вт. Безопасная ставка будет заключаться в том, чтобы обеспечить мощность не менее 1,5x. Что бы понадобилось

1.5x180W x 5 = 1350W

И это только для 5 видеокарт. Убедитесь, что у вас есть дополнительный источник питания для вашей платы, процессора, жестких дисков и других периферийных устройств. Также помните, что при загрузке необходимая мощность немного выше, пока система не заработает. Поэтому убедитесь, что вы также добавили немного терпимости для каждого компонента, требующего питания.

Другие вопросы по тегам