PCIex линии на Supermicro X10SRH-CF
Я пытаюсь настроить 5 графических процессоров на X10SRH-CF для запуска Tensorflow, но, похоже, не могу загрузить плату при подключении более 3-х карт. В какой-то схеме я загружаю ее с 4-мя картами, кроме ОС (Ubuntu server 16.04) видит только 3 подключенные карты. Если я перемещаю одну карту среди всех слотов, она работает нормально, поэтому отдельные слоты, похоже, не являются проблемой.
Насколько я вижу, это может быть проблема с использованием CPU/PCH PCIe, но я не очень опытен с этими типами материнских плат.
Только подключенные периферийные устройства - это графические процессоры и 2 твердотельных накопителя, которые не включены в RAID.
1 ответ
Supermicro X10SRH-CF поддерживает следующие конфигурации PCIE:
- 1 разъем PCI-E 3.0 x4 (в x8)
- 1 разъем PCI-E 3.0 x8 (в x16)
- 2 разъема PCI-E 3.0 x8
- 1 разъем PCI-E 2.0 x2 (в x4)
- 1 разъем PCI-E 2.0 x4 (в x8)
Итак, первое, что нужно проверить - сколько линий PCIE требуют ваши карты? Это одна и та же модель видеокарты? Как вы можете видеть, размер слотов НЕ соответствует количеству дорожек, доступных для этого слота. Например. в слоте размера 16 доступно только 8 линий, поэтому, если вы вставите карту, для которой требуется 16 линий, она будет работать только на половине скорости, что может быть или не быть проблемой для определенных типов карт с графическим процессором. Таким образом, вам нужно убедиться, что у вас достаточно доступных линий PCIE для поддержки всех ваших карт
РЕДАКТИРОВАТЬ: также убедитесь, что у вас достаточно источника питания для питания вашей платы, процессора, других периферийных устройств и 5 ваших карт GTX 1080. Похоже, каждая карта претендует на 180 Вт. Безопасная ставка будет заключаться в том, чтобы обеспечить мощность не менее 1,5x. Что бы понадобилось
1.5x180W x 5 = 1350W
И это только для 5 видеокарт. Убедитесь, что у вас есть дополнительный источник питания для вашей платы, процессора, жестких дисков и других периферийных устройств. Также помните, что при загрузке необходимая мощность немного выше, пока система не заработает. Поэтому убедитесь, что вы также добавили немного терпимости для каждого компонента, требующего питания.