Требуется ли для сервера графический процессор с поддержкой оперативной памяти ECC или нормально работает на сервере?

Требуется ли для сервера использовать оперативную память ECC на графическом процессоре, тогда как обычная оперативная память процессора - ECC? Я думаю, что вместо использования Quadro K6000 или AMD Firepro, мы могли бы использовать GTX 980 или AMD R9 290... если это возможно... Кроме того, если не обязательно использовать ECC RAM... чем там gpu "server" (процессор i7 "похож на" сервер E7... E7 обычно для сервера / рабочей станции, а i7 для рабочего стола)... Пожалуйста, помогите!!!

4 ответа

Решение

Самая большая проблема с использованием настольных карт на сервере - это не память (что не имеет значения), ее пространство и мощность.

Серверные карты обычно меньше по размеру, без массивных 2-3-х слотовых радиаторов и вентиляторов для настольных карт.

Они также обычно не требуют дополнительного кабеля питания. Большинство серверов не имеют 6 или 8-контактный разъем питания видеокарты (некоторые могут, или вы можете взломать один из них).

Нагрев также является проблемой - в небольших системах для монтажа в стойку выделяется только такое количество тепла, которое можно удалить с помощью 1-дюймовых вентиляторов.

И, наконец, драйверы - некоторые настольные карты не имеют надлежащих драйверов для серверных операционных систем. Иногда вы можете использовать драйверы одинаковых клиентских ОС, иногда нет.

Другое отличие состоит в том, как карты выполняют различные задачи. Настольные карты предназначены для игр. Карты серверов и рабочих станций обычно превосходят производительность в 2d по таким показателям, как ускорение gpu на терминальных серверах и, например, автоматическое рендеринг. Они также имеют тенденцию быть более стабильными и стоят намного дороже.

Если настольная карта подойдет для вашего сервера, имеет соответствующие подключения питания, не перегревается и обеспечивает требуемый уровень производительности, сделайте это.

GPU ECC RAM не является строгим требованием для любого сервера; он ни в каком режиме не связан с использованием ОЗУ системы ECC.

Тем не менее, в некоторых случаях, GPU с ECC-памятью сильно предпочтительны. По сути, вам нужна ECC VRAM, если вы используете GPU для высокоточных вычислений на GPU (подумайте о двойной точности Folding@Home или аналогичной). Это не совпадение, что ECC VRAM в основном встречаются в видеокартах компьютерного уровня (например, tesla K10, Titan), в то время как их эквивалентные ориентированные на игры братья используют обычную, не ECC RAM.

При использовании для CAD/CAM и / или рендеринга постобработки, ECC RAM является желанным дополнением, но не абсолютной необходимостью. Для игр ECC VRAM практически бесполезен.

Что действительно отличает Quadros от видеокарт потребительского класса, так это не память ECC, а драйвер, который вы можете установить на прежнем. CAD/CAM/3D моделирование требует манипулирования сложной каркасной моделью, в которой возможности геометрического движка и сглаживания линий доведены до предела (в отличие от игр, которые требуют текстурирования, заполнения и сглаживания на весь экран). Правильная карта (например, Quadro нижнего или среднего уровня) с правильным драйвером может повысить производительность в 2 или 3 раза по сравнению с картой более высокого уровня. Некоторые примеры: введите описание ссылки здесь

ОЗУ не имеет значения. Самая большая проблема заключается в том, что потребительские графические процессоры в настоящее время намеренно изготавливаются так, что кабель питания туда не помещается (они переместили его сзади в сторону).

Вы не можете использовать потребительские графические процессоры в центрах обработки данных

Иногда они намеренно оставляют известные ошибки в драйвере GTX/RTX, пока исправляют их в картах рабочей станции/сервера. Разумеется, это стоит в 5 раз дороже.

NV также включила в лицензионные соглашения различные юридические ограничения, которые прямо запрещают использование таких карт в центрах обработки данных. Итак, да, вы можете использовать потребительские графические процессоры в центрах обработки данных, но вы столкнетесь с множеством проблем.

21 февраля 2023 г.: Документация по инструменту MemTest86 компании Passmark содержит полезную информацию об ECC.


Память ECC предназначена для защиты от случайных изменений битов, например, от космических лучей.

Google провел исследование и пришел к выводу:

Около трети машин и более 8% модулей DIMM в нашем парке имели по крайней мере одну исправимую ошибку в год... количество исправимых ошибок на один модуль DIMM сильно варьируется, при этом некоторые модули DIMM испытывают огромное количество ошибок по сравнению с другими.

Конечно, это исследование было посвящено системной оперативной памяти, а не VRAM, но повреждение может произойти, но, по моему мнению, это низкая вероятность, и, надеюсь, для этого и нужны резервные копии :-).

Я думаю, что есть и другие, более важные факторы, которые следует учитывать в рамках одной и той же серии графических процессоров (например, серии 3000) при покупке графического процессора: объем видеопамяти, физический размер, охлаждение/шум, мощность и поддержка nvLink.

Например, у меня есть RTX A2000 с 12 ГБ видеопамяти ECC и Asus ROG Strix RTX 3060 с 12 ГБ видеопамяти NON-ECC. 3060 может использовать драйверы NVIDIA Gaming и Studio, он быстрее, работает холоднее, имеет такой же объем видеопамяти и тише. Да, он большой, занимает 3 слота, потребляет больше энергии, и я не могу использовать nvLink, но в моем случае есть место, нужен только 1 графический процессор, питание не имеет большого значения, и я буду бросать кости при перевороте битов.

В конце концов, это всего лишь компромиссы, как и большинство вещей в вычислительной технике.

Моя главная проблема с графическими процессорами для рабочих станций — это шум этих плаксивых вентиляторов, поэтому я готов отказаться от некоторых вещей ради снижения шума, пока у меня достаточно видеопамяти.

Другие вопросы по тегам