Стоит ли отключать гибридный сервер с графическим процессором на IDLE?

Существует сервер с 2 процессорами (Intel Xeon E5-2670, Sandy Bridge) и 1 графическим процессором AMD (Tahiti XT Radeon HD 7970). Есть также SSD (системные и исполняемые файлы) и HDD (тяжелые данные), которые подключены к этому серверу.

Иногда сервер работает под большой нагрузкой в ​​течение нескольких часов. Иногда сервер простаивает в течение нескольких часов (простоя может быть более 8 часов).

Я слышал два противоположных мнения:

  1. Я не должен выключать свой сервер, потому что сервер предназначен для работы без выключения. Тысячи серверов не выключены и работают без остановок месяц.
  2. Сервер должен быть выключен, если на нем нет нагрузки. Особенно из-за графического процессора. Ресурс GPU и кулера для GPU ограничен, и не стоит постоянно включать GPU, даже если он не находится под большой нагрузкой.

Какое мнение верно? Должен ли я или не должен выключать этот сервер, чтобы значительно продлить срок его службы?

UPD 1 Мне интересно в первую очередь о безостановочной работе графического процессора.

UPD 2 О выборе GPU. Это не просто игровой графический процессор. Radeon 7970 победил, например, Nvidia Kepler в нескольких случаях. Смотрите презентацию.

UPD 3 Существует мнение, что очень плохая стратегия для машины на GPU- включать IDLE. Я пытаюсь понять, верное мнение или ложное

1 ответ

Решение

Плюсы выключения сервера во время простоя:

  • Более низкое (нулевое) энергопотребление, что экономит расходы на электроэнергию и охлаждение
  • Меньший износ вентиляторов, который, скорее всего, умрет на GPU (или на остальной части сервера, вероятно).
  • Если у вас все равно запланировано отключение каждую ночь, планирование обновлений Windows станет намного проще

Недостатки выключения сервера во время простоя:

  • Моторы (как вентиляторы, так и вращающиеся приводы) с большей вероятностью не смогут раскрутиться, чем не смогут продолжать вращаться.
  • Сервер недоступен, если есть какая-то работа для него в середине ночи
  • Нагрузка на компоненты - существует большая разница температур (особенно в помещении с кондиционером) между работающим сервером и выключенным. Температурный цикл заставляет металл каждый раз расширяться и сжиматься, что в итоге приводит к износу деталей.
  • Проблемы с программным обеспечением и ОС чаще возникают во время загрузки. Возможно, последняя партия обновлений Windows что-то испортила, или ваш загрузчик поврежден и т. Д. Конечно, они появятся при следующей перезагрузке, но, по крайней мере, вам не придется беспокоиться о них ежедневно, и поспешите починить их в 8:50, прежде чем все придут в 9:00.

Вентиляторы и жесткие диски являются единственными частями большинства систем, которые имеют двигатели. Двигатели жесткого диска хорошо защищены от окружающей среды, но вентиляторы подвергаются воздействию всей пыли в воздухе. Поэтому они быстро изнашиваются по сравнению с другими деталями. Вот почему на большинстве серверов они поддерживают горячую замену - вы можете заменить их, не выключая сервер. Вентиляторов также больше, чем необходимо, поэтому отказ одного вентилятора не приводит к перегреву системы.

Тем не менее, это не значит, что отключать их - это, безусловно, хорошо. Большинство поклонников, которые начинают изнашиваться, работают нормально, когда набирают скорость, но имеют проблемы с запуском. Таким образом, они вообще не смогут включиться, когда сервер снова включится, но, возможно, продолжали работать, если он был оставлен на все время.

Мысли конкретно о видеокарте:

  • Используемая вами видеокарта предназначена для игровых систем высокого уровня. Линейка видеокарт AMD FirePro предназначена для использования на сервере.
  • Одно из больших отличий, которое вы сразу заметите, заключается в том, что только у модели самого высокого уровня есть вентилятор, остальные пассивно охлаждаются. У одного с фанатами их было по три, и они крупнее и, вероятно, более долговечны, чем фанаты игровых видеокарт.
  • Серверные видеокарты также рассчитаны на рабочую нагрузку 24x7, поэтому они имеют более долговечные компоненты в целом.

Все видеокарты замедляют работу своих вентиляторов и снижают энергопотребление в режиме ожидания. Не существует "ограниченного ресурса GPU", если вы имеете в виду что-то вроде "после 1 триллиона вычислений, видеокарта умрет", но определенно есть ограниченное количество часов, в течение которых вентилятор на нем будет работать до отказа. Что касается настольных компьютеров, у меня было много систем с выделенными видеокартами, которые работали почти 24x7 в течение 2-3 лет до того, как поклонник видеокарты умер. В реальной среде серверной комнаты, где, как мы надеемся, меньше тепла и меньше пыли, чем в среде рабочего стола, я ожидаю, что она может работать довольно долго без обслуживания. Но на всякий случай я бы заказал для него пару сменных вентиляторов, чтобы у меня был готов, если он умрет.

Заключение

  • Держите сервер включенным, даже если он простаивает, если только он не будет простаивать в течение многих дней или недель. И даже тогда я бы оставил это включенным.
  • Подберите несколько запасных вентиляторов для этого графического процессора. Тем более, что их будет трудно найти через год или два, когда карта будет считаться устаревшей.
  • Обратите внимание на замену графического процессора на эквивалент сервера. Является ли это хорошим вариантом, зависит от ваших потребностей обработки GPU и бюджета. Вы можете решить, что на случай, если кто-то умрет, дешевле просто положить всю запасную карту.
Другие вопросы по тегам