Что такое функция управления питанием OSPM в современных кластерах HPC?

Что операционная система делает для управления энергопотреблением в современных кластерах HPC? Какие функции встроены в современные кластеры HPC для экономии энергии

2 ответа

Не все кластеры одинаковы, и управление питанием меняется так же широко, как и любая другая функция. Некоторые используют очень элементарные методы, чтобы сэкономить немного энергии, другие отключают узлы, которые не используются, или другие действия, которые экономят более значительное количество энергии.

Если у вас есть вопросы по поводу конкретной модели кластера, мы можем помочь вам больше, но такие открытые вопросы не дадут хорошего ответа.

Что ж, если вы посмотрите на типичный кластер HPC, вычислительные узлы будут стандартными серверами x86 под управлением Linux. Поэтому вы можете спросить, что может сделать Linux для экономии энергии на оборудовании x86? Ну, есть все эти C-состояния ACPI и еще много чего, что можно использовать, чтобы перевести процессоры в некий режим ожидания, основанный на неактивности, или отключить процессоры и так далее.

Затем некоторые пакетные планировщики имеют функции, позволяющие отключать незанятые узлы, а затем, когда есть работа, планировщик может загружать эти узлы (через IPMI, ILO или другую систему удаленного управления).

На практике мы на самом деле не рассматривали ничего из этого. Зачем? Что ж, наши кластеры работают более или менее постоянно при нагрузке 90+%. Если в какой-то момент будет много свободных узлов, какой-нибудь умник увидит свой шанс и отправит список заданий длиной в милю в очередь; Задача решена.:)

Другие вопросы по тегам