Высокопроизводительные вычисления включают использование "суперкомпьютеров" с большим количеством процессоров, больших параллельных систем хранения и современных сетей для выполнения трудоемких вычислений. Параллельные алгоритмы и распараллеливание хранилища имеют важное значение для этой области, а также проблемы со сложными, быстрыми сетевыми структурами, такими как Infiniband.

Высокопроизводительные вычисления (HPC) охватывают многие аспекты традиционных вычислений и используются в различных областях, включая физику элементарных частиц, компьютерную анимацию / компьютерную графику для крупных фильмов, исследования рака / геномики и моделирование климата, но не ограничиваются ими. Системы HPC, иногда называемые "суперкомпьютерами", - это, как правило, большое количество высокопроизводительных серверов с большим количеством процессоров и ядер, соединенных высокоскоростной структурой или сетью.

Ведется список 500 самых быстрых компьютеров на планете, а также список 500 самых энергоэффективных компьютеров. Производительность этих систем измеряется с помощью эталонного теста LINPACK, хотя это новый эталонный тест с использованием метода сопряженных градиентов, который более характерен для современных рабочих нагрузок HPC. IBM, Cray и SGI являются основными производителями систем и программного обеспечения HPC, хотя следует отметить, что более 70% систем из списка top500 основаны на платформах Intel.

Технология межкомпонентной связи также имеет решающее значение для систем HPC, многие из которых полагаются на внутренние высокоскоростные сети, состоящие из Infiniband или аналогичных высокоскоростных сетей с низкой задержкой. В дополнение к технологии взаимосвязи, GPU и сопроцессоры в последнее время приобретают все большую популярность благодаря своей способности ускорять определенные типы рабочих нагрузок.

Программное обеспечение является дополнительной проблемой для систем HPC, так как типичные программы не оборудованы для работы в таком большом масштабе. Многие производители оборудования также производят свои собственные программные стеки для систем HPC, которые включают компиляторы, драйверы, библиотеки параллелизации и математики, интерфейсы управления системой и инструменты профилирования, специально предназначенные для работы с производимым оборудованием.

В большинстве систем HPC используется сильно модифицированное ядро ​​linux, которое разбирается только на основные компоненты, необходимые для запуска программного обеспечения на поставляемом оборудовании. Многие современные системы HPC настраиваются "без сохранения состояния", что означает, что никакие данные ОС не хранятся локально на вычислительных узлах, а образ ОС загружается в ОЗУ, как правило, по сети с использованием загрузки PXE. Это функционально позволяет перезагрузить узлы в чистое, хорошо известное рабочее состояние. Это желательно в системах HPC, поскольку иногда трудно эффективно очистить процессы, которые параллельно выполнялись на нескольких узлах.