Описание тега hpc
Высокопроизводительные вычисления включают использование "суперкомпьютеров" с большим количеством процессоров, больших параллельных систем хранения и современных сетей для выполнения трудоемких вычислений. Параллельные алгоритмы и распараллеливание хранилища имеют важное значение для этой области, а также проблемы со сложными, быстрыми сетевыми структурами, такими как Infiniband.
0
ответов
Как справиться с отказом головного узла MPI?
Есть приложение, которое начинается с mpirun. В случае сбоя вычислительного узла все процессы разрушаются, но если происходит сбой только головного узла (например, перезагрузка), то процессы будут зависать на вычислительных узлах. Как избавиться от …
07 ноя '17 в 13:50
1
ответ
Как получить лучший результат LINPACK и покорить Top500?
Имеется большой кластер Linux HPC с сотнями / тысячами узлов. Каковы ваши лучшие практики для получения наилучшего результата теста LINPACK ( HPL) для отправки в список суперкомпьютеров Top500? Чтобы дать вам представление о том, какие ответы я хоте…
10 июн '10 в 20:38
1
ответ
Параллельная файловая система, которая планирует одновременные запросы файлов к взаимоисключающим наборам OSS
Моя среда основана на RHEL, межсоединение бесконечно. У меня есть некоторый опыт работы с блеском. То, что я хочу знать, это: Существует ли параллельная файловая система, в которой при поступлении одновременного запроса на запись они планируются на …
02 май '14 в 17:44
2
ответа
Зачем настраивать узлы кластера для перезагрузки при нехватке памяти?
У меня есть доступ к исследовательскому кластеру HPC, который настроен таким образом, что, если ваша работа пытается использовать больше памяти, чем доступно узлу, узел аварийно завершает работу и автоматически перезагружается. Это кажется обычной п…
16 янв '15 в 14:24
1
ответ
SSH против qlogin, чтобы использовать все процессоры вычислительного узла
У меня есть кластер SGE, состоящий из четырех вычислительных узлов, каждый с 20 процессорами. Я не против предоставить одному конкретному пользователю все возможности одного конкретного узла, т.е. я не против, чтобы он / она использовал все 20 проце…
01 авг '16 в 09:43
3
ответа
Соответствующая сетевая файловая система для больших (5+ Гб) файлов
У меня есть несколько серверов, используемых для HPC / кластерных вычислений, и я заметил, что, учитывая тот факт, что часть выполняемых ими вычислений использует огромные файлы по NFS, это вызывает значительные узкие места. Мне интересно, как решит…
19 фев '13 в 08:27
1
ответ
Что именно означает "минуты процессора"?
Я на самом деле пытаюсь сообщить об использовании кластера в Slurm, но я не понимаю метрических минут процессора. [root@XXXX]# sreport cluster Utilization Start=2018-12-01 End=2018-12-31 --------------------------------------------------------------…
07 янв '19 в 10:39
5
ответов
Как разрешить пользователям передавать файлы другим пользователям в Linux
В нашей среде несколько тысяч пользователей работают с приложениями на 40 кластерах размером от 20 вычислительных узлов до 98 000 вычислительных узлов. Пользователи в этих системах генерируют массивные файлы (иногда> 1PB), управляемые традиционными …
18 июн '12 в 15:47
2
ответа
Что такое функция управления питанием OSPM в современных кластерах HPC?
Что операционная система делает для управления энергопотреблением в современных кластерах HPC? Какие функции встроены в современные кластеры HPC для экономии энергии
28 окт '10 в 19:23
1
ответ
Какой самый быстрый способ переместить 1 петабайт из одного хранилища в новое?
Прежде всего, спасибо за чтение, и извините за вопрос, связанный с моей работой. Я понимаю, что это то, что я должен решить сам, но, как вы увидите, это немного сложно. Небольшое описание: Сейчас Storage => 1PB с использованием хранилища DDN S2A9900…
03 апр '12 в 21:27
2
ответа
Посмотреть таблицу маршрутизации Infiniband, созданную OpenSM?
Насколько я понимаю, менеджер подсети сети Infiniband вычисляет лучшие маршруты между каждой парой узлов в сети и предоставляет эти маршруты узлам, когда они хотят связаться. Есть ли способ заставить менеджера подсети (и в частности, OpenSM) распеча…
26 апр '12 в 20:32
1
ответ
Intel Xeon 6134 + Один модуль DIMM на канал или два модуля DIMM на канал для максимальной пропускной способности памяти?
Я не могу найти эту важную информацию в спецификациях. Ценю любое понимание. Мы покупаем серверы для HPC, работающие с процессором Intel Xeon Gold 6134 (Skylake). Мне нужна максимальная пропускная способность памяти, и я не беспокоюсь об общем объем…
13 мар '18 в 10:49
2
ответа
Многочисленные ошибки pbs_server в /var/log/messages
На узле управления суперкомпьютера мы получаем множество ошибок, таких как: pbs_server: LOG_ERROR::is_request, bad attempt to connect from 10.10.0.254:1023 (address not trusted - check entry in server_priv/nodes) И после них почти каждая минута след…
26 сен '13 в 10:43
1
ответ
Что делает Luster более быстрым и масштабируемым, чем NFS?
Я читал в разных местах (например, здесь и здесь), что производительность ввода-вывода NFS не масштабируется, в отличие от Lustre, и что Luster в целом может обеспечить более высокую скорость ввода-вывода. Кажется, между ними существуют разные архит…
04 июл '12 в 16:44
2
ответа
Windows HPC Server 08 подходит для Matlabs
Я хочу настроить другую виртуальную машину Hyper-V для установки Matlabs/ выполнения некоторых ресурсоемких программ с использованием C. Я продолжаю думать, что Windows Server HPC 2008 предназначен для такой работы. Буду ли я на правильном пути, что…
17 май '10 в 20:58
1
ответ
Rocksclusters переустановка узлов ошибка разделения
У меня есть HPC на основе http://www.rocksclusters.org/. Поэтому, когда я добавил новый крен (крутящий момент), я посылаю команду kickstart всем узлам, чтобы переустановить их. Но после загрузки установщика X на узлах все они показали мне ошибку: Не…
23 апр '10 в 03:06
1
ответ
Open MPI не может запускать удаленные узлы через SSH
Я пытаюсь настроить Open MPI между несколькими компьютерами в сети. Open MPI отлично работает локально, но я просто не могу заставить его работать на удаленном узле. Я могу SSH на удаленной машине (без пароля) просто отлично, но если я попробую что-…
21 ноя '12 в 23:43
1
ответ
Почему большинство суперкомпьютеров используют Linux?
Ссылаясь на эту статью BBC: суперкомпьютерные суперспособности Почти все суперкомпьютеры используют Linux в качестве операционной системы. Почему Linux так популярен?
01 июн '10 в 01:57
1
ответ
Развертывание базовой заметки для кластера HPC на сервере 2012R2 зависает
Мы находимся в процессе оценки стандарта сервера 2012R2 с пакетом HPC для небольшого кластера узлов (для начала около 40 - в текущей настройке имеется только один вычислительный узел). На данный момент мы используем старое оборудование, чтобы испыта…
28 июн '15 в 14:59
2
ответа
Диспетчер задач для вычислительного сервера в Debian
Недавно наш университет приобрел вычислительный сервер с одной многоядерной видеокартой Xeon и 4 мощными видеокартами GeForce для занятий по дисциплине "Высокопроизводительные вычисления с CUDA". На нем есть Debian Squeeze. Я пытаюсь найти решение д…
14 апр '11 в 05:26