Описание тега slurm

1 ответ

Что именно означает "минуты процессора"?

Я на самом деле пытаюсь сообщить об использовании кластера в Slurm, но я не понимаю метрических минут процессора. [root@XXXX]# sreport cluster Utilization Start=2018-12-01 End=2018-12-31 --------------------------------------------------------------…
07 янв '19 в 10:39
1 ответ

Невозможно связаться с контроллером грязи

Я следовал инструкциям по устранению неполадок здесь: https://slurm.schedmd.com/troubleshoot.html. При запуске scontrol show slurmd я получаю: Active Steps = NONE Actual CPUs = 1 Actual Boards = 1 Actual sockets = 1 Actual cores = 1 Actual threads p…
28 мар '19 в 22:16
1 ответ

slurmdbd не запускается (первоначальная установка)

Я пытался установить slurmdbd для учета на Ubuntu 16.04 из стандартных репозиториев (версия: 15.08.7-1build1). Вот команды: $ sudo apt-get install mysql-server $ sudo mysql > create user 'slurm'@'localhost' identified by '123456'; > grant all …
06 фев '18 в 07:47
1 ответ

Ошибка демона узла Slurm: не удается открыть файл PID

Я бегу systemctl start slurmd.serviceи время ожидания истекло: Job for slurmd.service failed because a timeout was exceeded. Соответствующие строки из бега systemctl status slurmd.service: Mar 23 17:13:42 fedora1 systemd[1]: Starting Slurm node daem…
23 мар '19 в 22:29
0 ответов

Slurm не фильтрует результаты священных по дате

Мы используем Slurm в качестве менеджера ресурсов в нашем кластере Beowulf, поэтому я установил Slurm на свою рабочую станцию, чтобы протестировать свои сценарии, прежде чем отправлять их в кластер. Когда я пытаюсь перечислить старые рабочие места н…
15 июн '17 в 17:36
0 ответов

Как настроить работу с несколькими узлами для приложения spark через командный файл?

Я попробовал следующий скрипт, но похоже, что есть некоторые ошибки. Может кто-нибудь сказать мне, пожалуйста, если я что-то упустил в этой конфигурации выше? #!/bin/bash #SBATCH --nodes=2 #SBATCH --time=00:20:00 #SBATCH --mem=80G #SBATCH --cpus-per…
01 май '19 в 14:30
0 ответов

Как настроить параметр искровой работы в соответствии с доступными узлами?

Как я могу установить --num-executors, --executor-cores а также --executor-memory через задание по сланму в следующем сценарии: Предположим, у меня есть 2 узла с 32 ядрами и 128 г каждый. Лучшая конфигурация (я думаю) будет: Давайте назначим 4 ядра …
01 май '19 в 12:50
0 ответов

Программа на кластере превышает предел памяти RSS

Я пытался запустить скрипт Python на кластере компьютеров, но продолжаю сталкиваться с ошибкой, сообщающей, что предел памяти RSS превышен. Я использую эту программу для анализа набора данных, состоящего из около 40000 случаев. Я попробовал его на с…
29 сен '17 в 14:43
1 ответ

Как обновить Slurm?

Меня попросили обновить нашу установку Slurm Workload Manager. У меня есть slurm 2.3.4 на узкий кластер Debian 7.0 (1 мастер + 8 узлов). Я не установил его, поэтому я немного озадачен тем, как это сделать и как действовать, не разрушая ничего. (Я не…
03 окт '17 в 13:31
0 ответов

SLURM, SSH, ADN NOHUP Поведение

Я являюсь администратором кластера, работающего на CentOS и использующего SLURM для отправки заданий с узла входа в систему для вычисления узлов. Недавно пользователь пожаловался на неожиданное поведение при работе. Если пользователь начинает работу…
11 дек '17 в 22:11
1 ответ

Проблема с установкой slurm на Fedora 29

Когда я бегу slurmdДает -bash: slurmd: command not found, Я побежал sudo yum install slurm установить грязь. Я не знаю, почему это не работает, или я установил все необходимые пакеты для slurm.
22 мар '19 в 23:10
0 ответов

Slurm - поддерживает ли он ccNUMA?

Контролирует ли кластер SLURM, поддерживает или обеспечивает согласованность кэша по узлам? Это свойство конфигурации, или что-то подобное не существует? Я не могу найти ничего внутри документов.
29 апр '19 в 20:39
3 ответа

Рандомизировать распределение узла Slurm

Кому-нибудь повезло с рандомизацией распределения узлов Slurm? У нас есть небольшой кластер из 12 узлов, который может использоваться от 1 до 8 человек одновременно с заданиями различного размера / длины. При тестировании нашей новой настройки Slurm…
30 окт '17 в 23:14
1 ответ

Разрешить другим пользователям отменять вакансии

У меня есть тестовый кластер со Slurm, в котором я хотел бы, чтобы другие пользователи могли отменять задания других пользователей. По умолчанию пользователи могут отменить свою работу. Как я могу определить несколько администраторов? Моя конфигурац…
13 авг '18 в 09:20
1 ответ

Как запретить запуск дополнительных заданий данного пользователя?

С помощью диспетчера рабочей нагрузки Slurm, как я могу предотвратить больше заданий от пользователя bob с начала? Существующие задания должны продолжать выполняться. Пользователь должен иметь возможность отправлять больше заданий, но он не должен з…
25 окт '17 в 17:31
0 ответов

Предел раздела slurm для большой работы памяти

У меня есть два пула узлов, один для вычислений по умолчанию, а другой для приложений с большой памятью. default <- nodes[1-40] bigmem <- mem[1-8] Как настроить ограничение раздела по умолчанию, чтобы, если задание запрашивает более 30 ГБ памя…
14 мар '19 в 20:35