OGE нет значения для load_avg
Существует проблема с моей конфигурацией OGE. Load_avg для узлов не устанавливается (остается в -NA-). Из-за этого и из-за порога np_load_avg в очереди никакие задания не выполняются.
[ce@node1 ce]$ qhost -F -l h=node2
HOSTNAME ARCH NCPU LOAD MEMTOT MEMUSE SWAPTO SWAPUS
-------------------------------------------------------------------------------
node2 - - - - - - -
Никаких ошибок не появляется ни в default / spool / localhost / messages, ни в qmaster / messages. Сообщение планирования очереди - "нет значения для сложного атрибута np_load_avg".
Я не вижу никаких указаний относительно того, что может идти не так, на узле выполнения работает следующее:
- gethostname
- мастер gethostbyname
- qstat -f
- loadcheck
1 ответ
Проблема была в моем файле /etc/hosts, у меня было:
127.0.0.1 node2
это должно было стать:
10.0.0.2 node2
Наконец, давая мне
[ce@node1 ce]$ qhost -F -l h=node2
HOSTNAME ARCH NCPU LOAD MEMTOT MEMUSE SWAPTO SWAPUS
-------------------------------------------------------------------------------
node2 linux-x64 8 0.00 31.3G 308.8M 11.9G 0.0
а также
[ce@node2 ce]# utilbin/linux-x64/gethostname
Hostname: node2
Aliases:
Host Address(es): 10.0.0.2