OGE нет значения для load_avg

Существует проблема с моей конфигурацией OGE. Load_avg для узлов не устанавливается (остается в -NA-). Из-за этого и из-за порога np_load_avg в очереди никакие задания не выполняются.

[ce@node1 ce]$ qhost -F -l h=node2
HOSTNAME                ARCH         NCPU  LOAD  MEMTOT  MEMUSE  SWAPTO  SWAPUS
-------------------------------------------------------------------------------
node2                   -               -     -       -       -       -       -

Никаких ошибок не появляется ни в default / spool / localhost / messages, ни в qmaster / messages. Сообщение планирования очереди - "нет значения для сложного атрибута np_load_avg".

Я не вижу никаких указаний относительно того, что может идти не так, на узле выполнения работает следующее:

  • gethostname
  • мастер gethostbyname
  • qstat -f
  • loadcheck

1 ответ

Проблема была в моем файле /etc/hosts, у меня было:

127.0.0.1 node2

это должно было стать:

10.0.0.2    node2

Наконец, давая мне

[ce@node1 ce]$ qhost -F -l h=node2
HOSTNAME                ARCH         NCPU  LOAD  MEMTOT  MEMUSE  SWAPTO  SWAPUS
-------------------------------------------------------------------------------
node2                   linux-x64       8  0.00   31.3G  308.8M   11.9G     0.0

а также

[ce@node2 ce]# utilbin/linux-x64/gethostname 
Hostname: node2
Aliases:  
Host Address(es): 10.0.0.2 
Другие вопросы по тегам