Попытка установить Sun Grid Engine на Ubuntu 10.04 - не удается подключить больше исполнительных хостов

Я использую Ubuntu 10.04 и пытаюсь установить Sun Grid Engine из репозитория Ubuntu. Он работает на одной машине, я могу отправлять задания и т. Д. Но я не могу заставить его работать с любой другой машиной. Я добавил еще один исполнительный хост и установил gridengine-client gridengine-common gridengine-exec но это как-то не может общаться с мастером. Я даже отключил все брандмауэры, чтобы убедиться, что это не вызывает проблем.

Когда я пытаюсь qstat -f на мастер-узле я получаю:

queuename                      qtype resv/used/tot. load_avg arch          states
---------------------------------------------------------------------------------
standard@neuron1               BIP   0/0/2          0.04     lx26-amd64    
---------------------------------------------------------------------------------
standard@neuron2               BIP   0/0/2          -NA-     -NA-          au

Когда я перезапускаю deamon на узле neuron2, я получаю:

error: can't find connection
error: can't get configuration from qmaster -- backgrounding

Когда я пытаюсь бежать qstat -f с узла n2 (нейрон2) я получаю:

error: commlib error: access denied (server host resolves destination host "n1" as "neuron1")
error: unable to contact qmaster using port 6444 on host "n1"

У меня есть два имени хоста для этой машины, и похоже, что первая ошибка как-то связана с ней, но было бы странно, если бы она вызывала подобные проблемы. Я старался telnet n1 6444 и это соединяет.

Кто-нибудь знает, что здесь происходит? Я что-то пропустил?

1 ответ

Решение

Хорошо, проблема действительно была в двойных именах хостов. Когда я удалил один из них начал работать. Я откопаю его и попытаюсь выяснить, почему это так.

Другие вопросы по тегам