Sun Grid Engine: автоматическое завершение неактивных интерактивных заданий
Мы рассматриваем возможность использования Sun Grid Engine на небольшом вычислительном кластере. Прямо сейчас, текущая настройка довольно грубая и просто включает в себя привлечение людей ssh к открытой машине для выполнения их заданий.
Мы хотели бы разрешить интерактивные задания, поскольку это должно облегчить переход от запуска вручную заданий к запуску их с использованием qsub
, Но есть некоторые опасения, что, если мы это сделаем, люди могут случайно оставить свои интерактивные сеансы бездействующими и заблокировать запуск других заданий на машинах. Проблема не только теоретическая, так как ранее мы пытались использовать OpenPBS, и была проблема с людьми, открывающими интерактивную работу во время сеанса экрана и, по сути, стоящими на машине.
Есть ли способ настроить SGE для автоматического отключения неактивных интерактивных заданий? Похоже, что это было запрошено как улучшение ( выпуск №: 2447) еще в 2007 году. Но, похоже, запрос не был реализован.
2 ответа
Вы можете установить для SGE разумное время ожидания по умолчанию (h_rt), чтобы завершать сеансы после предварительно определенного предела.
Вы пытались перевести пользовательскую оболочку в режим ожидания на холостом ходу? Более подробная информация и примеры на http://www.cyberciti.biz/faq/linux-unix-login-bash-shell-force-time-outs/.
Найрмил имеет несколько хороших предложений. Другой вариант - ограничить количество машин, на которых можно запускать интерактивные задания. По сути, мы определяем некоторые узлы как "интерактивные" и помещаем в них очередь, которая переподписывает ресурсы узла, поэтому сразу несколько пользователей могут войти в систему. Пользователи могут в основном останавливаться там столько, сколько хотят, но если они хотят получить доступ к некоторым реальным ресурсам, им нужно предоставить правильную работу.