qdel удаляет все мои работы
Я использую Sun GridEngine (Rocks Cluster) на сервере для запуска удаленных заданий.
Когда я пытаюсь удалить работу с qdel
, он часто работает как положено, но время от времени он просто удаляет почти все, что находит.
Например, сегодня у меня было 77 рабочих мест:
[znorg @ server MD]$ qstat job-ID предыдущее имя пользовательское состояние submit / start в слотах очереди ja-task-ID ----------------------------------------------------------------------------------------------------------------- 7711 0.55500 shg_oAll_c znorg dr 30.10.2012 13:49:07 all.q@compute-0-22.local 1 7712 0,55500 shg_oCAB_c znorg dr 30.10.2012 13:49:07 all.q@compute-0-22.local 1 7873 0,55500 a1h3l_prdA znorg r 11/08/2012 13:37:22 all.q@compute-0-0.local 1 7874 0,55500 a1t8k_obsA znorg r 08.08.2012 13:37:22 all.q@compute-0-18.local 1 7875 0,55500 a1t8k_prdA znorg r 08.11.2012 13:37:37 all.q@compute-0-15.local 1 7877 0.55500 a3zr8_prdA znorg r 08.11.2012 13:37:37 all.q@compute-0-17.local 1 7878 0.55500 b1nez_obsA znorg r 08.11.2012 13:37:52 all.q@compute-0-23.local 1 7880 0.55500 b2j73_obsA znorg r 11.08.2012 13:37:52 all.q@compute-0-20.local 1 (...) 7955 0.55500 b2qcp_prdE znorg r 08.08.2012 13:44:07 all.q@compute-0-32.local 1 7956 0.55500 c3o2e_obsE znorg r 11.08.2012 13:44:22 all.q@compute-0-29.local 1 7960 0,55500 c3zzp_obsE znorg r 08.11.2012 13:44:37 all.q@compute-0-27.local 1 7995 0,55500 s1enh_prdA znorg r 22.11.2012 16:06:24 all.q@compute-0-33.local 1 7996 0.55500 s1igd_prdA znorg r 22.11.2012 16:06:39 all.q@compute-0-33.local 1 7997 0.55500 s1ixs_prdA znorg r 22.11.2012 16:06:39 все.q@compute-0-33.local 1 (...) 8008 0,55500 s1igd_prdD znorg r 22.11.2012 16:07:39 all.q@compute-0-5.local 1 8009 0,55500 s1ixs_prdD znorg r 11/22/2012 16:07:39 all.q@compute-0-13.local 1 8010 0,55500 s1shg_prdD znorg r 22.11.2012 16:07:39 all.q@compute-0-31.local 1
Я хотел удалить последние 16 заданий, поэтому набрал:
[znorg @ server MD] $ qdel 7995 7996 7997 7998 7999 8000 8001 8002 8003 8004 8005 8006 8007 8008 8009 8010
Который вернулся:
znorg зарегистрировал работу 7995 для удаления znorg зарегистрировал работу 7996 для удаления znorg зарегистрировал работу 7997 для удаления znorg зарегистрировал вакансию 7998 для удаления znorg зарегистрировал работу 7999 для удаления znorg зарегистрировал работу 8000 для удаления znorg зарегистрировал работу 8001 для удаления znorg зарегистрировал работу 8002 для удаления znorg зарегистрировал работу 8003 для удаления znorg зарегистрировал работу 8004 для удаления znorg зарегистрировал работу 8005 для удаления znorg зарегистрировал работу 8006 для удаления znorg зарегистрировал работу 8007 для удаления znorg зарегистрировал вакансию 8008 для удаления znorg зарегистрировал вакансию 8009 для удаления znorg зарегистрировал работу 8010 для удаления
Пока все хорошо, похоже, что все идет так, как ожидалось.
Но потом, когда я проверил еще раз, почти все другие рабочие места исчезли:
[znorg @ сервер MD]$ qstat идентификатор задания предыдущее имя пользовательское состояние submit / start в слотах очереди ja-task-ID ----------------------------------------------------------------------------------------------------------------- 7712 0.55500 shg_oCAB_c znorg dr 30.10.2012 13:49:07 all.q@compute-0-22.local 1 7893 0,55500 a1t8k_prdB znorg r 08.11.2012 13:39:07 all.q@compute-0-16.local 1 7929 0,55500 a1t8k_prdD znorg r 08.11.2012 13:42:07 all.q@compute-0-16.local 1
Я делаю что-то неправильно? Что здесь может происходить?
1 ответ
Кажется, что работа закончена. Я не вижу ничего плохого в вашей команде qdel. И по числам, которые вы получаете в конце, похоже, что это не qdel action. Вы можете проверить информацию о работе по:
qacct -o znorg -j Job-ID