Как справиться с отказом головного узла MPI?
Есть приложение, которое начинается с mpirun. В случае сбоя вычислительного узла все процессы разрушаются, но если происходит сбой только головного узла (например, перезагрузка), то процессы будут зависать на вычислительных узлах. Как избавиться от зомби-процессов автоматически?