Работа с открытым исходным кодом / управление процессами / мониторинг / система управления

Я ищу решение с открытым исходным кодом для следующего:

У меня есть работа, которая должна работать постоянно. Задания - это приложения или сценарии. Если они терпят неудачу, их нужно перезапустить. Если они терпят неудачу, скажем, 10 раз подряд или в течение определенного периода времени, скажем, 1 час, они должны быть отменены, и уведомление должно быть отправлено в центральное хранилище. Если задания начинают нагреваться (с использованием процессора или памяти и т. Д.), Следует выдавать предупреждения, а затем убивать, если они становятся слишком горячими. Задания могут быть дополнительно запланированы для выполнения только в определенные часы.

Я знаю, что для этого должны быть открытые, независимые от платформы, высокоуровневые языки (т.е. реализованные в python и т. Д.) Сложные сервисные решения для этого, но я даже не уверен, что искать или что такое система называется. Я много гуглил, но пока не нашел чего-то такого.

1 ответ

Супервизор (написан на Python) будет делать большую часть того, что вы хотите из коробки. Его можно расширить с помощью других функций, используя API-интерфейс XML-RPC.

Другие вопросы по тегам