Какие инструменты существуют для автоматического восстановления после очень больших средних нагрузок в Linux?
По ряду разных причин в последние год или два у меня были проблемы с серверами, на которых выполняются процессы, которые обычно приводят к очень высокой средней нагрузке.
В этих случаях я часто могу пропинговать сервер, но он становится очень невосприимчивым к любым другим соединениям, и мне часто приходится включать и выключать компьютер.
Одной из причин такой огромной нагрузки является плохо настроенный процесс Apache на виртуальном сервере, который допускает слишком много одновременных подключений для выделенного ему оборудования, и я, кажется, сегодня вечером запускал некоторые программы на другом сервере, который, похоже, сделал нечто подобное.
Что меня интересует, так это то, что в linux есть инструменты, которые обнаруживают очень большую среднюю нагрузку и каким-то образом прерывают эти процессы, позволяя машине восстанавливаться после этого?
Мои извинения, если я не сформулировал это хорошо, я ценю, что это довольно открытый.
2 ответа
Мне кажется, что вы ответили на свой вопрос.
Одна из причин такой огромной нагрузки - плохо настроенный процесс Apache на виртуальном сервере...
Если у вас плохо настроенный сервер Apache, исправьте эту конфигурацию. Вы уже провели расследование, так что теперь вы должны выполнить правильное исправление. Сценарий для прерывания / перезапуска / уничтожения процессов, которые были запущены, - это только обходной путь.
Все это, как говорится - я не знаю ни одного инструмента, который бы делал то, что вы ищете. Но я не думаю, что вам нужен инструмент, вам нужна правильная конфигурация для системы, над которой вы работаете.
Баумгарт прав, что вы должны решить проблему. Однако, в качестве обходного пути, вы можете использовать скрипты monit execute, если средняя нагрузка становится слишком высокой. Это что-то вроде хака, так что это далеко не идеально. Вы также можете написать что-нибудь, чтобы сделать это относительно тривиально.