Почему происходит сбой этого Сервера?
Мой сервер падал 3 раза (2 раза меньше, чем 24 часа назад) и один раз 1 неделю назад. Каждый раз сервер не пинговал, пока хост не перезагрузил машину. Я думаю, это выделенный сервер на ServerPronto с 4 ГБ оперативной памяти, двух или четырехъядерным процессором с тактовой частотой 3,1 ГГц. Более чем достаточно мощности, чтобы справиться с нагрузкой в тоннах процессора. В пуле буферов Innodb достаточно памяти (1,3 ГБ), чтобы в памяти была вся таблица MySQL с дополнительным пространством. APC имеет более чем достаточно памяти тоже.
У меня установлен новый Relic на моем сервере. Каждый из трех раз я проверял использование процессора, использование памяти, дисковое пространство, сетевой ввод-вывод, и все они были полностью стабильны. Я посмотрел на время ответа на запросы, и все они были минимально нормальными. Мой сервер получал 500 запросов в минуту в течение часа, который привел к сбою: это очень нормально для моего сервера. Затем, внезапно, без каких-либо всплесков, количество запросов в минуту уменьшилось до 0! Среднее значение загрузки было 0,05 (очень очень мало, но нормально для моего сервера), использование памяти было на уровне 30%, также нормально, сетевой ввод-вывод был на уровне 400 КБ / с, что также нормально. Дисковое IO было на 1-2%, тоже нормально. Файл журнала, должно быть, работал, потому что я вижу стандартные предупреждения в файлах журнала apache, но абсолютно никаких ошибок перед сбоем.
Последнее отключение произошло во время, когда мой трафик получает минимальное количество веб-трафика.
Кроме того, во время инцидентов не выполняются задания cron. Нет ошибок или предупреждений в журналах ошибок, журналах PHP/mysql во время завершения работы. На момент завершения работы сервера не было открыто ни IDE, ни SSH-соединения.
Каждый раз, когда происходит сбой, как только происходит перезагрузка, каждый работает снова.
Я использую одно и то же программное обеспечение в течение 2,5 лет на двух моих предыдущих хостах, и у меня не было подобных проблем. Кроме того, я не вносил никаких изменений в коде за последний месяц (для приложения, запущенного в данный момент).
Когда я впервые настроил эту машину с serverPronto около 1 месяца назад, у них возникла аппаратная проблема с кабелем к моей машине: не очень хорошее начало. Но они исправили это, и у меня не было никаких проблем в течение приблизительно 4 недель (за исключением 1 десятиминутного отключения, которое не требовало перезапуска сервера)
Учитывая всю эту информацию, означает ли это, что ServerPronto (мой хост) в настоящее время имеет проблемы с оборудованием на их стороне? или есть другая возможность.
1 ответ
Когда я впервые настроил эту машину с serverPronto около 1 месяца назад,
Плохие новости. У них все еще есть проблемы с оборудованием. Просто так.
Если у вас установлены правильные драйверы, то ответ будет тривиальным - задействовано сломанное оборудование.