Почему происходит сбой этого Сервера?

Мой сервер падал 3 раза (2 раза меньше, чем 24 часа назад) и один раз 1 неделю назад. Каждый раз сервер не пинговал, пока хост не перезагрузил машину. Я думаю, это выделенный сервер на ServerPronto с 4 ГБ оперативной памяти, двух или четырехъядерным процессором с тактовой частотой 3,1 ГГц. Более чем достаточно мощности, чтобы справиться с нагрузкой в ​​тоннах процессора. В пуле буферов Innodb достаточно памяти (1,3 ГБ), чтобы в памяти была вся таблица MySQL с дополнительным пространством. APC имеет более чем достаточно памяти тоже.

У меня установлен новый Relic на моем сервере. Каждый из трех раз я проверял использование процессора, использование памяти, дисковое пространство, сетевой ввод-вывод, и все они были полностью стабильны. Я посмотрел на время ответа на запросы, и все они были минимально нормальными. Мой сервер получал 500 запросов в минуту в течение часа, который привел к сбою: это очень нормально для моего сервера. Затем, внезапно, без каких-либо всплесков, количество запросов в минуту уменьшилось до 0! Среднее значение загрузки было 0,05 (очень очень мало, но нормально для моего сервера), использование памяти было на уровне 30%, также нормально, сетевой ввод-вывод был на уровне 400 КБ / с, что также нормально. Дисковое IO было на 1-2%, тоже нормально. Файл журнала, должно быть, работал, потому что я вижу стандартные предупреждения в файлах журнала apache, но абсолютно никаких ошибок перед сбоем.

Последнее отключение произошло во время, когда мой трафик получает минимальное количество веб-трафика.

Кроме того, во время инцидентов не выполняются задания cron. Нет ошибок или предупреждений в журналах ошибок, журналах PHP/mysql во время завершения работы. На момент завершения работы сервера не было открыто ни IDE, ни SSH-соединения.

Каждый раз, когда происходит сбой, как только происходит перезагрузка, каждый работает снова.

Я использую одно и то же программное обеспечение в течение 2,5 лет на двух моих предыдущих хостах, и у меня не было подобных проблем. Кроме того, я не вносил никаких изменений в коде за последний месяц (для приложения, запущенного в данный момент).

Когда я впервые настроил эту машину с serverPronto около 1 месяца назад, у них возникла аппаратная проблема с кабелем к моей машине: не очень хорошее начало. Но они исправили это, и у меня не было никаких проблем в течение приблизительно 4 недель (за исключением 1 десятиминутного отключения, которое не требовало перезапуска сервера)

Учитывая всю эту информацию, означает ли это, что ServerPronto (мой хост) в настоящее время имеет проблемы с оборудованием на их стороне? или есть другая возможность.

1 ответ

Когда я впервые настроил эту машину с serverPronto около 1 месяца назад,

Плохие новости. У них все еще есть проблемы с оборудованием. Просто так.

Если у вас установлены правильные драйверы, то ответ будет тривиальным - задействовано сломанное оборудование.

Другие вопросы по тегам