Как найти причину еженедельного простоя на веб-сервере Ubuntu, размещенном на AWS?

Мы начали мониторинг нашего веб-сервера с помощью Pingdom и обнаружили, что каждое воскресенье в 0:00 по Гринвичу у нас время простоя составляет несколько минут.

Тест выполняется каждую минуту и ​​проверяет, возвращен ли успешный HTTP-ответ (код 200) на порт 80. Тест не пройден из-за тайм-аута (нет ответа через 30 секунд).

Вот что мы уже проверили - безуспешно:

  • Поскольку мы запускаем наш веб-сервер за балансировщиком нагрузки, я установил тест Pingdom на общедоступном DNS балансировщика нагрузки и общедоступном DNS веб-сервера, чтобы выяснить, есть ли проблема с балансировщиком нагрузки AWS - оба теста возвращают один и тот же результат.

  • Мы создали Munin на нашем веб-сервере. Все выглядело хорошо даже после сбоя. Поскольку последний сбой длился всего 2 минуты, я полагаю, что Мунин не смог выявить потенциальную проблему (он проверяет только каждые 5 минут)

  • Я проверил /var/log/apache2/error.log и /var/log/syslog на наличие подозрительных записей

  • Я проверил /etc/cron.weekly и /etc/crontab на наличие подозрительных записей

  • Я искал файлы, созданные или последние изменения в течение 0:00 и 0:15, используя этот метод:

    touch -t 201209020000 начало
    touch -t конец 201209020015
    найти / -новый старт -и! -новый конец

    (Ничего не найдено)

Кто-нибудь сталкивался с подобной проблемой? Любые предложения о том, как найти причину такого поведения?

Это Ubuntu 10.04 LTS, работающая на экземпляре AWS m1.large.

Спасибо!

1 ответ

Есть некоторые сообщения, что процесс update-apt-xapi отнимает много ресурсов процессора за пару минут. Он работает по недельному графику. Он может снять вашу коробку, если обычная нагрузка также высока. Команда запускает update-apt-xapian-index для обновления индекса пакетов программного обеспечения.

Смотрите несколько подсказок для обходных путей здесь: http://empoccz.wordpress.com/2012/01/02/ubuntu-update-apt-xapi-takes-lot-of-cpu-usage-ii/ или https: // askubuntu. ком / вопросы / 79481/100-это-CPU-использование безвреден-то время-обновления-APT-XAPI-пробеги

Другие вопросы по тегам