Ганглия не обновляет график
Я начал замечать, что мой веб-интерфейс не обновил график за часы. Каждый раз, когда я перезагружаю gmond
процесс на моих клиентах, я вижу, что графики работают. Я вернулся через час или около того, и мой график пуст, просто белый график, и ничего не было обновлено. если я запустил его снова, он работает просто отлично. Я не уверен, что это такое.
Моя установка выглядит следующим образом.
Клиент -> Gmond Collector -> Gmeta/ веб-хостинг
gmetad.conf
data_source "ENG1" 10.199.1.110
data_source "ENG2" 10.199.19.100
data_source "QA" 10.199.10.200
gmond.conf от 10.199.10.200
globals {
daemonize = yes
setuid = yes
user = nobody
debug_level = 0
max_udp_msg_len = 1472
mute = no
deaf = no
allow_extra_data = yes
host_dmax = 0 /*secs */
cleanup_threshold = 300 /*secs */
gexec = no
send_metadata_interval = 0 /*secs */
}
cluster {
name = "QA"
}
udp_send_channel {
host = 10.199.10.200
port = 8649
ttl = 1
}
udp_recv_channel {
port = 8649
}
** gmond.conf Нет, мои файлы клиента такие же, как указано выше, за исключением того, что он не имеет udp_recv_channel
блок определен. Я перенаправил состояния из моего клиента в сборщик (например, 10.199.10.200), который затем получает сервер gmeta (10.199.1.110). Этот сервер также собирает данные от группы серверов, определенных как "ENG1".
3 ответа
Я столкнулся с этой проблемой, когда Ganglia установлен на Ubuntu. Согласно документу, это звучит как потерянные метаданные и не знает, что делать с метрическими данными. Поскольку вы настраиваете Ganglia в режиме одноадресной рассылки, вам нужно указать gmond периодически отправлять метаданные, изменяя send_metadata_interval
к ненулевому значению:
globals {
daemonize = yes
setuid = yes
user = ganglia
debug_level = 0
max_udp_msg_len = 1472
mute = no
deaf = no
allow_extra_data = yes
host_dmax = 0 /*secs */
cleanup_threshold = 300 /*secs */
gexec = no
send_metadata_interval = 30 /*secs */
}
Попробуйте!
Прочитайте больше:
http://sourceforge.net/apps/trac/ganglia/wiki/ganglia_release_notes
3.1. Коллекторы будут запрашивать gmond при необходимости повторно отправить информацию описания метрики, и если используется многоадресная рассылка, если вы используете одноадресную рассылку, способа сделать это пока нет, и поэтому, если вы перезапустите коллектор, у вас останутся частичные данные или нет данных из кластера. это собирается через него, пока все gmond в этом кластере не будут перезапущены. Чтобы обойти эту проблему при использовании настройки одноадресной рассылки
send_metadata_interval
до разумного значения, чтобы все gmond периодически отправляли свои метаданные сборщику в случае их утери.
http://sourceforge.net/apps/trac/ganglia/wiki/FAQ
В последних версиях gmond (3.1.x) новая глобальная переменная была добавлена в
gmond.conf
называетсяsend_metadata_interval
, с настройкой по умолчанию 0. Цель состояла в том, чтобы уменьшить сетевой трафик. В 3.1 данные метрики отправляются отдельно от метаданных, например, метаданные содержат подробное описание, группировку, другие возможные настройки. Нулевое значение означает, что gmond отправит метаданные при запуске, а не в другое время (что согласуется с более ранними версиями ganglia).Если вы планируете использовать одноадресный режим, установите
send_metadata_interval
было обнаружено, что в большинстве случаев надежно работает 30-60 секунд. Установка этой переменной в ненулевое значение заставит процессы gmond периодически объявлять свои метрики, и графики будут появляться на странице просмотра хоста.
Я изменил конфиг, чтобы использовать мульти-каст, и теперь он работает!