Ганглия не обновляет график

Я начал замечать, что мой веб-интерфейс не обновил график за часы. Каждый раз, когда я перезагружаю gmond процесс на моих клиентах, я вижу, что графики работают. Я вернулся через час или около того, и мой график пуст, просто белый график, и ничего не было обновлено. если я запустил его снова, он работает просто отлично. Я не уверен, что это такое.

Моя установка выглядит следующим образом.

Клиент -> Gmond Collector -> Gmeta/ веб-хостинг

gmetad.conf

data_source "ENG1" 10.199.1.110
data_source "ENG2" 10.199.19.100
data_source "QA" 10.199.10.200

gmond.conf от 10.199.10.200

globals {
    daemonize = yes
    setuid = yes
    user = nobody
    debug_level = 0
    max_udp_msg_len = 1472
    mute = no
    deaf = no
    allow_extra_data = yes
    host_dmax = 0 /*secs */
    cleanup_threshold = 300 /*secs */
    gexec = no
    send_metadata_interval = 0 /*secs */
}

cluster {
    name = "QA"    
}

udp_send_channel {
    host = 10.199.10.200
    port = 8649
    ttl = 1
}

udp_recv_channel {
    port = 8649
}

** gmond.conf Нет, мои файлы клиента такие же, как указано выше, за исключением того, что он не имеет udp_recv_channel блок определен. Я перенаправил состояния из моего клиента в сборщик (например, 10.199.10.200), который затем получает сервер gmeta (10.199.1.110). Этот сервер также собирает данные от группы серверов, определенных как "ENG1".

3 ответа

Решение

Я столкнулся с этой проблемой, когда Ganglia установлен на Ubuntu. Согласно документу, это звучит как потерянные метаданные и не знает, что делать с метрическими данными. Поскольку вы настраиваете Ganglia в режиме одноадресной рассылки, вам нужно указать gmond периодически отправлять метаданные, изменяя send_metadata_interval к ненулевому значению:

globals {
  daemonize = yes
  setuid = yes
  user = ganglia
  debug_level = 0
  max_udp_msg_len = 1472
  mute = no
  deaf = no
  allow_extra_data = yes
  host_dmax = 0 /*secs */
  cleanup_threshold = 300 /*secs */
  gexec = no
  send_metadata_interval = 30 /*secs */
}

Попробуйте!

Прочитайте больше:

http://sourceforge.net/apps/trac/ganglia/wiki/ganglia_release_notes

3.1. Коллекторы будут запрашивать gmond при необходимости повторно отправить информацию описания метрики, и если используется многоадресная рассылка, если вы используете одноадресную рассылку, способа сделать это пока нет, и поэтому, если вы перезапустите коллектор, у вас останутся частичные данные или нет данных из кластера. это собирается через него, пока все gmond в этом кластере не будут перезапущены. Чтобы обойти эту проблему при использовании настройки одноадресной рассылки send_metadata_interval до разумного значения, чтобы все gmond периодически отправляли свои метаданные сборщику в случае их утери.

http://sourceforge.net/apps/trac/ganglia/wiki/FAQ

В последних версиях gmond (3.1.x) новая глобальная переменная была добавлена ​​в gmond.conf называется send_metadata_interval, с настройкой по умолчанию 0. Цель состояла в том, чтобы уменьшить сетевой трафик. В 3.1 данные метрики отправляются отдельно от метаданных, например, метаданные содержат подробное описание, группировку, другие возможные настройки. Нулевое значение означает, что gmond отправит метаданные при запуске, а не в другое время (что согласуется с более ранними версиями ganglia).

Если вы планируете использовать одноадресный режим, установите send_metadata_interval было обнаружено, что в большинстве случаев надежно работает 30-60 секунд. Установка этой переменной в ненулевое значение заставит процессы gmond периодически объявлять свои метрики, и графики будут появляться на странице просмотра хоста.

Я изменил конфиг, чтобы использовать мульти-каст, и теперь он работает!

Попробуйте добавить: tcp_accept_channel { port = 8649 }

Другие вопросы по тегам