Ganglia - недостающие метрики для некоторых серверов

Недавно я установил Ganglia на свои серверы Ubuntu 16.04. Я в основном следовал инструкциям здесь.

Проблема в том, что rrd файлы для наборов метрик для некоторых серверов отсутствуют.

Самое главное, что нет метрик самого "главного" узла, кроме метрик графического процессора из плагина Nvidia.

Кто-нибудь может дать мне какой-нибудь совет по этому вопросу?

Кроме того, есть ли способ принудительно собрать все метрики, определенные хотя бы один раз сразу?

Спасибо!

1 ответ

Я разобрался с вопросом и решением.

man gmond.conf говорит:

If you have a large system with lots of metrics, you might experience UDP drops. This happens when gmond is not able to process the UDP fast enough from the network.
In this case you might consider changing your setup into a more distributed setup using aggregator gmond hosts.  Alternatively you can choose to create a bigger
receive buffer:

  udp_recv_channel {
    port = 6343
    buffer = 10485760
  }
B<buffer> is specified in bytes, i.e.: 10485760 will allow 10MB UDP
to be buffered in memory.

Note: increasing buffer size will increase memory usage by gmond

Я увеличил максимальный размер буфера приема UDP до 100 МБ, добавив net.core.rmem_max=104857600 в /etc/sysctl.conf (для постоянного эффекта) и работает sysctl -w net.core.rmem_max=104857600 что позволило мне изменить значение без перезагрузки.

А потом я добавил buffer атрибут со значением 104857600 в udp_recv_channel заблокировать и перезапустить gmond,

Другие вопросы по тегам