Решение Uptime Monitoring, которое открывает постоянное сокетное соединение?

Я хочу контролировать некоторые серверы, и некоторые из них могут иметь очень нестабильную связь.

Это потому, что они расположены в офисах, где есть только потребительский доступ в Интернет.

Меня беспокоит обычный подход - проверка http или что-то каждую минуту или другой интервал - короткие перебои, которые могут быть незаметны, поскольку они происходят между проверками, но могут привести к отсутствию чувствительных служебных соединений или их полному прерыванию.,

На самом деле такие проблемы у нас возникают, я уже часами кричу в телефонной компании.

В настоящее время мы оцениваем возможность получить прямую связь с оператором связи до уровня (3), что было бы довольно здорово и сделало бы мою жизнь намного проще.

Но для этого мне нужны надежные цифры, а не расплывчатые отчеты об опыте.

Поэтому мне бы хотелось, чтобы какой-то монитор работоспособности, который открывает сокетное соединение, оставлял его открытым и запрашивал ответ в довольно короткий промежуток времени (20 секунд).

Когда нет ответа, соединение должно быть прервано с момента последней проверки.

Я бы также использовал этот подход для "лучшего" мониторинга серверов в будущем.

Итак, мои вопросы:

  • Что-то не так с моим пониманием того, как работают сети - это хорошая идея?
  • Есть ли какое-то решение, которое я могу использовать сразу или я должен сделать это сам?

2 ответа

Решение

Я думаю, что вам следует подходить к мониторингу с точки зрения потери пакетов и задержки. Вы можете использовать некоторые инструменты, чтобы постоянно пинговать каждую секунду, и другой инструмент, такой как Nagios, для отправки электронной почты о проблемах, превышающих заданный период. Объедините это с некоторыми хорошо продуманными внешними контрольными точками, чтобы дать более широкую картину того, что терпит неудачу, когда, и вы должны получить хорошие метрики для борьбы со своим углом.

Почему бы не отслеживать все важные сервисы, а не просто пинг. Проверьте sql, http, ldap (или любой другой). Большинство инструментов мониторинга сегодня могут выполнять глубокие сервисные проверки. Тогда вы можете меньше заботиться о соединении, просто приложения работают хорошо.

Другие вопросы по тегам