Почему мой экземпляр группы автоматического масштабирования нездоров?

Я заметил очень странную проблему с группой автоматического масштабирования AWS.

Экземпляры сообщаются (неправильно) как нездоровые. Затем экземпляры закрываются и заменяются без необходимости. Это вызывает проблемы, потому что он оставляет ASG с недостаточной пропускной способностью, чтобы справиться с нагрузкой.

Чтобы попытаться определить проблему, я временно приостановил процесс "Завершение" для ASG.

Прямо сейчас у меня есть один случай в группе, который, по мнению ASG, является нездоровым. Вход в экземпляр и проверка работоспособности напрямую доказывают, что он действительно исправен.

Кроме того, балансировщики нагрузки, связанные с ASG, также сообщают обо всех экземплярах как исправные.

Мой вопрос Как мой ASG может считать экземпляр "НЕЗДОРОВЫМ", если тип проверки работоспособности для группы установлен на "ELB", а подсистемы балансировки нагрузки сообщают, что экземпляр исправен?

Могу ли я узнать, когда и почему ASG помечала экземпляры как "нездоровые"?

Эта ASG в настоящее время ассоциируется с 2 классическими ELB и 2 целевыми группами ALB. Мы находимся в процессе перехода с ELB на ALB.

Как уже упоминалось, и ELB, и обе целевые группы сообщают обо всех случаях как исправные.

1 ответ

Решение

Я предполагаю, что проблемы возникают из-за наличия части экземпляра нескольких ELB / ALB TG. Я подозреваю, что любой из этих ELB / ALB может затем инициировать завершение экземпляра, если он сочтет его нездоровым по какой-либо причине.

Измените тип проверки работоспособности на EC2, пока не закончите миграцию.

Рекомендуется использовать ASG только для одного балансировщика нагрузки.

Надеюсь, это поможет:)

Другие вопросы по тегам