Почему мой экземпляр группы автоматического масштабирования нездоров?
Я заметил очень странную проблему с группой автоматического масштабирования AWS.
Экземпляры сообщаются (неправильно) как нездоровые. Затем экземпляры закрываются и заменяются без необходимости. Это вызывает проблемы, потому что он оставляет ASG с недостаточной пропускной способностью, чтобы справиться с нагрузкой.
Чтобы попытаться определить проблему, я временно приостановил процесс "Завершение" для ASG.
Прямо сейчас у меня есть один случай в группе, который, по мнению ASG, является нездоровым. Вход в экземпляр и проверка работоспособности напрямую доказывают, что он действительно исправен.
Кроме того, балансировщики нагрузки, связанные с ASG, также сообщают обо всех экземплярах как исправные.
Мой вопрос Как мой ASG может считать экземпляр "НЕЗДОРОВЫМ", если тип проверки работоспособности для группы установлен на "ELB", а подсистемы балансировки нагрузки сообщают, что экземпляр исправен?
Могу ли я узнать, когда и почему ASG помечала экземпляры как "нездоровые"?
Эта ASG в настоящее время ассоциируется с 2 классическими ELB и 2 целевыми группами ALB. Мы находимся в процессе перехода с ELB на ALB.
Как уже упоминалось, и ELB, и обе целевые группы сообщают обо всех случаях как исправные.
1 ответ
Я предполагаю, что проблемы возникают из-за наличия части экземпляра нескольких ELB / ALB TG. Я подозреваю, что любой из этих ELB / ALB может затем инициировать завершение экземпляра, если он сочтет его нездоровым по какой-либо причине.
Измените тип проверки работоспособности на EC2, пока не закончите миграцию.
Рекомендуется использовать ASG только для одного балансировщика нагрузки.
Надеюсь, это поможет:)