Лучшая стратегия для поддержки активности на балансировщике нагрузки LVS
У нас есть балансировщики нагрузки виртуального сервера Linux, распределяющие около 300 запросов в секунду на 2 пула из 4 серверов Windows, на которых работает IIS. Эти запросы в основном предназначены для содержимого, отображаемого на сервере (ASPX), зависимые файлы, такие как CSS и изображения, кэшируются в CDN. Для выпусков мы переводим по одному пулу в автономный режим, потому что наша система выпуска не может полностью переключать контент. Перевод пула в автономный режим занимает целых 5 минут, потому что мы ждем, пока не истощатся активные соединения, что в конечном итоге является основным стробирующим фактором для короткого времени освобождения. Я бы хотел, чтобы это время уменьшилось как можно ближе к нулю. Мне интересно, могут ли помочь следующие изменения:
- Мы могли бы уменьшить тайм-аут HTTP keep-alive, чтобы соединения истощались быстрее
- Мы просто не могли использовать HTTP keep-alives
Techops - не моя специальность, но информация, которую я видел о HTTP keep-alive, похоже, подразумевает, что мы просто не могли бы их использовать и не было бы никаких недостатков, учитывая нашу сетевую архитектуру. Команда techops по понятным причинам скептически относится к этому. Есть ли эффективный и безопасный способ сократить время выпуска в этом сценарии?