Отказ при сбое питания ЦОД

Недавно у нас вышли из строя наши центры обработки данных. Мы защищены SLA и используем DNS для перенаправления пользователей при обнаружении сбоя. DNS не предназначен для этого специально. Является ли это наиболее практичным способом преодоления отказа между центрами обработки данных? Рассматриваемый центр обработки данных находится в разных странах. Великобритания и США.

Кто-нибудь может дать совет по этому конкретному сценарию?

РЕДАКТИРОВАТЬ: Экономически эффективным, насколько это возможно, без BGP или других сложных систем, которые требуют добавления выделенного оборудования.

Спасибо

4 ответа

Решение

"Экономически эффективный, насколько это возможно, без BGP или других сложных систем" означает именно то, что у вас есть сейчас: отказоустойчивость DNS (с действительно низким TTL на записях). - Гетто, дешево и разумно эффективно.

При отсутствии дополнительной информации я бы сказал, что BGP (возможно, в сочетании с anycast), вероятно, является "лучшим" решением, но для этого потребуется настройка и обслуживание в обоих центрах обработки данных.

BGP. По сути, вы используете протокол BGP для объявления маршрута для вашей IP-сети. Обычный маршрут идет к центру обработки данных A. В случае сбоя центра обработки данных A BGP объявляет новый маршрут, который ведет к центру обработки данных B.

Так как это информация о маршрутизации в реальном времени, она почти прозрачна, в отличие от DNS, который требует распространения записей, истечения TTL и так далее...

Однако для этого требуется, чтобы вы управляли своим пулом IP-адресов с помощью собственных маршрутизаторов BGP. Вы должны обсудить это с вашим провайдером.

Очень хорошее и недорогое решение использует Zoneedit: он обнаруживает сервер, когда основной сервер не работает, и переключает DNS на резервный сервер.

В зависимости от того, насколько важно для вас время безотказной работы и сколько денег вы можете потерять за секунду простоя, вы можете инвестировать в развертывание Anycast. Если это не очень важно, использовать DNS будет хорошо.

Предполагая, что вы отправляете оба IP-адреса с запросом A, клиенты должны запрашивать второй отправленный IP-адрес, если первый отказывает, он просто добавит немного больше времени к запросу.

Другие вопросы по тегам