Есть ли способ получить отказоустойчивую конфигурацию сети, когда сеть выходит из строя?

Вопрос

При удаленном изменении сетевых конфигураций, существует ли способ для сети попытаться использовать другой файл конфигурации в случае сбоя?

Фон - тлдр;

Я искал вокруг, но на самом деле я не вижу каких-либо ссылок на что-то вроде передачи файла в ifup, хотя и сказал, что это дало мне идею проверить страницу руководства для ifup, но безотносительно. Я не могу проверить это прямо сейчас.

Наш сервер был перенесен в центр обработки данных, а я здесь работаю в другом городе. Сетевое взаимодействие не является моей сильной стороной, и после установки я хотел соединить два сетевых интерфейса для повышения пропускной способности. Но при этом я потерял связь, так как сетевой интерфейс не прошел инициализацию.

Я пытался настроить связь, чтобы иметь в / etc / sysconfig / network-scripts

bond0: получение eth0 и eth1 eth0: установка на связь eth1: установка на связь, а затем eth1:1, думая, что я могу связать IP с этим на случай, если меня снова заблокируют...

К сожалению, это не сработало, и единственный человек, достаточно квалифицированный, чтобы пойти в центр обработки данных для поддержки, - мой начальник. Не очень хорошая ситуация. (И я дважды проверил его на виртуальном сервере, чтобы убедиться, что не потеряю связь)

Теперь мы связали его, но, насколько я могу судить, не существует способа выполнить конфигурацию "на всякий случай"...

Таким образом, сегодня мне нужно было соединить соединение для виртуальной машины внутри сервера... Но вот, я снова потерял связь, и это моя вторая поездка, которую мой босс совершит в этом месяце в центре обработки данных.: Facepalm:

Должен быть способ, при котором, если интерфейс не обнаружен как работающий, что сеть будет использовать совершенно другой набор конфигурационных файлов, отказоустойчивый, если хотите, чтобы после неудачной попытки сети задание cron запускалось каждые пять минут восстановит сетевое подключение к отказоустойчивому, если сеть не работает.

Хотелось бы, чтобы у меня был доступ к linux box прямо сейчас, но я обычно проверяю сеть, выполняя команду service network restart. Есть ли способ дать ему команду отказоустойчивости, которая, если сеть не обнаружена, что она, в свою очередь, попробует другую конфигурацию отказоустойчивости, пока она не будет запущена.

1 ответ

tl;dr: зайдите с OOB, посмотрите на управление конфигурацией, или вам нужно будет создать собственное решение.

Я не знаком с чем-то заранее созданным в linux-land, чтобы делать подобные вещи - IPMI/ILOM/OOB, как правило, это путь. У вас будет не только удаленный консольный доступ к хосту, но вы также можете (обычно) проверить состояние оборудования, выполнить удаленную перезагрузку, если она жестко заблокирована, и т. Д. И т. Д.

Если OOB не подходит, вы можете подумать о создании задания cron для проверки различных сценариев и определения того, находится ли ваш хост в недоступном состоянии, и выполнения задач, чтобы попытаться восстановить себя.

Конечно, есть большие риски. Вы должны рассмотреть множество различных сценариев - скажем, вы хотите проверить, чтобы убедиться, что вы можете подключиться к IP-адресу вашего шлюза, но ваш шлюз ненадолго уходит - вы не хотите, чтобы ваш хост перенастраивал свой интерфейс, если это не проблема. с вашей коробкой, но что-то вверх по течению.

Существует также возможность управления конфигурацией, которую вы можете настроить для восстановления вашего локального компьютера до ожидаемого состояния / проверки его в ожидаемом состоянии каждый час и т. Д. - вам придется настраивать эти приложения для использования локальной копии файлов конфигурации, а не чем пытаться поговорить с удаленным сервером, но это возможно. Это может быть немного чрезмерно в зависимости от того, сколько систем вы управляете (и если их больше 5, я настоятельно рекомендую изучить управление конфигурацией в целом, это сэкономит вам МНОГО времени).

Если вы чувствуете, что хотите пойти по пути наличия какого-либо сценария на мониторе коробки для изменений, я настоятельно рекомендую вам установить его в режиме пробного запуска на некоторое время. Таким образом, вы можете записать его в журнал, когда он подумает, что необходимо перенастроить сетевой интерфейс, что позволит вам отладить / протестировать / проверить работоспособность, прежде чем запустить его в эксплуатацию.

Более того, вы можете иметь 2-й или 3-й интерфейс (поскольку вы хотите соединиться), подключенный к вашему хосту, и либо никогда не трогать эту конфигурацию интерфейса, либо ваш сценарий только попытается восстановить свою работу с использованием этого интерфейса - таким образом, если он идет наперекосяк, он потенциально не портит интерфейсы, которые он считает плохими, а всего лишь третий интерфейс, который вы используете только для этой цели.

Другие вопросы по тегам