Зачем использовать ограждение, если у вас уже есть избыточные каналы связи?
В этой статье говорится, что вы должны использовать как ограждение (также известное как STONITH), так и избыточные каналы связи. Я пытаюсь понять, какие преимущества дает STONITH в случае расщепления мозга. Предположим, например, что у вас есть узел A, узел B, устройство STONITH, которые подключены с помощью коммутатора I. Если коммутатор I умирает - сеть разделена - и узел A не может отправить запрос на устройство STONITH, поэтому он бесполезен.
Хорошо, у нас может быть выделенный коммутатор II, который соединяет узлы с устройством STONITH. Если коммутатор I не работает, мы все еще можем отправить сигнал на устройство STONITH, и он может отключить узел B.
Но вопрос в том, почему бы просто не использовать коммутатор II в качестве резервного канала связи между узлом A и узлом B? Если коммутатор I выходит из строя, вы все равно можете использовать коммутатор II, и нет необходимости выключать узел B.
1 ответ
Идея состоит в том, что, когда ваш кластер решает, что он требует отработки отказа узла, с этим узлом должно быть что-то не так.
Ограждение, стрельба по другому узлу в голове (STONITH) - лучшая гарантия того, что вышедший из строя узел освободит все ресурсы, которые он держал, и есть вероятность, что, если проблема была связана с программным обеспечением, она будет исправлена путем аппаратного сброса, который хороший бонус...
Вы обычно создаете кластер, потому что кластерная служба не поддерживает его одновременный запуск, а когда два экземпляра работают одновременно, все идет ужасно неправильно. Много усилий направлено на предотвращение этого. Высокая доступность часто является отдаленной секундой в ваших приоритетах как дизайнера кластера.