Сценарий аппаратного сбоя кластера ESXi 5x
Привет ребята инженеры.
У меня есть настройка кластера ESXi5.0 с 3 хостами ESXi. Теперь мне нужно создать контрольный пример для сбоя сетевого оборудования и предварительно выполнить тест в центре обработки данных.
My Setup:
1) 3 DELL R820 Servers (all identical in the configuration and hardware)
2) PHYSICAL: Pair of 1GB ports for vSphere Management Network (active/standby)
VIRTUAL: 1 VMkernel Port vmk0 on standard vSwitch0
3) PHYSICAL: Pair of 10GB ports for regular network communications between guests MESH(active/active using IP Hash load balancing connected to the redundant switches)
VIRTUAL: dvSwitch0 with exposed and needed VLANs.
4) PHYSICAL: Pair of 10GB for storage NFS/VMDK (active/passive, Failover Only with "Link Status Only" network failure detection connected to different switches)
VIRTUAL: 1 VMkernel port vmk1 connected to distibuted switch dvSwitch01
5) PHYSICAL: Pair of 10GB for storage (guest initiated) (active/active, load balancing is based on Port ID with "Link Status Only" network failure detection connected to different switches)
HA and DRS enabled.
Я планировал просто провести регулярное тестирование кабеля, но, возможно, не хватало некоторых факторов. Буду признателен за любые предложения и / или лучшие практики для проведения такого теста.
3 ответа
- Выключите хост. - Для проверки доступности и контроля доступа.
- Выключите питание. - Чтобы проверить отказоустойчивые ссылки.
- Отсоедините кабели данных и сети хранения данных независимо. - Для проверки устойчивости, балансировки нагрузки и состояния пульса / изоляции хранилища данных / хоста. Также отказоустойчивость контроллера хранилища.
Когда мы тестируем сценарии сбоев, мы начинаем с удаления отдельных проводов / волокон, затем целых сетевых адаптеров / адаптеров, затем серверов, а затем коммутаторов - то есть от малого к большому - просто потому, что если платформа не может справиться с малым, то тестирование в целом будет бессмысленным,
Тем не менее, я не вижу никаких проблем с вашей настройкой, не так, как вы объяснили в любом случае.
Я больше использую большой подход - отключите сервер и при следующей попытке хранения и на последнем коммутаторе - или в любом другом порядке - если система выживет, что -> все хорошо. Но если у вас есть много времени (и кто-то платит за это), вы можете попробовать каждую небольшую проблему самостоятельно...
отсчет по радионавигационной системе, полученный при использовании пространственной волны от ведущей станции и поверхностной волны от ведомой станции