Неточные данные об использовании процессора vCenter Cluster

У нас достаточно "универсальный" ресурс vSphere, 80% наших серверов Windows/Linux виртуализированы и работают в шести центрах обработки данных. Одной из моих задач является среднесрочное и долгосрочное планирование емкости, благодаря которому я получаю достаточно денег на ежегодный прогноз Capex, чтобы обеспечить средства для модернизации хостов (обычно памяти), большего количества хостов (лицензий на оборудование и ESX) или расширения SAN в худшем случае.

Во всяком случае, до недавнего времени мне было вполне комфортно воспринимать статистику производительности vCenter как действительно отражающую происходящее. Я обычно работаю на уровне кластера, когда смотрю статистику, так как хосты в каждом кластере идентичны, модернизированы и т. Д.

Тем не менее, недавно я заметил кое-что, что немного подняло меня. Один из моих кластеров имеет доступную "полосу пропускания" 200 ГГц, это сделано следующим образом:

5 hosts x 2 sockets-per-host x 6 cores-per-socket x 3.33GHz per-core = 199.8GHz

Это нормально, и vCenter правильно сообщает об этом значении. Однако, когда вы просматриваете загрузку ЦП кластера в vCenter или извлекаете статистику с помощью командлета PowerCLI Get-Stat, загрузка ЦП может в разы превышать 300 ГГц. Это приводит к искажению моих расчетов, поскольку показатель использования достигает 150% (!). Прошло много времени с тех пор, как я сделал математику уровня A, но я не понимаю, как можно использовать процессор на 150%...

Итак, я записал звонок с поддержкой VMware. И, смехотворно, они сказали, что мне нужно купить vCenter Operations Manager (vCOPS), чтобы делать то, что я пытаюсь сделать. Что ж, нет, спасибо, если у меня есть точные статистические данные, я могу сделать свою поддержку принятия решений (извините, разглагольствовать).

Итак, я потребовал объяснений, и сотрудник службы поддержки сказал, что данные в vCenter основаны на "общем" вычислении, которое использует сумму средних значений. Что ж, усреднение выборок данных вполне нормально и вполне приемлемо, но я до сих пор не могу понять, как вы можете превысить 100%.

Итак, я пытался решить это сам, и мне интересно, влияет ли на результаты Xeon гиперпоточность или "турбо"? Тем не менее, "турбо" повышение только от 3,33 ГГц до 3,6 ГГц, то есть: 8%.

Есть какие-нибудь подсказки?

2 ответа

Именно здесь vCenter Operations Manager может быть полезен. Не стоит сбрасывать со счетов его полезность... потенциально он может быть лучшей платформой DSS, чем вы:) Однако, как и в большинстве сред VMware, вы будете долго использовать ресурсы ОЗУ, поскольку столкнетесь с ограничениями ЦП. В моих усилиях по планированию с другими большими кластерами, я бы выбирал для оперативной памяти и хранения, так как процессор никогда не был ограничивающим фактором. Какие версии ESXi, vSphere и уровня лицензии используются здесь?

Для ваших хостов они звучат как 3,33 ГГц системы на базе Westmere X5680. У вас есть возможность запускать те с включенной или выключенной Hyperthreading. Похоже, здесь что-то еще играет. Как выглядят другие серверные серверы, когда процессор нагружается до 150%?

Доступен бесплатный уровень vCenter Operations. Также доступна полнофункциональная (60 или 90-дневная) оценка. Это будет невероятно полезно для выявления реальных узких мест в вашей инфраструктуре... даже если они используются для выбора нужных размеров виртуальных машин и проверки работоспособности кластера.

Представление, которое может иметь значение для вас, является метрикой "Оставшееся время", которая вычисляет количество времени, оставшегося до исчерпания определенного ресурса.

Чтобы использовать технический термин, я здесь. Оказывается, что цифры vCenter действительно включают Hyper-Threading, когда дело доходит до общего МГц. Однако моя электронная таблица (созданная с использованием PowerCLI) не учитывала "количество потоков ЦП", и поэтому смотрела только на сокеты ("пакеты" на языке VMware) и ядра. Спасибо за вклад выше.

Другие вопросы по тегам