Понимание рекомендованных профилей RedHat
Мы собираемся развернуть настроенные (и numad) на ~1000 серверов, большинство из которых являются серверами VMware либо в хранилище NetApp, либо в 3Par.
Согласно документации RedHats мы должны выбрать virtual-guest
профиль. Что он делает, можно увидеть здесь: tuned.conf
Мы меняем планировщик ввода-вывода на NOOP, поскольку и VMware, и NetApp/3Par должны выполнять для нас достаточное планирование.
Однако после небольшого расследования я не уверен, почему они увеличиваются vm.dirty_ratio
а также kernel.sched_min_granularity_ns
,
Насколько я понял, растущий vm.dirty_ratio
до 40% будет означать, что для сервера с оперативной памятью 20 ГБ 8 ГБ могут быть грязными в любой момент времени, если только vm.dirty_writeback_centisecs
ударил первым. И при очистке этих 8 ГБ все операции ввода-вывода для приложения будут блокироваться до тех пор, пока грязные страницы не будут освобождены.
Увеличение dirty_ratio, вероятно, будет означать более высокую производительность записи при пиках, так как теперь у нас увеличен кэш, но опять же, когда кэш заполняется, ввод-вывод будет блокироваться на значительно более длительное время (несколько секунд).
Другая причина, почему они увеличивают sched_min_granularity_ns
, Если я правильно понимаю, увеличение этого значения приведет к уменьшению количества временных интервалов за эпоху (sched_latency_ns
) означает, что выполняющиеся задачи получат больше времени для завершения своей работы. Я могу понять, что это очень хорошая вещь для приложений с очень небольшим количеством потоков, но, например, для. apache или другие процессы с большим количеством потоков это не будет контрпродуктивным?
3 ответа
Короткий ответ: любая настройка является догадкой и имеет ценность только в том случае, если она подкреплена эмпирическими данными: попробуйте. Измерь это. Если вам это не нравится, настройте его.
Более длинный ответ:
Увеличение dirty_ratio, вероятно, будет означать более высокую производительность записи...IO будет заблокирован на значительно более длительное время
Нет. Увеличение коэффициента загрязнения означает, что ваша система с меньшей вероятностью попадет в состояние, в котором она должна начать блокировать записи. Недостатком является то, что используется больше памяти и повышается риск потери данных при сбое.
Это означает, что выполняющиеся задачи получат больше времени для завершения своей работы
Процессы обычно срабатывают до истечения времени. Проблема с виртуальной машиной заключается в том, что ваша машина может конкурировать за ЦП и кэш-память L1/L2 с другими виртуальными машинами - высокий уровень переключения задач (из-за упреждения) оказывает большое влияние на пропускную способность. Типы приложений, которые обычно развертываются на виртуальных машинах, - это приложения с привязкой к ЦП (веб-серверы, серверы приложений).
Да, увеличение пропускной способности (которое применяется ко всем типам приложений) будет происходить за счет увеличения задержки - но последняя составляет порядка микросекунд, когда большинство транзакций занимают миллисекунды. Если вам нужна возможность в реальном времени / очень низкая задержка, вам не следует использовать виртуальную машину.
Вот график настроек tuned-adm...
Я думаю, что это помогает увидеть их в табличной форме. Главное отметить, что стандартные настройки RHEL6 отстой! Другое дело, что профили корпоративного хранилища и виртуального гостя идентичны, за исключением уменьшения перестановки на стороне виртуального гостя (имеет смысл, верно?).
Что касается рекомендации по лифту ввода-вывода в хранилище, у вас есть несколько уровней абстракции на уровне хранилища. Использование планировщика noop будет иметь смысл, если вы используете RDM или представляете хранилище непосредственно своим виртуальным машинам. Но поскольку они будут работать в NFS или VMFS, мне все еще нравятся дополнительные параметры настройки, предоставляемые планировщиком сроков.
Настроенные профили могут быть изменены на лету в работающих системах, поэтому, если у вас есть какие-либо проблемы, протестируйте с вашим приложением и конкретной средой и тестом.
Посмотрите видео о настройке производительности Шака и Ларри с Summit, они подробно рассказывают о настроенных профилях.
- Часть 1 - http://www.youtube.com/watch?v=fATEiBJ3pKw
- Часть 2 - http://www.youtube.com/watch?v=km-vLELmWLs
Один из самых важных выводов заключается в том, что профили являются только рекомендуемой отправной точкой, а не неизменными числами, которые магически идеально подходят для любой среды.
Начните с одного профиля и поиграйте с настройками. Создайте хорошую рабочую нагрузку для тестирования и измерьте показатели, которые важны для вашего бизнеса.
Изменяйте одну вещь за раз и записывайте каждый результат на каждой итерации. Когда вы закончите, просмотрите результаты и выберите настройки, которые дали наилучшие результаты. Это ваш идеальный настроенный профиль.