Сколько переключений контекста является "нормальным" (как функция ядер ЦП (или других))?
Привет Повелители Linux/UNIX,
У кого-нибудь из вас есть практическое правило относительно того, сколько переключателей контекста (на ядро процессора) является нормальным на сервере Linux?
Мой колледж здесь поднял это, и он видит 16K на 8-ядерном x86_64
машина.
Вот некоторые статистические данные sarface за последние несколько дней...
http://src.autonomy.net.au/imagebin/81895e338fae67d3d205c09db44a81e6-Picture_10.png
И чтобы увидеть статистику создания процесса, вот логарифмическое представление того же графика...
http://src.autonomy.net.au/imagebin/7481f7e52bead4effc90248fc23c72fe-Picture_11.png
И 8 ядер скучно до смерти...
http://src.autonomy.net.au/imagebin/0e94326652e977fd74edcd840f94200f-Picture_12.png
CS против IOwait (масштаб x10000)
http://src.autonomy.net.au/imagebin/a52a2a8a120394849c0da4045933e306-Picture_13.png
Больше бесполезной информации на случай, если кто-нибудь спросит..
- Хранилище, на котором работает сервер, - это 0,5 ТБ SAN через FC
- Там 8 ГБ ОЗУ, в основном кеш - без подкачки.
5 ответов
Это очень сильно зависит от типа приложения, которое вы запускаете. Если у вас есть приложения, которые очень хорошо запускают системные вызовы WRT, вы можете ожидать большого количества переключения контекста. Если большинство ваших приложений бездействуют и просыпаются только тогда, когда что-то происходит в сокете, вы можете ожидать низкой скорости переключения контекста.
Системные звонки
Системные вызовы вызывают переключение контекста по своей собственной природе. Когда процесс выполняет системный вызов, он в основном говорит ядру взять на себя управление с его текущего момента времени и памяти для выполнения действий, которые процесс не имеет привилегий, и вернуться в то же место, когда оно выполнено.
Когда мы посмотрим на определение системного вызова write(2) из Linux, это становится очень ясным:
НАЗВАНИЕ write - записать в дескриптор файла СИНТАКСИС #включают запись ssize_t (int fd, const void *buf, size_t count); ОПИСАНИЕ write() записывает количество байтов из буфера, указанного в буфере, в файл упомянутый дескриптором файла fd. [..] ВОЗВРАЩАЕМОЕ ЗНАЧЕНИЕ В случае успеха возвращается число записанных байтов (ноль указывает ничего не было написано). При ошибке возвращается -1 и устанавливается errno соответственно. [..]
Это в основном говорит ядру взять на себя операцию из процесса, перейти к count
байты, начиная с адреса памяти, на который указывает *buf
к файловому дескриптору fd
текущего процесса, а затем вернитесь к процессу и расскажите ему, как все прошло.
Хорошим примером, демонстрирующим это, является выделенный игровой сервер для игр на основе Valve Source, hlds. http://nopaste.narf.at/f1b22dbc9 показывает количество системных вызовов в одну секунду, выполненных одним экземпляром игрового сервера, на котором не было игроков. Этот процесс занимает около 3% процессорного времени на Xeon X3220 (2,4 ГГц), просто чтобы вы почувствовали, насколько это дорого.
Многозадачность
Другим источником переключения контекста могут быть процессы, которые не выполняют системные вызовы, но нуждаются в удалении из данного ЦП, чтобы освободить место для других процессов.
Хороший способ визуализировать это - cpuburn. cpuburn сам не выполняет никаких системных вызовов, он просто перебирает свою собственную память, поэтому он не должен вызывать никакого переключения контекста.
Возьмите бездействующий компьютер, запустите vmstat, а затем запустите burnMMX (или любой другой тест из пакета cpuburn) для каждого ядра ЦП, имеющегося в системе. К тому времени у вас должно быть полное использование системы, но вряд ли какое-либо усиление переключения контекста. Затем попробуйте запустить еще несколько процессов. Вы увидите, что скорость переключения контекста увеличивается, когда процессы начинают конкурировать за ядра ЦП. Количество переключений зависит от соотношения процессов / ядра и многозадачного разрешения вашего ядра.
дальнейшее чтение
У linfo.org есть хорошая статья о переключениях контекста и системных вызовах. В Википедии есть общая информация и хороший набор ссылок на системные вызовы.
Мой умеренно загруженный веб-сервер работает со скоростью 100-150 переключателей в секунду большую часть времени с пиками в тысячи.
Высокие скорости переключения контекста сами по себе не являются проблемой, но они могут указать путь к более серьезной проблеме.
редактировать: переключение контекста является симптомом, а не причиной. Что вы пытаетесь запустить на сервере? Если у вас многопроцессорная машина, вы можете попробовать установить привязку к процессору вашего основного сервера.
В качестве альтернативы, если вы используете X, попробуйте перейти в режим консоли.
Снова отредактируйте: при 16 тыс. с / с каждый процессор усредняет два переключателя в миллисекунду, что составляет от половины до шестой части нормального временного интервала. Может ли он запустить много потоков, связанных с IO?
Редактировать снова опубликовать графики: Конечно, выглядит IO привязанным. система проводит большую часть своего времени в SYS, когда переключатели контекста высоки?
отредактируйте еще раз: высокий iowait и система в этом последнем графике - полностью затмевая пространство пользователя. У вас проблемы с IO.
Какую карту FC вы используете?
редактировать: хммм есть ли шанс получить какие-то тесты для доступа к SAN с помощью bonnie++ или dbench в мертвый период? Мне было бы интересно узнать, есть ли у них похожие результаты.
редактировать: я думал об этом на выходных, и я видел похожие шаблоны использования, когда Бонни делает проход "записать байт за раз". Это может объяснить большое количество происходящих переключений, поскольку каждая запись потребует отдельного системного вызова.
Я больше склонен беспокоиться о загруженности процессора состоянием системы. Если оно близко к 10% или выше, это означает, что ваша ОС тратит слишком много времени на переключение контекста. Хотя перемещение некоторых процессов на другую машину происходит намного медленнее, это заслуживает этого.
Именно поэтому вы должны стараться поддерживать базовые показатели производительности для своих серверов. Таким образом, вы можете сравнить вещи, которые вы внезапно заметили, с вещами, которые вы записали в прошлом.
Тем не менее, у меня есть работающие серверы (в основном, не очень загруженные серверы Oracle), которые устойчивы около 2 тыс. С некоторыми пиками 4 тыс. Для моих серверов это нормально, для серверов других людей, которые могут быть слишком низкими или слишком высокими.
Как далеко вы можете вернуться в ваших данных?
Какую информацию о процессоре вы можете дать нам?
Там нет правила большого пальца. Переключение контекста - это просто процессор, переходящий от обработки одного потока к другому. Если вы запустите много процессов (или несколько многопоточных), вы увидите больше переключателей. К счастью, вам не нужно беспокоиться о количестве переключений контекста - стоимость небольшая и более или менее неизбежна.