Многолучевое исполнение очень плохо RHEL/HSV200

Я использую RHEL 5.5 с системой хранения данных с несколькими путями @HSV200.

Производительность диска для записи ОЧЕНЬ низка по сравнению с аналогами Windows-системы (которые используют то же хранилище и многолучевое распространение).

Вот результаты:

mpath17 (3600508b400105f9d0002100000780000) dm-12 HP,HSV200
[size=850G][features=0][hwhandler=0][rw]
\_ round-robin 0 [prio=100][active]
 \_ 2:0:1:30  sdaw       67:0   [active][ready]
 \_ 1:0:1:30  sdc        8:32   [active][ready]
\_ round-robin 0 [prio=20][enabled]
 \_ 2:0:0:30  sdau       66:224 [active][ready]
 \_ 1:0:0:30  sda        8:0    [active][ready]

`atop` result:

LVM |      mpath17  | busy     99% |  read    3077 | write      6  | KiB/r     90 |               | KiB/w      4 |  MBr/s  27.11 | MBw/s   0.00  | avq     2.41 |  avio 3.21 ms 

Обратите внимание, что "занят" составляет 99% - и это происходит в большинстве случаев.

Multipath.conf использует рекомендуемые рекомендации HP для этого хранилища:

device {
                vendor                                   "HP"
                product                                  "HSV2[01]0|HSV3[046]0|HSV4[05]0"
                path_grouping_policy        group_by_prio
                getuid_callout                      "/sbin/scsi_id -g -u -s /block/%n"
                prio_callout                           "/sbin/mpath_prio_alua /dev/%n"
                path_selector                       "round-robin 0"
                path_checker                       tur
                hardware_handler              "0"
                failback                  immediate
                rr_weight                               uniform
                rr_min_io                              100
                no_path_retry                       18
}

Есть ли способ диагностировать это событие? Я хочу понять, где узкое место в этом сценарии... Есть предложения, с чего начать?

(Это мой первый пост здесь, большое спасибо)

2 ответа

Решение

Это может быть признаком проблемы с производительностью. Как сконфигурировано хранилище за этим LUN? Какой тип диска, сколько дисков и какой тип рейда? Кэш настроен на обратную запись?

Вы упомянули в комментарии, что вы количественно определяете использование диска по МБ / с, однако в большинстве случаев ограничение для не-SSD накопителей - не МБ / с, а ввод / вывод, поскольку им приходится много искать для случайное чтение.

Вся проблема была в контроллере диска; у него не было контроллера кеша, поэтому он работал плохо во многих отношениях - например, при записи больших файлов или одновременной записи большого количества файлов.

Спасибо за диагноз.

Другие вопросы по тегам