Необоснованные ожидания производительности для производительности RAID 0?

Я впервые строю машину с аппаратной картой RAID. Мы купили Dell T620 с H710P RAID controller (1GB NV Cache), 160GB Solid State Drive (SATA Read Intensive MLC 3Gbps), и два 3TB 7.2K RPM Near-Line SAS 6Gbps Hard Drives, Твердотельный накопитель в значительной степени предназначен для ОС, чтобы он оставался "скачкообразным".

Два диска SAS настроены на RAID 0. Мы рассматриваем это пространство как пустое место для анализа, поэтому нас не беспокоит потеря данных. Нам нужен высокопроизводительный ввод-вывод, потому что мы имеем дело с большим количеством больших файлов. Например, мой текущий проект - работа с 800 файлами размером от 100 до 200 ГБ. К сожалению, я должен передать файлы на компьютер, проанализировать их и удалить их. Удивительно (для меня), что у меня было одновременно запущено 8 заданий (передача, анализ, удаление), и каждое задание выполнялось более 20 часов (по сравнению с ~3 часами для одного задания). Я обнаружил, что процессоры ожидают ввода-вывода, в зависимости от top (время ожидания завершения ввода-вывода колебалось около 20).

Я понимаю, что это всего 7,2 тыс. Оборотов в минуту, но я предположил, что они достаточно мощные, поскольку Dell указала их скорость 6 Гбит / с. BeowulfNode42 упомянул здесь, что некоторые накопители получают интерфейс 6 Гбит / с для рекламы, даже если они не могут даже насыщать канал 3G Гбит / с. Но я предполагаю, что Dell не будет делать это с высокопроизводительным сервером.

Я прогулялся по земле Google, чтобы увидеть, были ли мои ожидания необоснованными, но я не нашел ничего определенного.

Вопрос: Каковы разумные ожидания для этой установки? IO, очевидно, является горлышком бутылки. Карта RAID кажется довольно хорошей, и я подумал, что диски были довольно хорошими.

Я запустил hdparm, чтобы увидеть, что я получаю. Вот результаты:

>sudo /usr/sbin/hdparm -Tt /dev/sdb

/dev/sdb:
 Timing cached reads:   19542 MB in  2.00 seconds = 9778.47 MB/sec
 Timing buffered disk reads: 1028 MB in  3.00 seconds = 342.11 MB/sec

Кэшированные чтения довольно крутые, но я ожидал большего от буферизованных чтений. Я полагаю, что теоретический вывод для двух дисков 6 Гбит / с составляет 750 МБ / с, поэтому я ожидал получить где-то около 600 МБ / с.

Я ценю вашу помощь. Другая соответствующая информация указана ниже. Пожалуйста, дайте мне знать, если я что-то пропустил.

OS: opensuse 13.1
RAM: 256GB (1866)
CPUs: Dual Intel Xeon E5-2650v2 2.6GHz, 20M Cache, 8.0GT/s QPI

2 ответа

Решение

6 Гбит / с - это скорость канала SAS, а не профиль ввода-вывода одного диска.

Как правило, скорость в объединительной плате SAS будет согласована до наименьшего общего знаменателя, поэтому вы найдете медленные диски, которые по-прежнему поддерживают высокоскоростные каналы SAS, чтобы позволить вам смешивать диски в одном (внешнем) корпусе или объединительной плате, или для получения выгоды из распараллеленного ввода-вывода распространился на большее количество дисков.

Профиль HP IO для аналогичных дисков SAS емкостью 3 ТБ 7,2 К 6 ГБ:

Диски SAS Midline предназначены для серверов и систем хранения, где требуется высокая емкость. Эти диски обладают умеренной ценой надежности и производительности для не критически важных приложений с низкой рабочей нагрузкой, таких как резервное копирование дисков, архивирование и справочные приложения.

hdparm в лучшем случае является показателем сырой производительности диска, но, например, он полностью обходит файловую систему и не симулирует более случайный ввод-вывод, AFAIK. Посмотрите, что такое хороший бесплатный тест с открытым исходным кодом для жесткого диска?

hdparm -T по существу проверит производительность чтения кэширования диска, а именно процессора и памяти. Это проверяет, какую скорость чтения вы получите, когда файлы кэшируются в памяти (см. Раздел "Кэш" для свободной команды).

Приближенные диски SAS не являются полными дисками SAS. Они имеют те же преимущества, что и диски SAS, поскольку они используют интерфейс SAS, но по-прежнему являются механическими приводами со скоростью 7200 об / мин. Полученное вами значение hdparm -t примерно одинаково для двух дисков в RAID0. Для сравнения, SATA-накопители емкостью 3 ТБ обычно имеют скорость около 150 МБ / с.

Для лучшей производительности вы будете смотреть на добавление большего количества дисков. Возьмем, к примеру, Hadoop, где рекомендуется получить лучшую цену за гигабайт, использовать больше дисков и добавлять больше серверов в кластер. Если вам нужна высокая производительность HD, лучше подойдут твердотельные накопители большей емкости, хотя интенсивное использование может привести к ранним сбоям из-за более частых циклов чтения / записи.

Другие вопросы по тегам