Насколько эффективно многоуровневое хранилище LSI CacheCade?

LSI предлагает свою технологию многоуровневого хранения данных CacheCade, которая позволяет использовать SSD-устройства в качестве кэшей чтения и записи для расширения традиционных массивов RAID.

Другие производители приняли аналогичные технологии; Контроллеры HP SmartArray имеют свои SmartCache. Adaptec имеет MaxCache... Не говоря уже о ряде программных инструментов ускорения ( sTec EnhanceIO, Velobit, FusionIO ioTurbine, Intel CAS, флеш-кэш Facebook?).

Исходя из опыта ZFS, я использую различные типы твердотельных накопителей для выполнения задач кэширования чтения (L2ARC) и записи в кэширование (ZIL). Различные характеристики необходимы для их соответствующих рабочих нагрузок; Низкая задержка и выносливость для кэширования записи. Высокая емкость для чтения.

  • Поскольку твердотельные накопители CacheCade можно использовать для кэширования записи и чтения, для чего предназначается встроенный NVRAM контроллера RAID?
  • При использовании в качестве кэша записи какая опасность для твердотельных накопителей CacheCade с точки зрения надежности записи? Использование потребительских твердотельных накопителей, похоже, рекомендуется.
  • Идут ли записи прямо на SSD или они сначала попадают в кэш контроллера?
  • Насколько интеллектуален алгоритм кэширования чтения? Я понимаю, как работает ZFS ARC и L2ARC. Есть ли понимание процесса многоуровневого CacheCade?
  • Какие показатели существуют для мониторинга эффективности установки CacheCade? Есть ли способ соблюдать коэффициент попадания в кэш или процент? Как вы можете определить, действительно ли это работает?

Мне интересны мнения и отзывы о решении LSI. Любые предостережения? Подсказки?

3 ответа

Решение

Поскольку твердотельные накопители CacheCade можно использовать для кэширования записи и чтения, для чего предназначается встроенный NVRAM контроллера RAID?

Если вы оставите включенной функцию кэширования записи контроллера, NVRAM все равно будет использоваться в первую очередь. Кэш записи SSD обычно используется только для больших объемов записываемых данных, когда одной NVRAM недостаточно для поддержки.

При использовании в качестве кэша записи какая опасность для твердотельных накопителей CacheCade с точки зрения надежности записи? Использование потребительских твердотельных накопителей, похоже, рекомендуется.

Это зависит от того, как часто ваши записи фактически приводят к необходимости кэширования записи на SSD... могут ли ваши диски справиться с нагрузкой записи достаточно быстро, чтобы NVRAM не заполнялся. В большинстве сценариев, которые я видел, в большинстве случаев кэш записи практически не работает, поэтому я не ожидаю, что это сильно повлияет на скорость записи - большинство операций записи на твердотельные накопители, вероятно, будут частью вашего чтения. кэширование.

Идут ли записи прямо на SSD или они сначала попадают в кэш контроллера?

Ответ выше... Сначала кэш контроллера, кэш SSD - вторая линия защиты.

Насколько интеллектуален алгоритм кэширования чтения? Я понимаю, как работает ZFS ARC и L2ARC. Есть ли понимание процесса многоуровневого CacheCade?

Извините... нет знаний, чтобы внести вклад в это - надеюсь, кто-то еще будет иметь некоторое понимание?

Какие показатели существуют для мониторинга эффективности установки CacheCade? Есть ли способ соблюдать коэффициент попадания в кэш или процент? Как вы можете определить, работает ли он?

Не похоже, что для этого доступны какие-либо инструменты мониторинга, как в других реализациях SAN этого набора функций... А поскольку виртуальный диск CacheCade не представлен в ОС, у вас может не быть никакого способа вручную следить за активностью либо. Это может просто потребовать дальнейшего тестирования, чтобы проверить эффективность...

Мнение / наблюдение: Во многих случаях (при правильном использовании считывать кэш, соответствующий размеру рабочего набора), эта функция делает вещи ЛЕТЫМИ. Но в конце концов, это может быть хитом и мисс.

Говоря об аппаратных решениях, я не нашел способа узнать точный коэффициент попадания или что-то в этом роде. Я полагаю, что для этого есть две причины: громкость за контроллером выглядит как один диск (и поэтому он должен "просто работать"), и трудно сосчитать "попадания", которые будут не для файлов, а для секторов жесткого диска, поэтому даже на пустом жестком диске может быть некоторая частота попаданий, что может сбивать с толку. Более того, алгоритмы, лежащие в основе "гибридизации", не являются общедоступными, поэтому знание битрейта мало чем поможет. Вы просто покупаете его и запускаете в работу - низкие затраты (по сравнению с чистым решением SSD), приятное влияние на скорость.

Подход "купи и используй" - это хорошая вещь, которую стоит рассмотреть, но на самом деле никто не знает наверняка, как создать самую быструю комбинацию: следует ли использовать несколько больших жестких дисков и несколько больших кэш-дисков SSD, или нам следует использовать много маленьких жестких дисков и несколько больших SSD и т. д., и в чем разница между 100 или, скажем, 500 Гб или 2000 Гб кеша SSD (даже 500 выглядит избыточно, если объем горячих данных небольшого размера), и должно ли быть 2x64 Гб или 8x8 Гб для передачи данных параллельно. Опять же, каждый поставщик использует свой собственный алгоритм и может изменить его при следующем обновлении прошивки.

Я пишу это в основном, чтобы сказать, что мои выводы дали мне странный ответ: если вы используете какой-то сервер общего назначения и профилируемый с общей нагрузкой, то ч / б гибридный контроллер подходит даже для относительно небольших SSD, но если ваши задачи раньше были Конкретнее, вам лучше выбрать программное решение (которое вы сможете выбрать, поскольку вы единственный, кто знает профиль нагрузки) или несколько дорогостоящих хранилищ PCI-карт.

Вот некоторые претензии от Dell:

Производительность хранилища - количество операций ввода-вывода в секунду (IOPS):

  • CacheCade обеспечил в три раза больше операций ввода-вывода в секунду, чем хранилище на жестком диске
  • SAS SSD хранилище достигло в 8 раз больше операций ввода-вывода, чем хранилище
  • Один флэш-накопитель Express показал в 10,5 раз больше операций ввода-вывода в секунду, чем 16 жестких дисков

С точки зрения IOPS, их количество, кажется, на одном уровне. Я стараюсь хранить отчеты DiskSpd с разных серверов, и если я масштабирую один из имеющихся у меня отчетов на счетчик шпинделей, который имеется на сервере cachecade, я получу только около 750 тыс. Операций ввода-вывода в секунду. Тем не менее, при тестировании этого сервера я получил более 2 миллионов. Это был действительно единственный раз, когда я видел, как загрузка процессора стала фактором, определяющим потоки diskpd. Обычно процессор все еще минимален, когда диск начинает закрываться, но здесь это было не так. Я бью себя за то, что я не запускаю diskpd с и без, ну да ладно.

Другой фактор здесь - это абсолютно прозрачно... потратьте несколько сотен долларов на меньший корпоративный класс ssd, добавьте его в качестве тома кэша и все готово. Если у вас есть деньги, чтобы сжечь хранилище all-ssd, то это не имеет значения, но для вдохновения жизни в физические шпиндели я считаю, что это того стоит.

Я пробовал это на Dell R515 с Dell PERC H700 Raid W 1 ГБ памяти с парой 500 МБ / с SSD

Я сделал отметку на скамейке через несколько часов после установки и через 48 часов

Я не увидел значительного улучшения скорости записи, небольшое улучшение для чтения, я сделал тест белый назад, и сейчас у меня нет цифр.

Но это не было значительным, и я в конечном итоге использовал ящик для хранения без этой функции.

По моему опыту, большинство этих программ - просто шутка! если вам нужно многоуровневое хранение, то создайте свое собственное, приобретите надежное оборудование от Dell и заполните коробку твердотельными накопителями

На моем рабочем месте очень хорошо работают многоуровневые системы хранения данных HP 3Par и модуль адаптивной оптимизации, он работает как рекламируется, но это решение стоит около 100K:)

Другие вопросы по тегам