ZFS против XFS

Мы рассматриваем возможность создания сервера хранения ~16 ТБ. На данный момент мы рассматриваем как ZFS, так и XFS в качестве файловой системы. Каковы преимущества, недостатки? Что мы должны искать? Есть ли третий, лучший вариант?

13 ответов

Решение

Я обнаружил, что XFS лучше подходит для очень больших файловых систем с большим количеством больших файлов. У меня есть работающая файловая система XFS 3,6 ТБ уже более 2 лет без проблем. Определенно работает лучше, чем ext3 и т. Д. При таком размере (особенно при работе со многими большими файлами и большим количеством операций ввода-вывода).

С ZFS вы получаете пул устройств, чередование и другие расширенные функции, встроенные в саму файловую систему. Я не могу говорить о деталях (я позволю другим комментировать), но из того, что я могу сказать, вы хотели бы использовать Solaris, чтобы получить максимальную выгоду здесь. Мне также неясно, насколько ZFS помогает, если вы уже используете аппаратный RAID (как и я).

ZFS даст вам преимущества, помимо программного RAID. Структура команд очень продуманна и интуитивно понятна. Также есть сжатие, моментальные снимки, клонирование, отправка / получение файловой системы и устройства кэширования (эти новые модные SSD-диски) для ускорения индексации метаданных.

Сжатие:

#zfs set compression=on filesystem/home

Он поддерживает простые для создания копий при записи снимки, которые можно смонтировать:

# zfs snapshot filesystem/home/user@tuesday
# cd filesystem/home/user/.zfs/snapshot/tuesday

Клонирование файловой системы:

# zfs clone filesystem/home/user@tuesday filesystem/home/user2

Файловая система отправки / получения:

# zfs send filesystem/home/user@tuesday | ssh otherserver "zfs receive -v filesystem/home/user"

Инкрементная отправка / получение:

# zfs send -i filesystem/home/user@tuesday | ssh otherserver "zfs receive -v filesystem/home/user"

Кеширующие устройства:

# zpool add filesystem cache ssddev

Это всего лишь верхушка айсберга, я настоятельно рекомендую попробовать установить Open Solaris и попробовать его.

http://www.opensolaris.org/os/TryOpenSolaris/

Изменить: Это очень старый, Open Solaris был прекращен, лучший способ использовать ZFS, вероятно, на Linux или FreeBSD.


Полное раскрытие: раньше я был архитектором систем хранения данных Sun, но я не работал на них более года, я просто в восторге от этого продукта.

Использование моментальных снимков lvm и xfs в живых файловых системах - это путь к катастрофе, особенно при использовании очень больших файловых систем.

Последние 6 лет я работал исключительно на LVM2 и xfs на своих серверах (дома, даже если zfs-fuse просто слишком медленный)...

Однако я больше не могу сосчитать различные режимы сбоев, с которыми я столкнулся при использовании снимков. Я вообще перестал их использовать - это слишком опасно.

Единственное исключение, которое я сделаю сейчас, - это мое личное резервное копирование почтового сервера / веб-сервера, где я буду делать резервные копии на ночь, используя кратковременный снимок, который всегда равен размеру исходного fs, и сразу после этого удаляется.

Самые важные аспекты, о которых следует помнить:

  1. если у вас есть большая (ish) файловая система, которая имеет снимок, производительность записи ужасно снижается
  2. Если у вас есть большая (ish) файловая система, у которой есть моментальный снимок, время загрузки будет отложено буквально на десятки минут, в то время как диск будет перетасовываться во время импорта группы томов. Сообщения не будут отображаться. Этот эффект особенно неприятен, если root находится на lvm2 (потому что время ожидания корневого устройства истечет, а система не загрузится)
  3. если у вас есть моментальный снимок, его очень просто не хватает. После исчерпания свободного места снимок поврежден и не может быть восстановлен.
  4. Снимки нельзя откатить / объединить в данный момент (см. http://kerneltrap.org/Linux/LVM_Snapshot_Merging). Это означает, что единственный способ восстановить данные из снимка - это фактически скопировать его (rsync?). ОПАСНОСТЬ ОПАСНОСТЬ: вы не хотите делать это, если емкость снимка не меньше размера исходного fs; Если вы этого не сделаете, вы скоро поразите кирпичную стену и в итоге и исходный фс, и снимок будут повреждены. (Я был там!)

Еще пара вещей, о которых нужно подумать.

  • Если диск умирает в аппаратном RAID-массиве независимо от файловой системы, которая находится поверх него, все блоки устройства должны быть перестроены. Даже те, которые не содержат никаких данных. ZFS, с другой стороны, является менеджером томов, файловой системой и управляет избыточностью и чередованием данных. Таким образом, он может разумно перестраивать только те блоки, которые содержат данные. Это приводит к более быстрому восстановлению, чем при заполнении тома на 100%.

  • ZFS имеет фоновую очистку, которая гарантирует, что ваши данные остаются согласованными на диске и устраняет любые проблемы, которые они обнаруживают, прежде чем это приведет к потере данных.

  • Файловые системы ZFS всегда находятся в согласованном состоянии, поэтому нет необходимости в fsck.

  • ZFS также предлагает больше гибкости и возможностей благодаря своим снимкам и клонам по сравнению со снимками, предлагаемыми LVM.

Запустив большие пулы хранения для производства видео большого формата в стеке Linux, LVM, XFS. Мой опыт показывает, что легко попасть в микро-управление вашим хранилищем. Это может привести к большому количеству неиспользованного выделенного пространства и времени / проблем с управлением логическими томами. Это может не иметь большого значения, если у вас есть администратор хранилища с полной занятостью, задачей которого является микроуправление хранилищем. Но я обнаружил, что подход к хранению в пуле ZFS устраняет эти проблемы управления.

ZFS абсолютно потрясающая. Я использую его в качестве домашнего файлового сервера для файлового сервера HD 5 x 1 ТБ, а также использую его в производстве с почти 32 ТБ места на жестком диске. Это быстрый, простой в использовании и содержит некоторые из лучших средств защиты от повреждения данных.

Мы используем OpenSolaris на этом сервере, в частности, потому что мы хотели получить доступ к новым функциям и потому что он предоставил новую систему управления пакетами и способ обновления.

Я не думаю, что вы должны сосредоточиться на производительности. Безопасны ли ваши данные с XFS, ext4 и т. Д.? Нет. Прочтите эти кандидатские и научные работы:

XFS не защищена от повреждения данных: pages.cs.wisc.edu/~vshree/xfs.pdf

И не ext3, JFS, ReiserFS и т. Д.: zdnet.com/blog/storage/how-microsoft-puts-your-data-at-risk/169?p=169&tag=mantle_skin%3bcontent "Я натолкнулся на увлекательную диссертацию PhD Виджаяна Прабхакарана, IRON File Systems, который анализирует, как пять файловых систем журналирования товаров - NTFS, ext3, ReiserFS, JFS и XFS - решают проблемы хранения.

В двух словах он обнаружил, что все файловые системы имеют

. . . failure policies that are often inconsistent, sometimes buggy, and generally inadequate in their ability to recover from partial disk failures. "

Но ZFS успешно защищает ваши данные. Вот исследовательский документ по этому вопросу: zdnet.com/blog/storage/zfs-data-integrity-tested/811

Какую ОС вы планируете запустить? Или это другая часть рассмотрения? Если вы используете Solaris, насколько я знаю, XFS даже не вариант. Если вы не используете Solaris, как вы планируете использовать ZFS? Поддержка ограничена на других платформах.

Если вы говорите о сервере Linux, я бы лично остановился на Ext3, хотя бы потому, что он проходит большую часть тестирования. zfs-fuse еще очень молод. Кроме того, однажды у меня были проблемы с XFS, когда ошибка приводила к повреждению данных после обновления ядра. Преимущества XFS по сравнению с Ext3 определенно не перевешивают затраты, связанные с восстановлением компьютера, расположенного в удаленном центре обработки данных.

Не ориентированный на FS ответ, извините, но имейте в виду, что некоторые контроллеры дисков не будут иметь дело с>2 ТБ LUNS/ логических дисков - это может немного ограничить организацию вашего хранилища. Я просто хотел, чтобы вы знали об этом, чтобы вы могли проверить всю систему до конца, чтобы убедиться, что она будет работать с 16 ТБ.

На сегодняшний день (2023 г.) не только XFS и ZFS хорошо подходят для больших файловых систем, но это единственные файловые системы, которые я бы использовал для больших томов (по крайней мере, в Linux).

Тем не менее, ZFS имеет преимущество благодаря работеscrub, позволяющий проверять и восстанавливать файловую систему в режиме онлайн. XFS развивается в сторону чего-то подобного (с возможностью только проверки), но это экспериментальная функция.

Учитывая все обстоятельства, для большой установки на «голое железо» я бы выбрал ZFS в Linux , если только не нужны рабочие ссылки, которые есть у XFS , а у ZFS нет (и предварительная реализация имеет некоторые подводные камни), или если модули вне дерева не допускаются.

Помимо того, что уже упоминалось, с точки зрения производительности xfs на базе MD raid работает лучше, чем zfs на потоковой передаче мультимедиа. Я использовал то же самое оборудование в течение полувека с xfs и примерно столько же времени с zfs на своем медиасервере. На Intel Atom 330 с xfs у меня никогда не возникало стутера, на zfs на сложных сценах такое же оборудование не успевает и начинает сбрасывать кадры.

Это зависит от того, какие функции вы хотите..., два разумных выбора - xfs и zfs, как вы сказали, код xfs довольно хорошо протестирован, я впервые использовал его 8 лет назад под IRIX

Можно получить снимки с xfs (используя lvm и xfs_freeze)

Возможно иметь отдельное лог-устройство, например SSD

mkfs.xfs -l logdev=/dev/sdb1,size=10000b /dev/sda1

Большие xfs традиционно требуют много памяти для проверки

Проблема с появлением нулей была функцией "безопасности", которая, я думаю, исчезла некоторое время назад.

Ну, ребята, давайте не будем забывать о последнем дополнении к zfs: дедупликация. И давайте поговорим о совместном использовании iscsi, nfs или smb. Как уже говорили другие, экспорт файловых систем zfs, снимков, контрольной суммы блоков raidz(=raid5), ширины динамической полосы, управления кешем и многих других. Я голосую за ЗФС.

Вместо того, чтобы строить свой собственный, альтернативой является Sun 7410 aka Toro. Он имеет очень полезное программное обеспечение, которое поставляется вместе с решением.

Другие вопросы по тегам