Безопасно ли снимать RAID-массив mdadm только с xfs_freeze?

Гарантирован ли mdadm (и заслуживает ли он доверия через опыт), чтобы он был безопасным для создания снимков только с xfs_freeze? Я встречал смутные предупреждения о том, что mdadm все еще работает в фоновом режиме, что делает небезопасные моментальные снимки без предварительной разборки RAID, но я бы предпочел избегать разборки / повторной сборки, если это возможно.

Снимки делаются на уровне блоков с помощью EBS, но меня меньше беспокоит процесс создания снимков, чем правильные данные, согласованные при создании снимка.

Опции, кроме mdadm, приветствуются, если они делают процесс более надежным - мы использовали чередование LVM, но переключились на mdadm специально из-за ненадежности отчетов о снимках между дисками. Мы также рассматриваем некоторую комбинацию, такую ​​как использование mdadm для чередования и слой LVM для создания снимков.

Идеальным решением было бы решение, при котором не нужно останавливать службы, работающие на RAID (в данном случае Mongo), и оно было бы в исходном формате данных, чтобы новый сервер мог присоединить массив восстановленных моментальных снимков и не требовал дополнительных шаги, чтобы массировать данные на место. (У нас уже есть код, который может собрать снимки в новый сервер - нам просто нужно надежно создать эти снимки.)

1 ответ

Даже этот вопрос довольно старый, я хочу дать краткий ответ на вопрос, безопасен ли моментальный снимок EBS-RAID. Мы работаем с PIOPS EBS-RAID0 и регулярно создаем резервные копии этого RAID с помощью следующей процедуры:

  1. Остановка сервиса (в нашем случае БД)
  2. fsfreeze точка монтирования RAID (мы используем ext4, но это должно работать со всеми fs, которые могут зависать)
  3. Вызовите EC2-API, чтобы сделать снимок устройств, которые являются частью RAID
  4. Дождитесь обратного вызова снимка (вам не нужно ждать, пока снимок будет завершен - обратного вызова из API достаточно)
  5. разморозить RAID
  6. Запустить сервис

В нашем случае вся процедура занимает около 1-2 минут.

Мы очень часто меняли наши экземпляры и системы в ближайшем прошлом, и мы всегда использовали эти моментальные снимки, чтобы копировать данные в наши новые экземпляры (и перестраивать там RAID), чтобы сократить время синхронизации между репликами. У нас никогда не было проблем с поврежденными данными - моментальные снимки просто отлично работают!

Надеюсь, что это помогает кому-то, кто ищет ответ.

Другие вопросы по тегам