Безопасно ли снимать RAID-массив mdadm только с xfs_freeze?
Гарантирован ли mdadm (и заслуживает ли он доверия через опыт), чтобы он был безопасным для создания снимков только с xfs_freeze? Я встречал смутные предупреждения о том, что mdadm все еще работает в фоновом режиме, что делает небезопасные моментальные снимки без предварительной разборки RAID, но я бы предпочел избегать разборки / повторной сборки, если это возможно.
Снимки делаются на уровне блоков с помощью EBS, но меня меньше беспокоит процесс создания снимков, чем правильные данные, согласованные при создании снимка.
Опции, кроме mdadm, приветствуются, если они делают процесс более надежным - мы использовали чередование LVM, но переключились на mdadm специально из-за ненадежности отчетов о снимках между дисками. Мы также рассматриваем некоторую комбинацию, такую как использование mdadm для чередования и слой LVM для создания снимков.
Идеальным решением было бы решение, при котором не нужно останавливать службы, работающие на RAID (в данном случае Mongo), и оно было бы в исходном формате данных, чтобы новый сервер мог присоединить массив восстановленных моментальных снимков и не требовал дополнительных шаги, чтобы массировать данные на место. (У нас уже есть код, который может собрать снимки в новый сервер - нам просто нужно надежно создать эти снимки.)
1 ответ
Даже этот вопрос довольно старый, я хочу дать краткий ответ на вопрос, безопасен ли моментальный снимок EBS-RAID. Мы работаем с PIOPS EBS-RAID0 и регулярно создаем резервные копии этого RAID с помощью следующей процедуры:
- Остановка сервиса (в нашем случае БД)
- fsfreeze точка монтирования RAID (мы используем ext4, но это должно работать со всеми fs, которые могут зависать)
- Вызовите EC2-API, чтобы сделать снимок устройств, которые являются частью RAID
- Дождитесь обратного вызова снимка (вам не нужно ждать, пока снимок будет завершен - обратного вызова из API достаточно)
- разморозить RAID
- Запустить сервис
В нашем случае вся процедура занимает около 1-2 минут.
Мы очень часто меняли наши экземпляры и системы в ближайшем прошлом, и мы всегда использовали эти моментальные снимки, чтобы копировать данные в наши новые экземпляры (и перестраивать там RAID), чтобы сократить время синхронизации между репликами. У нас никогда не было проблем с поврежденными данными - моментальные снимки просто отлично работают!
Надеюсь, что это помогает кому-то, кто ищет ответ.