Как сделать резервную копию / индексировать метаданные файла

Я выступаю за реализацию концепции надежного резервного копирования перед потерей данных. Наличие локальных и внешних резервных копий является одним из столпов такой концепции. Однако я узнал, что метаданные иногда так же ценны, как и фактическое содержимое файла.

Например, у меня была резервная копия данных и восстановленная файловая система btrfs, и мне нужно было решить, восстановить ли резервную копию или сохранить восстановленные данные. Так как мне не хватало контрольных сумм файлов, я решил восстановить данные из резервной копии вне сайта.

После восстановления я узнал, что дата создания файла, владелец и права доступа также очень важны для отслеживания. К счастью, мои данные структурированы, и я могу установить значения по умолчанию для каждого сценария.

Однако, чтобы улучшить мой план резервного копирования, я хочу сохранить метаданные моих файлов.

Первое действие было sha256sum а также stat данные и сохранить его на диск.

Как вы могли бы индексировать и хранить метаданные файлов в Linux более простым и эффективным способом?

Я заглянул в git-annex, который выглядит многообещающе, и я видел, как люди используют updatedb для отслеживания файлов (также метаданных?), Но, может быть, у кого-то есть лучшие варианты?

3 ответа

Для критически важного сервера, пожалуйста, используйте решение, которое выполняет полное резервное копирование машины, а не только копию файла. Таким образом, метаданные и все связанные настройки будут сохранены.

Если это виртуальная машина, некоторые программы просто копируют весь файл данных гипервизора.

Вы можете использовать инструмент целостности системы, как tripwire, AIDEи т. д. для хранения контрольных сумм и метаданных для ваших файлов. Эти инструменты предназначены для обнаружения изменений в метаданных и содержимом файлов, поэтому они создают индекс этой информации.

Большинство систем резервного копирования могут сохранять метаданные.

В архивах tar содержатся метаданные разрешений и меток времени, но вы можете выбрать контрольную сумму sha256.

Изображение всего блочного устройства содержит метаданные исходного файла. Тем не менее, это может иметь оперативные проблемы. Например, может быть сложно выполнить частичное восстановление, и для перехода на другой тип файловой системы требуются дополнительные шаги.

Или возьмите хорошо задокументированный пример Борг. Сохраненные метаданные файла включают метки времени и разрешения UNIX. Репозиторий может быть проверен для проверки его согласованности.

Для любого из них вы можете дополнительно вычислить и сохранить ваш любимый хеш.


Какое бы ни использовалось программное обеспечение для резервного копирования, определите цель точки восстановления, а затем выполните восстановление. Восстановленные объекты должны не только иметь правильные метаданные, но и содержать достоверные данные.

Другие вопросы по тегам