Опция дедупликации в Backup Exec 2010 - работает ли она так?
У нас есть система резервного копирования на диск объемом 6 ТБ, работающая с Backup Exec 2010. Каждую неделю полное резервное копирование выполняется с разницей в другие дни. Нам удается получить около четырех недель резервных копий там.
Во-первых, я прав, полагая, что вариант дедупликации будет более эффективно использовать это пространство резервного копирования на диск? Например, в каждую из этих четырех недель один и тот же одинаковый файл 4 ГБ резервируется четыре раза (использованное пространство = 16 ГБ), но при дедупликации будет сохранена только первая копия?
Во-вторых, если вы включите дедупликацию, это будет иметь немедленный эффект или потребуется время, чтобы дедупликация прошла через область B2D?
В первом случае потребуется выполнить задание для существующих файлов B2D, найти дубликаты и пометить файл BKF как перезаписываемый.
Последнее будет гораздо проще реализовать, так как оно просто влияет на резервное копирование в будущем.
Если бы я был игроком на пари, я бы выбрал более поздний вариант;-) Проще кодировать...
2 ответа
Я установил пробную версию Backup Exec 2010 и могу ответить на свои вопросы:
Во-первых, вы не можете использовать существующую систему резервного копирования на диск и преобразовать ее в хранилище с дедупликацией. Дедупликация - это совершенно другой механизм и новый тип хранилища в BE. Вы создаете новую область хранения с дедупликацией так же, как вы создаете область хранения резервных копий на диск.
Поэтому мой вопрос о том, удаляет ли он существующую папку B2D, "нет".
Это создает сложную проблему перехода к дедупликации с B2D, если вы пытаетесь использовать один и тот же носитель. Поскольку BE никогда не удаляет B2D BKF-файлы, вам придется делать это вручную по истечении срока действия носителя.
Во-вторых, BE de-dup является блочным по умолчанию с 64k блоками. Вдобавок к этому база данных словаря должна поддерживать, чтобы позволить ей хэшировать дублирующие блоки. Структура папки de-dup гораздо сложнее, чем B2D.
В-третьих, да, в BE 2010 большие требования к оперативной памяти. Я тестировал виртуальную машину W2k3 емкостью 1 ГБ и заметил, что она работает как трехногий осел. Он потреблял всего 1,5 ГБ, поэтому перебивал файл подкачки. Поэтому я думаю, что нам нужно обновить наш сервер резервного копирования в реальном времени, прежде чем мы рассмотрим использование de-dup.
Ура, Роб.
Обычная настройка для использования B2D в дедуплицированных системах хранения (или в модуле дедупликации BE) - 1 полная резервная копия, а затем "навсегда". Это предпочтительный метод, позволяющий использовать дедупликацию в полную силу, но он может не подходить для каждого центра обработки данных.
Дедупликация бывает разных вкусов. Сейчас я не могу вспомнить, какой используется один BE, но все они создают контрольные суммы блоков данных, а затем сравнивают их с базой данных, чтобы узнать, не был ли он уже сохранен где-то еще.
Backup Exec предъявляет достаточно жесткие системные требования для выполнения дедупликации, вы должны знать об этом. Если я правильно помню, это 1 ГБ ОЗУ на 1 ТБ данных в цикле резервного копирования.
Вы должны заметить эффект дедупликации после запуска полного резервного копирования с включенной опцией. В основном это будут ваши "базовые" данные, как описано выше, где каждая инкрементная резервная копия будет дублироваться против полной резервной копии.
Я не вижу необходимости использовать существующие файлы B2D. Почему бы просто не указать следующую полную резервную копию на папку в хранилище B2D, которая называется "дедупликация" или что-то в этом роде?