Server 2012 Дедупликация данных Пропускание виртуальных жестких дисков реплики
В настоящее время я пытаюсь использовать дедупликацию данных на двух отдельных хостах Hyper-V Windows Server 2012 Datacenter. Во-первых, я пытаюсь дедуплицировать реплики, которые все еще синхронизируются каждые 5 минут или около того. С другой стороны, я остановил повторную синхронизацию с помощью сценария powershell примерно на 15 серверах (4 терабайта данных) и переместил их в корень тома, на котором включена дедупликация.
Теперь по какой-то причине он работает со всем, что я вставил туда, кроме изображений VHD-реплик. Это просто пропускает их.
Я поставил 50 гигабайт шаблонов и isos, и он работал отлично, я запускаю дедупликацию так:
Start-DedupeJob -Full -Path R: -Type Optimization
Обычно он работает отлично, но настоящая причина, по которой я его использую, заключается в том, чтобы уменьшить пространство, необходимое для хранения снимка VHD реплики. Я бы предпочел, чтобы хост Hyper-V повторно синхронизировал виртуальные жесткие диски и включил дедупликацию, но если мне нужно удалить синхронизацию, а затем дедуплицировать, а затем отключить оптимизацию для повторной синхронизации или чего-то, что мне подходит, я могу просто написать сценарий вне, но сейчас ни при каких обстоятельствах я не могу заставить их дедуплицировать VHDS реплики!!! Это сводит меня с ума!
Любые советы, предложения, будет принята с благодарностью.
ОБНОВИТЬ:
У меня есть два виртуальных жестких диска, один из шаблона, а другой - образ реплики диска данных объемом 1,6 терабайта на другом виртуальном диске на другом хосте сервера hyper-v.
Я сопоставил все свойства и разрешения файла, чтобы они были идентичными, включая владельца. Единственное, что файл, который работает с дедупликацией, помечен как Атрибут APL, а тот, который не делает это, является просто Атрибутом А - я не уверен, что такое P и L, и я не верю, что могу установить его с помощью атрибута..EXE.
Так сумасшедший - никакая реплика VHS не будет выводить то, что когда-либо!
ОБНОВИТЬ:
Сценарий, который я использую для оптимизации VHS
$vhds = Get-ChildItem -Recurse | ? {$_.extension -match "vhd"}
foreach ($vhd in $vhds) {
Mount-VHD -Path $vhd.fullname -Verbose -ReadOnly
Optimize-VHD -path $vhd.fullname -Verbose -Mode Retrim
Dismount-VHD -path $vhd.fullname -Verbose
}
Я запустил это и заметил, что процесс дедупликации длится немного дольше, но дедупликация с виртуальными жесткими дисками репликации не происходит. Это очень странно для меня - я надеялся, что если что-то помечало файл как "открытый", то после запуска optimize-vhd этого не происходило. О VHD, о которых идет речь, давно не писали. Я использовал этот скрипт, чтобы отключить повторную синхронизацию на хосте, чтобы остановить запись:
$vmlist = get-vm * | where {$_.replicationstate -eq "replicating" -and $_.state -eq "Running"}
foreach ($vm in $vmlist) {
$vmname = $vm.name
set-vmreplication -vmname $vmname -AutoResynchronizeEnabled $false
}
2 ответа
Я подозреваю, что ваши виртуальные жесткие диски реплики либо постоянно открыты с блокировкой записи, либо слишком часто записываются, чтобы их охватывал параметр MinimumFileAgeDays (по умолчанию 5 дней, можно установить значение 0 с Set-Dedupvolume <Drive>: -MinimumFileAgeDays 0
).
Кстати, документация явно объявляет такую конфигурацию "неподдерживаемой":
Неподдерживаемые конфигурации
Постоянно открывать или менять файлы
Дедупликация не поддерживается для файлов, которые открыты и постоянно меняются в течение длительных периодов времени или имеют высокие требования к вводу-выводу, например, при работе виртуальных машин на хосте Hyper-V, действующих баз данных SQL Server или активных сеансов VDI.
Дедупликация может быть настроена на обработку файлов, возраст которых составляет 0 дней, и система продолжит функционировать должным образом, но не будет обрабатывать файлы, которые открыты исключительно. Неправильно использовать ресурсы сервера для дедупликации файла, в который постоянно записывается или будет записан в ближайшем будущем. Если вы установите для параметра минимального возраста файла по умолчанию значение 0, проверьте, что дедупликация не постоянно отменяется изменениями данных.
Дедупликация не будет обрабатывать файлы, которые постоянно и исключительно открыты для операций записи. Это означает, что вы не получите никакой экономии от дедупликации, если файл не будет закрыт, когда задание по оптимизации попытается обработать файл, который соответствует выбранным параметрам политики дедупликации.
И, таким образом, также содержит следующую рекомендацию:
Не хорошие кандидаты для дедупликации:
- Хозяева Hyper-V
- VDI VHD
- WSUS
- Серверы под управлением SQL Server или Exchange Server
- Файлы размером не более 1 ТБ
Это похоже на то, что вы ищете, это онлайн- дедупликация, которая выводит данные по мере их записи на диск. Это особенность некоторых более сложных SAN-решений (включая предложения Nexenta для SMB), но для кремния она стоит довольно дорого - вам понадобится мощная машина с большим количеством оперативной памяти для бесперебойной работы в режиме онлайн.
У меня такая же проблема. После прочтения этого блога упомянутые вами атрибуты отправили меня на следующий сайт MS........ тупой атрибут повторного разбора заставляет дедупликация пропускать реплику VHS.
Дедупликация пропускает следующие файлы:
Файлы состояния системы
Зашифрованные файлы
Файлы с расширенными атрибутами
Файлы размером менее 32 КБ
Точки повторной обработки (которые не являются точками повторной обработки дедупликации данных)
http://msdn.microsoft.com/en-us/library/windows/desktop/hh769303(v=vs.85).aspx