Фрагментация физических файлов базы данных SQL
Я знаю, что на самом деле есть три вида фрагментации, о которых я должен беспокоиться как администратор баз данных:
Фрагментация индекса в файлах данных SQL, включая фрагментацию кластерного индекса (таблицы). Определите это с помощью DBCC SHOWCONTIG (в SQL 2000) или sys.dm_ db_ index_ Physical_Stats (в 2005+).
Фрагментация VLF внутри файлов журнала SQL. Запустите DBCC LOGINFO, чтобы увидеть, сколько VLF содержится в каждом из ваших файлов журнала SQL.
Физическая фрагментация файлов базы данных на жестком диске. Диагностируйте это с помощью утилиты "Дефрагментация диска" в Windows. (вдохновленный этим прекрасным сообщением в блоге)
Большое внимание уделяется фрагментации индекса (см. Этот отличный ответ Serverfault от Пола Рэндалла), так что это не главное в моем вопросе.
Я знаю, что могу предотвратить физическую фрагментацию (и фрагментацию VLF), когда база данных изначально создается, планируя разумный ожидаемый размер файла данных и журнала, потому что эта фрагментация чаще всего происходит из-за частых увеличений и уменьшений, но у меня есть несколько вопросов о том, как исправить физическая фрагментация, как только она идентифицирована:
Прежде всего, актуальна ли физическая фрагментация в Enterprise SAN? Могу ли я / я должен использовать дефрагментацию Windows на диске SAN, или команда SAN использует внутренние утилиты дефрагментации? Является ли анализ фрагментации, который я получаю от инструмента Windows, даже точным при запуске на диске SAN?
Насколько велика физическая фрагментация производительности SQL? (Давайте предположим, что внутренний дисковый массив ожидает решения предыдущего вопроса.) Является ли это более крупной сделкой, чем внутренняя фрагментация индекса? Или это действительно та же самая проблема (привод должен делать случайное чтение вместо последовательного чтения)
Является ли дефрагментация (или перестройка) индексов пустой тратой времени, если диск физически фрагментирован? Должен ли я исправить один, прежде чем обратиться к другому?
Каков наилучший способ исправить физическую фрагментацию файлов в рабочей коробке SQL? Я знаю, что могу отключить службы SQL и запустить дефрагментацию Windows, но я также слышал о методике, при которой вы делаете полное резервное копирование, удаляете базу данных, а затем восстанавливаете из резервной копии на пустой диск. Этот последний метод рекомендуется? Создает ли восстановление из резервной копии, подобной этой, индексы с нуля, устраняя внутреннюю фрагментацию индекса? Или он просто возвращает порядок страниц на тот же, что и при создании резервной копии? (Мы используем резервные копии Quest Lightspeed со сжатием, если это имеет значение.)
ОБНОВЛЕНИЕ: Хорошие ответы на данный момент о том, следует ли дефрагментировать диски SAN (НЕТ) и стоит ли дефрагментация индекса на физически фрагментированных дисках (ДА).
Кто-нибудь еще хочет взвесить лучшие методы для проведения дефрагментации? Или оценка времени, которое, как вы ожидаете, потребуется для дефрагментации большого фрагментированного диска, скажем, 500 ГБ или около того? Очевидно, потому что это время, когда мой SQL-сервер не работает!
Кроме того, если у кого-нибудь есть какая-либо неподтвержденная информация об улучшениях производительности SQL, которые вы сделали, исправив физическую фрагментацию, это тоже было бы здорово. В блоге Майка рассказывается о том, как раскрыть проблему, но не говорится о том, какие улучшения она сделала.
6 ответов
Я думаю, что эта статья дает отличный обзор дефрагментации дисков SAN
http://www.las-solanas.com/storage_virtualization/san_volume_defragmentation.php
Основным моментом является то, что дефрагментация в хранилище SAN не рекомендуется, поскольку трудно сопоставить физическое расположение блоков на диске, когда SAN виртуализирует это местоположение при представлении LUN.
Если вы использовали сопоставления устройств RAW или у вас есть прямой доступ к RAID-набору, который является LUN, с которым вы работаете, я мог бы увидеть, что дефрагментация дает положительный эффект, но если вы получаете "виртуальный" LUN от общего RAID-массива 5 комплектов, нет.
Несколько частей на этот вопрос и ответ:
Как уже указывал Кевин, физическая фрагментация файлов на самом деле не относится к хранилищу Enterprise SAN, поэтому добавить нечего. Это действительно сводится к подсистеме ввода-вывода и тому, насколько вероятно, что вы сможете переключать диски с более случайных операций ввода-вывода при выполнении сканирования на более последовательные операции ввода-вывода при выполнении сканирования. для DAS, скорее всего, для сложного SAN-фрагмента, скорее всего, нет.
Дефрагментация на уровне файловой системы - делайте это только с выключенным SQL. Здесь я никогда не сталкивался с проблемами (так как никогда не выполнял онлайн-дефрагментацию файлов базы данных SQL с открытым файлом), но я слышал множество неподтвержденных свидетельств от клиентов и клиентов о возникающих странных проблемах с коррупцией. Общая мудрость заключается не в том, чтобы делать это с SQL онлайн.
Фрагментация индекса полностью ортогональна фрагментации файла. SQL Server не имеет представления о фрагментации файлов - слишком много уровней виртуализации между ними, чтобы иметь хоть какую-то надежду на разработку реальной геометрии подсистемы ввода-вывода. Фрагментация индекса, однако, SQL знает все о. Не повторяя слишком много из ответа, на который вы уже ссылались, фрагментация индекса не позволит SQL выполнять эффективную проверку дальности сканирования независимо от того, насколько фрагментированы (или нет) файлы на уровне файловой системы. Так что - абсолютно необходимо уменьшить фрагментацию индекса, если вы видите снижение производительности запросов.
Вам не нужно делать это в каком-то определенном порядке, хотя, если вы позаботитесь о фрагментации файловой системы, а затем перестроите все свои индексы и вызовете еще большую фрагментацию файловой системы, выращивая несколько файлов на дефрагментированном томе, вы, вероятно, быть галочкой. Будет ли это вызывать какие-либо проблемы с перфорированием? Как обсуждалось выше, это зависит от:-D
Надеюсь это поможет!
Каков наилучший способ исправить физическую фрагментацию файлов в рабочей коробке SQL?
Я запускаю SYSINTERNALS' contig в моих файлах базы данных.
См. http://technet.microsoft.com/en-us/sysinternals/bb897428.aspx
Я бы порекомендовал правильно выбрать размер базы данных, выключить сервер sql, скопировать файл базы данных на другой дисковый массив, а затем скопировать его обратно для дефрагментации. Гораздо быстрее, чем использование дефрагментации Windows в моем опыте.
Я однажды пытался дефрагментировать физические диски в scsi-решении, но практически не получил никакого повышения производительности. Урок, который я усвоил, состоит в том, что если вы испытываете низкую производительность из-за дисковой системы, это не имеет ничего общего с фрагментацией, насколько мы говорим с файлом данных, поскольку он использует произвольный доступ.
Если ваши индексы дефрагментированы и статистика обновлена (очень важно), и вы все еще видите, что ввод / вывод является узким местом, то вы страдаете от других вещей, кроме физической фрагментации. Вы использовали более 80% диска? Достаточно ли у вас дисков? Ваши запросы достаточно оптимизированы? Вы часто сканируете таблицы или, что еще хуже, ищите индексы, а затем просматриваете кластерные индексы? Посмотрите на планы запросов и используйте "установить статистику io on", чтобы узнать, что на самом деле происходит с вашим запросом. (ищите большое количество логических или физических чтений)
Пожалуйста, дайте мне знать, если я полностью неправ.
/ Хокан Винтер
Возможно, индексы недостаточно оптимизированы для вашего приложения, и у вас нет Veritas I3 для оптимизации базы данных, тогда вы можете использовать такой оператор, чтобы найти отсутствующие индексы:
SELECT
mid.statement,
mid.equality_columns,
mid.inequality_columns,
mid.included_columns,
migs.user_seeks,
migs.user_scans,
migs.last_user_seek,
migs.avg_user_impact,
user_scans,
avg_total_user_cost,
avg_total_user_cost * avg_user_impact * (user_seeks + user_scans) AS [weight]--, migs.*--, mid.*
FROM
sys.dm_db_missing_index_group_stats AS migs
INNER JOIN sys.dm_db_missing_index_groups AS mig
ON (migs.group_handle = mig.index_group_handle)
INNER JOIN sys.dm_db_missing_index_details AS mid
ON (mig.index_handle = mid.index_handle)
ORDER BY
avg_total_user_cost * avg_user_impact * (user_seeks + user_scans) DESC ;
Или такой оператор, чтобы найти индексы, которые не используются в операторах выбора и снижают производительность обновления / вставки:
CREATE PROCEDURE [ADMIN].[spIndexCostBenefit]
@dbname [nvarchar](75)
WITH EXECUTE AS CALLER
AS
--set @dbname='Chess'
declare @dbid nvarchar(5)
declare @sql nvarchar(2000)
select @dbid = convert(nvarchar(5),db_id(@dbname))
set @sql=N'select ''object'' = t.name,i.name
,''user reads'' = iu.user_seeks + iu.user_scans + iu.user_lookups
,''system reads'' = iu.system_seeks + iu.system_scans + iu.system_lookups
,''user writes'' = iu.user_updates
,''system writes'' = iu.system_updates
from '+ @dbname + '.sys.dm_db_index_usage_stats iu
,' + @dbname + '.sys.indexes i
,' + @dbname + '.sys.tables t
where
iu.database_id = ' + @dbid + '
and iu.index_id=i.index_id
and iu.object_id=i.object_id
and iu.object_id=t.object_id
AND (iu.user_seeks + iu.user_scans + iu.user_lookups)<iu.user_updates
order by ''user reads'' desc'
exec sp_executesql @sql
set @sql=N'SELECT
''object'' = t.name,
o.index_id,
''usage_reads'' = user_seeks + user_scans + user_lookups,
''operational_reads'' = range_scan_count + singleton_lookup_count,
range_scan_count,
singleton_lookup_count,
''usage writes'' = user_updates,
''operational_leaf_writes'' = leaf_insert_count + leaf_update_count + leaf_delete_count,
leaf_insert_count,
leaf_update_count,
leaf_delete_count,
''operational_leaf_page_splits'' = leaf_allocation_count,
''operational_nonleaf_writes'' = nonleaf_insert_count + nonleaf_update_count + nonleaf_delete_count,
''operational_nonleaf_page_splits'' = nonleaf_allocation_count
FROM
' + @dbname + '.sys.dm_db_index_operational_stats(' + @dbid + ', NULL, NULL, NULL) o,
' + @dbname + '.sys.dm_db_index_usage_stats u,
' + @dbname + '.sys.tables t
WHERE
u.object_id = o.object_id
AND u.index_id = o.index_id
and u.object_id=t.object_id
ORDER BY
operational_reads DESC,
operational_leaf_writes,
operational_nonleaf_writes'
exec sp_executesql @sql
GO
У меня есть некоторые другие операторы SQL, которые я использую при анализе проблем производительности в производственной среде, но я думаю, что эти два - хорошее начало.
(Я знаю, этот пост немного тематический, но я подумал, что вас это может заинтересовать, так как он связан со стратегией индексирования)
/ Хокан Винтер