Дедупликация в Windows Server 2012


С официальным выходом в свет Windows Server 2012 теперь можно вздохнуть спокойно- из RTM все-таки не убрали эту прекраснейшую возможность, как многие весьма справедливо того опасались.Чтобы включить эту функцию, нужно установить роль File and Storage Services и сконфигурировать несколько параметров. Сначала установим роль File And Service Role и не забудем отметить полезный сервис-  Data deduplication

Ставим

Конфигурируем: Открываем Server Manager-> File and Storage Servcies -> Volumes -> пр кл мыши на томе, где необходимо включить дедупликацию данных,  выбираем пункт Configure Data Deduplication

Отмечаем Enable data deduplication и меняем расписание так, как нам нравится.

Настройки расписания

Для управления функцией Data Deduplication очень разумно использовать Powershell:

Просмотреть статус

Просмотреть  полный отчет тома : 

Работает чудо-технология не на уровне файлов, как решения представленные на рынке сторонними производителями, а на уровне блоков данных.

Дедупликация данных в Windows Server 2012:

  • Доступна только в Windows Server 2012. (не ждите ее в клиентской ОС)
  • Дедупликация поддерживает кластерные решения (cluster aware).
  • Основана на драйвере фильтра для тома.
  • Не поддерживается для загрузочных или системных томов, предназначена только для томов с данными.
  • Не работает со сжатыми или зашифрованными NTFS файлами.
  • Требует файловую систему NTFS и не поддерживает ReFS.
  • Не поддерживает Cluster Shared Volumes.
  • Не поддерживает файлы меньше 32KB.
  • Не конфигурируется через Group Policy.
  • Дедупликация — это пост процесс, который может потребовать определенного времени.
  • Поддерживается кеширование и BITS.

Возможный эффект от применения технологии
Microsoft провела некоторые исследования с применением механизма дедупликации и опубликовала результаты исследования:

Использование Возможное сохранение
Общие данные 50-60%
Документы 30-50%
Библиотека приложений 70-80%
Библиотека VHD(X) 80-95%

Дедупликация данных – Производительность

Бесспорно, что включение дедупликации для тома повлечет за собой некоторое снижение производительности, где бы мы ни задействовали эту технологию — используя возможности оборудованиия, либо обходясь средствами ОС.

Операции записи не влияют напрямую на производительность, поскольку процесс дедупликации осуществляется в фоновом режиме во время простоя системы. А вот операции чтения подвержены снижению производительности примерно на 3% ,если файл не кеширован.

Дедупликация данных и PowerShell

Добавляем:

Add-WindowsFeature -name FS-Data-Deduplication

Поджигаем на диске D:

Enable-DedupVolume D:

По умолчанию, вау-эффект случится через 30 дней.

Изменим на 0 дней:

Set-DedupVolume D: -MinimumFileAgeDays 0

После этого процесс дедупликации запустится в планировщике задач.

Совет:  не используйте планировщик, если есть запущенные VM на томе. ( в первый раз запущенный процесс на 2-х  2TB WD Green работал 10 часов 😦 )
В таком сценарии выключите машины и проделайте ручную оптимизацию после создания одной или более VM.

Start-DedupJob D: –Type Optimization

Смотрим статус фонового задания:

Get-DedupJob

Можно не только включить,, но и выключить дедупликацию для тома, вот так:

Start-DedupJob -Volume D: -Type Unoptimization

И, напоследок, самый полезный командлет:

Реклама

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход / Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход / Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход / Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход / Изменить )

Connecting to %s