Table of contents
TOC
Свернуть оглавление
Развернуть оглавление

Обзор дедупликации данных

wmgries|Последнее обновление: 14.04.2017
|
1 Участник

Область применения: Windows Server 2016

Что такое дедупликация данных

Дедупликацию данных для краткости часто называют Dedup. Это функция Windows Server 2016, с помощью которой можно уменьшить влияние избыточных данных на стоимость хранения. Если дедупликация данных включена, она оптимизирует свободное место в томе за счет проверки данных тома на наличие дублирующихся частей. Дублирующиеся части набора данных тома сохраняются один раз и (при необходимости) сжимаются для дополнительной экономии. Дедупликация оптимизирует избыточные данные, не нарушая достоверность или целостность данных. Дополнительные сведения о дедупликации данных см. в разделе Как работает дедупликация данных? на странице Общие сведения о дедупликации данных.

Важно

Обновление KB4013429 содержит накопительный пакет исправлений, в том числе обеспечивающих надежность системы. Мы настоятельно рекомендуем установить его при использовании дедупликации данных в Windows Server 2016.

Преимущества дедупликации данных

Дедупликация данных помогает администраторам хранилища снизить затраты, связанные с дублирующимися данными. Зачастую в больших наборах данных многие данные дублируются, что увеличивает затраты на их хранение. Например:

  • Файловые ресурсы пользователей могут содержать множество копий одних и тех же или похожих файлов.
  • Гостевые службы виртуализации могут практически не отличаться от служб на виртуальных машинах.
  • Моментальные снимки резервных копий могут иметь минимальные отличия от ежедневных.

Экономия места, которую может обеспечить дедупликация данных, зависит от набора данных или рабочей нагрузки в томе. В наборах данных с высоким уровнем дупликации скорость оптимизации достигает 95 %, а объем использования службы хранилища может уменьшаться в 20 раз. В следующей таблице представлены типичные значения экономии за счет дедупликации для разных типов содержимого.

СценарийСодержимоеОбычная экономия пространства
Документы пользователяДокументы Office, фотографии, музыка, видео и т. д.30-50 %
Общие ресурсы развертыванияДвоичные файлы программного обеспечения, CAB-файлы, символы и т. д.70–80 %
Библиотеки виртуализацииОбразы ISO, файлы виртуальных жестких дисков и т. д.80–95 %
Файловый ресурс общего доступаВсе вышеперечисленное50–60 %

Когда можно использовать дедупликацию данных

Illustration of file serversФайловые серверы общего назначения
Файловые серверы общего назначения представляют собой файловые серверы для общего использования, которые могут содержать общие папки любого типа из перечисленных далее:
  • Общие групповые папки
  • домашние папки пользователей;
  • рабочие папки
  • Общие ресурсы для разработки программного обеспечения
Файловые серверы общего назначения подходят для дедупликации данных из-за тенденции сохранения многочисленных копий или версий одного файла несколькими пользователями. От дедупликации данных выигрывают общие ресурсы для разработки программного обеспечения, так как многие двоичные файлы остаются по сути неизменными от сборки к сборке.
Illustration of VDI serversРазвертывания инфраструктуры виртуальных рабочих столов (VDI)
Благодаря серверам VDI, таким как службы удаленных рабочих столов, организации получают упрощенный способ подготовки настольных компьютеров для пользователей. Эта технология подходит для организаций по многим причинам.
  • Развертывание приложений: вы получаете возможность быстрого развертывания приложений в среде предприятия. Это особенно полезно при наличии приложений, которые часто обновляются, редко используются или являются сложными в управлении.
  • Консолидация приложений: при установке и запуске приложений из набора централизованно управляемых виртуальных машин больше нет необходимости обновлять приложения на клиентских компьютерах. Это также снижает требования к пропускной способности сети, необходимой для доступа к приложениям.
  • Удаленный доступ: пользователи могут получать доступ к корпоративным приложениям с таких устройств, как домашние компьютеры, киоски и маломощное оборудование, а также из операционных систем, отличных от Windows.
  • Доступ к филиалам: развертывания VDI могут обеспечить лучшую производительность приложений для работников филиала, которым требуется доступ к централизованным хранилищам данных. Ресурсоемкие приложения иногда не имеют протоколов клиентов и серверов, оптимизированных для подключений по медленной линии.
Развертывания VDI прекрасно подходят для дедупликации данных, так как виртуальные жесткие диски, определяющие удаленные рабочие столы для пользователей, по сути идентичны. Кроме того, дедупликация данных может помочь в случае падения производительности хранилища на пиковых нагрузках (так называемый VDI boot storm), когда множество пользователей одновременно входит на настольные системы в начале дня.
Illustration of backup applicationsЦелевые объекты резервного копирования, например виртуализированные приложения резервного копирования
Приложения резервного копирования, такие как Microsoft Data Protection Manager (DPM), прекрасно подходят для дедупликации данных, так как значительная часть моментальных снимков резервных копий дублируется.
Illustration of other workloadsДругие рабочие нагрузки
К другим рабочим нагрузкам также можно применять дедупликацию данных.
© 2017 Microsoft