(0) exportieren Drucken
Alle erweitern

Installieren und Konfigurieren der Datendeduplizierung

Veröffentlicht: Februar 2012

Letzte Aktualisierung: August 2012

Betrifft: Windows Server 2012, Windows Storage Server 2012

In diesem Dokument wird das Einrichten eines Servers, das Aktivieren der Datendeduplizierung, das Optimieren eines Volumes sowie das Ausführen erweiterter Deduplizierungsvorgänge erklärt.

Inhalt dieses Dokuments

  1. Wählen Sie im Assistenten zum Hinzufügen von Rollen und Features unter "Serverrollen" die Option Datei- und Speicherdienste (falls diese nicht bereits installiert sind).

  2. Aktivieren Sie das Kontrollkästchen Dateidienste und anschließend das Kontrollkästchen Datendeduplizierung.

  3. Klicken Sie auf Weiter, bis die Schaltfläche Installieren aktiviert wird, und klicken ´Sie dann auf Installieren.

  1. Starten Sie Windows PowerShell. Klicken Sie auf der Taskleiste mit der rechten Maustaste auf das Windows PowerShell-Symbol, und klicken Sie dann auf Als Administrator ausführen.

  2. Führen Sie die folgenden Windows PowerShell-Befehle aus:

    PS C:\> Import-Module ServerManager
    PS C:\> Add-WindowsFeature -name FS-Data-Deduplication
    PS C:\> Import-Module Deduplication
    

  1. Klicken Sie auf dem Server-Manager-Dashboard auf ein Datenvolume und wählen Sie die Option Datendeduplizierung konfigurieren. Die Seite "Deduplizierungseinstellungen" wird geöffnet.

  2. Aktivieren Sie das Kontrollkästchen Datendeduplizierung aktivieren, geben Sie die Anzahl der Tage von der Erstellung bis zur Deduplizierung der Dateien ein, geben Sie die Erweiterungen der Dateien ein, die nicht dedupliziert werden sollen, und klicken Sie dann auf Hinzufügen um zu allen Ordnern mit nicht zu deduplizierenden Dateien zu navigieren.

  3. Klicken Sie auf Übernehmen, um diese Einstellungen zu übernehmen und zum Server-Manager-Dashboard zurückzukehren, oder klicken Sie auf die Schaltfläche Zeitplan für die Deduplizierung festlegen, um mit dem Festlegen eines Zeitplans für die Deduplizierung fortzufahren.

  1. Zum Aktivieren der Deduplizierung auf einem Volume führen Sie auf dem Server den folgenden Windows PowerShell-Befehl aus. In diesem Beispiel wird die Deduplizierung auf Volume E aktiviert.

    PS C:\> Enable-DedupVolume E:
    
  2. Legen Sie optional eine Mindestanzahl von Tagen fest, die vor der Deduplizierung einer Datei vergehen müssen. Verwenden Sie dazu den folgenden Befehl.

    PS C:\> Set-Dedupvolume E: -MinimumFileAgeDays 20
    

    Wenn Sie "MinimumFileAgeDays" auf 0 festlegen, werden alle Dateien unabhängig von ihrem Alter dedupliziert. Diese Einstellung eignet sich für eine Testumgebung, in der die maximale Deduplizierung getestet werden soll. In einer Produktionsumgebung wird dagegen empfohlen, mehrere Tage zu warten (standardmäßig 5 Tage), da sich Dateien in einem kurzen Zeitraum häufig ändern, bevor die Änderungsrate abnimmt. Dies ermöglicht die effizienteste Nutzung Ihrer Serverressourcen.

So geben Sie mithilfe von Windows PowerShell eine Liste der für die Datendeduplizierung aktivierten Volumes zurück

Führen Sie auf dem Server die folgenden Windows PowerShell-Befehle aus.

PS C:\> Get-DedupVolume
PS C:\> Get-DedupVolume | format-list

Mit dem ersten Befehl wird eine Zusammenfassung der Informationen zurückgegeben, und mit den zweiten Befehl werden Details zu den Volumedaten-Deduplizierungseinstellungen zurückgegeben.

In Windows Server 2012 können Datendeduplizierungsaufträge nach Bedarf (manuell) oder nach einem Zeitplan ausgeführt werden. Auf einem Volume können drei Arten von Aufträgen ausgeführt werden: Optimierung, Datenbereinigung und automatische Speicherbereinigung.

Die Datendeduplizierung beinhaltet integrierte Aufträge, die automatisch gestartet werden und das bzw. die angegebene(n) Volume(s) regelmäßig optimieren. Optimierungsaufträge deduplizieren Daten und komprimieren Dateiblöcke auf einem Volume gemäß den Richtlinieneinstellungen. Nachdem die Erstoptimierung abgeschlossen ist, werden für die in den Richtlinien enthaltenen Dateien Optimierungsaufträge ausgeführt. Dies erfolgt gemäß den von Ihnen konfigurierten Auftragszeitplänen oder den im Produkt enthaltenen Standardauftragszeitplänen.

Sie können einen Optimierungsauftrag bei Bedarf in Windows PowerShell mithilfe des Cmdlets Start-DedupJob auslösen. Beispiel:

PS C:\> Start-DedupJob –Volume E: –Type Optimization

Dieser Befehl wird sofort zurückgegeben, und der Auftrag wird asynchron gestartet. Wenn der Auftrag zu einem späteren Zeitpunkt ausgeführt werden soll, fügen Sie den Parameter "–wait" wie folgt hinzu:

PS C:\> Start-DedupJob E: –Type Optimization -Wait

Sie können den Fortschritt des Auftrags auf dem Volume mit dem Cmdlet Get-DedupJob abfragen:

PS C:\> Get-DedupJob

Mit dem Befehl Get-DedupJob werden derzeit ausgeführte Aufträge und Aufträge in der Warteschlange angezeigt.

Sie können die wichtigsten Statusstatistiken einschließlich der erzielten Einsparungen auf dem Volume mit dem Cmdlet Get-DedupStatus abrufen:

PS C:\> Get-DedupStatus | f1

Mit dem Befehl Get-DedupStatus werden freier Speicherplatz, gesparter Speicherplatz, optimierte Dateien, InPolicyfiles (die Anzahl der Dateien, die in der Deduplizierungsrichtlinie des Volumes berücksichtigt sind, basierend auf definiertem Dateialter, Größe, Typ und Speicherortkriterien) sowie die zugeordnete Laufwerksidentifizierung angezeigt.

noteHinweis
Sie können die Einsparungen durch Deduplizierung auch in Server-Manager auf der Volumes-Seite anzeigen. Klicken Sie in Server-Manager auf Dateidienste und anschließend auf Volumes. Klicken Sie mit der rechten Maustaste auf die Spaltenüberschrift, um Einsparungen durch Deduplizierung hinzuzufügen.

Warteschlange für Optimierungsaufträge

Optimierungsaufträge werden in der folgenden Reihenfolge gestartet:

  1. Präemptiv (manuelle Ausführung von nicht geplanten Aufträgen)

    Manuelle Aufträge mit der Option –Preempt beenden alle derzeit ausgeführten Aufträge und werden sofort gestartet. (Beachten Sie, dass die Option –Preempt bei geplanten Aufträgen ignoriert wird.)

  2. StopWhenSystemBusy-Parameter

    Aufträge mit diesem Parameter werden angehalten, wenn keine Ressourcen verfügbar sind, um den Auftrag ohne Beeinträchtigung der Arbeitslast des Servers auszuführen.

  3. Priorität

    Bei mehreren Aufträgen mit verschiedenen StopWhenSystemBusy-Einstellungen werden Aufträge mit hoher Priorität als Erstes, normale Aufträge als Zweites, und Aufträge mit niedriger Priorität als Letztes in der Warteschlange eingereiht.

  4. Manuell oder geplant

    Manuelle Aufträge werden vor geplanten Aufträgen in der Warteschlange eingereiht.

Speichereinstellungen gelten nicht als Teil des Optimierungsauftrags-Warteschlangenalgorithmus.

Optimierungsmetadaten

Metadaten bieten Nachweise für Einsparungen, die durch die Verwendung der Optimierung erzielt wurden. Diese Metadaten werden mit drei Cmdlets ausgegeben: Update-DedupStatus, Get-DedupMetadata und Measure-DedupFileMetadata. Diese Metadaten helfen Ihnen beim Bewerten der Auswirkungen einiger Optimierungskonfigurationsoptionen.

Update-DedupStatus gibt die folgenden Metadaten zurück:

 

Metadaten Was wird angegeben

DedupSavedSpace

Unterschied zwischen der logischen Größe der optimierten Dateien und der logischen Größe des Speichers (die deduplizierten Benutzerdaten plus Deduplizierungsmetadaten). Diese Anzahl ändert sich laufend.

DedupRate

Verhältnis von "DedupSavedSpace" zur logischen Größe aller Dateien auf dem Volume; wird als Prozentsatz ausgedrückt. Diese Anzahl ändert sich laufend.

OptimizedFilesCount

Anzahl der optimierten Dateien auf den angegebenen Volume. Beachten Sie, dass sich diese Anzahl konstant bleibt (statt abzunehmen), wenn Benutzer Dateien vom Volume löschen oder Dateien hinzufügen, bis Sie einen automatischen Speicherbereinigungsauftrag ausführen. Diese Anzahl wird nach der Ausführung eines vollständigen automatischen Speicherbereinigungsauftrags am präzisesten angezeigt.

OptimizedFilesSize

Aggregierte Größe aller optimierten Dateien auf den angegebenen Volume. Beachten Sie, dass sich diese Anzahl konstant bleibt (statt abzunehmen), wenn Benutzer Dateien vom Volume löschen oder neue Dateien hinzufügen, bis Sie einen automatischen Speicherbereinigungsauftrag ausführen. Diese Anzahl wird nach der Ausführung eines vollständigen automatische Speicherbereinigungs am präzisesten angezeigt.

InPolicyFilesCount

Anzahl der derzeit zur Optimierung berechtigten Dateien. Diese Anzahl bleibt zwischen Optimierungsaufträgen relativ konstant.

InPolicyFilesSize

Aggregierte Größe aller derzeit zur Optimierung berechtigten Dateien. Diese Anzahl bleibt zwischen Optimierungsaufträgen relativ konstant.

LastOptimizationTime

Datum und Uhrzeit der letzten Ausführung eines Optimierungsauftrags auf dem angegebenen Volume. Dieses Datum und diese Uhrzeit bleiben zwischen Optimierungsaufträgen konstant.

LastGarbageCollectionTime

Datum und Uhrzeit der letzten Ausführung eines automatischen Speicherbereinigungsauftrags auf dem angegebenen Volume. Dieses Datum und diese Uhrzeit bleiben zwischen Optimierungsaufträgen konstant.

LastScrubbingTime

Datum und Uhrzeit der letzten Ausführung eines Bereinigungsauftrags auf dem angegebenen Volume. Dieses Datum und diese Uhrzeit bleiben zwischen Optimierungsaufträgen konstant.

Get-DedupMetadata gibt die folgenden Metadaten zurück:

 

Metadaten Was wird angegeben

DataChunkCount

Anzahl der Datenblöcke auf dem Volume.

DataContainerCount

Anzahl der Container im Datenspeicher.

DataChunkAverageSize

Datenspeichergröße (ohne Blockmetadaten) geteilt durch die Gesamtanzahl von Datenblöcken im Datenspeicher.

StreamMapCount

Anzahl der Datenströme auf dem Volume.

StreamMapContainerCount

Anzahl der Container im Stromzuordnungsspeicher.

StreamMapAverageChunkCount

Größe des Stromzuordnungsspeichers geteilt durch die Gesamtanzahl von Strömen im Speicher.

HotspotCount

Anzahl der Hotspot-Blöcke auf dem Volume. Ein Hotspot ist ein Block, auf den mehr als 100 Mal verwiesen wird. Alle Hotspotblöcke werden auf dem Volume dupliziert, um eine automatische Wiederherstellung bei Datenbeschädigungen verfügbar zu machen, wenn auf dem Datenträger Daten beschädigt werden und einer dieser häufig verwendeten Blöcke beeinträchtigt wird.

HotspotContainerCount

Anzahl der Hotspotcontainer.

CorruptionLogEntryCount

Anzahl der beschädigten Elemente auf dem Volume.

Die Datendeduplizierung verfügt über integrierte Datenintegritätsfeatures wie z. B. Prüfsummenvalidierung und Überprüfung der Metadatenkonsistenz. Zudem ist eine integrierte Redundanz für kritische Metadaten und die am häufigsten verwendeten Datenblöcke verfügbar. Beim Zugriff auf Daten oder der Verarbeitung von Daten durch Aufträge ermitteln diese Features u. U. Beschädigungen und zeichnen diese Beschädigungen in einer Protokolldatei auf. Bereinigungsaufträge verwenden diese Features zum Analysieren der Blockspeicher-Beschädigungsprotokolle und ggf. zum Vornehmen von Korrekturen. Mögliche Reparaturvorgänge umfassen das Verwenden dreier Quellen von redundanten Daten:

  1. Durch Deduplizierung werden Sicherungskopien von häufig verwendeten Blöcken beibehalten, wenn auf diese im als "Hotspot" bezeichneten Bereich mehr als 100 Mal verwiesen wird. Falls die Arbeitskopie beschädigt ist, wird bei der Deduplizierung die Sicherung verwendet.

  2. Bei der Verwendung von Speicherplätze in einer gespiegelten Konfiguration, kann die Deduplizierung die Spiegelung des redundanten Blocks verwenden, um E/A zu bedienen und die Beschädigung zu beheben.

  3. Wenn eine Datei mit einem beschädigten Block verarbeitet wird, wird der beschädigte Block entfernt, und der neue eingehende Block wird zum Beheben der Beschädigung verwendet.

Bereinigungsaufträge geben einen Zusammenfassungsbericht hier im Windows-Ereignisprotokoll aus:

Ereignisanzeige\Anwendungs- und Dienstprotokolle\Microsoft\Windows\Deduplication\Scrubbing

Die Datendeduplizierungsstandards erstellen wöchentlich einen Datenintegritäts-Bereinigungsauftrag, Sie können den Auftrag bei Bedarf jedoch auch mit dem folgenden Befehl auslösen:

PS C:\> Start-DedupJob E: –Type Scrubbing

Dadurch wird ein Auftrag gestartet, mit dem während des E/A-Vorgangs an Deduplizierungsdateien alle Beschädigungen behoben werden sollen, die im internen Deduplikationsbeschädigungsprotokolle erfasst wurden. Zum Überprüfen der Datenintegrität aller deduplizierten Daten auf dem Volumen verwenden Sie den Parameter -full:

PS C:\> Start-DedupJob E: –Type Scrubbing -full

Der auch als "umfassende Bereinigung" bezeichnete -full-Parameter bereinigt den vollständigen Satz deduplizierter Daten und sucht nach allen Beschädigungen, die zu Datenzugriffsfehlern führen.

Die Datendeduplizierung verwendet Speicherbereinigungsaufträge zum Verarbeiten gelöschter oder geänderter Daten auf dem Volume, damit Datenblöcke bereinigt werden und nicht mehr darauf verwiesen wird. Speicherbereinigungsaufträge verarbeiten zuvor gelöschten oder logisch überschriebenen optimierten Inhalt zum Erstellen von verwendbarem freiem Volumespeicherplatz. Wenn eine optimierte Datei gelöscht oder mit neuen Daten überschrieben wird, werden die alten Daten im Blockspeicher nicht sofort gelöscht.

noteHinweis
Die Speicherbereinigung ist ein arbeitsintensiver Vorgang, daher sollten Sie zulassen, dass die Auslastung durch den Löschvorgang eine Grenze erreicht und dann diesen Auftragstyp manuell ausführen oder ihn außerhalb der normalen Arbeitszeiten zu planen.

Die Speicherbereinigung kann auch bei Bedarf ausgelöst werden. Beispiel:

PS C:\> Start-DedupJob E: –Type GarbageCollection

Mit diesem Befehl werden Blöcke entfernt, auf die nicht verwiesen wird, sowie Container komprimiert, die mehr als 5 % an Daten enthalten, auf die nicht verwiesen wird. Bei Angabe des –full-Parameters komprimiert der Auftrag alle Container mit der höchstmöglichen Rate. Beispiel:

PS C:\> Start-DedupJob E: –Type GarbageCollection -full

Die Datendeduplizierung umfasst drei Zeitpläne, die sofort eingerichtet werden. Die Optimierung wird stündlich ausgeführt, die Speicherbereinigung und die Bereinigung sind einmal pro Woche angesetzt. Sie können die Zeitpläne mit diesem Windows PowerShell-Befehl anzeigen:

PS C:\> Get-DedupSchedule

Enabled    Type               StartTime              Days               Name
-------    ----               ---------              ----               ----
True       Optimization                                                 BackgroundOptimization
True       GarbageCollection  2:45 AM                Saturday           WeeklyGarbageCollection
True       Scrubbing          3:45 AM                Saturday           WeeklyScrubbing

Zwei zusätzliche Zeitpläne können sofort zum Hinzufügen von Aufträgen verwendet werden. Diese Auftragszeitpläne werden auf allen Volumes auf dem Server ausgeführt. Soll ein Auftrag nur auf einem bestimmten Volume ausgeführt werden, müssen Sie einen neuen Auftrag erstellen. Sie können Auftragszeitpläne auf der Seite Deduplizierungseinstellungen in Server-Manager erstellen, ändern oder anzeigen, oder indem Sie die folgenden Windows PowerShell-Befehle verwenden:

PS C:\> Set-DedupSchedule <ScheduleName> <properties>
PS C:\> Remove-DedupSchedule <ScheduleName>
noteHinweis
Die Deduplizierung unterstützt nur die Planung von wöchentlichen Aufträgen. Wenn Sie eine Zeitplan für einen monatlichen Auftrag oder einen anderen Zeitraum erstellen möchten, verwenden Sie dazu die Windows-Aufgabenplanung. Sie können benutzerdefinierte, mit der Aufgabenplanung erstellte oder geänderte Auftragszeitpläne jedoch nicht mit dem Cmdlet Get-DedupSchedule anzeigen. Solche Zeitpläne werden bei Serveraktualisierungen nicht migriert.

Folgende integrierte Auftragszeitpläne werden von der Datendeduplizierung verarbeitet:

  • BackgroundModeOptimization   Verwenden Sie diesen Auftragszeitplan, um einen Optimierungsauftrag mit den folgenden Parametern auszuführen:

     

    Parameter Wert

    Aktiviert

    True

    Priorität

    Niedrig

    Arbeitsspeicher

    25

    ContinueWhenSystemBusy

    False

    ScheduledTask

    Microsoft\Windows\Deduplication\BackgroundModeOptimization

    Start

    00:00:00

    Tage

    {Mo,Di,Mi,Do,Fr,Sa,So}

    Dauer

    0

    Wiederholung

    1





  • ThroughputModeOptimization   Verwenden Sie diesen Auftragszeitplan, um einen Optimierungsauftrag mit den folgenden Parametern auszuführen:

     

    Parameter Wert

    Aktiviert

    False

    Priorität

    Normal

    Arbeitsspeicher

    50

    ContinueWhenSystemBusy

    False

    ScheduledTask

    Microsoft\Windows\Deduplication\ThroughputModeOptimization

    Start

    00:00:00

    Tage

    {Mo,Di,Mi,Do,Fr,Sa,So}

    Dauer

    4

    Wiederholung

    0





  • ThroughputModeOptimization2   Verwenden Sie diesen Auftragszeitplan, um einen Optimierungsauftrag mit den folgenden Parametern auszuführen:

     

    Parameter Wert

    Aktiviert

    False

    Priorität

    Normal

    Arbeitsspeicher

    50

    ContinueWhenSystemBusy

    False

    ScheduledTask

    Microsoft\Windows\Deduplication\ThroughputModeOptimization

    Start

    00:00:00

    Tage

    {Mo,Di,Mi,Do,Fr,Sa,So}

    Dauer

    4

    Wiederholung

    0





  • WeeklyGarbageCollection   Mit dieser Standardeinstellung wird das Ausführen eines Speicherbereinigungsauftrags mit den folgenden Parametern geplant:

     

    Parameter Wert

    Aktiviert

    True

    Priorität

    Normal

    Arbeitsspeicher

    50

    ContinueWhenSystemBusy

    False

    ScheduledTask

    Microsoft\Windows\Deduplication\WeeklyGarbageCollection

    Start

    01:45:00

    Tage

    {Sa}

    Dauer

    0

    Wiederholung

    0





  • WeeklyScrubbing   Verwenden Sie diesen Auftragszeitplan, um einen Bereinigungsauftrag mit den folgenden Parametern auszuführen:

     

    Parameter Wert

    Aktiviert

    True

    Priorität

    Normal

    Arbeitsspeicher

    50

    ContinueWhenSystemBusy

    False

    ScheduledTask

    Microsoft\Windows\Deduplication\WeeklyScrubbing

    Start

    02:45:00

    Tage

    {Sa}

    Dauer

    0

    Wiederholung

    0




Überlegungen zur Verwendung

Einige Dateien können nicht gelesen werden, wenn auf einem deduplizierten Volume fast kein freier Speicherplatz mehr vorhanden ist. Führen Sie Lösen dieses Problems eine der folgenden Aktionen aus:

  • Führen Sie eine Speicherbereinigung zum Freigeben von Speicherplatz durch.

  • Kopieren Sie die Dateien an einen anderen Speicherort (wenn keine kürzlich erstellte Speicherzuordnung der Dateien vorhanden ist).

  • Führen Sie "Robocopy.exe" im zwischengespeicherten Lesemodus aus, um die Dateien an einen anderen Speicherort zu kopieren (wenn eine kürzlich erstellte Speicherzuordnung der Dateien vorhanden ist). Weitere Informationen zur Verwendung von Robocopy finden Sie unter Robocopy.

Überlegungen zu erweiterten Deduplizierungsrichtlinien

Mit einigen Serverkonfigurations können Sie den Deduplizierungsvorgang beschleunigen. Folgende Szenarien erfordern u. U. zusätzliche Auftragszeitplanung:

 

Bedingung Denkbare Aktion

Wichtige eingehende Daten

Fügen Sie zusätzliche Durchsatzoptimierungsaufträge hinzu.

Mehr Volumes als CPU-Core-Prozessoren mit wichtigen eingehenden Daten

Fügen Sie zusätzliche Durchsatzoptimierungsaufträge hinzu.

Die Datenlöschung überschreitet 50 GB pro Stunde, und Sie möchten den freien Speicherplatz so schnell wir möglich zurückerhalten.

Fügen Sie zusätzliche Speicherbereinigungsaufträge hinzu, um den Speicherplatz wieder freizugeben.

Fanden Sie dies hilfreich?
(1500 verbleibende Zeichen)
Vielen Dank für Ihr Feedback.

Community-Beiträge

HINZUFÜGEN
Anzeigen:
© 2014 Microsoft