Overzicht Gegevensontdubbeling

 

Gepubliceerd: augustus 2016

Is van toepassing op: Windows Storage Server 2012, Windows Server 2012 R2, Windows Server 2012

In dit onderwerp wordt de functie voor gegevensontdubbeling Windows Server 2012 R2 en Windows Server 2012 beschreven en worden er enkele praktische toepassingen van de functie besproken.

Functiebeschrijving

Gegevensontdubbeling omvat het zoeken en verwijderen van dubbele vermeldingen binnen gegevens verwijderen, zonder dat dit ten koste gaat van de kwaliteit of integriteit. Het doel is meer gegevens op minder ruimte op te slaan door bestanden te segmenteren in kleine stukken met een variabele grootte (32-128 KB), dubbele segmenten te identificeren en één exemplaar van elk segment te bewaren. Redundante exemplaren van het segment worden vervangen door een verwijzing naar één exemplaar. De segmenten worden gecomprimeerd en vervolgens ingedeeld in speciale containerbestanden in de map met informatie over systeemvolumes.

Het resultaat is een transformatie op de schijf van elk bestand, zoals weergegeven in afbeelding 1. Na ontdubbeling worden de bestanden niet meer opgeslagen als onafhankelijke gegevensstromen, maar vervangen door stubs die verwijzen naar gegevensblokken die zijn opgeslagen in een algemeen segmentarchief. Omdat deze bestanden blokken delen, worden deze blokken slechts eenmalig opgeslagen, waardoor er minder schijfruimte nodig is om alle bestanden op te slaan. Tijdens de toegang tot bestanden worden de juiste blokken transparant opgebouwd om de gegevens te leveren zonder dat de toepassing wordt aangeroepen of dat de gebruiker kennis heeft van de transformatie op schijf naar het bestand. Hierdoor kunnen beheerders gegevensontdubbeling toepassen op bestanden zonder dat ze zich zorgen hoeven maken over wijzigingen in het gedrag van de toepassingen of de gevolgen voor gebruikers die deze bestanden openen.

Afbeelding 1 Transformatie van bestanden op de schijf

Afbeelding 1   Transformatie van bestanden op schijf tijdens gegevensontdubbeling

Nadat een volume is ingeschakeld voor gegevensontdubbeling en de gegevens zijn geoptimaliseerd, bevat het volume het volgende:

  • Niet-geoptimaliseerde bestanden. Bij niet-geoptimaliseerde bestanden kan het bijvoorbeeld gaan om bestanden die niet voldoen aan de geselecteerde instelling voor het beleid voor de bestandsleeftijd, systeemstatusbestanden, alternatieve gegevensstreams, gecodeerde bestanden, bestanden met uitgebreide kenmerken, bestanden die kleiner zijn dan 32 KB, andere reparsepuntbestanden of bestanden die door andere toepassingen worden gebruikt (de limiet 'in gebruik' wordt verwijderd in de Windows Server 2012 R2).

  • Geoptimaliseerde bestanden. Bestanden die worden opgeslagen als reparsepunten met verwijzingen naar een overzicht van de betreffende segmenten in het segmentarchief die nodig zijn om het bestand te herstellen wanneer deze wordt opgevraagd.

  • Segmentarchief. Locatie voor de geoptimaliseerde bestandsgegevens.

  • Extra vrije ruimte. De geoptimaliseerde bestanden en het segmentarchief nemen veel minder ruimte in dan voor de optimalisatie.

Praktische toepassingen

Om de toenemende gegevensopslag binnen de onderneming het hoofd te bieden, consolideren beheerders servers en vormen capaciteitsschaling en gegevensoptimalisatie belangrijke doelstellingen. Gegevensontdubbeling biedt praktische manieren om deze doelstellingen te realiseren, waaronder:

  • Capaciteitsoptimalisatie. Gegevensontdubbeling zorgt ervoor dat er meer gegevens kunnen worden opgeslagen in minder fysieke ruimte. De opslagefficiëntie is groter dan met functies als Single Instance Storage (SIS) of NTFS-compressie kan worden bereikt. Gegevensontdubbeling verdeelt de subbestanden in segmenten van verschillende grootte en maakt gebruik van compressie, wat resulteert in een optimalisatieratio van 2:1 voor algemene bestandsservers en een ratio van maximaal 20:1 voor virtualisatiegegevens.

  • Schaal en prestaties. Gegevensontdubbeling is zeer schaalbaar, resource-efficiënt en opvallend. Kan maximaal 50 MB per seconde verwerken in Windows Server 2012 R2 en 20 MB aan gegevens per seconde in Windows Server 2012. Dit kan tegelijkertijd uitgevoerd op meerdere volumes zonder dat dit ten koste gaat van andere werkbelastingen op de server. De lage impact op de serverbelastingen wordt bereikt door het beperken van de CPU en geheugenbronnen die worden verbruikt. Als de server overbelast raakt, kan de ontdubbeling volledig worden gestopt. Beheerders hebben bovendien de flexibiliteit om op elk gewenst moment taken voor gegevensontdbubbeling uit te voeren, schema's voor het uitvoeren van gegevensontdubbeling in te stellen en beleidsrichtlijnen voor bestandsselectie op te stellen.

  • Betrouwbaarheid en gegevensintegriteit. Wanneer gegevensontdubbeling wordt toegepast, wordt de integriteit van de gegevens gehandhaafd. Gegevensontdubbeling valideert de controlesom, consistentie en identiteit om de integriteit van gegevens te controleren. Voor alle metagegevens en de gegevens waarnaar het meest wordt verwezen, handhaaft gegevensontdubbeling de redundantie om ervoor te zorgen dat de gegevens in het geval van beschadiging kunnen worden hersteld.

  • Efficiënter gebruik van bandbreedte met BranchCache. Dankzij de integratie met BranchCache worden dezelfde optimalisatietechnieken toegepast op gegevens die via het WAN worden overgedragen naar een filiaal. Het resultaat is dat bestanden sneller worden gedownload en dat het bandbreedteverbruik wordt gereduceerd.

  • Optimalisatiebeheer met bekende hulpmiddelen. Gegevensontdubbeling heeft de optimalisatiefunctie ingebouwd in Serverbeheer en Windows PowerShell. De standaardinstellingen leveren direct een besparing op, maar beheerders kunnen de instellingen ook verfijnen om nog meer te besparen. U kunt Windows PowerShell-cmdlets gebruiken om een optimalisatietaak te starten of een optimalisatietaak te plannen die in de toekomst moet worden uitgevoerd. De installatie van de functie Gegevensontdubbeling en het inschakelen van ontdubbeling op geselecteerde volumes kan ook worden bereikt via een Unattend.xml-bestand dat een Windows PowerShell-script aanroept en kan worden gebruikt met Sysprep om ontdubbeling te implementeren wanneer een systeem voor het eerst wordt opgestart.

Nieuwe en gewijzigde functionaliteit

In de volgende tabel worden de wijzigingen in de functie Gegevensontdubbeling beschreven. Zie Wat is nieuw in Gegevensontdubbeling in WindowsServer voor meer informatie.

Onderdeel/functionaliteit

Nieuw of bijgewerkt?

Beschrijving

Gegevensontdubbeling voor externe opslag van VDI-belastingen (Virtual Desktop Infrastructure)

Nieuw in Windows Server 2012 R2

Optimaliseren van virtuele harde schijven (VHD's) voor VDI-belastingen (Virtual Desktop Infrastructure) door het implementeren van Gegevensontdubbeling op gedeelde clustervolumes (CSV's).

Een geoptimaliseerd bestand op het oorspronkelijke pad uitbreiden

Nieuw in Windows Server 2012 R2

Gebruik de nieuwe cmdlet Expand-DedupFile in Windows PowerShell om geoptimaliseerde bestanden op het opgegeven pad te decomprimeren naar het oorspronkelijke pad indien nodig voor compatibiliteit met toepassingen, prestaties of andere vereisten. Zie T:Deduplication.Expand-DedupFile voor meer informatie over de cmdlet.

Gegevensontdubbeling voor back-upvolumes die worden gebruikt door gevirtualiseerde back-uptoepassingen

Nieuw in Windows Server 2012 R2

Optimaliseer virtuele harde schijven (VHD's) die worden gebruikt door gevirtualiseerde werkbelastingen van back-uptoepassingen en door het implementeren van gegevensontdubbeling op gedeelde clustervolumes (CSV’s) of beperkte hyper-geconvergeerde configuraties. (Ondersteund in Windows Server 2012 R2 met het updatepakket van november 2014 (KB 3000850) of nieuwer.)

Vereisten

Als u wilt profiteren van gegevensontdubbeling, moet de omgeving aan de volgende vereisten voldoen:

  • Server: één computer of virtuele machine met Windows Server 2012 R2 of Windows Server 2012 met ten minste één gegevensvolume

  • (Optioneel) Een andere computer of virtuele machine met Windows Server 2012 R2 of Windows Server 2012 die via een netwerk is verbonden met de server

    Belangrijk

    Als gegevensontdubbeling wordt uitgevoerd op VDI-werkbelastingen of gevirtualiseerde back-upwerkbelastingen, moeten alle VHD-bestanden:

    • zijn opgeslagen op een bestandsserver met Windows Server 2012 R2, en het opslag- en berekeningsknooppunt worden uitgevoerd op verschillende servers;

    • zijn opgeslagen op lokale opslag in een specifieke, beperkt hyper-geconvergeerde configuratie. Zie Plan de implementatie van Gegevensontdubbeling voor gedetailleerde vereisten.

Interoperabiliteit met virtuele Azure-machines

U kunt deze Windows Server-functieservice uitvoeren op een virtuele machine in Azure. Dit scenario is getest met Windows Server 2012 R2. Het is raadzaam Gegevensontdubbeling te gebruiken met Microsoft Azure Virtual Machines die volumes hebben die regelmatig worden lezen maar waarvoor slechts incidenteel schrijfbewerkingen worden uitgevoerd. In deze situaties biedt Gegevensontdubbeling een efficiënte manier om meer gegevens op te slaan in virtuele Azure-machines.

De volgende werkbelastingen zijn geschikt voor gebruik met Gegevensontdubbeling op virtuele Azure-machines:

  • Algemene bestandsservers met relatief statische inhoud

  • Microsoft SharePoint-sites met relatief statische inhoud

  • Websites met relatief statische inhoud

De volgende werkbelastingen zijn niet aanbevolen voor gebruik met Gegevensontdubbeling op virtuele Azure-machines als gevolg van de frequentie van wijzigingen in de grote bestanden die door de werkbelastingen worden gebruikt:

  • Messaging-servers zoals Microsoft Exchange Server

  • Databaseservers zoals Microsoft SQL Server

Voor meer informatie over hoe u kunt aan de slag met virtuele Azure-machines gaat u naar de Azure-website.

Architectuuroverzicht

De functie Gegevensontdubbeling bestaat uit een filterstuurprogramma dat de lokale of externe I/O controleert en een ontdubbelingsservice waarmee de drie typen beschikbare taken (optimalisatie, garbagecollection en scrubbing) worden beheerd.

Tolerantie tijdens hardwarefouten is inherent aan de ontdubbelingsarchitectuur — met volledige validatie van de controlesom voor gegevens en metagegevens, met inbegrip van redundantie voor metagegevens en de meestgebruikte gegevenssegmenten.

Met Gegevensontdubbeling kunnen in potentie alle gegevens op een geselecteerd volume worden verwerkt (met uitzondering van bestanden die kleiner zijn dan 32 KB, bestanden in mappen die zijn uitgesloten of bestanden waarvoor leeftijdsinstellingen zijn toegepast). Voordat u de functie inschakelt, moet u zorgvuldig bepalen of een server en de gekoppelde volumes geschikte kandidaten zijn voor ontdubbeling. Het is raadzaam tijdens de ontdubbeling regelmatig een back-up van belangrijke gegevens te maken.

Zie ook

Zie de volgende bronnen voor aanvullende informatie.

Inhoudstype

Verwijzingen

Productevaluatie

Implementatie

Bewerkingen

Communitybronnen.

Verwante technologieën