Table of contents
TOC
Minimera innehållsförteckningen
Maximera innehållsförteckningen

Avancerade inställningar för Datadeduplicering

wmgries|Senast uppdaterad: 2017-03-10
|
1 Medverkande

Gäller för Windows Server 2016

I det här dokumentet beskrivs hur du ändrar avancerade inställningar för Datadeduplicering. När det gäller rekommenderade arbetsbelastningar bör standardinställningarna vara tillräckliga. Huvudskälet till att ändra de här inställningarna är att man vill förbättra prestanda för funktionen Datadeduplicering med andra typer av arbetsbelastningar.

Ändra jobbscheman för Datadeduplicering

Standardschemana för datadeduplicering fungerar bra för rekommenderade arbetsbelastningar och inkräktar så lite som möjligt (med undantag för prioritetsoptimeringsjobb som har aktiverats för användningstypen Säkerhetskopiering). När arbetsbelastningar har stora resurskrav kan du se till att jobben bara körs utanför normal arbetstid, eller så kan du minska eller öka den mängd systemresurser som ett datadedupliceringsjobb tillåts använda.

Ändra ett datadedupliceringsschema

Du kan schemalägga datadedupliceringsjobben via Schemaläggaren i Windows och du kan visa och redigera dem via sökvägen Microsoft\Windows\Deduplication. Datadeduplicering innehåller flera cmdletar som underlättar schemaläggningen.

Den vanligaste orsaken till att man ändrar något när ett datadedupliceringsjobb kör att man vill säkerställa att jobbet körs utanför normal arbetstid. I följande steg för steg-exempel visas hur du ändrar datadedupliceringsschemat för ett vackert dag-scenario: en hyperkonvergerad Hyper-V-värd som är inaktiv under helger och efter 19:00 på vardagar. Om du vill ändra schemat kör du följande PowerShell-cmdletar i en administratörskontext.

  1. Inaktivera de schemalagda timvisa optimeringsjobben.

     Set-DedupSchedule -Name BackgroundOptimization -Enabled $false
     Set-DedupSchedule -Name PriorityOptimization -Enabled $false
    
  2. Ta bort de schemalagda skräpinsamlings- och integritetsrensningsjobben.

     Get-DedupSchedule -Type GarbageCollection | ForEach-Object { Remove-DedupSchedule -InputObject $_ }
     Get-DedupSchedule -Type Scrubbing | ForEach-Object { Remove-DedupSchedule -InputObject $_ }
    
  3. Skapa ett optimeringsjobb nattetid som startar 19:00 med hög prioritet och alla tillgängliga processorer och allt tillgängligt minne i systemet.

     New-DedupSchedule -Name "NightlyOptimization" -Type Optimization -DurationHours 11 -Memory 100 -Cores 100 -Priority High -Days @(1,2,3,4,5) -Start (Get-Date "2016-08-08 19:00:00")
    
    Information

    Datumdelen av den System.Datetime som tillhandahållits till -Start är inte relevant (så länge som den ligger i det förflutna), men tidsdelen del anger när jobbet ska starta.

  4. Skapa ett veckovis skräpinsamlingsjobb som körs på lördagar med start 07:00:00 med hög prioritet och alla tillgängliga processorer och allt tillgängligt minne i systemet.

     New-DedupSchedule -Name "WeeklyGarbageCollection" -Type GarbageCollection -DurationHours 23 -Memory 100 -Cores 100 -Priority High -Days @(6) -Start (Get-Date "2016-08-13 07:00:00")
    
  5. Skapa ett veckovis integritetsrensningsjobb som körs på söndagar med start kl. 7 på morgonen med hög prioritet och alla tillgängliga processorer och allt tillgängligt minne i systemet.

     New-DedupSchedule -Name "WeeklyIntegrityScrubbing" -Type Scrubbing -DurationHours 23 -Memory 100 -Cores 100 -Priority High -Days @(0) -Start (Get-Date "2016-08-14 07:00:00")
    

Tillgängliga jobbomfattande inställningar

Du kan växla mellan följande inställningar för nya eller schemalagda datadedupliceringsjobb:

ParameternamnDefinitionGodkända värdenVarför skulle du vilja ange det här värdet?
TypTyp av jobb som ska schemaläggas
  • Optimering
  • GarbageCollection
  • Rensning
Det här värdet krävs eftersom det är den typ av jobb som du skulle vilja ha schemalagt. Du kan inte ändra det här värdet efter det att du har schemalagt uppgiften.
PrioritetSystemprioriteten för det schemalagda jobbet
  • Hög
  • Medel
  • Låg
Det här värdet hjälper systemet att allokera CPU-tid. Hög innebär att mer CPU-tid används, medan låg innebär att mindre CPU-tid används.
DagarDe dagar då jobbet har schemalagtsEn matris med heltalen 0-6 som representerar veckodagar:
  • 0 = söndag
  • 1 = måndag
  • 2 = tisdag
  • 3 = onsdag
  • 4 = torsdag
  • 5 = fredag
  • 6 = lördag
Schemalagda aktiviteter måste köras minst en dag.
KärnorDen procentandel kärnor i datorn som ska användas i ett jobbHeltalen 0-100 (anger procent)Anger vilken effektnivå ett jobb ska ha på systemets beräkningsresurser
DurationHoursDet maximala antal timmar under vilket ett jobb ska tillåtas körasPositiva heltalFörhindrar att ett jobb för att körs så att det kolliderar med en arbetsbelastnings aktiva timmar
AktiveradHuruvida jobbet ska körasSant/falsktInaktivera ett jobb utan att ta bort det
FullständigSchemalägga ett fullständigt skräpinsamlingsjobbVäxel (sant/falskt)Vart fjärde jobb är som standard ett fullständigt skräpinsamlingsjobb. Med den här växeln kan du lägga schemat så att fullständiga skräpinsamlingsjobb körs oftare.
InputOutputThrottleAnger hur stor I/O-begränsning som ska tillämpas på jobbetHeltalen 0-100 (anger procent)Begränsningen garanterar att jobb inte störa andra I/O-intensiva processer.
MinneDen procentandel av datorns minne som ska användas i ett jobbHeltalen 0-100 (anger procent)Kontrollera vilken effektnivå ett jobb ska ha på systemets minnesresurser
NamnDet schemalagda jobbets namnSträngEtt jobb måste ha ett unikt definierbart namn.
ReadOnlyIndikerar att rensningsjobbet bearbetar och rapporter om fel som det hittar, men utan att göra några reparationsåtgärderVäxel (sant/falskt)Du vill manuellt återställa filer som finns skadade delar av disken.
StartaAnger den tid ett jobb ska startaSystem.DateTimeDatumdelen av den System.Datetime som tillhandahållits till Start är inte relevant (så länge som den ligger i det förflutna), men tidsdelen del anger när jobbet ska starta.
StopWhenSystemBusyAnger om Datadeduplicering ska avbrytas om systemet är upptagetVäxel (sant/falskt)Med den här växeln kan du styra datadedupliceringens beteende. Detta är särskilt viktigt om du vill köra Datadeduplicering medan din arbetsbelastning inte är inaktiv.

Ändra volymtäckande inställningar för Datadeduplicering

Växla mellan volyminställningar

Du kan ange de volymtäckande standardinställningarna för Datadeduplicering via den användningstyp du väljer när du aktiverar deduplicering för en volym. Datadeduplicering innehåller cmdletar som gör det enklare att redigera volymtäckande inställningar:

De viktigaste skälen för att ändra volyminställningarna för den valda användningstypen är att förbättra läsprestanda för specifika filer (t.ex. multimediafiler eller andra filtyper som redan har komprimerats) eller finjustera datadedupliceringen så att den optimeras för den specifika arbetsbelastningen. I följande exempel visas hur du ändrar volyminställningarna för Datadeduplicering för en arbetsbelastning som närmast liknar en vanlig serverarbetsbelastning, men som använder stora filer som ändras ofta.

  1. Visa de aktuella volyminställningarna för klusterdelad volym 1.

     Get-DedupVolume -Volume C:\ClusterStorage\Volume1 | Select *
    
  2. Aktivera OptimizePartialFiles för klusterdelad volym 1 så att principen MinimumFileAge gäller för delar av filen snarare än hela filen. Detta garanterar att större delen av filen optimeras även om vissa delar av filen ändras regelbundet.

     Set-DedupVolume -Volume C:\ClusterStorage\Volume1 -OptimizePartialFiles
    

Tillgängliga volymtäckande inställningar

Namn på inställningDefinitionGodkända värdenVarför skulle du vilja ändra det här värdet?
ChunkRedundancyThresholdDet antal gånger som det refereras till ett segment innan ett segment dupliceras till segmentlagrets hotspotavsnitt. Fördelen med hotspotavsnitten är att så kallade ”heta” segment som det ofta refereras till har flera åtkomstsökvägar, vilket förbättrar åtkomsttiden.Positiva heltalDet främsta skälet till att ändra det här talet är att det ökar besparingsnivån för volymer med hög dupliceringsgrad. Standardvärdet (100) är i allmänhet den inställning som rekommenderas, och du borde inte behöva ändra den.
ExcludeFileTypeFiltyper som undantas från optimeringMatris med filnamnstilläggVissa filtyper, särskilt multimediafiler eller filer som redan har komprimerats, vinner inte mycket på att optimeras. Med den här inställningen kan du konfigurera vilka typer som ska undantas.
ExcludeFolderAnger vilka mappsökvägar som bör undantas från optimeringMatris med mappsökvägarOm du vill förbättra prestanda eller förhindra att innehållet i vissa sökvägar optimeras, kan du undanta vissa sökvägar på volymen från optimering.
InputOutputScaleAnger den I/O-parallelliseringsnivå (I/O-köer) för Datadeduplicering som ska användas på en volym under ett efterbearbetningsjobbPositiva heltal från 1 till 36Huvudskälet till att ändra det här värdet är att minska påverkan på prestanda hos höga I/O-arbetsbelastningar genom att begränsa det antal I/O-köer som Datadeduplicering får använda på en volym. Observera att om du ändrar den här inställningen från standardvärdet kan leda till att datadedupliceringens efterbearbetningsjobb körs långsamt.
MinimumFileAgeDaysAntal dagar från det att filen har skapats till dess att den anses vara optimeringsbar.Positiva heltal (inklusive noll)Användningstyperna Standard och HyperV anger det här värdet som 3 för att maximera prestanda för heta eller nyligen skapade filer. Du kanske vill ändra detta om du vill att Datadeduplicering vara mer aggressivt eller om du inte är intresserad av den extra svarstid som är associerad till dedupliceringen.
MinimumFileSizeDen minsta filstorlek som en fil måste ha för att tas i beaktande för optimeringPositiva heltal (byte) som är större än 32 kBHuvudskälet till att ändra det här värdet är att undanta små filer som det är föga värt att optimera, och på så vis spara in på bearbetningstid.
NoCompressHuruvida segmenten ska komprimeras innan de placeras i segmentlagretSant/falsktVissa typer av filer, särskilt multimedia-filer och filtyper som redan är komprimerade, lämpar sig inte särskilt väl för komprimering. Med den här inställningen kan du inaktivera komprimering för alla filer på volymen. Detta vore idealiskt om du optimerar en datauppsättning som innehåller många filer redan har komprimerats.
NoCompressionFileTypeFiltyper vars segment inte bör komprimeras innan de placeras i segmentlagretMatris med filnamnstilläggVissa typer av filer, särskilt multimedia-filer och filtyper som redan är komprimerade, lämpar sig inte särskilt väl för komprimering. Med den här inställningen kan du stänga av komprimering för dessa filer, vilket sparar processorresurser.
OptimizeInUseFilesNär du aktiverar det här alternativet betraktas filer med aktiva referenser som tillgängliga för optimering.Sant/falsktAktivera den här inställningen om din arbetsbelastning håller filer öppna under längre tidsperioder. Om du inte har aktiverat den här inställningen optimeras aldrig någon fil om en arbetsbelastning har en öppen referens till den, även om den bara lägger till data i slutet emellanåt.
OptimizePartialFilesNär du aktiverar det här alternativet gäller MinimumFileAge-värdet för filsegment snarare än hela filen.Sant/falsktAktivera den här inställningen om din arbetsbelastning fungerar med stora, ofta redigerade filer där merparten av filinnehållet är orört. Om du inte aktiverar den här inställningen optimeras aldrig de här filerna, även om merparten av filinnehållet är klart för optimering.
VerifieraOm du aktiverar det här innehållet och om en segmenthash matchar ett segment som redan finns i segmentlagret, så jämförs segmenten byte för att säkerställa att de är identiska.Sant/falsktDetta är en integritetsfunktion som garanterar att den hash-algoritm som jämför segment inte begår något misstag genom att jämföra två datasegment som i praktiken är olika men som har samma hash. I praktiken är det mycket osannolikt att detta någonsin skulle hända. Om du aktiverar verifieringsfunktionen läggs betydande overhead till i optimeringsjobbet.

Ändra systemomfattande inställningar för Datadeduplicering

Datadedupliceringen har ytterligare systemomfattande inställningar som du kan konfigurera via registret. Dessa inställningar gäller för alla jobb och volymer som körs på systemet. Du måste vara extra försiktig varje gång som du redigerar registret.

Du vill kanske inaktivera fullständig skräpinsamling. Mer information om varför detta kan vara användbart för scenariot hittar du i Vanliga frågor och svar. Redigera registret med PowerShell:

  • Om Datadeduplicering körs i ett kluster:

      Set-ItemProperty -Path HKLM:\System\CurrentControlSet\Services\ddpsvc\Settings -Name DeepGCInterval -Type DWord -Value 0xFFFFFFFF
      Set-ItemProperty -Path HKLM:\CLUSTER\Dedup -Name DeepGCInterval -Type DWord -Value 0xFFFFFFFF
    
  • Om Datadeduplicering inte körs i ett kluster:

      Set-ItemProperty -Path HKLM:\System\CurrentControlSet\Services\ddpsvc\Settings -Name DeepGCInterval -Type DWord -Value 0xFFFFFFFF
    

Tillgängliga systemomfattande inställningar

Namn på inställningDefinitionGodkända värdenVarför skulle du vill ändra detta?
WlmMemoryOverPercentThresholdMed den här inställningen kan jobben utnyttja mer minne än vad som Datadeduplicering beräknar vara tillgängligt. En inställning 300 skulle t.ex. innebära att jobbet skulle behöva använda tre gånger det tilldelade minnet för att annulleras.Positiva heltal (ett värde på 300 innebär 300 % eller 3 gånger)Om du har en annan aktivitet som avbryts om Datadeduplicering tar mer minne i anspråk
DeepGCIntervalDen här inställningen konfigurerar det intervall med vilket regelbundna skräpinsamlingsjobb blir fullständiga skräpinsamlingsjobb. Inställningen n innebär att var n:te jobb var ett fullständigt skräpinsamlingsjobb. Observera att fullständig skräpinsamling alltid är inaktiverad (oavsett registervärdet) för volymer med användningstypen Säkerhetskopiering. Start-DedupJob -Type GarbageCollection -Full kan användas om fullständig skräpinsamling önskas på en säkerhetskopieringsvolym.Heltal (-1 indikerar inaktiverad)Mer information finns i Vanliga frågor och svar

Vanliga frågor och svar

Du har ändrat en inställning för Datadeduplicering och nu går jobben långsamt, slutförs inte eller så har mina arbetsbelastningsprestanda försämrats. Varför?
De här inställningarna ger dig stor förmåga att kontrollera hur Datadeduplicering körs. Använd dem ansvarsfullt och övervaka prestanda.

Jag vill köra ett datadedupliceringsjobb nu, men jag vill inte skapa något nytt schema. Kan jag göra så?
Ja, alla jobb kan köras manuellt.

Vad är skillnaden mellan fullständiga och regelbundna skräpinsamlingar?
Det finns två typer av skräpinsamling:

  • Normal skräpinsamling använder sig av en statistisk algoritm för att hitta stora orefererade segment som uppfyller vissa kriterier (lite minne och IOPS). Normal skräpinsamling komprimerar en segmentlagerbehållare endast om en viss minimiprocentandel av segment är orefererat. Den här typen av skräpinsamlingar körs mycket snabbare och använder färre resurser än fullständig skräpinsamling. Standardschemat för ett normalt skräpinsamlingsjobb är att det körs en gång i veckan.
  • Fullständig skräpinsamling utför en mycket mer omfattande sökning efter oanvända segment och frigör mer diskutrymme. Fullständig skräpinsamling komprimerar alla behållare, även om endast ett enda segment i behållaren är orefererat. Fullständig skräpinsamling frigör även ledigt utrymme som kan ha varit i bruk om det förekommit en krasch eller ett elfel under ett optimeringsjobb. Fullständiga skräpinsamlingsjobb återställer 100 procent av det tillgängliga utrymme som kan återställas på en deduplicerad volym. Detta innebär att det kräver mer tid och systemresurser än ett vanligt skräpinsamlingsjobb. Ett fullständigt skräpinsamlingsjobb hittar och frigör vanligtvis upp till 5 procent mer orefererade data än ett normalt skräpinsamlingsjobb. Standardschemat för ett fullständigt skräpinsamlingsjobb innebär att det körs var fjärde gång som skräpinsamling har schemalagts.

Varför skulle jag vilja inaktivera fullständig skräpinsamling?

  • Skräpinsamling kan inverka menligt på livslängden för volymens skuggkopior och storleken på den inkrementella säkerhetskopieringen. Hög omsättning eller I/O-intensiva arbetsbelastningar kan drabbas av försämrade prestanda pga fullständiga skräpinsamlingsjobb.
  • Du kan köra ett fullständigt skräpinsamlingsjobb manuellt från PowerShell om du vill rensa bort läckor när du blivit medveten om en systemkrasch.
© 2017 Microsoft