Yinelenen Verileri Kaldırmaya Genel Bakış

 

Yayımlanan: Ağustos 2016

Uygulama Hedefi: Windows Storage Server 2012, Windows Server 2012 R2, Windows Server 2012

Bu konuda, Windows Server 2012 R2 ve Windows Server 2012 içindeki yinelenen verileri kaldırma özelliği ve özelliğe ilişkin pratik uygulamalar açıklanmaktadır.

Özellik açıklaması

Yinelenen verileri kaldırma, aslına uygunluk ve bütünlükten taviz verilmeden veriler içindeki yinelemelerin bulunmasını ve kaldırılmasını içerir. Hedef, dosyaları küçük değişken boyutlu öbeklere (32–128 KB) ayırarak, yinelenen öbekleri belirleyerek ve her bir öbeğin tek bir kopyasını koruyarak daha az alanda daha fazla veriyi depolamaktır. Öbeklerin fazlalık kopyaları, tek bir kopya başvurusuyla değiştirilir. Öbekler sıkıştırılır ve sonra Sistem Birim Bilgisi klasöründe özel kapsayıcı dosyalarında düzenlenir.

Şekil 1'de gösterildiği gibi sonuçta her bir dosyanın disk üzerinde dönüşümü gerçekleşir. Yinelenenleri kaldırma işleminden sonra dosyalar artık bağımsız veri akışları olarak depolanmaz ve genel bir öbek deposu içinde depolanan veri bloklarını işaret eden saplamalarla değiştirilir. Bu dosyalar blokları paylaştığından bu bloklar yalnızca bir defa depolanır ve bu da tüm dosyaları depolamak için daha az disk alanı gerekmesini sağlar. Dosya erişimi sırasında, uygulama çağrılmadan veya kullanıcının disk üzerinde dosyaların dönüşümü hakkında bilgisi olmadan doğru bloklar şeffaf olarak birleştirilir. Böylece uygulamalara yönelik davranışta herhangi bir değişiklik oluşması veya bu dosyalara erişen kullanıcılar üzerinde etki oluşması konusunda endişe yaşanmadan yöneticilerin dosyalar üzerinde yinelenenleri kaldırma işlemi uygulaması sağlanır.

Şekil 1 Dosyaların disk üzerinde dönüştürülmesi

Şekil 1   Yinelenen verileri kaldırma sırasında disk üzerinde dosyaların dönüşümü

Bir birim, yinelenenleri kaldırma için etkinleştirildikten ve veriler iyileştirildikten sonra birim aşağıdakileri içerir:

  • İyileştirilmemiş dosyalar. Örneğin, iyileştirilmemiş dosyalar arasında, seçilen dosya yaşı ilkesi ayarını karşılamayan dosyalar, sistem durumu dosyaları, alternatif veri akışları, şifrelenmiş dosyalar, genişletilmiş öznitelikleri olan dosyalar, 32 KB'den küçük dosyalar, diğer yeniden ayrıştırma noktası dosyaları veya diğer uygulamalar tarafından kullanımda olan dosyalar yer alır ("kullanımda olan" sınırı Windows Server 2012 R2'de kaldırılmıştır).

  • İyileştirilmiş dosyalar. İstendiğinde dosyayı geri yüklemek için gerekli öbek deposundaki ilgili öbeklerin eşlemine yönelik işaretçileri içeren yeniden ayrıştırma noktaları olarak depolanan dosyalar.

  • Öbek deposu. İyileştirilmiş dosya verilerinin konumu.

  • Ek boş alan. İyileştirilmiş dosyalar ve öbek deposu, iyileştirmeden öncesine kıyasla çok daha az alan kaplar.

Pratik uygulamalar

İşletmedeki veri depolamanın büyümesinin üstesinden gelmek için yöneticiler, sunucuları birleştirmekte ve kapasite ölçekleme ve veri iyileştirme temel hedeflerini belirlemektedir. Yinelenen verileri kaldırma işlevi, aşağıdakiler de dahil olmak üzere bu hedefleri başarmanın pratik yollarını sağlar:

  • Kapasite iyileştirme. Yinelenen verileri kaldırma işlemi, daha az fiziksel alanda daha fazla veri depolar. Tek Örnek Depolama (SIS) veya NTFS sıkıştırması gibi özellikleri kullanarak, mümkün olandan daha fazla depolama verimliliği elde eder. Yinelenen verileri kaldırma işlemi, genel dosya sunucuları için 2:1 ve sanallaştırma verileri için 20:1'e kadar iyileştirme oranları sunan, alt dosya değişken boyutlu öbekleme ve sıkıştırmasını kullanır.

  • Ölçek ve performans. Yinelenen verileri kaldırma, son derece ölçeklenebilirdir, kaynak açısından verimlidir ve izinsiz devreye girmez.Windows Server 2012 R2'de saniyede 50 MB ve Windows Server 2012'de saniyede 20 MB veri işleyebilir. Sunucudaki diğer iş yüklerini etkilemeden aynı anda birden çok birim üzerinde çalışabilir. Kullanılan CPU ve bellek kaynakları kısıtlanarak sunucu iş yükleri üzerinde daha az olumsuz etki olması sağlanır. Sunucu çok meşgul olursa, yinelenenleri kaldırma tamamen durdurulabilir. Ayrıca yöneticiler istedikleri zaman yinelenen verileri kaldırma işlerini çalıştırma, yinelenen verileri kaldırma işlerinin ne zaman çalıştırılacağına yönelik zamanlamalar belirleme ve dosya seçimi ilkeleri oluşturma esnekliğine de sahiptir.

  • Güvenilirlik ve veri bütünlüğü. Yinelenen verileri kaldırma işlemi uygulandığında, verilerin bütünlüğü korunur. Yinelenen Verileri Kaldırma işlemi, veri bütünlüğünü sağlamak için sağlama toplamını, tutarlılık ve kimlik doğrulamasını kullanır. Tüm meta veriler ve en sık başvurulan veriler için yinelenen verileri kaldırma işlemi, veri bozulması durumunda verilerin kurtarılabilir olmasını sağlamak için artıklığı korur.

  • BranchCache ile bant genişliği verimliliği. BranchCache ile tümleştirme sayesinde, WAN üzerinden bir şube ofisine aktarılan verilere aynı iyileştirme teknikleri uygulanır. Sonuçta daha hızlı dosya indirme süresi ve daha az bant genişliği tüketimi elde edilir.

  • Bilindik araçlar ile iyileştirme yönetimi. Yinelenen verileri kaldırma işlemi, Sunucu Yöneticisi'nde ve Windows PowerShell'de yerleşik olarak iyileştirme işlevselliğine sahiptir. Varsayılan ayarlar anında tasarruf sağlayabilir veya yöneticiler daha fazla kazanç görmek için ayarlar üzerinde hassas ayar yapabilir. İyileştirme işini başlatmak veya gelecekte çalıştırılmak üzere bir iyileştirme işini zamanlamak için kolayca Windows PowerShell cmdlet'leri kullanılabilir. Yinelenen Verileri Kaldırma özelliğinin yüklenmesi ve seçilen birimlerde yinelenenleri kaldırmanın etkinleştirilmesi, Windows PowerShell komut dosyasını çağıran bir Unattend.xml dosyası kullanılarak da gerçekleştirilebilir ve sistem ilk önyüklendiğinde yinelenenleri kaldırmayı dağıtmak için Sysprep ile birlikte kullanılabilir.

Yeni ve değiştirilmiş işlevsellik

Aşağıdaki tabloda, Yinelenen Verileri Kaldırma işlevselliğindeki değişiklikler açıklanmaktadır. Daha fazla bilgi için bkz. Yinelenen verileri kaldırma Windows Server'daki Yenilikler.

Özellik/İşlevsellik

Yeni veya güncelleştirilmiş?

Açıklama

Sanal Masaüstü Altyapısı (VDI) iş yüklerinin uzak depolaması için yinelenen verileri kaldırma

Windows Server 2012 R2'deki yenilikler

Küme Paylaşılan Birimleri (CSV'ler) üzerinde Yinelenen Verileri Kaldırma işlemini uygulayarak Sanal Masaüstü Altyapısı (VDI) iş yükleri için etkin sanal sabit diskleri (VHD'ler) iyileştirme.

İyileştirilmiş bir dosyayı özgün yolunda genişletme

Windows Server 2012 R2'deki yenilikler

Uygulamalar, performans veya diğer gereksinimlerle uyumluluk için gerekiyorsa özgün yolda belirtilen bir yolda iyileştirilmiş dosyaları genişletmek için Windows PowerShell'de yeni Expand-DedupFile cmdlet'ini kullanın. Cmdlet hakkında daha fazla bilgi için bkz. T:Deduplication.Expand-DedupFile.

Sanallaştırılmış yedekleme uygulamaları tarafından kullanılan yedekleme birimleri için yinelenen verileri kaldırma

Windows Server 2012 R2'deki yenilikler

Küme Paylaşılan Birimlerinde (CSV’ler) veya sınırlı hiper yakınsanmış yapılandırmalarda Yinelenen Verileri Kaldırma uygulayarak, sanallaştırılmış yedekleme uygulaması iş yükleri tarafından kullanılan etkin sanal sabit diskleri (VHD’ler) iyileştirin. (Kasım 2014 güncelleştirme paketi (KB 3000850) yüklü Windows Server 2012 R2 veya üzeri ile desteklenir).

Gereksinimler

Yinelenen verileri kaldırma işleminden yararlanmak için ortam aşağıdaki gereksinimleri karşılamalıdır:

  • Sunucu: En az bir veri birimi ile Windows Server 2012 R2 veya Windows Server 2012 çalıştıran tek bir bilgisayar ya da sanal makine

  • (İsteğe bağlı) Bir ağ üzerinden sunucuya bağlı olan, Windows Server 2012 R2 veya Windows Server 2012 çalıştıran başka bir bilgisayar ya da sanal makine.

    Önemli

    Yinelenen Verileri Kaldırma, VDI veya sanallaştırılmış yedekleme iş yükleri üzerinde gerçekleştiriliyorsa, tüm VHD dosyaları için aşağıdakilerden birinin geçerli olması gerekir:

    • Windows Server 2012 R2 çalıştıran bir dosya sunucusunda depolanmış ve depolama düğümü ile hesaplama düğümü farklı sunucularda çalıştırılıyor.

    • Yerel depolamada belirli, sınırlı hiper yakınsanmış bir yapılandırmayla depolanmış. Ayrıntılı gereksinimler hakkında bilgi için, bkz. Yinelenen Verileri Kaldırma Dağıtmayı Planlama.

Azure sanal makineleriyle birlikte çalışabilirlik

Azure'de bir sanal makinede bu Windows Server rol hizmetini çalıştırabilirsiniz. Bu senaryo, Windows Server 2012 R2 ile test edilmiştir. Yinelenen Verileri Kaldırma işlevinin, sık sık okuma ve nadir yazma içeren birimlere sahip Windows Azure sanal makineleri ile kullanılmasını öneririz. Bu koşullarda Yinelenen Verileri Kaldırma işlevi, Azure sanal makinelerinde daha fazla veriyi depolamanın verimli bir yolunu sağlayabilir.

Aşağıdaki iş yükleri, Azure sanal makinelerinde Yinelenen Verileri Kaldırma işleviyle birlikte kullanım için iyi adaylar olabilir:

  • Göreceli olarak statik içeriğe sahip genel dosya sunucuları

  • Göreceli olarak statik içeriğe sahip Microsoft SharePoint siteleri

  • Göreceli olarak statik içeriğe sahip web siteleri

İş yükleri tarafından kullanılan büyük dosyalar üzerinde sık sık değişiklik yapılması nedeniyle aşağıdaki iş yüklerinin Azure sanal makinelerinde Yinelenen Verileri Kaldırma işleviyle birlikte kullanılması önerilmez:

  • Microsoft Exchange Server gibi ileti sunucuları

  • Microsoft SQL Server gibi veritabanı sunucuları

Azure sanal makinelerini kullanmaya başlama hakkında daha fazla bilgi edinmek için Azure web sitesini ziyaret edin.

Mimariye genel bakış

Yinelenen Verileri Kaldırma özelliği, yerel veya uzak G/Ç'yi izleyen bir filtre sürücüsünden ve kullanılabilir üç iş türünü (İyileştirme, Atık Toplama ve Çıkarma) denetleyen yinelenenleri kaldırma hizmetinden oluşur.

Yinelenenleri kaldırma mimarisinde, meta veri ve en çok erişilen veri öbekleri için artıklık da dahil olmak üzere, veri ve meta veride tam sağlama toplamı doğrulaması ile birlikte donanım hataları sırasında esneklik yerleşik olarak bulunur.

Yinelenen Verileri Kaldırma, seçilen bir birimdeki tüm verileri (32 KB'den küçük bir dosya boyutu, hariç tutulan klasörlerdeki dosyalar veya yaş ayarları uygulanan dosyalar) işleyebilir. Özelliği etkinleştirmeden önce, sunucunun ve bağlı birimlerin, yinelenenleri kaldırma için uygun adaylar olup olmadığını dikkatlice belirlemelisiniz. Yinelenenleri kaldırma sırasında önemli verileri düzenli olarak yedeklemenizi kesinlikle öneririz.

Ayrıca bkz.

İlgili ek bilgiler için, aşağıdaki kaynaklara bakın.

İçerik türü

Başvurular

Ürün değerlendirmesi

Dağıtım

İşlemler

Topluluk kaynakları

İlgili teknolojiler