Aracılığıyla paylaş


Belirsiz gruplandırma dönüşümü

Belirsiz gruplandırma dönüştürme veri çoğaltmaları büyük olasılıkla veri satırları belirlemek ve bir kurallı verileri standartlaştırılmasına içinde kullanmak için veri satırı seçerek temizleme görevlerini gerçekleştirir.

Not

İncelemeyi, performans ve bellek sınırlamaları gibi belirsiz gruplandırma dönüştürme hakkında daha ayrıntılı bilgi için bkz: belirsiz arama ve sql Server Integration hizmetleri 2005 belirsiz gruplandırma.

Belirsiz gruplandırma dönüşümü için bir bağlantı gerektiren bir örnek , SQL Server geçici oluşturmak için SQL Server tabloları dönüştürme algoritması gerektiren yapmak onun iş.Bağlantının veritabanında tablo oluşturma izni olan bir kullanıcı çözülmesi gerekir.

Yapılandırmak için dönüştürme, çoğaltmaları tanımlarken kullanmak için giriş sütunları seçmeniz gerekir ve eşleşme türü seçmeniz gerekir — bulanık veya tam — her sütun için.Yalnızca satırları bir tam eşleşme garanti aynı değerleri içinde olan sütun gruplandırılır.Tam eşleştirme uygulandığı herhangi bir sütun için Integration Services veri türü dışında dt_text, dt_ntext ve DT_IMAGE.Bir bulanık eşleşme yaklaşık aynı değerlere sahip satırlar gruplandırır.Bir benzerlik kullanıcı tarafından belirlenen puan üzerinde yaklaşık veri eşleştirme yöntem temel alır.dt_wstr ve dt_str veri türlerini içeren sütunlar yalnızca kullanılabilir benzer öğe eşleştirme.Daha fazla bilgi için bkz: Tümleştirme Hizmetleri veri türleri.

dönüştürme çıktısı, tüm giriş sütunlar, standartlaştırılmış veri ile bir veya daha fazla sütun ve benzerlik puanı içeren bir sütun içerir.Skor 0 ile 1 arasında ondalık bir değerdir.Kurallı satır 1 puanı.Bulanık gruptaki diğer satırları göstermek ne kadar iyi kurallı satır satır ile eşleşen puanları vardır.Yakın puan 1, kurallı satır satır daha yakından eşleşen olur.Belirsiz Grup kurallı satırın tam olarak çoğaltılan satırlar içeriyorsa, bu satırları bir puan 1 de vardır.dönüştürme ; Yinelenen satırları kaldırma bunu onlara kurallı satıra benzer satırların ilişkili olduğu bir anahtar oluşturarak gruplandırır.

dönüştürme Her satır, aşağıdaki ek sütunlar giriş için bir çıkış satır üretir:

  • _key_in, her satırı benzersiz olarak tanımlayan bir sütun.

  • _key_out, yinelenen satır grubunu tanımlayan bir sütun.The _key_out column has the value of the _key_in column in the canonical data row.Satırları aynı değer _key_out aynı grubun bir parçasıdır.The _key_outvalue for a group corresponds to the value of _key_in in the canonical data row.

  • _score, 0 ve kurallı satıra giriş satır benzerlik gösterir 1 arasında bir değer.

Bunlar varsayılan sütun adları ve bulanık gruplandırma yapılandırabilirsiniz dönüştürme diğer adları kullanmak için.Çıktı da benzerlik puanı her sütunun sağlayan bir benzer öğe gruplandırma.

Belirsiz gruplandırma dönüştürme gerçekleştirdiği gruplandırma özelleştirmek için iki özellik içerir: belirteç sınırlayıcıları ve benzerlik eşiği.dönüştürme Sınırlayıcıları varsayılan bir veri tokenize için kullanılır, ancak verilerinizin belirteçlere ayırma artıran yeni sınırlayıcıları ekleyebilirsiniz sağlar.

Benzerlik eşiği nasıl kesinlikle gösterir dönüştürme çoğaltmaları tanımlar.Benzerlik eşikleri olabilir küme bileşen ve sütun düzeylerinde.Sütun -düzey benzerliği eşik yalnızca bir bulanık eşleşme gerçekleştirmek sütunlar için kullanılabilir.Benzerlik aralık için 0 1'dir.Yineleme nitelemek için satır ve sütunları olması gerekir eşik ise, 1 benzer daha yakın.Satırlar ve sütunlar arasında benzerlik eşiği ayarlayarak belirlediğiniz MinSimilarity özellik bileşen ve sütun düzeyi.Bileşen belirtilen benzerlik karşılamak için düzey, tüm satırlar bileşen belirtilen benzerliği eşik eşit veya daha büyük olan tüm sütunlar arasında bir benzerlik olması gerekir düzey.

Belirsiz gruplandırma dönüştürme benzerlik ve belirtilen değerden daha az benzer satırların iç ölçümleri hesaplar MinSimilarity değil gruplandırılır.

Verileriniz için çalışan bir benzerliği eşik tanımlamak için bir kaç kez farklı en az benzerlik eşikleri kullanarak belirsiz gruplandırma dönüştürme uygulamak gerekebilir.Çalışma sırasında saat, bir grup içindeki her satır için benzerlik puanlarını puanı sütun dönüştürme çıktısı içerir.Bu değerler, verileriniz için uygun olan benzerliği eşik tanımlamak için kullanabilirsiniz.Benzerlik artırmak istiyorsanız, gereken küme MinSimilarity bir değere büyük değerden puanı sütunlar.

Bulanık gruplandırma sütun özelliklerini ayarlayarak dönüştürme yapan gruplama özelleştirebilirsiniz dönüştürme girdisi.Örneğin, FuzzyComparisonFlags özellik belirtir dize veri dönüşümün nasıl karşılaştıran bir sütunve ExactFuzzy özellik belirtir olup olmadığını dönüştürme gerçekleştiren bir bulanık eşleşme ya da tam bir eşleşme.

Belirsiz gruplandırma dönüştürme kullandığı bellek miktarı ayarlanarak yapılandırılabilir MaxMemoryUsage özel özellik.Megabayt (mb) sayısını belirtin veya izin vermek için 0 değeri kullanın dönüştürme bir dinamik belleğin kullanılabilir fiziksel belleğin ve kendi gereksinimlerine göre kullanılacak.The MaxMemoryUsage custom property can be updated by a property expression when the package is loaded.Daha fazla bilgi için bkz: Integration Services İfadesi Başvurusu, Paketlerinde özelliği ifadeleri kullanma, ve Dönüşümü özel özellikleri.

Varsa bu dönüştürme giriş ve bir çıkış.Hata çıktı desteklemiyor.

Satır karşılaştırma

Belirsiz gruplandırma dönüştürme yapılandırırken, satırlardaki karşılaştırmak için dönüştürmen kullanan karşılaştırma algoritma belirtmek dönüştürme girdisi.Yaparsanız Exhaustive özellikne true, dönüştürme karşılaştırır her satırda bir giriş her bir satıra giriş.Bu karşılaştırma algoritma daha kesin sonuçlar verebilir, ancak giriş satýr sayýsýný küçük olmadığı sürece daha yavaş dönüştürme yapmak olasıdır.Performans sorunlarını önlemek için bunu tavsiye için küme Exhaustive özelliğine true sırasında paket geliştirme.

Geçici tablolar ve dizinler

Çalışma sırasında saat, belirsiz gruplandırma dönüştürme oluşturur geçici tablolar ve dizinler, potansiyel olarak önemli boyutu gibi veritabanındaki nesneler SQL Server dönüştürme bağlandığı veritabanı.Tablolar ve dizinler boyutunu, satır sayısına orantılı dönüştürme girdisi ve bulanık gruplandırma dönüştürme tarafından oluşturulan simge sayısı.

dönüştürme Da geçici tablolar sorgular.Bu nedenle bir üretim için belirsiz gruplandırma dönüştürme bağlanma düşünmelisiniz örnek , SQL Server, özellikle üretim sunucusu kullanılabilir disk alanı sınırlaması durumunda.

Bu performans dönüştürme tablolar ve dizinler kullandığı yerel bilgisayarda bulunuyorsa artırabilir.

Belirsiz gruplandırma dönüşümü yapılandırma

Yapabilirsiniz küme Özellikler'inde SSIS Tasarımcısı veya programlı olarak.

Yapabilirsiniz özellikleri hakkında daha fazla bilgi için küme , Bulanık gruplandırma dönüşümü Düzenleyicisi iletişim kutusunda, aşağıdaki konulardan birini tıklatın:

Yapabilirsiniz özellikleri hakkında daha fazla bilgi için küme , Gelişmiş Düzenleyici iletişim kutusunda veya programlı olarak aşağıdaki konulardan birini tıklatın:

Özellikleri küme hakkında daha fazla bilgi için aşağıdaki konulardan birini tıklatın:

Integration Services simgesi (küçük)Integration Services ile güncel kalın

En son karşıdan yüklemeler, makaleler, örnekler ve seçilen topluluk çözümleri yanı sıra Microsoft videolar için ziyaret Integration Services sayfa msdn veya TechNet:

Bu güncelleştirmelerle ilgili otomatik bildirim almak için, sayfadaki RSS akışlarına abone olun.