Share via


Bulanık gruplandırma dönüşümü

Belirsiz gruplandırma dönüşümü veri yinelenenler olabilir veri satırları tanımlama ve veri standardizing içinde kullanmak için kurallı satıra seçerek Görevler Temizleme gerçekleştirir.

[!NOT]

Performans ve bellek sınırlamaları gibi belirsiz gruplandırma dönüşümü hakkında daha ayrıntılı bilgi için teknik incelemesine bakın bakın.bulanık arama ve SQL Server ıntegration Hizmetleri 2005 belirsiz gruplandırma.

Belirsiz gruplandırma dönüşümü örneği bağlantı gerektirir SQL Servergeçici oluşturmak için SQL Serverçalışmalarını yapmak için dönüşüm algoritma gerektirir tabloları. Bağlantının veritabanında tablo oluşturma izni olan bir kullanıcı çözülmesi gerekir.

Dönüşümün yapılandırmak için yinelenenleri belirlemek için giriş sütunları seçin ve eşleme türünü seçmeniz gerekir — bulanık veya tam — her sütun için. Tam eşleşme bu sütunda aynı değerlere sahip tek satırların gruplandırılmasını garanti eder. Tam eşleşen herhangi bir sütun için uygulanabilir Integration Servicesveri türü dt_text, dt_ntext ve DT_IMAGE dışında. Bir bulanık eşleşme yaklaşık aynı değerlere sahip satırlar gruplandırılır. Yaklaşık veri eşleme yöntemi, bir kullanıcı tarafından belirtilen benzerlik puanı dayanmaktadır. dt_str ve dt_wstr veri türlerini içeren sütunlar, bulanık eşleşen kullanılabilir. Daha fazla bilgi için, bkz. Tümleştirme Hizmetleri veri türleri.

Dönüşümü çıktı tüm giriş sütun, bir veya daha fazla sütun standartlaştırılmış veri ve benzerlik puanı içeren bir sütun içerir. Puan 0 ve 1 arasında ondalık bir değerdir. Kurallı satıra 1 Puan oldu. Bulanık gruptaki diğer satırlar ne kadar iyi kurallı satır satır ile eşleşen gösteren sonuçlar vardır. Puan 1, kurallı satır satır daha yakından eşleşen yakındır. Bulanık grubu tam çoğaltma kurallı satır satır içeriyorsa, bu satırları da 1 Puan var. Dönüşümün yinelenen satırları kaldırmaz; o kurallı satıra benzer satırların ilişkili anahtar oluşturarak gruplandırır.

Dönüşümün aşağıdaki ek sütunlar ile giriş her satır için bir çıkış satır üretir:

  • _key_in, her satırı benzersiz şekilde tanımlayan bir sütun.

  • _key_out, yinelenen satır grubunu tanımlayan bir sütun. _Key_out sütun değeri olan _key_in kurallı veri satırı sütun. Aynı değere sahip satırlar _key_out aynı grubun bir parçasıdır. _Key_outiçin bir grup değerine karşılık gelen değer _key_in kurallı veri satırı.

  • _score, kurallı satıra giriş satır benzerlik gösteren 1 ile 0 arasında bir değer.

Bu varsayılan sütun adlarını ve diğer adları kullanmak için belirsiz gruplandırma dönüşümü yapılandırabilirsiniz. Çıkış bir belirsiz gruplandırma her sütunun bir benzerlik puanı da sağlar.

Bulanık gruplandırma dönüşümü gerçekleştirdiği gruplandırma özelleştirmek için iki özellik içerir: Belirteç sınırlayıcıları ve benzerliği eşik. Dönüşümü, veri tokenize için kullanılan sınırlayıcı varsayılan sunmakla birlikte, verilerinizin tokenization artıran yeni sınırlayıcıları ekleyebilirsiniz.

Benzerliği eşik nasıl kesinlikle çoğaltmaları dönüşümü tanımlar gösterir. Benzerlik eşikleri, bileşen ve sütun düzeyinde ayarlanabilir. Sütun düzeyinde benzerliği eşik gerçekleştiren bir bulanık eşleşme sütunlar için kullanılabilir. Benzerlik aralığı 0-1. Satır ve sütunları yineleme olarak nitelemek amacıyla olmalıdır eşik, 1 daha benzer daha yakın. Belirttiğiniz satır ve sütunları arasında benzerlik eşiği ayarlayarak MinSimilarityözelliği bileşen ve sütun düzeyinde. Bileşen düzeyinde belirtilen benzerlik karşılamak için tüm satırları benzerliği eşik bileşen düzeyinde belirtilen eşit veya daha büyük olan tüm sütunlar arasında bir benzerlik olmalıdır.

Belirsiz gruplandırma dönüşümü hesaplar benzerlik ve belirtilen değerden daha az benzer satırları iç önlemler MinSimilaritydeğil gruplandırılır.

Verileriniz için çalışan benzerliği eşik tanımlamak için birkaç kez farklı en az benzerlik eşikleri kullanarak belirsiz gruplandırma dönüşümü uygulamak gerekebilir. Çalışma zamanında, bir grup içindeki her satır için benzerlik puanlar için dönüşümü çıkış puanı sütunlar içerir. Bu değerler, verileriniz için uygun olan benzerliği eşik tanımlamak için kullanabilirsiniz. Benzerlik artırmak istiyorsanız, ayarlamalısınız MinSimilaritypuanı sütun değeri daha büyük bir değere.

Bulanık gruplandırma dönüşümü giriş sütunları özelliklerini ayarlayarak dönüşümü gerçekleştiren gruplandırma özelleştirebilirsiniz. Örneğin, FuzzyComparisonFlagsözelliği belirtir bir sütundaki dize veri dönüşümün nasıl karşılaştırır ve ExactFuzzyözelliği belirtir dönüşümün bulanık eşleşme ya da tam bir eşleşme gerçekleştirir.

Belirsiz gruplandırma dönüşümü kullandığı bellek miktarı ayarlanarak yapılandırılabilir MaxMemoryUsageözel özellik. Megabayt (mb) sayısını belirtin veya bir dinamik kendi gereksinimlerine göre bellek miktarı ve kullanılabilir fiziksel bellek kullanmak için dönüşümü sağlamak için 0 değeri kullanın. MaxMemoryUsageÖzel özellik paketi yüklendiğinde bir özellik ifadeye göre güncelleştirilebilir. Daha fazla bilgi için bkz: Integration Services Expression Reference, Paketlerinde özelliği ifadeleri kullanma, ve Dönüşümü özel özellikleri.

Bu dönüşüm sahip giriş ve bir çıkış. Hata çıktı desteklemiyor.

Satır karşılaştırma

Belirsiz gruplandırma dönüşümü yapılandırırken, satır giriş dönüşüm karşılaştırmak için dönüşümün kullanan karşılaştırma algoritma belirtebilirsiniz. Eğer Exhaustiveözelliği true, her satırda bir giriş her satır için giriş dönüşüm karşılaştırır. Bu karşılaştırma algoritma daha doğru sonuçlar üretebilir, ancak satır giriş küçük olmadığı sürece daha yavaş gerçekleştirme dönüşümü yapmak olasıdır. Performans sorunlarını önlemek için onu ayarlamak için tavsiye Exhaustiveözelliği truepaketi geliştirme sırasında sadece.

Geçici tablolar ve dizinler

Çalışma zamanında, içinde tablolar ve dizinler, potansiyel olarak önemli boyutu, gibi belirsiz gruplandırma dönüşümü oluşturur geçici nesneler SQL Serverdönüşümü bağlandığı veritabanı. Tablolar ve dizinler boyutu satır dönüşümü giriş ve belirsiz gruplandırma dönüşümü tarafından oluşturulan simge sayısı ile orantılı.

Dönüşümün de geçici tablolar sorgular. Bu nedenle belirsiz gruplandırma dönüşümü bir sigara üretim örneği için bağlanma düşünmelisiniz SQL Server, özellikle üretim sunucusu kullanılabilir disk alanı sınırlıdır.

Tablolar ve dizinler kullanır Yerel bilgisayarda bulunuyorsa bu dönüşümün performansını artırabilir.

Belirsiz gruplandırma dönüşümün yapılandırma

Aracılığıyla özelliklerini ayarlayabilirsiniz SSISTasarımcısı veya programlı olarak.

Sen-ebilmek koymak içinde özellikleri hakkında daha fazla bilgi için Bulanık gruplandırma dönüşümü Düzenleyicisi iletişim kutusunda, aşağıdaki konulardan birini tıklatın:

Sen-ebilmek koymak içinde özellikleri hakkında daha fazla bilgi için Gelişmiş Düzenleyici iletişim kutusu veya programlı olarak aşağıdaki konulardan birini tıklatın:

ilişkili Görevler

Bu görevin özelliklerini ayarlama hakkında daha fazla bilgi için aşağıdaki konulardan birini tıklatın:

İlişkili İçerik

Integration Services simgesi (küçük) Integration Services ile güncel kalın

En son karşıdan yüklemeler, makaleler, örnekler ve Microsoft video yanı sıra topluluk seçili çözümleri için ziyaret Integration ServicesMSDN sayfası:


Bu güncelleştirmelerle ilgili otomatik bildirim almak için, sayfadaki RSS akışlarına abone olun.

Ayrıca bkz.

Kavramlar

Bulanık arama dönüşümü

Tümleştirme Hizmetleri dönüşümleri