Aracılığıyla paylaş


Belirsiz arama dönüşümü

Belirsiz arama dönüştürme veri temizleme veri standartlaştırılmasına veri düzeltme ve eksik değerleri sağlama gibi görevleri gerçekleştirir.

Not

İncelemeyi, performans ve bellek sınırlamaları gibi belirsiz arama dönüştürme hakkında daha ayrıntılı bilgi için bkz: belirsiz arama ve sql Server Integration hizmetleri 2005 belirsiz gruplandırma.

Belirsiz arama dönüştürme kullanımı, arama dönüştürme farklı benzer öğe eşleştirme.Arama dönüştürme başvurusunda eşleşen kayıtları bulmak için bir eş birleştirmeler kullanan tablo.Başvurudan tam bir eşleşme veya hiçbir şey verdiği tablo.Buna karşılık, bulanık arama dönüştürme bulanık eşleşen bir kullanır veya daha fazla başvuru eşleşmeleri kapatın tablo.

Belirsiz arama dönüştürme, sık sık paket veri akışı arama dönüştürme izler.İlk olarak, tam bir eşleşme bulmak arama dönüştürme çalışır.Belirsiz arama dönüştürme başarısız olursa, başvuru yakın eşleşmeleri sağlar tablo.

Başvuru veri dönüştürme erişmesi kaynak temiz ve giriş verileri genişletmek için kullanılan değerleri içerir.Başvuru veri kaynak olması gereken bir tablo , bir SQL Server 2000 veya sonraki veritabanı.Eşleşen bir giriş sütunundaki değeri başvurunun değeri arasındaki tablo tam bir eşleşme veya bulanık eşleşme olabilir.Ancak, dönüştürme için yapılandırılacak en az bir sütun eşleme gerektirir benzer öğe eşleştirme.Yalnızca tam eşleştirme kullanmak istiyorsanız, arama dönüştürme yerine kullanın.

Varsa bu dönüştürme giriş ve bir çıkış.

Yalnızca giriş sütunları ile DT_WSTR ve DT_STR veri türleri kullanılabilir benzer öğe eşleştirme.Tam eşleştirme dışında herhangi bir dts veri türü kullanarak DT_TEXT, DT_NTEXT, ve DT_IMAGE.Daha fazla bilgi için bkz: Tümleştirme Hizmetleri veri türleri.Giriş ve başvuru arasında yer alan sütunların tablo uyumlu veri türlerine sahip olması gerekir.For example, it is valid to join a column with the DTS DT_WSTR data type to a column with the SQL Server nvarchar data type, but invalid to join a column with the DT_WSTR data type to a column with the int data type.

Bu dönüştürme, en fazla miktarda bellek satır karşılaştırma algoritma ve dizinler ve dönüştürme kullanır başvuru tabloları olarak önbelleğe alma belirterek özelleştirebilirsiniz.

Belirsiz arama dönüştürme kullandığı bellek miktarı ayarlanarak yapılandırılabilir MaxMemoryUsage özel özellik.Megabayt (mb) sayısını belirtin veya sağlayan değeri 0, dönüştürme bir dinamik belleğin kullanılabilir fiziksel belleğin ve kendi gereksinimlerine göre kullanın.The MaxMemoryUsage custom property can be updated by a property expression when the package is loaded.Daha fazla bilgi için bkz: Integration Services İfadesi Başvurusu, Paketlerinde özelliği ifadeleri kullanma, ve Dönüşümü özel özellikleri.

Belirsiz eşleştirme davranışı denetleme

Belirsiz arama dönüştürme gerçekleştirdiği aramasını özelleştirmek için üç özelliği içerir: Giriş satır, belirteç sınırlayıcıları ve benzerlik eşikleri döndürülecek en fazla sayısı.

dönüştürme Sıfır veya daha fazla eşleşme için belirtilen eşleşme sayısını döndürür.En fazla eşleşme sayısını belirten garanti etmez, dönüştürme eşleşir; en fazla sayısını verir Bunu yalnızca, garanti dönüştürme en fazla eşleşme o sayısını verir.En fazla eşleşme sayısı için bir değer 1, çıkışını'den büyük yaparsanız dönüştürme birden fazlasını içerebilir her arama ve bazı satırların satır Yinelenenler olabilir.

dönüştürme Sınırlayıcıları varsayılan bir veri tokenize için kullanılan, ancak, verilerinizi gereksinimlerine uyacak şekilde belirteç sınırlayıcıları ekleyebilirsiniz sağlar.The Delimiters property contains the default delimiters.Tokenization önemlidir, çünkü birbirlerine içinde Karşılaştırılan veri birimlerini tanımlar.

Benzerlik eşikleri olabilir küme bileşen ve birleştirmek düzeylerde.Bulanık eşleşen bir giriş sütun başvurusu arasındaki dönüştürme gerçekleştiren katılma düzeyini benzerliği eşik yalnızca kullanılabilir tablo.Benzerlik aralık için 0 1'dir.Yineleme nitelemek için satır ve sütunları olması gerekir eşik ise, 1 benzer daha yakın.Ayarlayarak benzerliği eşik belirtmek MinSimilarity özellik bileşen ve birleştirmek düzeyleri.Bileşen belirtilen benzerlik karşılamak için düzey, tüm satırlar, büyük ya da bileşen belirtilen benzerliği eşik değerine eşit olan tüm eşleri arasında bir benzerlik olması gerekir düzey.Diğer bir deyişle, bileşenin en çok yakın bir eşleşme belirtemezsiniz düzey sürece satır veya birleştirmek eşleşir düzey eşit olarak yakın olan.

Her eþleþme benzerlik puanı ve güvenirlik puan içerir.Bir matematiksel ölçmek giriş kayıt ve kayıt arasında dokulu benzerlik bu bulanık arama benzerlik puanı ise dönüştürme başvuru tablosundan döndürür.GÜVENİRLİK puan nasıl büyük bir olasılıkla, iş ölçü başvurusunda bulunan eşleştirmelerle arasında en iyi eşleşen belirli bir değeri olan tablo.Bir kayda atanan güvenirlik puan verilen diğer eşleşen kayıtları üzerinde bağlıdır.Örneğin, eşleşen St. ve Saint başka eşleşmeler ne olursa olsun bir benzerlik düşük puan verir.If Saint is the only match returned, the confidence score is high.Her iki Saint ve St. Başvurusu'nda görünen tablo, confidence, St. yüksek ve güven Saint azaldı.Ancak, yüksek benzerlik yüksek güvenirlik gelebilir.Örneğin değer arıyorsanız, Bölüm 4, sonuçların Bölüm 1, Bölüm 2, ve Bölüm 3 , sonuçlar en iyi eşleşen olduğu belirsiz olduğundan yüksek benzerlik puanı ancak düşük güven puanı vardır.

Benzerlik puanı 0 ve 1, burada tam olarak eşleşen giriş sütunundaki değeri başvurunun değeri arasındaki gelir bir benzerlik puanı 1 arasında ondalık bir değer tarafından temsil edilen tablo.Ayrıca 0 ve 1 arasında ondalık bir değer güvenirlik puan KAÇINCI güven gösterir.Kullanılabilir eşleşme bulunamazsa, benzerlik ve güvenirlik puan 0 satıra atanan ve çıktı sütunları kopyaladığınız başvurudan tablo null değerleri içerir.

Bazı durumlarda, belirsiz arama uygun eşleşme başvurusunda bulamayabilir tablo.Bir tek, kısa bir sözcük bir aramada kullanılan girdi değeri ise, bu durum oluşabilir.Örneğin, helo değeriyle eşleşen Merhaba yapılan bir başvuru tablo ne zaman diğer belirteçleri o sütundaki veya satırdaki herhangi bir sütunu yok.

dönüştürme çıktısı sütunları doğrudan sütunları Seçili sütunlar arama olarak işaretlenmiş giriş sütunlar dahil tablove aşağıdaki ek sütunlar:

  • _Similarity, giriş ve başvuru sütunlardaki değerleri arasındaki benzerliği açıklar sütun.

  • _Confidence, eşleşmenin kalitesi açıklar sütun.

dönüştürme Bağlantıyı kullanan SQL Server geçici oluşturmak için veritabanı tabloları bulanık eşleşen algoritmasını kullanır.

Belirsiz arama dönüşümü çalışan

Paket dönüşümün ilk kez çalıştırdığında, dönüştürme başvuru tablosu kopyalar, yeni tablo için bir tamsayı veri türüne sahip bir anahtar ekler ve anahtar üzerinde bir dizin oluşturur sütun.Daha sonra dönüştürme eşleşme dizin adı verilen başvurunun kopyası üzerinde bir dizin oluşturur tablo.Eşleşme dizin değerleri tokenizing sonuçlarını depolar dönüştürme girdisi sütun ve dönüştürme sonra arama işleminde belirteçlerini kullanır.Eşleşme dizin tablo içinde olan bir SQL Server 2000 veya daha yeni bir veritabanı.

paket yeniden çalıştırıldığında, dönüştürme ya da varolan bir eşleşme dizin kullanabilir veya yeni bir dizin oluşturun.Yoksa başvuru tablo olan statik, paket veri temizleme yineleme oturumları için dizini yeniden oluşturma işlemi potansiyel pahalı önlemek.Varolan bir dizini kullanmayı seçerseniz, dizinin ilk oluşturulan saat , paket çalıştırır.Birden çok bulanık arama dönüşümleri aynı başvuru kullanırsanız, tablo, tüm aynı dizin kullanabilirsiniz.Dizini yeniden kullanmak için arama işlemleri aynı olmalıdır; Arama sütunlarından kullanmanız gerekir.Dizin adı ve bağlantı seçin SQL Server veritabanı kaydettiği dizin.

dönüştürme Eşleşme dizin kaydeder eşleşme dizin otomatik olarak tutulabilir.Bunun anlamı her saat referans tablosundaki bir kayıt güncelleştirildiğinde, eşleşme dizin de güncelleştirilir.Eşleşme dizin bakım işlemleri kaydedebilirsiniz saat, paket çalıştırıldığında yeniden oluşturulması dizin olmadığından.Belirtebileceğiniz nasıl dönüştürme eşleşme dizin yönetir.

Aşağıdaki tablo eşleşme dizin seçeneklerini açıklar.

Seçenek

Açıklama

GenerateAndMaintainNewIndex

Yeni bir dizin oluşturmak, kaydetmek ve onu korumak.dönüştürme Başvuru tablosu ve dizin tablosu eşitlenmiş tutmak için referans Tablo Tetikleyicileri yükler.

GenerateAndPersistNewIndex

Yeni bir dizin oluşturmak ve kaydetmek, ancak onu korumak.

GenerateNewIndex

Yeni bir dizin oluşturmak, ancak kaydettikten değil.

ReuseExistingIndex

Varolan bir dizini yeniden.

Eşleşme dizin tablosu Bakımı

The GenerateAndMaintainNewIndex option installs triggers on the reference table to keep the match index table and the reference table synchronized.Yüklü tetikleyici kaldırmak varsa, çalıştırmanız gerekir sp_FuzzyLookupTableMaintenanceUnInstall saklı yordam ve belirtilen ad MatchIndexName özellik olarak giriş parametresi değeri.

Tutulan eşleşme dizin silmek tablo çalıştırmadan önce sp_FuzzyLookuptabloMaintenanceUnInstall saklı yordamı.Varsa eşleşme dizin tablo silinir, Tetikleyiciler başvurusundaki tablo doğru yürütülmez.Başvuru için tüm bundan sonraki güncelleştirmeleri tablo kadar referans olarak el ile Tetikleyicileri bırakma başarısız olur tablo.

truncate table sql komutu silme tetikleyicileri harekete geçirmek.Başvuru tablosu üzerinde truncate tablo komutunu kullandıysanız, başvuru tablosu ve eşleşme dizin artık senkronize edilir ve bulanık arama dönüştürme başarısız olur.Başvuru tablosu üzerinde eşleşme dizin tablosunu tutmak Tetikleyiciler tamamlanmışken, sql delete komutu yerine truncate tablo komutunu kullanmanız gerekir.

Not

Seçtiğinizde, saklayın depolanan dizin üzerinde Başvuru tablosu sekmesinde Bulanık arama dönüştürme Düzenleyicisi, dönüşümün yönetilen saklı yordamlar dizini korumak için kullanır..Ortak dil çalışma zamanı (clr) tümleştirme özelliği bu yönetilen saklı yordamları kullanmak SQL Server 2008.Varsayılan olarak, clr tümleştirme , SQL Server 2008 etkin değil.Kullanmak için saklayın depolanan dizin işlevleri clr etkinleştirmeniz gerekir tümleştirme.Daha fazla bilgi için bkz: clr tümleştirme etkinleştirme.

Çünkü saklayın depolanan dizin seçenek clr Entegrasyonu, başvuru seçtiğinizde bu özellik works gerektirir tablo örneğinde SQL Server 2005 veya SQL Server 2008 clr Entegrasyonu etkin nerede.Dizin üzerinde tutulan edilemez bir örnek , SQL Server 2000.

Satır karşılaştırma

Belirsiz arama dönüştürme yapılandırırken, dönüştürme başvurusunda eşleşen kayıtları bulmak için kullandığı karşılaştırma algoritma belirtmek tablo.Yaparsanız Exhaustive özellikne True, her satırda bir giriş her başvurunun satırı için dönüştürme karşılaştırır tablo.Bu karşılaştırma algoritma daha kesin sonuçlar verebilir, ancak başvurunun satır sayısını olmadığı sürece daha yavaş dönüştürme yapmak büyük olasılıkla tablo kadar küçüktür.If the Exhaustive property is set to True, the entire reference table is loaded into memory.Performans sorunlarını önlemek için bunu tavsiye için küme Exhaustive özelliğine True paket geliştirme sırasında.

If the Exhaustive property is set to False, the Fuzzy Lookup transformation returns only matches that have at least one indexed token or substring (the substring is called a q-gram) in common with the input record.Aramalar, yalnızca alt küme küme küme kümesi içindeki her satırı belirteçleri verimliliğini en üst düzeye çıkarmak için tablo eşleşmeleri bulmak için bulanık arama dönüştürme kullanır ters dizin yapısında dizine alınır.Zaman giriş verileriküme olan küçük, şunları yapabilirsiniz küme Exhaustive için True korunma eksik eşleşmeler, hiçbir ortak belirteçleri mevcut dizin tablo.

Dizinler ve başvuru tabloları olarak önbelleğe alma

Belirsiz arama dönüşümü yapılandırırken, dönüşümünü kısmen dizin ve başvuru önbelleğe olup olmadığını belirtebilirsiniz tablo dönüştürme işini yapmadan önce bellekte.Yaparsanız WarmCaches özellikne True, dizin ve başvuru tablo bellek. yüklenmiş olanAyarlama, çok sayıda satır olduğunda giriş WarmCachesözellik için True performansını geliştirebilirdönüştürme. Giriş satır sayısı küçük olduğunda ayarı WarmCaches özellik için False büyük bir dizin yeniden hızlandırabilir.

Geçici tablolar ve dizinler

Çalışma sırasında saat, tablolar ve dizinler gibi geçici nesneler oluşturur bulanık arama dönüştürme SQL Server dönüştürme bağlandığı veritabanı.Bunlar geçici boyutunu tablos ve dizinler uygun sayıda satır ve simgeleri başvurusu için tablo ve bulanık arama dönüştürme oluşturur; simge sayısı Bu nedenle, bunlar önemli miktarda disk alanı olabilecek tüketebilir.dönüştürme de bu geçici tablolar sorgular.Bu nedenle bir üretim için bulanık arama dönüştürme bağlanma düşünmelisiniz örnek , bir SQL Server özellikle üretim sunucusu kullanılabilir disk alanı sınırlaması durumunda veritabanı,.

Bu performans dönüştürme tablolar ve dizinler kullandığı yerel bilgisayarda bulunuyorsa artırabilir.Belirsiz arama dönüştürme kullanır Başvuru Tablosu'nda üretim sunucusunda ise, tablo olmayan üretim sunucusuna kopyalama ve kopya erişmek için bulanık arama dönüştürme yapılandırma göz önünde bulundurmalısınız.Bunu yaptığınızda, arama sorgularını üretim sunucusundaki kaynakları tüketmesini engelleyebilirsiniz.In addition, if the Fuzzy Lookup transformation maintains the match index—that is, if MatchIndexOptionsis set to GenerateAndMaintainNewIndex—the transformation may lock the reference table for the duration of the data cleaning operation and prevent other users and applications from accessing the table.

Belirsiz arama dönüşümü yapılandırma

Yapabilirsiniz küme Özellikler'inde SSIS Tasarımcısı veya programlı olarak.

Yapabilirsiniz özellikleri hakkında daha fazla bilgi için küme , Bulanık arama dönüşümü Düzenleyicisi iletişim kutusunda, aşağıdaki konulardan birini tıklatın:

Yapabilirsiniz özellikleri hakkında daha fazla bilgi için küme , Gelişmiş Düzenleyici iletişim kutusunda veya programlı olarak aşağıdaki konulardan birini tıklatın:

Özellikleri küme hakkında daha fazla bilgi için bkz: Nasıl yapılır: Bir veri akışı bileşen özelliklerini ayarlama.

Integration Services simgesi (küçük)Integration Services ile güncel kalın

En son karşıdan yüklemeler, makaleler, örnekler ve seçilen topluluk çözümleri yanı sıra Microsoft videolar için ziyaret Integration Services sayfa msdn veya TechNet:

Bu güncelleştirmelerle ilgili otomatik bildirim almak için, sayfadaki RSS akışlarına abone olun.