Share via


Bulanık arama dönüşümü

Belirsiz arama dönüşümü veri temizleme veri standardizing veri düzeltme ve eksik değerleri sağlama gibi görevleri gerçekleştirir.

[!NOT]

Performans ve bellek sınırlamaları gibi belirsiz arama dönüşümü hakkında daha ayrıntılı bilgi için teknik incelemesine bakın bakın.bulanık arama ve SQL Server ıntegration Hizmetleri 2005 belirsiz gruplandırma.

Belirsiz arama dönüşümü, eşleşen arama dönüşümü bulanık--dan onun kullanımı farklıdır. Arama dönüşümü Eş birleşim başvuru tablosundaki eşleşen kayıtları bulmak için kullanır. Tam bir eşleşme veya hiçbir başvuru tablosundan döndürür. Aksine, belirsiz arama dönüşümü bulanık eşleşen bir kullanır ya da daha fazla maç başvuru tablosundaki kapatın.

Bulanık arama dönüşümü, sık sık bir paketi veri akışı arama dönüşümü izler. Öncelikle, arama dönüşümü tam eşleşme bulmaya çalışır. Başarısız olursa, başvuru tablosundaki Yakın eşleşmeleri belirsiz arama dönüşümü sağlar.

Dönüşümün temiz ve giriş verileri genişletmek için kullanılan değerleri içeren başvuru veri kaynağına erişmesi gerekir. Başvuru veri kaynağı tablo olmalıdır bir SQL Serververitabanı. Giriş sütunundaki değeri ve referans tablosundaki değeri arasındaki maç, tam bir eşleşme veya bulanık eşleşme olabilir. Ancak, dönüşümün bulanık eşleşme için yapılandırılmış en az bir sütun eşleme gerektirir. Yalnızca tam eşleme kullanmak istiyorsanız, arama dönüşümü kullanın.

Bu dönüşüm sahip giriş ve bir çıkış.

Yalnızca giriş sütunları ile DT_WSTRve DT_STRbulanık eşleşen veri türleri kullanılabilir. Tam eşleşen herhangi bir dts veri türü dışında kullanabilirsiniz DT_TEXT, DT_NTEXT, ve DT_IMAGE. Daha fazla bilgi için, bkz. Tümleştirme Hizmetleri veri türleri. Üyelik giriş ve başvuru tablosu arasında katılan sütunlar uyumlu veri türlerine sahip olmalıdır. Örneğin, bir sütunun dts ile katılmak için geçerli olduğunu DT_WSTRveri türüne sahip bir sütun SQL Server  nvarcharveri türü sütun ile katılmaya, ancak geçersiz DT_WSTRveri türüne sahip bir sütun intveri türü.

Bu dönüşüm, bellek, satır karşılaştırma algoritma ve dizinler ve dönüşümü kullanır başvuru tabloları önbelleğe alma maksimum miktarını belirleyerek özelleştirebilirsiniz.

Belirsiz arama dönüşümü kullandığı bellek miktarı ayarlanarak yapılandırılabilir MaxMemoryUsageözel özellik. Megabayt (mb) sayısını belirtebilir veya kullanım dönüşümü sağlayan 0 değeri, dinamik bir kendi ihtiyaçlarını ve kullanılabilir fiziksel belleğin temel bellek miktarı. MaxMemoryUsageÖzel özellik paketi yüklendiğinde bir özellik ifadeye göre güncelleştirilebilir. Daha fazla bilgi için bkz: Integration Services Expression Reference, Paketlerinde özelliği ifadeleri kullanma, ve Dönüşümü özel özellikleri.

Belirsiz eşleştirme davranışı denetleme

Belirsiz arama dönüşümü gerçekleştirdiği arama özelleştirmek için üç özelliği içerir: maç giriş satır, Belirteç sınırlayıcıları ve benzerlik eşikleri dönmek için en fazla sayısı.

Dönüşümün sıfır ya da daha fazla maç eşleşmeleri belirtilen sayıya yukarı döndürür. Maç sayısını belirterek, dönüşümün eşleşme sayısını döndürür garanti etmez; yalnızca, dönüşümün en çok maç sayısı döner garanti eder. Bir değer, maç sayısı 1'den büyük ayarlarsanız dönüşümü çıkış arama başına birden fazla satır içerebilir ve satırlarını yinelemeler olabilir.

Dönüşüm, verileri tokenize için kullanılan sınırlayıcı varsayılan sunmakla birlikte, veri gereksinimlerini karşılamak için belirteç sınırlayıcıları ekleyebilirsiniz. DelimitersÖzelliği, varsayılan sınırlayıcı içerir. Tokenization önemli çünkü karşılaştırılan veri birimleri birbirine tanımlar.

Benzerlik eşikleri bileşen ve birleşim düzeylerinde ayarlanabilir. Üyelik düzeyi benzerliği eşik ne zaman bir bulanık eşleşme sütunlar Giriş ve başvuru tablosu arasında dönüşümü gerçekleştirir. Benzerlik aralığı 0-1. Satır ve sütunları yineleme olarak nitelemek amacıyla olmalıdır eşik, 1 daha benzer daha yakın. Ayarlayarak benzerliği eşik belirtmek MinSimilarityözelliği bileşen ve birleşim düzeylerinde. Bileşen düzeyinde belirtilen benzerlik karşılamak için tüm satırları benzerliği eşik bileşen düzeyinde belirtilen eşit veya daha büyük olan tüm eşleşmeleri arasında bir benzerlik olmalıdır. Yani, satır veya birleştirme düzeyinde maç eşit yakın olmadıkça bileşen düzeyinde çok yakın bir eşleşme belirtemezsiniz.

Her maç bir benzerlik puanı ve güven puanı bulunur. Benzerlik puanı çeşitleyerek benzerlik giriş kaydı ve belirsiz arama dönüşümü başvuru tablosundan döndürür kaydı arasında matematiksel bir ölçüsüdür. Güven puanı nasıl muhtemelen öyle bir ölçüsüdür belirli bir değer başvuru tablosunda bulunan eşleştirmelerle arasında en iyi bir eştir. Bir kayda atanan güven puanı verilen diğer eşleşen kayıtlara bağlıdır. Örneğin, eşleşen St. ve Saint ne olursa olsun diğer maçlar düşük benzerlik puan verir. Eğer Saint tek maç döndürülür, güven puanı yüksek. Her iki Saint ve St. başvuru tablosu, güven içinde görünür St. yüksek ve güven Saint düşüktür. Ancak, yüksek benzerlik yüksek güven anlamına gelmez. Örneğin, değer arıyorsanız Bölüm 4, sonuçların Bölüm 1, Bölüm 2, ve Bölüm 3 en iyi eşleşen sonuçların olduğu belirsiz olduğu için yüksek benzerlik puanı ancak düşük güven puanı var.

Benzerlik puanı 0-1, burada tam olarak eşleşen giriş sütun değeri ve referans tablosundaki değeri arasında bir benzerlik puanı 1 anlamına gelir arasında ondalık bir değer gösterilir. Ayrıca 0 ve 1 arasında ondalık bir değer güven puanı maç güven gösterir. Kullanılabilir eşleşme bulunursa, benzerlik ve güven skoru 0 satıra atanır ve başvuru tablosundan kopyalanır çıktı sütunları null değerler içerir.

Bazen bulanık arama uygun eşleşme başvuru tablosundaki yerini. Bir aramada kullanılan giriş değeri tek, kısa bir sözcük ise, bu durum oluşabilir. Örneğin, helo değeriyle eşleşen Merhaba bu sütun veya satırdaki diğer herhangi bir sütunu diğer belirteçleri bulunduğunda başvuru tablosu.

Dönüşüm çıktı sütunları doğrudan sütunları, arama tablosunda seçili sütunları ve aşağıdaki ek sütunlar işaretlenmiş giriş sütunları içerir:

  • _Similarity, giriş ve başvuru sütunlardaki değerleri arasındaki benzerliği açıklar sütun.

  • _Confidence, maç kalitesini açıklar sütun.

Dönüşümün bağlantıyı kullanan SQL Serverbulanık eşleşen algoritmasını kullanır geçici tablolar oluşturmak için veritabanına.

Belirsiz arama dönüşümü çalışan

Paket dönüşümün ilk kez çalıştırdığında, dönüşümün başvuru tablosu kopyalar, bir anahtar bir tamsayı veri türü için yeni bir tablo ekler ve bir dizin anahtar sütunu oluşturur. Sonra dönüşümü başvuru tablosu kopyası üzerinde bir eşleşme dizin adında bir dizin oluşturur. Tokenizing dönüşümün giriş sütunları değerleri sonuçları maç dizinini saklar ve sonra dönüşümün Arama işleminde belirteçlerini kullanır. Bir tabloda eşleşen dizin olduğundan bir SQL Serververitabanı.

Paketi yeniden çalıştırıldığında, dönüşümün varolan bir eşleme dizini kullanabilir veya yeni bir dizin oluşturun. Referans tablosundaki statik ise, paket veri temizleme tekrar oturum dizini yeniden oluşturuluyor potansiyel pahalı işlemi önleyebilirsiniz. Varolan bir dizini kullanmayı seçerseniz, dizin paketi çalışan ilk kez oluşturulur. Birden çok bulanık arama dönüşümleri aynı referans tablo kullanırsanız, tüm aynı dizin kullanabilirsiniz. Dizini yeniden kullanmak için arama işlemleri aynı olmalıdır; Arama aynı sütunlara kullanmanız gerekir. Dizin adı ve bağlantı seçin SQL Serververitabanı dizini kaydeder.

Dönüşümün eşleşme dizin kaydederse, eşleşme dizin otomatik olarak tutulabilir. Yani her referans tablosundaki bir kayıt güncelleştirildiğinde eşleşme dizin de güncelleştirilir. Dizin paket çalıştığında yeniden oluşturulması gerekmez çünkü eşleşme dizin Bakımı işlem süresi, kaydedebilirsiniz. Dönüşümün eşleşme dizin yönetme biçimini belirtebilirsiniz.

Aşağıdaki tabloda eşleşen dizin seçeneklerini açıklar.

Seçenek

Açıklama

GenerateAndMaintainNewIndex

Yeni bir dizin oluşturmak, kaydetmek ve bunu sürdürmek. Dönüşümü, başvuru tablosu ve dizin tablo eşitlenmiş tutmak için başvuru tablosu için Tetikleyiciler yükler.

GenerateAndPersistNewIndex

Yeni bir dizin oluşturmak ve kaydetmek, ancak bunu korumak değil.

GenerateNewIndex

Yeni bir dizin oluşturmak, ancak onu kaydetmeyin.

ReuseExistingIndex

Varolan bir dizini yeniden.

Bakım Eşleştir dizin tablo

GenerateAndMaintainNewIndex seçenek yükler Tetikleyiciler maç dizin tablo ve senkronize başvuru tablosu için başvuru tablosu. Yüklü tetikleyici kaldırmak zorunda kalırsanız, you must run sp_FuzzyLookupTableMaintenanceUnInstall saklı yordamı ve belirtilen ad vermek MatchIndexNameözelliği giriş parametresinin değeri olarak.

Tutulan eşleşme dizin tablo çalıştırmadan önce silmemeniz gerekir sp_FuzzyLookupTableMaintenanceUnInstall saklı yordamı. Eşleşme dizin tablo silinirse, referans Tablo Tetikleyicileri düzgün yürütmez. El ile referans Tablo Tetikleyicileri damla kadar referans tablosundaki tüm sonraki güncelleştirmeler başarısız olur.

truncate table sql komutu silme tetikleyicileri harekete değil. truncate table komutu başvurusu tablo kullanılırsa, başvuru tablosu ve eşleşme dizin artık eşitlenir ve belirsiz arama dönüşümü başarısız olur. Eşleşme dizin tablosu tetikler başvuru tablosu üzerinde yüklü iken, yerine truncate table komutu sql delete komutunu kullanmanız gerekir.

[!NOT]

Seçtiğinizde saklayın depolanan dizin üzerine Başvuru tablosu sekmesini Bulanık arama dönüşümü Düzenleyicisi, dönüşümün yönetilen saklı yordamlar dizini korumak için kullanır. Bu yönetilen saklı yordamları kullanmak için ortak dil çalışma zamanı (clr) tümleştirme özelliği SQL Server. Varsayılan olarak, clr entegrasyonu SQL Serveretkin. Kullanmak için saklayın depolanan dizin işlevleri clr tümleştirme etkinleştirmek gerekir. Daha fazla bilgi için, bkz. clr tümleştirme etkinleştirmek.

Çünkü saklayın depolanan dizin seçeneğini gerektirir clr tümleştirme, yalnızca başvuru tablosu örneği seçtiğinizde bu özelliği inşaat SQL Serverclr tümleştirme etkin nerede.

Satır karşılaştırma

Belirsiz arama dönüşümü yapılandırırken, başvuru tablosundaki eşleşen kayıtları bulmak için dönüşümün kullanan karşılaştırma algoritma belirtebilirsiniz. Eğer Exhaustiveözelliği True, dönüşüm her satırda referans tablosundaki her satır girişi karşılaştırır. Bu karşılaştırma algoritma daha doğru sonuçlar üretebilir, ancak başvuru tablosu küçük satır olmadığı sürece daha yavaş gerçekleştirme dönüşümü yapmak olasıdır. Eğer Exhaustiveözelliği ayarlanır True, tüm başvuru tablosunu belleğe yüklenir. Performans sorunlarını önlemek için onu ayarlamak için tavsiye Exhaustiveözelliği Truepaketi geliştirme sırasında.

Eğer Exhaustiveözelliği ayarlanır False, belirsiz arama dönüşümü en az bir dizin oluşturulmuş belirteci veya alt dize eşleşmeleri döndürür (alt dize adı verilen bir q gram) giriş kaydı ile ortak. Aramaları verimliliğini en üst düzeye çıkarmak için yalnızca bir alt kümesini tablodaki her satırı belirteçleri belirsiz arama dönüşümü eşleşmeleri bulmak için kullandığı ters dizin yapısı içinde indekslenmektedir. Giriş veri kümesi küçük olduğunda, sen-ebilmek koymak Exhaustiveiçin Truemaçlar için hiçbir ortak belirteçleri mevcut dizin tablosunda eksik önlemek için.

Dizinler ve başvuru tabloları önbelleğe alma

Belirsiz arama dönüşümü yapılandırırken, dönüşümün kısmen önbelleğe dizin ve onun iş başvuru tablosundaki dönüşüm önce bellek yok olup olmadığını belirtebilirsiniz. Eğer WarmCachesözelliği True, dizin ve başvuru tablosunu belleğe yüklenir. Giriş ayarı birçok satır olduğunda WarmCachesözelliği Truedönüşümün performansını artırabilir. Giriş satır sayısı küçük olduğunda, ayar WarmCachesözelliği Falsebüyük bir dizin yeniden hızlandırabilir.

Geçici tablolar ve dizinler

Çalışma zamanında, belirsiz arama dönüşümü geçici nesneler, tablolar ve dizinler gibi oluşturur SQL Serverdönüşümü bağlandığı veritabanı. Bu geçici tablolar ve dizinler büyüklüğüne orantılı sayıda satır ve referans tablosundaki belirteçleri ve belirsiz arama dönüşümü oluşturan simge sayısı; Bu nedenle, potansiyel olarak önemli miktarda disk alanı tüketir. Dönüşümün de bu geçici tablolar sorgular. Belirsiz arama dönüşümü bir sigara üretim örneği için bağlanma bu nedenle düşünmelisiniz bir SQL Serververitabanı, özellikle üretim sunucusu kullanılabilir disk alanı sınırlıdır eğer.

Tablolar ve dizinler kullanır Yerel bilgisayarda bulunuyorsa bu dönüşümün performansını artırabilir. Belirsiz arama dönüşümü kullanır Başvuru Tablosu'nda üretim sunucusundaki ise, tablo olmayan-üretim sunucusuna kopyalama ve kopya erişmek için belirsiz arama dönüşümü yapılandırma düşünmelisiniz. Bunu yaptığınızda, arama sorguları üretim sunucusundaki kaynakları tüketmesini engelleyebilirsiniz. Ayrıca, belirsiz arama dönüşümü eşleşme dizin tutuyorsa — yani, eğer MatchIndexOptions ayarlanır GenerateAndMaintainNewIndex— dönüşümü veri temizleme işlemi süresince başvuru tablosu kilitleme ve diğer kullanıcıların ve uygulamaların tablo erişimini engellemek.

Belirsiz arama dönüşümü yapılandırma

Aracılığıyla özelliklerini ayarlayabilirsiniz SSISTasarımcısı veya programlı olarak.

Sen-ebilmek koymak içinde özellikleri hakkında daha fazla bilgi için Bulanık arama dönüşümü Düzenleyicisi iletişim kutusunda, aşağıdaki konulardan birini tıklatın:

Sen-ebilmek koymak içinde özellikleri hakkında daha fazla bilgi için Gelişmiş Düzenleyici iletişim kutusu veya programlı olarak aşağıdaki konulardan birini tıklatın:

ilişkili Görevler

Veri akışı bileşen özelliklerini ayarlama hakkında daha fazla bilgi için bkz: Veri akışı bileşen özelliklerini ayarlama.

İlişkili İçerik

Integration Services simgesi (küçük) Integration Services ile güncel kalın

En son karşıdan yüklemeler, makaleler, örnekler ve Microsoft video yanı sıra topluluk seçili çözümleri için ziyaret Integration ServicesMSDN sayfası:


Bu güncelleştirmelerle ilgili otomatik bildirim almak için, sayfadaki RSS akışlarına abone olun.

Ayrıca bkz.

Kavramlar

Arama dönüşümü

Bulanık gruplandırma dönüşümü

Tümleştirme Hizmetleri dönüşümleri