Yapılandırma ve sözcük ayırıcılarını ve sözcük köklerini arama yönetme

Word ayırıcılarını ve sözcük köklerini üzerindeki tüm tam metin dizini oluşturulmuş veri dilbilimsel çözümlemesi gerçekleştirin. Sözcük sınırları (sözcük bölme) bulma içerir dilsel analiz ve fiiller (stemming) conjugating. Sözcük ayırıcılarını ve sözcük köklerini dile içindir ve dilsel çözümleme kuralları farklı diller için farklı. Belirli bir dil için bir sözcük ayırıcı burada sözcük sınırları var sözlü dilin kurallarına göre belirlenerek tek tek sözcükleri tanımlar. Her sözcüğün (olarak da bilinen bir token) boyutunu küçültmek için sıkıştırılmış gösterimi kullanarak tam metin dizini eklenir. Sözcük kökü ayırıcı o dili (örneğin, "çalışan", "bitti" ve "Yolluk" kurallara göre belirli bir sözcüğün Inflectional formları oluşturur "Çalıştır" word'ün çeşitli formları vardır).

Dile özgü sözcük ayırıcılarını kullanmak, bu dil için doğru olarak ortaya çıkan şartlar sağlar. Sözcük ayırıcısı için belirli sub-language dil ailesi, ancak orada, büyük dil kullanılır. Örneğin, Fransızca sözcük ayırıcısı, Fransız Kanadalı metni işlemek için kullanılır. Belirli bir dil için hiçbir sözcük ayırıcı varsa, tarafsız sözcük ayırıcısı kullanılır. Nötr sözcük ayırıcısı ile kelime, boşluk ve noktalama işaretleri gibi belirsiz karakterler kesilir.

Bu Konuda

  • Sözcük ayırıcılarını kaydediliyor

  • Varsayılan tam metin dili seçeneği ayarlama

  • Dil için dizine alınmış sütun seçme

  • Sözcük ayırıcılarını hakkında bilgi edinme

  • Sözcük bölme zaman aşımı hataları giderme

  • Yeni sözcük ayırıcılarını etkisini anlama

Sözcük ayırıcılarını kaydediliyor

Kullanılacak bir dil için sözcük ayırıcılarını, onlar kayıtlı olmalıdır. Kayıtlı sözcük ayırıcılarını için dil kaynakları ilişkilendirilmiş — sözcük köklerini, gürültü sözcükleri (stopwords) ve eş anlamlılar dosyaları — tam dizin oluşturma ve sorgulama işlemleri metin için de kullanılabilir. Sözcük ayırıcılarını şu anda ile kayıtlı diller listesini görüntülemek için SQL Serverbirini kullanın Transact-SQLdeyimi:

SEÇİN * listelenecektirsys.fulltext_languagesKatalog dan

Eklemek, kaldırmak ya da sözcük ayırıcısı alter, tam dizin oluşturma ve sorgulama metin için desteklenen Microsoft Windows yerel betimleyicileri (LCID) listesini yenilemek gerekir. Daha fazla bilgi için, bkz. Görüntüleme veya değiştirme kayıtlı sözcük ayırıcılarını ve filtreleri.

Varsayılan tam metin dili seçeneği ayarlama

Yerelleştirilmiş sürümü için SQL Server, SQL Serverkurulum ayarlar varsayılan tam metin dili uygun bir eşleşme varsa, sunucu dil seçeneği. Yerelleştirilmemiş bir sürümü için SQL Server, default full-text languageseçenek İngilizce.

Oluşturma veya bir tam metin dizini değiştirerek, her tam metin dizini oluşturulmuş sütun için farklı bir dil belirtebilirsiniz. Hiçbir dil için bir sütun belirtilmezse, varsayılan yapılandırma seçeneği değeri ise default full-text language.

[!NOT]

Sorguda dil seçeneği belirtilmediği sürece bir tek tam metin sorgu işlevi yan tümcesinde listelenen tüm sütunlar aynı dili kullanmanız gerekir. Tam metin sorgu yüklemler bağımsız değişkenler üzerinde gerçekleştirilen dilsel analiz sorgulanan tam metin dizini oluşturulmuş sütun için kullanılan dili belirler (CONTAINS ve freetext) ve işlevleri (CONTAINSTABLE ve freetexttable).

Dil için dizine alınmış sütun seçme

Ne zaman bir tam metin dizini oluşturma, bir dil her dizine alınmış sütun için belirttiğiniz öneririz. Bir dil için bir sütun belirtilmezse, sistem varsayılan dil kullanılır. Sütun dil hangi sözcük ayırıcısı ve sözcük kökü ayırıcı o sütunun dizin oluşturma için kullanılacağını belirler. Ayrıca, bu dilin eş anlamlılar dosyası sütun üzerinde tam metin sorgular tarafından kullanılacaktır.

Orada birkaç şey bir tam metin dizini oluşturmak için sütun dil seçerken göz önünde bulundurulacak. Metninizin nasıl tokenized için bu noktalar arasında ilişki ve sonra tam metin altyapısı tarafından dizine. Daha fazla bilgi için, bkz. Bir tam metin dizini oluşturma, bir dil seçin.

Sözcük bölücü dil sütun görüntülemek için

Sözcük ayırıcılarını hakkında bilgi edinme

Sözcük ayırıcısı, eş anlamlılar ve stoplist birlikte tokenization sonucunu görüntüleme

Kayıtlı sözcük ayırıcılarını hakkında bilgi dönmek için

Sözcük bölme zaman aşımı hataları giderme

Bir sözcük bölme zaman aşımı hatası çeşitli durumlarda ortaya çıkabilir. Bu durumlar ve her durumda yanıt hakkında daha fazla bilgi için bkz: MSSQLSERVER_30053.

Yeni sözcük ayırıcılarını etkisini anlama

Her sürümü SQL Servergenellikle daha iyi dil kuralları ve daha önceki sözcük ayırıcılarını daha doğru yeni sözcük ayırıcılarını içerir. Potansiyel olarak yeni sözcük ayırıcılarını biraz farklı--dan önceki sürümlerinden alınan tam metin dizinlerini sözcük ayırıcılarını davranabilir SQL Server. Bu veritabanını geçerli sürüme yükseltildiğinde bir tam metin kataloğu alındıysa önemli SQL Server. Tam metin kataloğu tam metin dizinleri tarafından kullanılan bir veya daha fazla dil şimdi yeni sözcük ayırıcılarını ile ilişkili olabilir. Daha fazla bilgi için, bkz. SQL Server 2005 tam metin arama yükseltme.

Tüm sözcük ayırıcılarını tam bir listesi için bkz: listelenecektirsys.fulltext_languagesKatalog (Transact-sql).

Ayrıca bkz.

Başvuru

alter fulltext INDEX (Transact-sql)

fulltext INDEX (Transact-sql) oluştur

sp_fulltext_service (Transact-sql)

listelenecektirsys.fulltext_languagesKatalog (Transact-sql)

Kavramlar

Yapılandırma ve Stopwords ve Stoplists için tam metin araması yönetme

SQL Server 2005 tam metin arama yükseltme