Artykuł
05/11/2010

Konfigurowanie Full-Text Linguistic składników

Począwszy od SQL Server 2008, wyszukiwanie pełnotekstowe obsługuje prawie 50 różnych języków, takich jak angielski, hiszpański, chiński, japoński, arabski, bengalskiego i Hindi. Aby uzyskać pełną listę obsługiwanych języków pełnego tekstu Zobacz sys.fulltext_languages (języka Transact-SQL). Każdej z kolumn zawartych w indeksie pełnego tekstu jest skojarzony z identyfikatorem regionalny systemu Microsoft Windows (LCID), co daje na język, który jest obsługiwany przez przeszukiwanie pełnego tekstu.Na przykład co daje LCID 1033 język angielski USA i równa angielskiego, co daje LCID 2057.Dla każdego obsługiwanych języków pełnego tekstu SQL Server zawiera lingwistyczne składniki, obsługujące indeksowanie i wyszukiwanie pełnotekstowe dane, które są przechowywane w tym języku.

Specyficzne dla języka składniki zawierają dzielenie wyrazów i program szukający rdzeni.Dzielenie wyrazów znajdzie wyraz granice oparte na regułach leksykalne z (danego językaDzielenie wyrazów).Każdy dzielącego jest skojarzony z program szukający rdzeni, które conjugates zleceń dla tej samej wersji językowej.Aby uzyskać więcej informacji zobaczProgram Word podziały i Stemmers.

Ponadto począwszy od SQL Server 2008, stoplist systemu jest pod warunkiem, że zawiera stopwords podstawowego zestaw (znane również jako słowa ignorowane). A stopword jest to słowo, które nie pomaga w wyszukiwaniu i jest ignorowany przez kwerendy pełnego tekstu.Na przykład dla języka angielskiego regionalny wyrazów, takich jak "" ","i","jest"oraz „" są traktowane jako stopwords.Zazwyczaj należy skonfigurować jeden lub więcej plików tezaurusa i stoplists.Aby uzyskać więcej informacji zobaczStopwords and Stoplists.

SQL Server instaluje plik tezaurusa dla każdego języka pełnego tekstu, jak i plik globalny tezaurusa.Pliki tezaurusa zainstalowane są zasadniczo puste, ale można je zdefiniować synonimów dla określonego języka lub scenariusza biznesowego edytować.Przy opracowywaniu tezaurusa, dostosowane do danych pełnego tekstu, można skutecznie rozszerzyć zakres kwerendy pełnotekstowy dla tych danych.Aby uzyskać więcej informacji zobaczKonfiguracja tezaurusa.

Indeksowanie dokumentu w varbinary, varbinary(max), image, lub xml Kolumna typu danych wymaga filtr, aby wykonać dodatkowe przetwarzanie. Filtr musi być określone dla wybranego typu dokumentu (.doc, .pdf, .xls, XML i tak dalej).Aby uzyskać więcej informacji zobaczFiltry wyszukiwanie pełnego tekstu.

Uwaga

Word wyłączników (i stemmers) i filtry są uruchamiane w procesie hosta demon filtru (fdhost.exe).Aby uzyskać informacje dotyczące tego procesu zobacz Full-Text Search Architecture.

Udostępnij przez

Konfigurowanie Full-Text Linguistic składników

See Also

Concepts

Other Resources

Dodatkowe zasoby