Stopwords and Stoplists

Aby zapobiec staje się bloated indeks pełnotekstowy SQL Server zawiera mechanizm, który odrzuca najczęściej występującą ciągów, które nie pomagają wyszukiwania. Tych ciągów usuwane są nazywane stopwords.Podczas tworzenia indeksu aparat Full-Text pomija stopwords z indeksu pełnotekstowego.Oznacza to, że kwerendy pełnego tekstu nie będzie szukał w stopwords.

Important noteImportant Note:

SQL Server 2005 słowa ignorowane zostały zastąpione stopwords.Po uaktualnieniu bazy danych SQL Server 2008 z jednej z poprzednich wersji plików wyraz pomijalny nie są już używane w SQL Server 2008. Jednak pliki wyraz pomijalny są przechowywane w folderze FTNoiseThesaurusBak FTDATA\ i można ich używać później podczas aktualizowania lub tworzenie odpowiednich SQL Server 2008 stoplists. Aby uzyskać informacje dotyczące uaktualniania do stoplists wyraz pomijalny plików Zobacz Full-Text Search Upgrade.

A stopword może być słowo o znaczeniu w określonym języku lub może być Token , nie ma znaczenia językowe.Na przykład w języku angielskim, wyrazy, takie jak „, „ "i", "jest" i "" "są pozostawione z indeksu pełnotekstowego, ponieważ są one znane się bezużyteczny do wyszukiwania.

Chociaż ignoruje włączenia stopwords, indeks pełnotekstowy brać pod uwagę przy ich położenie.Na przykład należy wziąć pod uwagę frazę "Instrukcje mają zastosowanie do tych modeli cykle firmy Adventure Works".W poniższej tabela przedstawiono pozycja słowa we frazie:

Word

Pozycja

Instrukcje

1

2

zastosowanie

3

Aby

4

te

5

Adventure

6

Program Works

7

Cykle

8

modele

9

The stopwords "się", "do" i „ ", są one w pozycji 2, 4 i 5 są pozostawiane z indeksu pełnotekstowego.Jednak ich pozycyjne informacje są obsługiwane, a tym samym pozostawienia położenia innych wyrazów w zdaniu nie ma wpływu.

Stoplists

W SQL Server 2008, stopwords są zarządzane w bazach danych za pomocą obiektów o nazwie stoplists. A stoplist znajduje się lista stopwords, skojarzony z indeksu pełnotekstowego, jest stosowana do całego tekstu kwerendy dla tego indeksu.

Tworzenie Stoplist

A stoplist można utworzyć w dowolnym z następujących sposobów:

  • Using the system-supplied stoplist in the database.SQL Server ships with a system stoplist that contains the most commonly used stopwords for each supported language, that is for every language that is associated with given word breakers by default.Stoplist systemu zawiera stopwords wspólne dla wszystkich obsługiwanych języków.Kopiowanie stoplist systemu i dostosować dodając i usuwając stopwords kopii.

    System stoplist jest instalowany w Zasób bazy danych.

  • Tworzenie własnych stoplist, a następnie dodanie stopwords jej dla wszystkich języków, dla których określono.Stopwords można również usunąć z sieci stoplist, gdy jest to konieczne.

  • Za pomocą istniejących stoplist niestandardowego z innej bazy danych na bieżącym serwerze wystąpienie dodawania i upuszczając stopwords stosownie do potrzeb.

Important noteImportant Note:

STOPLIST więcej CREATE, ALTER STOPLIST więcej i DROP STOPLIST więcej są obsługiwane tylko w obszarze poziom zgodności 100.W obszarze poziom zgodności 80 i 90 instrukcje te nie są obsługiwane.Jednak na wszystkich poziomach zgodności stoplist systemu jest automatycznie kojarzona z nowe indeksy pełnotekstowe.

Aby utworzyć stoplist

Aby dodać lub usunąć stopwords z stoplist

Aby usunąć stoplist

Za pomocą Stoplist w kwerendach

Aby korzystać z stoplist w kwerendach, należy skojarzyć z indeksem pełnotekstowym.A stoplist można dołączyć do indeksu całego tekstu podczas tworzenia indeksu lub można zmienić później, aby dodać stoplist indeksu.

Aby utworzyć indeks pełnotekstowy i skojarzyć z nią stoplist

Aby skojarzyć lub usuwanie skojarzenia stoplist z istniejącego indeksu pełnotekstowego

Aby pominąć komunikat o błędzie, jeśli operacja logiczna na zapytanie pełnotekstowe nie powiedzie się, że stopwords

Przeglądanie Stoplists i Stoplist metadane

Aby wyświetlić wszystkie stopwords z stoplist

Aby uzyskać informacje na temat wszystkich stoplists w bieżącej bazie danych

Aby wyświetlić wynik tokenizacja kombinacji dzielenie, tezaurus i stoplist wyrazu