Stopwords i Stoplists

Aby zapobiec indeksu pełnotekstowego staje się bloated SQL Server został mechanizm, który odrzuca często występujących ciągi, które nie pomagają wyszukiwania.Tych ciągów złomowane są nazywane stopwords.Podczas tworzenia indeksu pełnotekstowego silnika pomija stopwords z indeksu pełnotekstowego.Oznacza to, że kwerendy pełnego tekstu nie szukać na stopwords.

Ważna informacjaWażne:

SQL Server 2005 słowa ignorowane zostały zastąpione przez stopwords.Po uaktualnieniu bazy danych do SQL Server 2008 z poprzedniej wersji wyraz pomijalny pliki nie są już używane w SQL Server 2008.Jednak pliki wyraz pomijalny są przechowywane w folderze FTDATA\ FTNoiseThesaurusBak i można je później podczas aktualizowania lub tworzenia odpowiednich SQL Server 2008 stoplists.Aby uzyskać informacje dotyczące uaktualniania plików list słów ignorowanych w stoplists, zobacz Uaktualnienie wyszukiwania pełnotekstowego.

Stopword może być wyraz o znaczeniu w określonym języku lub może być token nie ma znaczenia językowej.Na przykład w języku angielskim, wyrazy, takie jak"" "i", "jest" i "" są pozostawiane z indeksu pełnotekstowego, ponieważ są one znane się bezużyteczny do wyszukiwania.

Chociaż ignoruje włączenia stopwords, indeksu pełnotekstowego uwzględniać ich pozycji.Rozważmy na przykład frazę "Instrukcje mają zastosowanie do tych modeli Adventure Works cykli".W poniższej tabela zebrano pozycja wyrazów frazy:

Word

Pozycja

Instrukcje

1

2

zastosowanie

3

Aby

4

te

5

Adventure

6

Program Works

7

Cykle

8

modele

9

Stopwords "są", "do" i "" w pozycji 2, 4 i 5 są pozostawione poza indeksu pełnotekstowego.Jednak ich pozycyjne informacje są obsługiwane, tym samym pozostawiając nienaruszone pozycji innych wyrazów frazy.

Stoplists

W SQL Server 2008, stopwords są zarządzane w bazach danych za pomocą obiektów o nazwie stoplists.A stoplist jest lista stopwords, skojarzony z indeksu pełnotekstowego, jest stosowana do pełnego tekstu kwerendy dla tego indeksu.

Tworzenie Stoplist

Stoplist można utworzyć następujące sposoby:

  • Using the system-supplied stoplist in the database.SQL Server ships with a system stoplist that contains the most commonly used stopwords for each supported language, that is for every language that is associated with given word breakers by default.System stoplist zawiera stopwords wspólne dla wszystkich obsługiwanych języków.Można skopiować stoplist systemu i dostosować przez dodawanie i usuwanie stopwords kopii.

    System stoplist jest instalowany w zasobów bazy danych.

  • Tworzenie własnych stoplist, a następnie dodanie stopwords do niego dla dowolnego języka, który określisz.Stopwords można także usunąć z sieci stoplist, gdy jest to konieczne.

  • Przy użyciu istniejących stoplist niestandardowego z innej bazy danych w bieżącej wystąpienie serwera, a następnie dodanie i upuszczając stopwords w razie potrzeby.

Ważna informacjaWażne:

Tworzenie STOPLIST PEŁNOTEKSTOWY, ALTER PEŁNOTEKSTOWY STOPLIST i UPUŚĆ PEŁNOTEKSTOWY STOPLIST są obsługiwane tylko w obszarze poziom zgodności 100.W obszarze poziomy zgodności 80 i 90 oświadczenia te nie są obsługiwane.W obszarze wszystkie poziomy zgodności automatycznie skojarzone z nowe indeksy pełnotekstowe jest stoplist systemu.

Aby utworzyć stoplist

Aby dodać lub usunąć stopwords z stoplist

Aby upuścić stoplist

Za pomocą Stoplist w kwerendach

Aby korzystać z stoplist w kwerendach, musisz skojarzyć go z indeksu pełnotekstowego.Stoplist można dołączyć do indeksu pełnotekstowego, podczas tworzenia indeksu lub można zmienić później, aby dodać stoplist indeksu.

Aby utworzyć indeks pełnotekstowy i skojarzy z nim stoplist

Aby skojarzyć lub skojarzenie stoplist z istniejącego indeksu pełnotekstowego

Aby pominąć komunikat o błędzie, jeśli stopwords spowodować operacja logiczna na zapytanie pełnotekstowe się niepowodzeniem

Wyświetlanie Stoplists i Stoplist metadanych

To view all the stopwords of a stoplist

Aby uzyskać informacje o wszystkich stoplists w bieżącej bazie danych.

Aby wyświetlić wynik tokenizacja połączenia dzielenie, tezaurus i stoplist programu word