Architektura wyszukiwania pełnotekstowego

Przeszukiwanie pełnego tekstu jest obsługiwany przez aparat pełnego tekstu.Aparat pełnego tekstu ma dwie role: Obsługa indeksowania i obsługi kwerend.

Począwszy od SQL Server 2008, architektura przeszukiwanie pełnego tekstu składa się z następujących procesów:

  • SQL Server Proces (sqlservr.exe)

    Ostrzeżenie

    Usługa MSFTESQL nie istnieje w SQL Server 2008 i nowsze wersje.Zadania pełnego tekstu, które były wykonywane przez MSFTESQL usługa w SQL Server 2005 i starsze wersje są obecnie realizowane przez SQL Server procesu.

  • Proces hosta demona filtru (fdhost.exe)

    Ze względów bezpieczeństwa, począwszy od SQL Server 2008, filtry są ładowane przez oddzielne procesy o nazwie hosts demona filtru.Wystąpienie serwera używa wielowątkowym procesie wielowątkowe wszystkie filtry i proces jednowątkowym wszystkich filtrów jednowątkowym.

    Ostrzeżenie

    fdhost.exe zastępuje demona filtru pełnotekstowego silnika (msftefd.exe) z SQL Server 2005 i wcześniejszych wersji.

    Procesy fdhost.exe są tworzone przez usługa uruchamianie FDHOST (MSSQLFDLauncher) i są uruchamiane przy użyciu poświadczenia konta usługa uruchamiania FDHOST.Dlatego usługa ta musi działać indeksowania pełnotekstowego i badanie pełnego tekstu do pracy.Informacje dotyczące ustawiania konta usługa dla tej usługa, zobacz Jak Ustaw konto uruchamiania (MSSQLFDLauncher) FDHOST dla wyszukiwania pełnotekstowego (SQL Server Menedżer konfiguracji).

Procesy te zawierają składniki architektury przeszukiwanie pełnego tekstu.Na poniższej ilustracji przedstawiono te składniki i ich relacji.Po ilustracji opisano składniki.

architektura wyszukiwania pełnotekstowego

SQL ServerProces

Wyszukiwanie pełnotekstowe wykorzystuje następujące składniki SQL Server proces:

  • Tabele użytkowników

    Te tabele zawierają dane, które mają być indeksowane pełnego tekstu.

  • Program zbierający pełnego tekstu

    Program zbierający pełnotekstowe współpracuje z wątków przeszukiwanie pełnego tekstu.Jest odpowiedzialny dla planowania i prowadzenia zapełnianie indeksy pełnotekstowe oraz monitorowania wykazów pełnego tekstu.

    Ostrzeżenie

    Począwszy od SQL Server 2008, wykaz pełnotekstowy jest obiektem wirtualnych i nie należą do żadnego grupa plików.wykaz pełnotekstowy jest koncepcja logiczne odnosi się do grupy indeksy pełnotekstowe.

  • Pliki tezaurusa

    Pliki te zawierają synonimy wyszukiwane terminy.Aby uzyskać więcej informacji, zobacz Konfiguracja tezaurusa.

  • Obiekty Stoplist

    Stoplist obiekty zawierają listy typowych słów, które nie są przydatne do wyszukiwania.Aby uzyskać więcej informacji, zobacz Stopwords i Stoplists.

    Ostrzeżenie

    Zamień obiektów Stoplist wyraz ignorowany pliki SQL Server 2005 i wcześniejszych wersji.

  • SQL Server procesor kwerend

    Procesor kwerend kompiluje i wykonuje kwerendy SQL.Kwerenda SQL zawiera kwerendę przeszukiwanie pełnego tekstu, kwerenda jest wysyłana do silnika pełnego tekstu w zarówno w trakcie kompilacji, jak i podczas wykonywania.Wynik kwerendy jest dopasowywane do indeksu pełnotekstowego.Aby uzyskać więcej informacji, zobacz Aparat pełnego tekstu.

  • Aparat pełnego tekstu

    Aparat pełnotekstowego w SQL Server teraz jest w pełni zintegrowany z procesor kwerend. Aparat pełnego tekstu kompiluje i wykonuje pełny tekst kwerendy.Jako część wykonania kwerendy aparat pełnego tekstu może odbierać wprowadzania z tezaurusa i stoplist.W SQL Server 2008 i nowszych aparat pełnego tekstu dla SQL Server działające wewnątrz SQL Server procesora kwerendy.

  • Moduł zapisujący indeksu (indeksatora)

    Moduł zapisujący indeksu tworzy strukturę, która służy do przechowywania indeksowanych tokenów.

  • Menedżer demon filtru

    Menedżer demona filtru jest odpowiedzialny za monitorowanie stanu hosta demona filtru pełnotekstowego silnika.

Host demon filtru

Host demona filtru jest proces, który jest uruchamiany przez aparat pełnego tekstu.Działa następujące składniki przeszukiwanie pełnego tekstu, które są odpowiedzialne dostępu, filtrowanie i dane z tabel dzielenia wyrazów, jak również dla programu word, dzielenia i wynikających z wprowadzania kwerendy:

Składniki hosta demona filtru są następujące:

  • Obsługa protokołu

    Składnik ten ściąga dane z pamięci do dalszego przetwarzania i uzyskuje dostęp do danych z tabela użytkowników w określonej bazie danych.Jednym z jego obowiązków jest zebrać dane z kolumn pełnego tekstu są indeksowane i przekazać je do hosta demona filtru, który będzie zastosować filtrowanie i dzielącego wymagane..

  • Filtry

    Niektóre typy danych wymagają filtrowanie przed danych w dokumencie może być pełnotekstowe indeksowane, włącznie z danymi w varbinary, varbinary(max), image, lub xml kolumny.Filtr używane w danym dokumencie zależy od jego typu dokumentu.Na przykład różne filtry są używane dla dokumentów programu Microsoft Word (.doc), dokumenty programu Microsoft Excel (xls) i dokumentów XML (.xml).Następnie filtr wyodrębnia fragmentów tekstu z dokumentu, usuwanie osadzonych formatowanie i zachowywanie tekstu i, potencjalnie, informacje o położenie tekstu.Wynik jest strumieniem informacji tekstowych.Aby uzyskać więcej informacji, zobacz Filtry wyszukiwania pełnotekstowego.

  • Moduły dzielenia wyrazów i programy szukające rdzeni

    Dzielenie wyrazów jest składnikiem specyficzne dla języka, który znajdzie wyraz granice oparte na regułach leksykalne danego języka (dzielenia wyrazu).Każdy dzielącego jest skojarzony z określonego języka program szukający rdzeni składnik conjugates zleceń i wykonuje osiągnięcia słowa ignorowanego.Na indeksowanie czas, host demona filtru używa dzielącego i programem szukającym rdzeni do przeprowadzania analizy językowej dla danych tekstowych z kolumna danej tabela.Dzielenie wyrazów, które określa język, który jest skojarzony z kolumna tabela do indeksu pełnotekstowego i program szukający rdzeni są używane do indeksowania kolumna.Aby uzyskać więcej informacji, zobacz Moduły dzielenia wyrazów i programy szukające rdzeni.

    Ostrzeżenie

    Aby uzyskać informacje dotyczące wszystkich składników lingwistyczne pełnego tekstu, zobacz Konfigurowanie pełnotekstowe składników lingwistyczne.