Изменения в функциях полнотекстового поиска

В этом разделе описаны изменения поведения полнотекстового поиска. Изменения в работе относятся к способу выполнения функций или взаимодействия между ними в SQL Server 2012 по сравнению с предыдущими версиями SQL Server.

Изменения в работе полнотекстового поиска в SQL Server 2012

В SQL Server 2012 устанавливается новая версия средств разбиения по словам и парадигматических модулей для языков «Английский (США)» (код 1033) и «Английский (Великобритания)» (код 2057). Однако можно переключиться на предыдущую версию этих компонентов, если требуется сохранить предыдущий режим работы. Дополнительные сведения см. в разделе Изменение средства разбиения по словам, используемого для английского (США) и английского (Британского).

Установлены новые средства разбиения по словам и парадигматические модули

В выпуске SQL Server 2012 обновлены все средства разбиения по словам и парадигматические модули, используемые при полнотекстовом и семантическом поиске. Для обеспечения согласованности между содержимым индексов и результатами запросов рекомендуется выполнить повторное заполнение существующих полнотекстовых индексов.

  1. Для английского языка добавлены новые средства разбиения по словам. Если необходимо сохранить поведение, существовавшее в предыдущем выпуске, см. раздел Изменение средства разбиения по словам, используемого для английского (США) и английского (Британского).

  2. Средства разбиения по словам сторонних поставщиков для датского, польского и турецкого языков, входившие в предыдущие выпуски SQL Server, заменены компонентами Microsoft. Эти новые компоненты включены по умолчанию.

  3. Добавлены средства разбиения по словам для чешского и греческого языков. В предыдущих выпусках SQL Server компонент полнотекстового поиска (Full-Text Search) не поддерживал эти два языка.

Изменения в поведении новых средств разбиения по словам и парадигматических модулей

Новые компоненты могут возвращать при заполнении полнотекстовых индексов и запросах к ним результаты, отличные от результатов, возвращаемых старыми компонентами. В следующих таблицах показаны некоторые различия, которые могут возникнуть в результатах на английском языке.

Сведения о сохранении прежнего поведения средства разбиения по словам и парадигматических модулей см. в следующих разделах:

В некоторых случаях новые компоненты возвращают больше результатов.

Термин

Результаты при использовании предыдущей версии средства разбиения по словам и парадигматического модуля

Результаты при использовании нового средства разбиения по словам и парадигматического модуля

cat-dog

cat

dog

cat

cat-dog

dog

cat@dog.com

cat

com

dog

cat

cat@dog.com

com

dog

12/11/2011

(где терм — дата)

12/11/2011

dd20111211

11

12

12/11/2011

2011

dd20111211

В некоторых случаях новые компоненты возвращают подобные результаты:

Термин

Результаты при использовании предыдущей версии средства разбиения по словам и парадигматического модуля

Результаты при использовании нового средства разбиения по словам и парадигматического модуля

100$

100$

nn100$

100$

nn100usd

022

022

nn022

022

nn22

10:49AM

(где терм — время)

10:49am

tt1049

10:49am

tt24104900

В некоторых случаях новые компоненты возвращают меньше результатов, что может быть непредвиденным для приложений:

Термин

Результаты при использовании предыдущей версии средства разбиения по словам и парадигматического модуля

Результаты при использовании нового средства разбиения по словам и парадигматического модуля

jěˊÿqℭžl

(где термы не являются допустимыми символами английского языка)

‘jěˊÿqℭžl’

je yq zl

table's

table’s

таблица

table’s

cat-

cat

cat-

cat

v-z(где v и z являются пропускаемыми словами)

(нет результатов)

v-z

$100 000 USD

$100

000

nn000

nn100$

usd

$100 000 usd

nn100000usd

beautiful U.S land

beautiful

land

u.s

us

beautiful

land

Mt. Kent and Mt Challenger

challenger

kent

mt

mt.

mt

kent

challenger

Изменения в поведении полнотекстового поиска в SQL Server 2008

В SQL Server 2008 и более поздних версиях средство полнотекстового поиска интегрировано в виде службы базы данных в реляционную базу данных, являющуюся частью инфраструктуры механизма запросов и подсистемы хранилища сервера. Новая архитектура полнотекстового поиска обеспечила достижение следующих целей.

  • Интегрированное хранение и управление. Полнотекстовый поиск теперь напрямую интегрирован со встроенными функциями хранения и управления SQL Server. Службы MSFTESQL больше нет. 

    • Полнотекстовые индексы хранятся в файловых группах баз данных, а не в файловой системе. Административные операции с базой данных, например создание резервной копии, автоматически влияют на ее полнотекстовые индексы.

    • Полнотекстовый каталог теперь является виртуальным объектом, не принадлежащим ни одной файловой группе; он является логическим понятием, ссылающимся на группу полнотекстовых индексов. В связи с этим многие из функций управления каталогами устарели. Данное устаревание вызвало наличие критических изменений в некоторых функциях. Дополнительные сведения см. в разделах Устаревшие функции компонента Database Engine в SQL Server 2012 и Критические изменения в полнотекстовом поиске.

      ПримечаниеПримечание

      Инструкции DDL языка SQL Server 2005Transact-SQL, указывающие полнотекстовые каталоги, работают правильно.

  • Интегрированная обработка запросов. Новый обработчик запросов полнотекстового поиска является частью компонента Database Engine. Он полностью интегрирован с обработчиком запросов SQL Server. Это означает, что оптимизатор запросов распознает полнотекстовые предикаты запросов и автоматически выполняет их наиболее эффективным способом.

  • Улучшенное администрирование и устранение неполадок. Интегрированный полнотекстовый поиск предоставляет такие средства для анализа структур поиска, как полнотекстовые индексы, вывод определенного средства разбиения по словам, конфигурации стоп-слов и т. д.

  • Пропускаемые слова и файлы пропускаемых слов были заменены стоп-словами и списками стоп-слов. Список стоп-слов представляет собой объект базы данных, обеспечивающий выполнение задач управления для стоп-слов и улучшающий целостность между различными экземплярами серверов и средами. Дополнительные сведения см. в разделе Настройка и управление стоп-словами и списками стоп-слов для полнотекстового поиска.

  • В SQL Server 2008 и более поздние версии включены новые средства разбиения по словам для многих языков, присутствующих в SQL Server 2005. Остались без изменения только средства разбиения по словам для английского, корейского, тайского и китайского языков (всех форм). Для всех остальных языков действует следующее правило: если полнотекстовый каталог был импортирован при обновлении базы данных SQL Server 2005 до SQL Server 2008 или более поздней версии, один или несколько языков, используемых полнотекстовыми индексами в полнотекстовом каталоге, может быть связан с новыми средствами разбиения по словам. Дополнительные сведения о том, как обеспечить соответствие между запросами и содержимым полнотекстового индекса, см. в разделе Обновление полнотекстового поиска из SQL Server 2005.

  • Была добавлена служба FDHOST Launcher (MSSQLFDLauncher). Дополнительные сведения см. в разделе Приступая к работе с компонентом Full-Text Search.

  • Полнотекстовое индексирование обрабатывает столбцы FILESTREAM так же, как и столбцы типа varbinary(max). В таблице FILESTREAM должен присутствовать столбец, в котором содержится расширение имени файла для каждого блока больших двоичных объектов (BLOB) FILESTREAM. Дополнительные сведения см. в разделах Запрос с полнотекстовым поиском,Настройка и управление фильтрами для поиска и sys.fulltext_document_types (Transact-SQL).

    Полнотекстовый поиск индексирует содержимое блоков больших двоичных объектов (BLOB) FILESTREAM. Индексирование таких файлов, как изображения, может оказаться нецелесообразным. При обновлении блоков больших двоичных объектов (BLOB) FILESTREAM выполняется их повторное индексирование.

См. также

Основные понятия

Компонент Full-Text Search (SQL Server)

Обновление полнотекстового поиска из SQL Server 2005

Приступая к работе с компонентом Full-Text Search

Другие ресурсы

Обратная совместимость компонента полнотекстового поиска