Alterações de comportamento em pesquisa de texto completo

Este tópico descreve alterações de comportamento em pesquisa de texto completo. Essas alterações afetam a maneira como os recursos funcionam ou interagem no SQL Server 2012 em comparação com as versões anteriores do SQL Server.

Alterações de comportamento na pesquisa de texto completo do SQL Server 2012

O SQL Server 2012 instala uma nova versão dos separadores de palavras e lematizadores para inglês dos EUA (LCID 1033) e inglês do Reino Unido (LCID 2057). Porém, você poderá alternar para a versão anterior desses componentes se desejar reter o comportamento anterior. Para obter mais informações, consulte Alterar o separador de palavras usado para inglês dos EUA e inglês do Reino Unido.

Novos separadores de palavras e lematizadores instalados

O SQL Server 2012 atualiza todos os separadores de palavras e lematizadores usados por Pesquisas de texto completo e semântico. Para obter consistência entre o conteúdo de índices e os resultados das consultas, nós recomendamos que você repopule os índices de texto completo existentes.

  1. Há novos separadores de palavras para inglês. Se você tiver que manter o comportamento anterior, consulte Alterar o separador de palavras usado para inglês dos EUA e inglês do Reino Unido.

  2. Separadores de palavras de terceiros para dinamarquês, polonês e turco que foram incluídos com versões anteriores do SQL Server foram substituídos por componentes do Microsoft. Os novos componentes estão habilitados por padrão.

  3. Há novos separadores de palavras para tcheco e grego. As versões anteriores de Pesquisa de Texto Completo do SQL Server não incluíam suporte para estes dois idiomas.

Alterações de comportamento de novos separadores de palavras e lematizadores

Os novos componentes podem retornar resultados diferentes dos componentes mais antigos quando você popula e consulta índices de texto completo. As tabelas a seguir demonstram algumas das diferenças que podem ser esperadas em resultados em inglês.

Se você tiver que reter o comportamento anterior dos separadores de palavras e lematizadores, consulte os tópicos seguintes:

Em alguns casos, os novos componentes retornam mais resultados:

Termo

Resultados com separador de palavras e lematizador anterior

Resultados com novo separador de palavras e lematizador

cat-dog

cat

dog

cat

cat-dog

dog

cat@dog.com

cat

com

dog

cat

cat@dog.com

com

dog

12/11/2011

(onde o termo é uma data)

12/11/2011

dd20111211

11

12

12/11/2011

2011

dd20111211

Em alguns casos, os novos componentes retornam resultados semelhantes:

Termo

Resultados com separador de palavras e lematizador anterior

Resultados com novo separador de palavras e lematizador

100$

100$

nn100$

100$

nn100usd

022

022

nn022

022

nn22

10:49AM

(onde o termo é uma hora)

10:49am

tt1049

10:49am

tt24104900

Em alguns casos, os novos componentes retornam menos resultados ou resultados que podem ser inesperados pelos aplicativos:

Termo

Resultados com separador de palavras e lematizador anterior

Resultados com novo separador de palavras e lematizador

jěˊÿqℭžl

(onde os termos não são caracteres válidos em inglês)

‘jěˊÿqℭžl’

je yq zl

table's

table’s

table

table’s

cat-

cat

cat-

cat

v-z(onde v e z são palavras de ruído)

(nenhum resultado)

v-z

$100 000 USD

$100

000

nn000

nn100$

usd

$100 000 usd

nn100000usd

beautiful U.S land

beautiful

land

u.s

us

beautiful

land

Mt. Kent and Mt Challenger

challenger

kent

mt

mt.

mt

kent

challenger

Alterações de comportamento na pesquisa de texto completo do SQL Server 2008

No SQL Server 2008 e em versões posteriores, o Mecanismo de Texto Completo é integrado como um serviço de banco de dados ao banco de dados relacional, como parte da infraestrutura de consulta de servidor e do mecanismo de armazenamento. A nova arquitetura de pesquisa de texto completo atinge as seguintes metas:

  • Armazenamento e gerenciamento integrados — Agora a pesquisa de texto completo está diretamente integrada aos recursos de armazenamento e gerenciamento inerentes ao SQL Server, e o serviço MSFTESQL não existe mais. 

    • Os índices de texto completo são armazenados nos grupos de arquivos de banco de dados, e não no sistema de arquivos. As operações administrativas executadas em um banco de dados, como a criação de um backup, afetam automaticamente seus índices de texto completo.

    • Agora um catálogo de texto completo é um objeto virtual que não pertence a nenhum grupo de arquivos; trata-se de um conceito lógico que faz referência a um grupo de índices de texto completo. Por esse motivo, muitos recursos de gerenciamento de catálogo ficaram obsoletos e isso gerou alterações recentes em alguns recursos. Para obter mais informações, consulte Recursos do Mecanismo de Banco de Dados preteridos no SQL Server 2012 e Alterações recentes na pesquisa de texto completo.

      ObservaçãoObservação

      As instruções DDL Transact-SQL do SQL Server 2005 que especificam catálogos de texto completo funcionam corretamente.

  • Processamento de consultas integrado — O processador de consultas de pesquisa de texto completo faz parte do Mecanismo de Banco de Dados e está totalmente integrado ao Processador de Consultas do SQL Server. Isso significa que o otimizador de consulta reconhece predicados de consulta de texto completo e os executa automaticamente com o máximo de eficácia possível.

  • Administração e solução de problemas aprimoradas — A pesquisa de texto completo integrada oferece ferramentas que ajudam você a analisar estruturas de pesquisa, como o índice de texto completo, a saída de um determinado separador de palavras, a configuração de palavras irrelevantes (stopwords), entre outras.

  • As palavras irrelevantes e as listas de palavras irrelevantes (stoplists) substituíram as palavras de ruído o os arquivos de palavras de ruído. Uma lista de palavras irrelevantes é um objeto de banco de dados que facilita as tarefas de capacidade de gerenciamento relacionadas a palavras irrelevantes e melhora a integridade entre diferentes ambientes e instâncias de servidor. Para obter mais informações, consulte Configurar e gerenciar palavras irrelevantes e listas de palavras irrelevantes (stoplists) para pesquisa de texto completo.

  • O SQL Server 2008 e versões posteriores inclui novos separadores de palavras para muitos dos idiomas existentes no SQL Server 2005. Somente os separadores de palavras para inglês, coreano, tailandês e chinês (todas as formas) permanecem os mesmos. Nos demais idiomas, se um catálogo de texto completo foi importado durante a atualização de um banco de dados do SQL Server 2005 para o SQL Server 2008 ou um versão posterior, é possível que agora um ou mais idiomas usados pelos índices de texto completo do catálogo de texto completo estejam associados a novos separadores de palavras, cujo comportamento pode ser ligeiramente diferente daquele apresentado pelos separadores de palavras importados. Para obter mais informações sobre como garantir consistência entre consultas e o conteúdo de índices de texto completo, consulte Atualizar pesquisa de texto completo do SQL Server 2005.

  • Um novo serviço Iniciador FDHOST (MSSQLFDLauncher) foi adicionado. Para obter mais informações, consulte Iniciar a pesquisa de texto completo.

  • A indexação de texto completo funciona com uma coluna FILESTREAM da mesma maneira que com uma coluna varbinary(max). A tabela FILESTREAM deve ter uma coluna que contenha a extensão do nome do arquivo para cada BLOB FILESTREAM. Para obter mais informações, consulte Consulta com pesquisa de texto completo, Configurar e gerenciar filtros para pesquisa e sys.fulltext_document_types (Transact-SQL).

    O mecanismo de texto completo indexa o conteúdo dos BLOBs FILESTREAM. Arquivos de indexação, como imagens, podem não ser úteis. Quando um BLOB FILESTREAM é atualizado, ele é reindexado.

Consulte também

Conceitos

Pesquisa de texto completo (SQL Server)

Atualizar pesquisa de texto completo do SQL Server 2005

Iniciar a pesquisa de texto completo

Outros recursos

Compatibilidade com versões anteriores da pesquisa de texto completo