Cambios de comportamiento en la búsqueda de texto completo

En este tema se describen los cambios de comportamiento en la búsqueda de texto completo. Los cambios de comportamiento afectan al modo en que las características de SQL Server 2012 funcionan o interactúan en comparación con las versiones anteriores de SQL Server.

Cambios de comportamiento en la búsqueda de texto completo de SQL Server 2012

SQL Server 2012 instala una versión nueva de los separadores de palabras y los lematizadores para inglés de EE.UU. (LCID 1033) e inglés de Reino Unido (LCID 2057). Aunque puede cambiar a la versión anterior de estos componentes si desea conservar el comportamiento anterior. Para obtener más información, vea Cambiar el separador de palabras usado para el inglés de Estados Unidos y el del Reino Unido.

Nuevos separadores de palabras y lematizadores instalados

SQL Server 2012 actualiza todos los separadores de palabras y lematizadores que se utilizan en la búsqueda de texto completo y en la búsqueda semántica. Para que haya coherencia entre el contenido de los índices y los resultados de las consultas, se recomienda que vuelva a rellenar los índices de texto completo existentes.

  1. Existen nuevos separadores de palabras para inglés. Si tiene que conservar el comportamiento anterior, vea Cambiar el separador de palabras usado para el inglés de Estados Unidos y el del Reino Unido.

  2. Se han reemplazado los separadores de palabras de terceros para danés, polaco y turco que se incluían en versiones anteriores de SQL Server con componentes de Microsoft. Los componentes nuevos están habilitados de forma predeterminada.

  3. Existen nuevos separadores de palabras para checo y griego. Las versiones anteriores de búsqueda de texto completo de SQL Server no incluían compatibilidad con estos dos idiomas.

Cambios de comportamiento de los nuevos separadores de palabras y lematizadores

Es posible que los componentes nuevos devuelvan resultados diferentes a los componentes anteriores cuando se rellenan y consultan índices de texto completo. Las tablas siguientes muestran algunas de las diferencias que se pueden esperar en los resultados en inglés.

Si tiene que conservar el comportamiento anterior de los separadores de palabras y lematizadores, vea los siguientes temas:

En algunos casos, los componentes nuevos devuelven más resultados:

Término

Resultados con los separadores de palabras y el lematizador anteriores

Resultados con los separadores de palabras y lematizadores

gato-perro

gato

perro

gato

gato-perro

perro

gato@perro.com

gato

com

perro

gato

gato@perro.com

com

perro

12/11/2011

(donde el término es una fecha)

12/11/2011

dd20111211

11

12

12/11/2011

2011

dd20111211

En algunos casos, los componentes nuevos devuelven resultados similares:

Término

Resultados con los separadores de palabras y el lematizador anteriores

Resultados con los separadores de palabras y lematizadores

100$

100$

nn100$

100$

nn100usd

022

022

nn022

022

nn22

10:49AM

(donde el término es una hora)

10:49am

tt1049

10:49am

tt24104900

En algunos casos, los componentes nuevos devuelven menos resultados o bien, las aplicaciones no esperan los resultados:

Término

Resultados con los separadores de palabras y el lematizador anteriores

Resultados con los separadores de palabras y lematizadores

jěˊÿqℭžl

(donde los términos no son caracteres válidos en español)

‘jěˊÿqℭžl’

je yq zl

table's

table’s

table

table’s

gato-

gato

gato-

gato

v-z(donde v y z son palabras irrelevantes)

(sin resultados)

v-z

$100 000 USD

$100

000

nn000

nn100$

usd

$100 000 usd

nn100000usd

bonita tierra americana

bonita

tierra

norteamericana

americana

bonita

tierra

Mt. Kent and Mt Challenger

challenger

kent

mt

mt.

mt

kent

challenger

Cambios de comportamiento en la búsqueda de texto completo de SQL Server 2008

En SQL Server 2008 y versiones posteriores, el motor de búsqueda de texto completo se integra como un servicio de base de datos en la base de datos relacional y pasa a formar parte de la consulta de servidor y de la infraestructura del motor de almacenamiento. La nueva arquitectura de búsqueda de texto completo logra los objetivos siguientes:

  • Administración y almacenamiento integrados: ahora, la búsqueda de texto completo se integra directamente con las características de almacenamiento y administración inherentes de SQL Server; ya no existe el servicio MSFTESQL. 

    • Los índices de texto completo se almacenan en grupos de archivos de base de datos en lugar de hacerlo en el sistema de archivos. Las operaciones administrativas que se llevan a cabo en una base de datos, como la creación de una copia de seguridad, afectan a los índices de texto completo de forma automática.

    • Un catálogo de texto completo es un objeto virtual que no pertenece a ningún grupo de archivos; es un concepto lógico que hace referencia a un grupo de índices de texto completo. Por tanto, muchas de las características de administración de catálogos se han quedado desusadas, lo que ha provocado cambios de última hora en algunas características. Para obtener más información, vea Características desusadas del motor de base de datos de SQL Server 2012 y Cambios principales en la búsqueda de texto completo.

      [!NOTA]

      Las instrucciones de DDL de SQL Server 2005 Transact-SQL que especifican los catálogos de texto completo funcionan correctamente.

  • Procesamiento de consultas integrado: el nuevo procesador de búsqueda de texto completo forma parte del motor de base de datos y está totalmente integrado con el procesador de consultas de SQL Server. Esto significa que, el optimizador de consultas reconoce los predicados de consulta de texto completo y los ejecuta automáticamente de la forma más eficaz posible.

  • Administración y solución de problemas mejoradas: la búsqueda de texto completo integrada pone a su disposición herramientas con las que podrá analizar las estructuras de búsqueda, como el índice de texto completo, el resultado de un separador de palabras determinado, la configuración de las palabras irrelevantes, etc.

  • Las listas de palabras irrelevantes han reemplazado a los archivos de palabras irrelevantes. Una lista de palabras irrelevantes es un objeto de base de datos que facilita las tareas de administración de las palabras irrelevantes y mejora la integridad entre instancias de servidor y entornos diferentes. Para obtener más información, vea Configurar y administrar palabras irrelevantes y listas de palabras irrelevantes para la búsqueda de texto completo.

  • SQL Server 2008 y versiones posteriores incluyen nuevos separadores de palabras para muchos de los idiomas de SQL Server 2005. Los únicos separadores de palabras que siguen siendo iguales son los de inglés, coreano, tailandés y chino (tradicional y simplificado). En los demás idiomas, si al actualizar una base de datos de SQL Server 2005 a SQL Server 2008 o a una versión posterior, se importó un catálogo de texto completo, uno o varios de los idiomas usados por los índices de texto completo de dicho catálogo podrían estar ahora asociados a nuevos separadores de palabras cuyo comportamiento podría ser algo distinto del de los separadores de palabras importados. Para obtener más información sobre cómo garantizar una coherencia entre las consultas y el contenido del índice de texto completo, vea Actualizar la búsqueda de texto completo desde SQL Server 2005.

  • Se ha agregado un nuevo servicio del iniciador del FDHOST (MSSQLFDLauncher). Para obtener más información, vea Introducción a la búsqueda de texto completo.

  • La indización de texto completo funciona con una columna FILESTREAM igual que con una columna varbinary(max). La tabla FILESTREAM debe tener una columna con la extensión de nombre de archivo para cada BLOB FILESTREAM. Para obtener más información, vea Consultar con búsqueda de texto completo,Configurar y administrar filtros para búsquedas, y sys.fulltext_document_types (Transact-SQL).

    El motor de texto completo indiza el contenido de los BLOB FILESTREAM. Indizar archivos como las imágenes podría no ser útil. Cuando se actualiza un BLOB FILESTREAM, vuelve a indizarse.

Vea también

Conceptos

Búsqueda de texto completo (SQL Server)

Actualizar la búsqueda de texto completo desde SQL Server 2005

Introducción a la búsqueda de texto completo

Otros recursos

Compatibilidad con versiones anteriores de búsqueda de texto completo