Información general sobre el esquema de búsqueda en SharePoint Server

SE APLICA A:yes-img-132013 yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint en Microsoft 365

El índice de búsqueda es el centro de la búsqueda. Lo que se encuentra en el índice de búsqueda determina lo que la gente encontrará cuando busque información especificando consultas de búsqueda o interactuando con páginas de Internet o de la intranet.

Este artículo describe cómo se recopila el contenido y se recupera del índice de búsqueda mediante el esquema de búsqueda. El esquema de búsqueda contiene las propiedades rastreadas, las categorías de propiedades rastreadas, la asignación de propiedades rastreadas a administradas y la configuración de propiedades administradas. La configuración de propiedades administradas define lo que puede buscar y cómo (por ejemplo, si puede refinar una propiedad o realizar una consulta sobre ella).

Rastreo y propiedades rastreadas

Para crear el índice de búsqueda, primero necesita rastrear el contenido. Puede rastrear distintos orígenes de contenido (por ejemplo, contenido de SharePoint Server, recursos compartidos de archivos o perfiles de usuario). El contenido y los metadatos de los elementos que rastree se representan como propiedades rastreadas.

Cada elemento rastreado y pasado al componente de procesamiento de contenido tiene propiedades rastreadas asociadas a él. Los ejemplos de propiedades rastreadas son Autor, Título y Fecha de creación. Las propiedades nuevas rastreadas se detectarán automáticamente.

Las propiedades rastreadas se agrupan en categorías basadas en IFilter o en el controlador de protocolos del elemento. Ejemplos de categorías son Office (propiedades rastreadas de documentos de Word, hojas de cálculo de Excel, etc.), Datos profesionales (propiedades rastreadas de, por ejemplo, bases de datos) y Web (propiedades rastreadas de sitios web).

Para obtener más información sobre el rastreo, vea Planear el rastreo y la federación en SharePoint Server.

Propiedades administradas y asignación de propiedades

Para incluir el contenido y los metadatos de propiedades rastreadas en el índice de búsqueda, debe asignar propiedades rastreadas a propiedades administradas. Solo las propiedades administradas se escriben en el índice de búsqueda.

Las propiedades administradas pueden tener muchas configuraciones. La configuración de la propiedad administrada determina cómo se puede mostrar el contenido en los resultados de búsqueda y cómo podemos realizar dicha búsqueda.

Puede asignar varias propiedades rastreadas a una única propiedad administrada. Por ejemplo, puede asignar las propiedades rastreadas "Escritor" y "Autor" a la propiedad administrada "Autor". O puede asignar una única propiedad rastreada a varias propiedades administradas.

De la misma forma, el orden en el que se asignan las propiedades rastreadas a una propiedad administrada puede determinar el contenido de una propiedad administrada. Por ejemplo, una propiedad administrada puede tener múltiples propiedades rastreadas asignadas y se puede configurar para incluir todos los valores de todas las propiedades rastreadas que se le han asignado. Pero si otorga prioridad a una propiedad rastreada que contiene el título SharePoint en lugar de a otra con un título distinto de la asignación, se mostrará el título SharePoint en los resultados de la búsqueda.

Hay un conjunto de asignaciones predeterminadas definidas entre las propiedades rastreadas y administradas; vea Información general sobre las propiedades administradas y rastreadas en SharePoint Server.

Algunos tipos de propiedades rastreadas generan de forma automática una nueva propiedad administrada y una asignación entre a propiedad rastreada y administrada. Por ejemplo, todas las columnas de sitios de bibliotecas de SharePoint tienen esta generación y asignación automáticas. Cuando crea una columna de sitios en una lista y rastrea esa lista, se crea automáticamente una propiedad rastreada, una propiedad administrada y una asignación entre la propiedad rastreada y la administrada para la columna de sitios.

Puede cambiar la asignación predeterminada o cualquier otra asignación de propiedades rastreadas a administradas, crear nuevas asignaciones o crear nuevas propiedades administradas. Cuando crea una nueva propiedad administrada o cambia una configuración concreta de las propiedades administradas existentes, debe realizar un rastreo completo antes de que la propiedad administrada y su valor se incluyan en el índice de búsqueda. Si la propiedad nueva o cambiada se encuentra en una lista o biblioteca de SharePoint, puede reindizar dicha biblioteca o lista sin necesidad de iniciar un rastreo completo de todo el origen de contenido SharePoint. Esto tendría el mismo efecto que un rastreo completo.

Para obtener más información, vea la tabla Información general de configuración de propiedades administradas más adelante en este mismo artículo.

El esquema de búsqueda

El esquema de búsqueda se almacena en la base de datos de administración de búsqueda. El esquema de búsqueda contiene:

  • La asignación entre propiedades rastreadas y administradas. Puede tratarse de la asignación de una propiedad rastreada a una propiedad administrada, de una a muchas, de muchas a una sola o incluso de muchas a muchas.

  • El modo en que las propiedades administradas deben escribirse en el índice de búsqueda. Por ejemplo, en qué índice de texto completo deben escribirse las propiedades administradas y en qué grupo (contexto).

  • La configuración para las distintas propiedades administradas. Por ejemplo, si puede buscar, consultar o refinar resultados de búsqueda mediante propiedades administradas concretas.

  • Las categorías de propiedades rastreadas que agrupan propiedades en función su IFilter o controlador de protocolo. Si edita una categoría de propiedad rastreada, los cambios se aplican a todas las propiedades rastreadas de la categoría. Esto puede afectar al rendimiento y a cómo se guardan los elementos en el índice de búsqueda.

Las actualizaciones de esquema de búsqueda se propagan por el sistema de búsqueda cada minuto.

Varios esquemas de búsqueda

Puede crear varios esquemas de búsqueda. El principal esquema de búsqueda se define en la aplicación de servicio de búsqueda y se puede editar en la Administración central. Los administradores de la colección de sitios y los administradores de inquilinos pueden cambiar el esquema de búsqueda para una colección de sitios o inquilino concretos. Por ejemplo, un administrador de colecciones de sitios puede personalizar lo que se incluye en el índice de búsqueda cambiando el esquema de búsqueda para esa colección de sitios y, haciendo esto, personalizar la experiencia de búsqueda de la colección de sitios. Los propietarios de sitios pueden ver el esquema de búsqueda, pero no cambiarlo.

Nota:

No puede ver ni cambiar el esquema de búsqueda de la colección de sitios en Administración central. Para ver el esquema de búsqueda o realizar cambios en él para una colección de sitios, debe usar la Administración de la colección de sitios.

El índice de búsqueda

El índice de búsqueda contiene un conjunto de archivos en carpetas en un servidor. El contenido que procesa componentes también procesa elementos rastreados, usa el esquema de búsqueda para asignar propiedades rastreadas a propiedades administradas y traduce las propiedades administradas a un formato que se escribe en el índice de búsqueda. Además de los distintos índices de texto completo, existen índices independientes de las propiedades administradas marcados como recuperables e índices marcados como consultables. También hay un índice independiente para vectores de atributos e índices numéricos.

Grupos de actualización de índice

Siempre que un elemento cambia, debe volver a indexarse después de que se vuelva a rastrear. Para reducir la carga de reindizado, SharePoint Server introduce varios grupos de actualización de índices independientes.

  • Predeterminado Contiene la mayoría de propiedades administradas. Este grupo de actualización de índice contiene todas las propiedades administradas que no pertenecen a los grupos de actualización de índice Seguridad, Vínculo, Uso o Personas.

  • Seguridad Contiene la propiedad administrada de lista de control de acceso (ACL) de documentos

  • Vínculo Contiene las propiedades administradas relacionadas con la estructura de vínculos

  • Uso Contiene las propiedades administradas relacionadas con los datos de uso

  • Personas Contiene las propiedades administradas relacionadas con la búsqueda de personas

Cada grupo de actualización se almacena en una carpeta distinta en el índice de búsqueda.

Índice de texto completo

Un índice de texto completo contiene todo el texto de las propiedades administradas que permiten búsquedas que se guardan en ese índice de texto completo. Cada índice de texto completo se divide en dos grupos, también conocidos como contextos. Los diferentes contextos se relacionan con la importancia relativa de una propiedad administrada, que es una de las características de clasificación que se usan para calcular la clasificación de relevancia total de un resultado de búsqueda. El número, o Id., de un contexto no es importante; el modelo de clasificación determina su importancia relativa mediante la asignación de un peso de contribución a un contexto en particular. Un mayor peso de contribución da como resultado una clasificación más elevada. Para más información, vea la sección sobre cómo Influir en la clasificación de los resultados de búsqueda mediante el esquema de búsqueda del artículo Información general sobre la clasificación de resultados de la búsqueda en SharePoint Server.

Existen dos índices de texto completo predefinidos además del índice de texto completo predeterminado: el índice de texto completo de términos de SharePoint (SpTermsIdx) y el índice de personas (PeopleIdx).

La mayor parte de las propiedades administradas ya están asignadas, de forma predeterminada, a un contexto y un índice de texto completo adecuados. No recomendamos cambiar el contexto de ninguna de las propiedades administradas que permiten búsqueda existentes.

Información general de configuración de propiedades administradas

La configuración de las propiedades administradas determina cómo se guarda el contenido en el índice de búsqueda, si se pueden realizar búsquedas de dicho contenido y recuperarlo y cómo hacerlo.

El esquema de búsqueda se puede editar en Administración central, Administración de la colección de sitios y Administración de inquilinos. Los administradores de sitios pueden ver el esquema de búsqueda, pero no pueden editarlo. La siguiente tabla describe las distintas configuraciones y si están disponibles para edición en los diferentes niveles de administrador.

Configuración de propiedades administradas Qué hace Ejemplo: Disponible en Rastreo completo o reindizado de la lista o biblioteca de SharePoint después de cambiar la configuración
Permite la búsqueda Permite consultar el contenido de la propiedad administrada. El contenido de esta propiedad administrada se incluye en el índice de texto completo. Si la propiedad es "autor", una simple consulta de "Smith" devolverá elementos que contengan la palabra "Smith" y elementos cuya propiedad de autor contenga "Smith". Administración central/Administración de la colección de sitios/Administración de inquilinos
Configuración de Permite búsquedas avanzada Permite ver y cambiar el índice de texto completo en el que se escribe la propiedad administrada. También permite cambiar el contexto de la propiedad administrada para el cálculo de la clasificación de relevancia. No recomendamos cambiar el contexto de ninguna de las propiedades administradas existentes. Para más información, vea la sección sobre cómo Influir en la clasificación de los resultados de búsqueda mediante el esquema de búsqueda del artículo Información general sobre la clasificación de resultados de la búsqueda en SharePoint Server. Administración central/Administración de la colección de sitios/Administración de inquilinos
Consultable Permite consultar en la propiedad administrada específica. El nombre de la propiedad administrada debe incluirse con la consulta, especificarse en la misma consulta o incluirse en la consulta mediante la programación. Si la propiedad administrada es "autor", la consulta debe contener "autor:Smith". Administración central/Administración de la colección de sitios/Administración de inquilinos De deshabilitado a habilitado.
Se puede recuperar Permite que se devuelva contenido de esta propiedad administrada en los resultados de búsqueda. Habilite esta configuración para que las propiedades administradas relevantes se presenten en los resultados de búsqueda. Administración central/Administración de la colección de sitios/Administración de inquilinos De deshabilitado a habilitado.
Permitir varios valores Permite varios valores del mismo tipo en esta propiedad administrada. Si esta es la propiedad administrada "autor", y un documento contiene varios autores, cada nombre de autor se almacenará como un valor independiente en la propiedad administrada. Administración central
Se puede refinar Sí - activo: permite usar la propiedad como un refinador de los resultados de búsqueda en el front-end. Debe configurar manualmente el refinador en el elemento web.

Sí - latente: permite cambiar de que se puede refinar a activo más adelante, sin tener que hacer un rastreo completo de nuevo al cambiar.

Ambas opciones requieren un rastreo completo para que tengan efecto.

IMPORTANTE: Si selecciona "Sí: activo" o "Sí: latente", también necesita definir la propiedad administrada como "Consultable".

No se admite en la experiencia de búsqueda moderna.
Si la propiedad administrada "autor" está definida como Se puede refinar, puede configurar Autor como un refinador en el front-end de búsqueda más adelante. Administración central De deshabilitado a habilitado (si no está configurado en Ordenable)
Se puede ordenar Sí - activo: permite clasificar el conjunto de resultados basado en la propiedad antes de que el conjunto de resultados se devuelva.

Sí - latente: permite cambiar de que se puede clasificar a activo más adelante, sin tener que hacer un rastreo completo de nuevo al cambiar.

Ambas opciones requieren un rastreo completo para que tengan efecto.

No se admite en la experiencia de búsqueda moderna.
Use esta opción para conjuntos de resultados grandes que no se pueden clasificar y recuperar a la vez. Administración central De deshabilitado a habilitado (si no está configurado en Restringible)
Alias Define un alias para una propiedad administrada si desea usar el alias en lugar del nombre de la propiedad administrada en consultas y en resultados de búsqueda. Use la propiedad administrada original y no el alias para asignar una propiedad rastreada. Use un alias si no desea crear o no tiene permiso para crear una propiedad administrada nueva. Administración central/Administración de la colección de sitios/Administración de inquilinos No
Normalización de token Permite devolver resultados independientemente del uso de mayúsculas y los signos diacríticos usados en la consulta. La consulta "curacao" también devolverá "Curaçao", "curacao" y "Curacao". Administración central/Administración de la colección de sitios/Administración de inquilinos
Coincidencia completa De forma predeterminada, la búsqueda devuelve coincidencias parciales entre las consultas en una propiedad administrada y el contenido de la propiedad administrada.

Seleccione Completar coincidencia para que la búsqueda devuelva coincidencias exactas en su lugar.
Si una propiedad administrada "Title" contiene "Contoso Sites", solo la consulta Title: "Contoso Sites" dará un resultado. Administración central/Administración de la colección de sitios/Administración de inquilinos Yes
Tokenización neutra del lenguaje (solo SharePoint Server 2019) Seleccione la tokenización de idioma neutro si tiene contenido multilingüe y la propiedad administrada contiene etiquetas basadas en conjuntos de términos de metadatos u otros identificadores.

De forma predeterminada, la búsqueda depende del idioma cuando divide las consultas y el contenido en partes (tokenización). Por ejemplo, una biblioteca de documentos que contiene hojas de datos de productos en inglés y chino donde los identificadores de producto tienen caracteres no alfanuméricos, como "11.132-84-115#4". Cuando la búsqueda procesa una hoja de datos, detecta su idioma y tokeniza todo lo que contiene según ese idioma. Cuando los usuarios buscan un identificador de producto, la búsqueda tokeniza su consulta según la configuración de idioma del sitio de SharePoint en el que se encuentra. Si el sitio está establecido en inglés y el usuario busca un identificador de producto que se tokenizó como texto chino, es posible que los tokens no coincidan y los usuarios no obtengan resultados.

Para mejorar los resultados para los usuarios, asigne la propiedad rastreada del identificador de producto a una nueva propiedad administrada, "ProductID", con la tokenización neutral del lenguaje habilitada. Indique a los usuarios que busquen identificadores de producto en la nueva propiedad administrada, como esta: ProductID:"11.132-8".
Si la propiedad rastreada de un identificador de producto se asigna a una propiedad administrada "ProductID", la búsqueda usa la tokenización de lenguaje neutro para las consultas en "ProductID". Administración central/Administración de la colección de sitios/Administración de inquilinos Yes
Tokenización de consulta más fina (solo SharePoint Server 2019) Use esta configuración para ayudar a los usuarios a obtener mejores resultados de búsqueda al buscar en propiedades administradas que contienen metadatos con caracteres no alfanuméricos. Esta configuración hace que las consultas en la propiedad administrada se ralenticen.

Los usuarios que prefieren escribir rápidamente una consulta y, a continuación, examinar los resultados para encontrar la hoja de datos que buscan, normalmente escriben consultas como ProductID:"132-884". Dado que la búsqueda interrumpe de forma predeterminada el contenido del índice de búsqueda en partes más pequeñas que las consultas, es posible que la búsqueda no encuentre coincidencias para estas consultas. Cuando la consulta está más fina con tokens, es más probable que haya coincidencias entre los tokens en el índice de búsqueda y en la consulta. Los usuarios también pueden consultar la parte central o la última parte del identificador del producto.

Los usuarios que buscan una hoja de datos y esperan obtener solo resultados que coincidan con el identificador completo del producto, normalmente escriben consultas como ProductID:"11.132-884-115#4". La tokenización de consulta más fina no hace una diferencia para estas consultas.
Si tiene una propiedad administrada "Identificador de producto" que contiene "11.132-884-115#4", es probable que las búsquedas como ProductID:"132-884" obtengan resultados. Administración central/Administración de la colección de sitios/Administración de inquilinos No
Asignaciones a propiedades rastreadas La lista muestra todas las propiedades rastreadas asignadas a esta propiedad administrada. Una propiedad administrada puede obtener este contenido de una o varias propiedades rastreadas.

Puede incluir contenido de todas las propiedades rastreadas o incluir contenido de la primera propiedad rastreada que no esté vacía, basándose en un orden especificado.
Administración central/Administración de la colección de sitios/Administración de inquilinos
Extracción del nombre de la compañía Permite al sistema extraer entidades de nombres de compañía de la propiedad administrada al rastrear elementos nuevos o actualizados. Las entidades extraídas se pueden usar después para configurar refinadores.

Hay un diccionario rellenado previamente para la extracción de nombres de compañía. El sistema guarda el contenido de la propiedad administrada original sin cambiar en el índice y, además, copia las entidades extraídas en la propiedad administrada "compañías". La propiedad administrada "compañías" está configurada para que permita búsquedas, consultas y para que se pueda recuperar, ordenar y refinar.

Puede editar el diccionario de nombres de la compañía en el almacén de términos.

Para obtener más información, vea Administrar la extracción de nombres de compañía en SharePoint Server.

No se admite en la experiencia de búsqueda moderna.
Administración central/Administración de la colección de sitios/Administración de inquilinos
Extracción de entidades personalizadas Permite asociar uno o varios extractores de entidades personalizadas con esta propiedad administrada. Esto permite al sistema extraer entidades de la propiedad administrada al rastrear elementos nuevos o actualizados. Las entidades extraídas se pueden usar después para configurar refinadores.

Crear e implementar extractores de entidades personalizadas en SharePoint Server

No se admite en la experiencia de búsqueda moderna.
Administración central/administración de la colección de sitios

Consulte también

Administrar el esquema de búsqueda en SharePoint Server

Resumen de rastrea y administra propiedades en SharePoint Server

Planear el rastreo y la federación en SharePoint Server