Compartir a través de


Planeación del motor de búsqueda global Enterprise Search

En este artículo:

  • Arquitecturas de búsqueda recomendadas

  • Búsqueda centralizada

  • SSP regionales con contenido sincronizado

  • Búsqueda centralizada y búsqueda distribuida

  • Búsqueda distribuida

  • Búsqueda federada

Arquitecturas de búsqueda recomendadas

Si tiene previsto implementar más de una granja de servidores que ejecuten Microsoft Office SharePoint Server 2007 de manera geográfica, hay varias arquitecturas de búsqueda que resultan prácticas para entornos de red de área extendida (WAN). En este artículo se describen estas arquitecturas. El siguiente modelo de tamaño póster proporciona una introducción de las soluciones globales compatibles y las arquitecturas de búsqueda recomendadas de implementación de Microsoft Office SharePoint Server de forma geográfica (en inglés) (https://go.microsoft.com/fwlink/?linkid=110982&clcid=0xC0A) (en inglés). Este modelo se creó en Microsoft Office Visio. Si no tiene instalado Visio, puede descargar un visor gratuito (https://go.microsoft.com/fwlink/?linkid=73526&clcid=0xC0A). El uso de un trazador mejora la calidad de impresión de este archivo.

Nota

Este póster aún no se ha actualizado con la información acerca de la arquitectura de búsqueda federada.

La planeación de la arquitectura de búsqueda equilibra los siguientes tipos de requisitos en función de las prioridades de una organización:

  • Experiencia del usuario al buscar contenido mediante consultas de búsqueda. La experiencia del usuario incluye:

    • Problemas de rendimiento relacionados con emitir una solicitud de consulta y recibir resultados de búsqueda.

    • Relevancia e integridad de los resultados que se devuelven.

  • Problemas de rendimiento relacionados con el rastreo del contenido a través de una WAN.

  • El costo de administrar un entorno de búsqueda global.

En algunos casos, conocer las opciones de la arquitectura de búsqueda en un entorno WAN ayudará a determinar cuáles de las soluciones globales compatibles resultan más adecuadas para la organización. Para obtener más información acerca de estas soluciones, vea Soluciones globales compatibles con Office SharePoint Server.

En este artículo no se abordan las características de rendimiento del envío de consultas de búsqueda a través la WAN ni del rastreo del contenido a través de la WAN. Sin embargo, es crucial conocer hasta qué punto el entorno WAN admite estos tipos de operaciones para planear un entorno global. Para obtener más información acerca del rendimiento de Office SharePoint Server 2007 en la WAN, vea Planeación de los requisitos de ancho de banda.

Búsqueda centralizada

Con la arquitectura de búsqueda centralizada, el servicio de búsqueda de la granja de servidores central rastrea el contenido en todas las granjas de servidores regionales. Las consultas de búsqueda de los usuarios regionales se envían a la granja de servidores central.

La siguiente ilustración muestra una arquitectura de búsqueda centralizada.

Arquitectura centralizada: implementación de búsqueda global

Si los vínculos WAN son compatibles con el rastreo de contenido en sitios regionales, ésta será la arquitectura recomendada, ya que proporciona una experiencia de búsqueda unificada para los usuarios que incluye los siguientes aspectos:

  • Los usuarios siempre tienen acceso a la granja de servidores central para la búsqueda.

  • La relevancia de la búsqueda se mantiene en los resultados de búsqueda.

  • Los usuarios pueden buscar en todo aquel contenido de la organización para el que tienen permiso de consulta.

Sin embargo, esta arquitectura presenta el inconveniente de que no existe ninguna forma de establecer prioridades ni distinguir el contenido local en los resultados de búsqueda, a menos que se cree un ámbito de búsqueda basado en la ubicación de la granja de servidores del contenido. Es decir, si un usuario de un sitio regional busca un documento ubicado en el sitio regional, no hay una forma sencilla de distinguir la ubicación de los documentos cuando se enumeran en los resultados de búsqueda.

Si los vínculos WAN no funcionan bien, esta arquitectura puede suponer varios riesgos. El rastreo de contenido puede sobrecargar un vínculo WAN, lo que disminuye el rendimiento de la atención de las solicitudes de usuario. Si existe un gran volumen de datos con altos índices de cambio, es posible que los trabajos de indización no puedan mantener actualizados los cambios. Sin embargo, hay formas de optimizar Office SharePoint Server 2007 para mejorar el rastreo de contenido a través de la WAN. Estas optimizaciones pueden reducir el tiempo y el tráfico de red que se usan durante los procesos de indización. Para obtener más información, vea la sección sobre optimización del rastreo de contenido en Optimización de Office SharePoint Server para entornos WAN.

Por último, aunque los vínculos WAN influyen en el rastreo de contenido de forma remota (y, en consecuencia, en la posibilidad de usar la arquitectura de búsqueda centralizada) los vínculos WAN más lentos también contribuyen al grado de utilidad de una búsqueda para los usuarios regionales. Los vínculos WAN lentos pueden desanimar a los usuarios a emitir consultas. Se puede optimizar el rendimiento de la WAN durante el horario laboral; para ello, se puede programar el rastreo de contenido y otras operaciones que pueden reducir el rendimiento para que se realicen en las horas de mínima actividad. Sin embargo, incluso con la optimización, hay que determinar el grado en que la arquitectura de búsqueda centralizada satisface las necesidades de los usuarios regionales a través de los vínculos WAN existentes.

En muchos casos, la arquitectura de búsqueda centralizada permite escalar Office SharePoint Server 2007 para proporcionar servicios a los usuarios regionales.

En la tabla siguiente se resumen las ventajas e inconvenientes de la arquitectura de búsqueda centralizada.

Ventajas Inconvenientes

La relevancia de la búsqueda se mantiene.

La administración del proveedor de servicios compartidos (SSP) está centralizada.

Cuando se rastrea contenido a través de la WAN, se usa ancho de banda.

Puede resultar difícil mantener los índices actualizados en entornos con grandes volúmenes de datos e índices de cambio altos.

El rendimiento de las consultas está sujeto al rendimiento de los vínculos WAN.

SSP regionales con contenido sincronizado

Si los vínculos WAN no son compatibles con la arquitectura de búsqueda centralizada y desea proporcionar la búsqueda como un servicio para los sitios regionales, puede hospedar un SSP en cada sitio regional.

Existen varias arquitecturas de búsqueda diferentes que incluyen el hospedaje de SSP en sitios regionales. La primera de estas arquitecturas se basa en la sincronización de contenido en toda la organización de manera que cada sitio regional tenga una copia de todo el contenido que necesitan los trabajadores en ese sitio regional. Este método de administrar el contenido en una organización global se describe en Diseño del gobierno y la arquitectura de información global. Debido a que el contenido está sincronizado, no existe la necesidad de rastrear el contenido de forma remota en la WAN.

La siguiente ilustración muestra esta arquitectura.

Arquitectura de búsqueda sincronizada

En la ilustración:

  • Los proyectos que están listos para compartirse en la organización se publican en el sitio central, independientemente de dónde se haya creado el contenido.

  • Después de publicar el contenido en el sitio central, las versiones de solo lectura de los proyectos se sincronizan en todos los sitios.

  • El servicio de búsqueda de cada granja de servidores sólo rastrea el contenido de la granja.

Del mismo modo, la información de la compañía se sincroniza en la organización de la misma forma, como se muestra en la siguiente ilustración.

Escenario de búsqueda global del proveedor de servicios compartidos

Aunque esta arquitectura elimina la necesidad de rastrear el contenido en la WAN, requiere el uso de vínculos WAN para sincronizar el contenido en todo el entorno. Para minimizar el efecto sobre el rendimiento de la WAN, se pueden programar estas operaciones en las horas de menor actividad. La ventaja principal es que los usuarios regionales tienen acceso local al contenido mediante el servicio de búsqueda local. Con esta arquitectura, se programa y administra el uso de vínculos WAN, de manera que el rendimiento de éstos no afecta a los usuarios mientras desempeñan sus responsabilidades laborales.

En la tabla siguiente se resumen las ventajas e inconvenientes de esta arquitectura de búsqueda.

Ventajas Inconvenientes

El contenido se rastrea de forma local.

El rendimiento de las consultas de búsqueda no depende del rendimiento de los vínculos WAN.

La relevancia de la búsqueda se mantiene en cada granja.

Con varios SSP, los costos administrativos son mayores.

La sincronización del contenido en una organización aumenta la complejidad de la solución.

Búsqueda centralizada y búsqueda distribuida

Se puede diseñar una arquitectura de búsqueda que combine la búsqueda centralizada y la búsqueda distribuida. Con esta arquitectura, el servicio de búsqueda de cada región rastrea todo el contenido de esa región y la granja de servidores central rastrea el contenido de todas las granjas de la organización.

Con esta arquitectura, los usuarios regionales pueden buscar contenido local sin usar vínculos WAN. Los usuarios regionales pueden buscar en la organización global mediante el envío de consultas en la granja central.

La siguiente ilustración muestra la búsqueda centralizada y la arquitectura de búsqueda distribuida.

Configuración de granja de servidores para búsqueda distribuida y centralizada

En el diagrama:

  • Cada granja de servidores hospeda un SSP. El servicio de búsqueda que proporciona el SSP local rastrea el contenido local de cada granja de servidores regional.

  • El servicio de búsqueda que proporciona el SSP en la granja de servidores central también rastrea el contenido en las granjas de servidores regionales.

La ventaja principal de esta arquitectura es que el rendimiento de las consultas se optimiza para el contenido local mientras que la búsqueda global se proporciona como una opción. Esta arquitectura funciona bien en las siguientes circunstancias:

  • Los trabajadores regionales usan la búsqueda fundamentalmente para tener acceso al contenido local.

  • Los vínculos WAN admiten el contenido de rastreo en los sitos regionales.

No obstante, de forma similar a la arquitectura de búsqueda central, esta arquitectura se basa en el uso intensivo de vínculos WAN para rastrear contenido. Sin embargo, con la búsqueda local como una opción, la búsqueda global no desempeña una función tan fundamental en la arquitectura de búsqueda general y se puede tomar como factor en los programas de rastreo y contratos del nivel de servicio.

En la tabla siguiente se resumen las ventajas e inconvenientes de esta arquitectura de búsqueda.

Ventajas Inconvenientes

El rendimiento de las consultas se optimiza para el contenido local.

Esta opción reduce enormemente la cantidad de consultas en la WAN, comparado con el modelo de búsqueda centralizada.

La relevancia de la búsqueda se optimiza en función del ámbito de la búsqueda (local o global).

Con varios SSP, los costos administrativos son mayores.

Cuando se rastrea contenido a través de la WAN, se usa ancho de banda.

Para los usuarios regionales que realizan consultas globales, el rendimiento de las consultas se ve afectado por el rendimiento de los vínculos WAN.

Búsqueda distribuida

Si los vínculos WAN no son compatibles con la capacidad de sincronizar el contenido en un entorno global o rastrear contenido remoto en granjas de servidores regionales, se puede ofrecer el servicio de búsqueda únicamente en el nivel de granja regional. Con la arquitectura de búsqueda distribuida, cada granja de servidores regional hospeda su propio SSP y el servicio de búsqueda que se proporciona mediante cada SSP regional rastrea únicamente contenido local.

La siguiente ilustración muestra la arquitectura de búsqueda distribuida.

Búsqueda global de SSP en una arquitectura distribuida

Considere la posibilidad de implementar la arquitectura de búsqueda distribuida en las siguientes circunstancias:

  • Los sitios regionales no están bien conectados con los vínculos WAN.

  • Los sitios regionales son autónomos respecto de otros sitios regionales.

  • Los sitios regionales no se basan principalmente en una conexión al sitio central: por ejemplo, una organización con sucursales que funcionan de forma autónoma.

  • Hay un gran número de sitios regionales pero el modelo empresarial y los vínculos WAN no son compatibles con un modelo centralizado: por ejemplo, una organización con un gran número de sucursales que no están bien conectadas mediante vínculos WAN.

En la tabla siguiente se resumen las ventajas e inconvenientes de la arquitectura de búsqueda distribuida.

Ventajas Inconvenientes

La relevancia de la búsqueda se mantiene.

El contenido no se rastrea en los vínculos WAN.

La búsqueda no se realiza en toda la empresa.

Los usuarios de las granjas de servidores regionales deben conectarse a la granja central para buscar contenido en esa granja.

Búsqueda federada

La búsqueda federada es una característica que se agrega en Actualización de infraestructura para servidores de Microsoft Office. Esta característica también se incluye en Microsoft Search Server 2008. La búsqueda federada permite a los usuarios finales emitir una consulta que busca varios orígenes de datos y muestra resultados en los elementos web independientes en una página de resultados de búsqueda única. Estos orígenes pueden ser repositorios de contenido de empresa, otros motores de búsqueda o partes del índice del servidor de búsqueda. Mediante la federación es posible proporcionar resultados de consulta más extensos para los usuarios sin dedicar los recursos del servidor a rastrear e indizar contenido.

En un entorno distribuido con granjas de servidores en diferentes regiones, la búsqueda federada se puede configurar en cada una de las regiones que representa una ubicación federada diferente. El usuario verá los resultados de la búsqueda de cada región en un elemento web de resultados federados diferentes. Los resultados se pueden mostrar tan pronto como se reciben. Por ejemplo, lo más probable es que se devolverá los resultados de la búsqueda a partir de la granja de servidores local antes que los resultados de la búsqueda se reciban a través de conexiones WAN.

En el diagrama siguiente se muestra el uso de la búsqueda federada en un entorno distribuido geográficamente en el que Microsoft Office SharePoint Server se implementa en cada región.

Conexión de búsqueda federada a una granja de servidores remota

En este diagrama:

  • Un usuario de la granja de servidores regional 2 emite una consulta.

  • El tráfico de consultas se envía a un servidor web de la granja de servidores local. El servidor web reenvía la consulta a las ubicaciones de búsquedas federadas.

  • Las consultas A y B son ubicaciones federadas y se envían a las granjas de servidores distribuidas geográficamente.

  • La consulta C es la búsqueda local que se sirve a través de la granja de servidores local.

  • Los resultados de búsqueda se muestran en una página web de elementos web independientes.

Configuración de la búsqueda federada en entornos distribuidos

Mediante la búsqueda federada, cada granja de servidores rastrea su propio contenido. Para las granjas de servidores que ejecutan Office SharePoint Server, se requiere un SSP en cada granja de servidores regional. Cree una conexión federada para una granja de servidores remota que ejecute Office SharePoint Server mediante la creación (en la granja de servidores local) de una ubicación federada OpenSearch. La ubicación federada OpenSearch debe señalar al alimentador RSS de una página de resultados de búsqueda dentro de un centro de búsqueda en la granja de servidores remota. Incluya la granja de servidores local en la búsqueda federada creando un tipo de índice de búsqueda local de la ubicación federada. Para implementar la búsqueda federada en un entorno distribuido, configure cada granja de servidores con ubicaciones federadas para las otras granjas de servidores.

El siguiente diagrama ilustra con más detalle una conexión de búsqueda federada a una granja de servidores remota.

Búsqueda federada de distribución geográfica; cada región con su propia implementación

En este diagrama:

  • En la granja de servidores central, se agrega un centro de búsqueda a la colección de sitios de información de la empresa. Dicho centro de búsqueda se configura con el ámbito que permite a los usuarios buscar en la granja de servidores. Este centro de búsqueda incluye una página de resultados de búsqueda. Para esta página se habilita un canal RSS.

  • En la granja de servidores regional, se configura una conexión de búsqueda federada (denominada A) para conectarse a la página de resultados de búsqueda de la granja de servidores central. Así se permite a los usuarios locales de la granja de servidores regional buscar contenido en la granja central.

En muchos entornos con varias granjas de servidores, no todo el contenido de una granja de servidores es relevante para los usuarios ubicados cerca de otras granjas de servidores. Por ejemplo, las directivas de la organización de una región específica sólo se aplican a esa región. Si sabe que existe un subconjunto de contenido relevante para que los usuarios de otras regiones realicen búsquedas, cree un ámbito en la granja de servidores que abarque la búsqueda en el subconjunto relevante de contenido. Cuando se crea una conexión federada a la granja de servidores remota, conéctese al mismo canal RSS de la página de resultados de búsqueda y agregue el ámbito como parámetro URL. Por ejemplo: https://server/searchcenter/_layouts/srchrss.aspx?k={searchTerms}&s=<yourcustomscope>

Para obtener más información sobre la implementación de un centro de búsqueda, vea los artículos siguientes:

Después de haber terminado de crear y configurar las ubicaciones de búsqueda federada, tiene que conectar cada uno de los elementos web de resultados federados para que los usuarios puedan ver los resultados desde la ubicación mostrada en un centro de búsqueda. Configure un elemento web de resultados federados para cada granja de servidores. Al configurar las propiedades del elemento web de resultados federados, asegúrese de seleccionar la opción para procesar los resultados de forma asíncrona (ésta es la configuración predeterminada). Se mostrará los resultados con esta configuración a medida que se reciben y los usuarios no tienen que esperar conexiones más lentas para empezar a ver los resultados. De forma predeterminada, si no está activada de forma asíncrona, los resultados no se procesarán hasta que cada una de las ubicaciones federadas devuelvan resultados o superen el tiempo de espera. El período de tiempo de espera está establecido en 90 segundos y no se puede cambiar.

Una consideración importante para evaluar cuándo usar la búsqueda federada es la reducción de seguridad de los resultados de búsqueda. De forma predeterminada, la reducción de seguridad de los resultados de búsqueda persiste para los resultados devueltos por las siguientes ubicaciones:

  • Ubicaciones de índice de búsqueda local (granja de servidores local)

  • Ubicaciones OpenSearch que usan credenciales comunes (un único conjunto de credenciales para todos los usuarios)

  • Ubicaciones OpenSearch que usan la autenticación Kerberos por usuario

Sin embargo, las credenciales de usuario no se pasan automáticamente de protocolos de autenticación que no sea de Kerberos. Para asegurarse de que los resultados son con reducción de seguridad para el usuario actual para estos escenarios, amplíe el elemento web de resultados federados para recopilar las credenciales de usuario. Para obtener más información, vea el tema relativo a la creación de elementos web de búsqueda federada personalizados con una IU de credenciales (en inglés) (https://go.microsoft.com/fwlink/?linkid=121779&clcid=0xC0A) (en inglés).

También considere la posibilidad de usar el elemento web de resultados federados superior que muestra los primeros resultados de las diversas ubicaciones federadas. No obstante, este elemento web se configura para mostrar resultados de forma asíncrona y esta configuración no se puede modificar. En consecuencia, el tiempo de carga de la página es tan rápido como la ubicación más lenta configurada en el elemento web de resultados federados superior. Si no se usa la autenticación Kerberos, también necesitará este elemento web para recopilar credenciales de usuario si desea asegurarse de que los resultados de búsqueda para las ubicaciones OpenSearch (todas las ubicaciones que no son de la granja de servidores locales) son con reducción de seguridad para cada usuario

Por último, mientras la búsqueda federada proporciona a los usuarios una vista en varios orígenes de búsqueda, los usuarios están limitados a las opciones de búsqueda estándar. Las opciones de búsqueda avanzadas no pueden usarse con la búsqueda federada.

Uso de la búsqueda federada con granjas de servidores que ejecutan Windows SharePoint Services

Para usar la búsqueda federada con una granja de servidores que ejecute Windows SharePoint Services, actualice la granja de servidores que ejecute Windows SharePoint Services a Search Server 2008 Express o bien a Search Server 2008. La actualización proporciona la ventaja de ofrecer una búsqueda en toda la granja de servidores de la granja que ejecuta Windows SharePoint Services, en vez de una búsqueda cuyo ámbito sea únicamente cada base de datos de contenido. Además, Servidor de búsqueda es obligatorio para proporcionar canales RSS de resultados. RSS es obligatorio para crear una ubicación OpenSearch federada para los resultados de una granja de servidores remota para que los resultados se puedan mostrar en una página agregada

El siguiente diagrama ilustra un entorno distribuido geográficamente con granjas de servidores que ejecutan Windows SharePoint Services actualizado a Search Server 2008 en las ubicaciones regionales.

Entorno de distribución geográfica; granjas de servidores actualizadas en la ubicación regional

Resumen de la búsqueda federada

Existen muchas ventajas para usar la búsqueda federada en una implementación geográfica. La búsqueda federada elimina la necesidad de rastrear contenido a través de las conexiones WAN o de sincronizar contenido a través de las conexiones WAN. Al mostrar los resultados en elementos web separados, los usuarios pueden distinguir dónde está ubicado el contenido, facilitando la identificación del contenido local. Ver dónde está ubicado el contenido también puede ayudar al usuario a determinar los resultados que son probablemente los más relevantes.

No obstante, existen algunos inconvenientes en esta arquitectura. En primer lugar, no se puede garantizar la relevancia para la empresa en los resultados de búsqueda. En vez de ello, la relevancia se limita a cada ubicación federada. En segundo lugar, el rendimiento de las consultas para las ubicaciones remotas está sujeto a los vínculos WAN. Sin embargo, los usuarios suelen recibir rápidamente los resultados de búsqueda de la granja de servidores local.

En la tabla siguiente se resumen las ventajas e inconvenientes de la arquitectura de búsqueda federada.

Ventajas Inconvenientes

Proporciona la búsqueda en toda la empresa.

No hay limitación de documentos o elementos a buscar.

El contenido no se rastrea ni sincroniza a través de los vínculos WAN.

El rendimiento de las consultas se optimiza para el contenido local mientras que a la vez se proporciona resultados para el contenido remoto.

Los usuarios pueden realizar búsquedas en diferentes ubicaciones sin tener que conectarse a cada ubicación por separado.

Cada almacén de contenido se puede administrar de forma independiente.

Windows SharePoint Services con Search Server 2008 se puede usar en granjas regionales, en lugar de Office SharePoint Server.

Se preserva la reducción de seguridad para la granja de servidores local y para las granjas de servidores remotas si se usa la autenticación Kerberos.

La relevancia de la búsqueda no es para toda la empresa. La relevancia se limita a cada origen de contenido.

Administrar varios SSP o implementaciones de Search Server 2008 aumenta los costes administrativos.

El rendimiento de las consultas para las ubicaciones remotas está sometido a los vínculos WAN.

Como el contenido no está sincronizado en todo el entorno, los usuarios se descargarán documentos a través de vínculos WAN durante las horas punta para el uso del ancho de banda.

Los usuarios no pueden usar las opciones de búsqueda avanzadas.

Si no se usa Kerberos, para conservar de reducción de seguridad de los resultados de búsqueda es necesario ampliar los elementos web de búsqueda federada.

Descarga de este libro

En este tema se incluye el siguiente libro descargable para facilitar la lectura y la impresión:

Vea la lista completa de libros disponibles en la página que muestra el contenido descargable para Office SharePoint Server 2007.

Vea también

Conceptos

Soluciones globales compatibles con Office SharePoint Server
Diseño del gobierno y la arquitectura de información global
Planeación de los requisitos de ancho de banda