Rendimiento estimado y requisitos de capacidad para entornos de búsqueda

En este artículo:

  • Características clave

  • Entorno de prueba

  • Recomendaciones

Este escenario de rendimiento y capacidad incorpora una única granja de servidores de Microsoft Office SharePoint Server 2007 que se usa para la búsqueda e indización de contenido de Office SharePoint Server en un entorno empresarial.

Importante

Algunas de las instrucciones de este artículo se han actualizado para Office SharePoint Server 2007 con SP1. Para ver la lista completa de actualizaciones de Office SharePoint Server 2007 con SP1, vea Libro descargable: Planeación e implementación del Service Pack 1 para Office SharePoint Server 2007 en un entorno de varios servidores.

Características clave

En las características clave se describen los factores del entorno, las características de uso y otros aspectos que, probablemente, se encontrarán en las implementaciones basadas en este escenario.

Las características clave para este escenario incluyen:

  • Tiempos de respuesta de usuario Los objetivos de tiempo de respuesta de los usuarios para operaciones habituales, poco habituales, de larga duración e infrecuentes se enumeran en la tabla "Tiempo de respuesta de usuario" de Planeación de límites de software (Office SharePoint Server). Algunas organizaciones podrían admitir tiempos de respuesta de usuario más lentos o requerir tiempos más rápidos. El tiempo de respuesta de usuario esperado es un factor clave que determina los objetivos de productividad global. La productividad se define como el número de respuestas por segundo que puede procesar la granja de servidores. Cuando el número de usuarios es más elevado, se requiere un objetivo de productividad más alto para lograr el mismo tiempo de respuesta de usuario.

  • Simultaneidad de usuarios Se asume una tasa de simultaneidad del 10%, con un 1% de usuarios simultáneos realizando solicitudes en un momento dado. Por ejemplo, para 10.000 usuarios, 1.000 pueden estar usando activamente la solución al mismo tiempo y 100 usuarios pueden estar realizando solicitudes activamente.

  • Tareas asincrónicas de larga duración Las tareas como el rastreo de contenido y la copia de seguridad de las bases de datos agregan una carga de rendimiento a la granja de servidores. Las características de rendimiento generales de las topologías de ejemplo asumen que estas tareas se ejecutan durante períodos de menos actividad (por ejemplo, durante la noche), por lo que no se ven afectadas las tasas de respuesta de los usuarios durante las horas de trabajo.

Entorno de prueba

Las pruebas de este escenario se diseñaron para ayudar a desarrollar estimaciones sobre cómo responden a los cambios las diferentes configuraciones de granja de servidores en cuanto a una serie de factores, incluidos:

  • Cuántos usuarios simultáneos usan el sistema

  • Qué tipos de operaciones de usuario se realizan

  • Cuántos documentos se encuentran en el índice que se consulta

Es importante tener en cuenta que, si bien se pueden extraer ciertas conclusiones a partir de los resultados de las pruebas, las cifras concretas de rendimiento y capacidad de esta sección serán distintas de las cifras de los entornos reales. Las cifras de este artículo se ofrecen como un punto de partida para el diseño de un entorno con el tamaño correcto. Después de completar el diseño del sistema inicial, pruebe la configuración para determinar si el sistema será compatible con los factores inherentes de su entorno.

Nota

Estas pruebas se realizaron para simular un entorno empresarial con millones de documentos y una base de usuarios de gran tamaño. El hardware usado para el entorno de pruebas se configuró con procesadores eficaces y una gran cantidad de memoria y capacidad de disco. Vea "Recomendaciones de hardware" en la sección Recomendaciones de este artículo para conocer las recomendaciones de hardware iniciales.

Para obtener más información acerca de cómo probar una implementación, vea Herramientas de planeación de rendimiento y capacidad (Office SharePoint Server).

Suposiciones

  • Arquitectura de 64 bits En el entorno de prueba sólo se usaron servidores de 64 bits. Aunque Office SharePoint Server 2007 se puede implementar en servidores de 32 bits, recomendamos usar servidores de 64 bits en implementaciones de granjas de servidores de Office SharePoint Server 2007. Para obtener más información, vea la sección sobre 64 bits y 32 bits del artículo Acerca de la planeación del rendimiento y la capacidad (Office SharePoint Server).

  • Habilitación del almacenamiento en caché basado en disco El almacenamiento en caché basado en disco elimina la necesidad de tener acceso a la base de datos varias veces en busca de fragmentos de código o archivos binarios grandes, como archivos de imagen, sonido y vídeo. Al habilitar el almacenamiento en caché basado en disco se mejora el rendimiento de toda la implementación. Tenga en cuenta que el almacenamiento en caché basado en disco no se habilita de manera predeterminada. Para obtener información acerca de cómo habilitar el almacenamiento en caché basado en disco, vea el artículo Almacenamiento en caché para objetos binarios grandes basado en disco (https://go.microsoft.com/fwlink/?linkid=82617&clcid=0xC0A).

Topología de laboratorio

Para las pruebas se usaron varias configuraciones de granja de servidores, de uno a ocho servidores de consulta, un servidor de índices, un SSP y un servidor de base de datos con el software de base de datos Microsoft SQL Server 2005. Todos los servidores ejecutaban la configuración predeterminada de Office SharePoint Server 2007 Enterprise Edition en el sistema operativo Microsoft Windows Server 2003 con Service Pack 1 (SP1), Enterprise x64 Edition.

En la tabla siguiente, se incluye el hardware específico usado para las pruebas.

Función del equipo Hardware Capacidad de disco duro

Servidores de consultas

Cuatro procesadores de núcleo dual Intel Xeon a 2,66 gigaherzios (GHz)

32 gigabytes (GB) de RAM

40 GB para el sistema operativo (RAID (matriz redundante de discos independientes) 5)

956 GB para el índice de contenido y el archivo de paginación del sistema operativo (RAID 10)

Servidor de índices

Cuatro procesadores de núcleo dual Intel Xeon a 2,66 GHz

32 GB de RAM

40 GB para el sistema operativo (RAID 5)

956 GB para el índice de contenido y el archivo de paginación del sistema operativo (RAID 10)

Servidor de base de datos

Cuatro procesadores de núcleo dual Intel Xeon a 2,66 GHz

32 GB de RAM

40 GB para el sistema operativo (RAID 5)

956 GB para la base de datos SharedServices_Search_DB con controlador SCSI (interfaz estándar de equipos pequeños) dedicado (RAID 10)

Los discos siguientes comparten un controlador SCSI:

273 GB para la base de datos SharedServices_DB (RAID 10)

273 GB para la base de datos TempDb (RAID 10)

273 GB para los archivos de registro (RAID 10)

136 GB para la base de datos SharePoint_Config (RAID 10)

En el entorno de prueba se usó una red de un gigabit (mil millones bits/seg.). Recomendamos usar una red de un gigabit entre los servidores de una granja de Office SharePoint Server para garantizar que existe un ancho de banda de red suficiente.

Perfil de uso

En la tabla siguiente se muestra el perfil de uso del entorno de prueba de búsqueda de Office SharePoint Server 2007.

Nota

Para las pruebas de este escenario, sólo se usaron las operaciones de usuario de consulta para determinar el rendimiento del sistema.

Se rastrearon aproximadamente 50 millones de elementos para las pruebas. En la tabla siguiente se muestran el tipo y el número de elementos rastreados. Estos elementos, entre los que se incluyen elementos de lista, páginas web y varios tipos de documentos, tenían un tamaño de 10 kilobytes (KB) a 100 KB.

Tipo de elemento Número de elementos

Contenido en los sitios de SharePoint

10 millones de elementos, incluidos los siguientes:

  • 420 colecciones de sitios

  • 4.000 sitios

  • 24.200 listas

  • 47.780 bibliotecas de documentos

Contenido en recursos compartidos de archivos

15 millones de elementos

Contenido HTTP

15 millones de elementos

Perfiles de personas

2,5 millones

Stitch (herramienta de pruebas en memoria que genera documentos en memoria)

7,5 millones

Propiedades (metadatos)

1 millón

En la siguiente tabla se muestra el uso del espacio de disco

Tipo de uso Volumen

Tamaño del índice en el servidor de consultas

100 GB*

Tamaño del índice en el servidor de índices

100 GB*

Tamaño de la base de datos de búsqueda

600 GB

Nota

Los tamaños de índice probados son menores que los que se observan en un entorno de producción. En el corpus generado en la prueba, el número de palabras únicas es limitado y se repite a menudo.

El tiempo necesario para realizar un rastreo completo durante la prueba fue de 35 días (aproximadamente 15 documentos por segundo). Tenga en cuenta que estos resultados se observaron en un entorno de producción donde la velocidad de rastreo se vio afectada por la latencia de red y la capacidad de respuesta de los repositorios rastreados. La velocidad de rastreo medida en documentos por segundo podría ser bastante mayor en un entorno puramente de pruebas o en entornos con más ancho de banda y en los que los repositorios rastreados tuvieran más capacidad de respuesta.

Si se cambiase el dos por ciento de un corpus del mismo tamaño que se empleó en el entorno de prueba, el rastreo incremental necesario para ponerse al día con los cambios llevaría aproximadamente entre 8 y 12 horas en función de la latencia y la capacidad de respuesta de los sitios rastreados. Tenga en cuenta que los cambios de los metadatos y vínculos de salida tardan más en procesarse que los cambios en el contenido de los documentos.

Recomendaciones

En esta sección, se proporcionan recomendaciones generales sobre el rendimiento y la capacidad. Úselas para determinar la capacidad y las características de rendimiento de la topología inicial que creó en Planeación de la redundancia (Office SharePoint Server) y para determinar si es preciso escalarla en horizontal o en vertical.

Nota

*Escalar en horizontal* significa agregar más servidores para una función específica y *escalar en vertical* es aumentar el rendimiento o la capacidad de un servidor dado al agregarle memoria, capacidad de disco duro o velocidad de procesador.

Recomendaciones de hardware

En la tabla siguiente, se enumera el hardware recomendado para los servidores web, los servidores de índices y los servidores de base de datos.

Nota

Los requisitos de memoria para los servidores web, de índices y de base de datos dependen del tamaño de la granja de servidores, del número de usuarios simultáneos y de la complejidad de las características y las páginas de la granja de servidores. Las recomendaciones de memoria de la tabla siguiente pueden ser adecuadas para una granja de servidores pequeña o de bajo uso, pero es necesario supervisar el uso de memoria cuidadosamente para determinar si debe agregarse más.

Función de servidor Hardware recomendado

Servidor web (de consultas)

Procesadores duales a 2,5 GHz o más rápidos (se recomiendan 3 o más GHz)

2 GB de RAM como mínimo

3 GB de espacio disponible en disco

Unidad de DVD, local o accesible mediante red

Servidor de índices

Procesadores duales a 2,5 GHz o más rápidos (se recomiendan 3 o más GHz)

4 GB de RAM como mínimo

3 GB de espacio disponible en disco

Unidad de DVD, local o accesible mediante red

Servidor de base de datos

Procesadores duales a 2,5 GHz o más rápidos (se recomiendan 3 o más GHz)

4 GB de RAM como mínimo

El espacio en disco duro para la base de datos de contenido se basa en una proporción 1:1,2 de tamaño del contenido por capacidad de la base de datos. Por ejemplo, si tiene previsto un contenido de 100 GB, necesitará al menos 120 GB de espacio en disco disponible para la base de datos de contenido, además de espacio adicional para los registros de transacciones.

El espacio en disco duro para la base de datos de búsqueda se basa en una proporción 1:4 de tamaño del índice por capacidad de la base de datos. Por ejemplo, si el índice va a tener un tamaño de 100 GB, necesitará al menos 400 GB de espacio en disco disponible para la base de datos de búsqueda, además de espacio adicional para los registros de transacciones.

Unidad de DVD, local o accesible mediante red

Nota

La cantidad de espacio en disco duro que se requiere en el servidor de base de datos para los registros de transacciones depende de la configuración del registro. Para obtener más información, vea la página de descripción y administración de registros de transacciones (https://go.microsoft.com/fwlink/?linkid=82925&clcid=0xC0A).

Para obtener más información acerca de los requisitos del sistema mínimos y recomendados, vea Determine hardware and software requirements (Search Server 2008).

Topologías de inicio

Puede calcular el rendimiento de la topología inicial si la compara con las topologías iniciales que se proporcionan en Planeación de la redundancia (Office SharePoint Server). Al hacerlo, podrá determinar rápidamente si necesita escalar en vertical o en horizontal la topología inicial para satisfacer sus objetivos de rendimiento y capacidad.

Capacidad y rendimiento de topologías escaladas en vertical y en horizontal

Para aumentar la capacidad y el rendimiento de una de las topologías iniciales, puede escalarla en vertical, implementando servidores con mayor capacidad, o puede escalarla en horizontal, agregándole servidores. En esta sección, se describen las características generales de rendimiento de varias topologías escaladas en vertical y en horizontal. Las topologías de ejemplo representan las siguientes formas comunes de escalar en vertical o en horizontal una topología para un entorno de búsqueda:

  • Para poder asumir una mayor carga de usuarios, agregue servidores de consultas. También puede agregar servidores de índices y servidores de consultas dedicados para aliviar una parte de la carga de procesamiento de los servidores web.

  • Para asumir una mayor carga de datos, agregue capacidad a la función de servidor de la base de datos aumentando la capacidad de un solo servidor (agrupado o reflejado) actualizando a un servidor de 64 bits o agregando servidores agrupados o reflejados.

  • Mantenga una proporción inferior a ocho servidores web por cada servidor de base de datos (agrupado o reflejado). Las pruebas de laboratorio revelaron una proporción óptima de 7x1x1 (siete servidores de consultas por cada servidor de índices y cada servidor de base de datos)

Cálculo de objetivos de rendimiento

En esta sección se proporcionan datos de prueba que muestran el rendimiento de una granja de servidores para un número en aumento de servidores de consulta y conexiones de usuario.

Puesto que Office SharePoint Server 2007 se puede implementar y configurar de muchas formas, no hay una manera sencilla de estimar cuántos usuarios se pueden admitir en un número determinado de servidores. En consecuencia, es importante que realice pruebas en su entorno antes de implementar Office SharePoint Server 2007 en un entorno de producción.

Existen varios factores que pueden afectar al rendimiento, como el número de usuarios, la complejidad y la frecuencia de las operaciones de usuario, el almacenamiento en memoria caché y la personalización de las páginas y elementos web. Cada uno de estos factores puede tener un efecto importante en el rendimiento de la granja de servidores. Debería considerarlos detenidamente al planear la implementación.

Para obtener más información acerca del almacenamiento en memoria caché en Office SharePoint Server 2007, vea los siguientes recursos:

Si su organización dispone de una solución de búsqueda, puede ver los registros de Internet Information Services (IIS) para determinar los patrones de uso y las tendencias en el entorno actual. Para obtener más información acerca del análisis de registros de IIS, vea el tema relativo al análisis de archivos de registro (IIS 6.0) (en inglés) (https://go.microsoft.com/fwlink/?linkid=78825&clcid=0xC0A) (en inglés).

Si su organización va a planear un nueva implementación de solución de búsqueda, use la información de la sección siguiente para calcular los patrones de uso.

Resultados de la prueba: rendimiento por configuración de granja

En la tabla de esta sección se muestran los resultados de las pruebas realizadas para varios perfiles de operaciones de usuario con el hardware y el perfil de uso indicados en la sección Entornos de prueba de este artículo. Tenga en cuenta que para cada configuración de granja de servidores se comprobó un intervalo de uno a ocho servidores de consultas, junto con un servidor de índices y un servidor de base de datos. Por lo tanto, una configuración de granja de servidores 3x1x1 indica tres servidores de consulta por un servidor de índices y por un servidor de base de datos. Las pruebas no se realizaron en granjas de servidores con varios servidores de índices o de base de datos.

En la tabla siguiente se muestran los resultados de las pruebas para operaciones de usuario relacionadas con la búsqueda.

Tamaño de la granja de servidores RPS Porcentaje de uso de CPU del servidor de consultas Porcentaje de uso de CPU del servidor de índices Porcentaje de uso de CPU del servidor de base de datos Promedio de operaciones de escritura en disco por segundo para el servidor de base de datos

1x1x1

24,01

99,49

1,98

7,23

6,11

2x1x1

48,04

96,98

3,95

13,02

2,66

3x1x1

71,07

94,73

5,61

20,56

2,29

4x1x1

93,11

91,77

8,81

29,21

2,41

5x1x1

114,95

90,50

10,27

39,38

2,45

6x1x1

133,34

87,29

11,91

52,94

2,83

7x1x1

148,52

80,20

15,24

63,72

3,14

8x1x1

146,94

65,65

15,15

69,15

2,87

En el siguiente gráfico se muestran los cambios de rendimiento de las operaciones de búsqueda cuando cambia el número de servidores de consultas.

Solicitudes por segundo frente a servidores de consultas

Estimación del período de tiempo de rastreo

En un entorno de búsqueda de Office SharePoint Server 2007, el rastreo de contenido suele ser la operación de mayor duración no iniciada por usuarios. Deberá realizar pruebas en su propio entorno para determinar la cantidad de tiempo que lleva rastrear el contenido al usar un origen de contenido específico y si la capacidad que consume el rastreo de este contenido interfiere en el objetivo de tiempo de respuesta de los usuarios. Normalmente, debería comprobar si es posible limitar el rastreo de un origen de contenido determinado a un período de 12 horas durante la noche.

Estimación de los requisitos de espacio en disco

Use la siguiente información para planear los requisitos de espacio en disco de los servidores de índices, servidores de consultas y servidores de base de datos de su entorno.

Requisitos de espacio en disco para servidores de índices y servidores de consultas

Use la información siguiente para planear los requisitos de espacio en disco para los servidores de índices y servidores de consultas en la granja de servidores.

Nota

El tamaño del índice de contenido es normalmente menor que el corpus porque todas las palabras vacías se quitan antes de que el contenido se indice.

Nota

Si la función de servidor de consultas está habilitada en un servidor que no es el servidor de índices, el índice se propaga automáticamente a los servidores de consultas. Para almacenar una copia del índice de contenido en el sistema de archivos del servidor de consultas, cada servidor de consultas requiere la misma cantidad de espacio en disco que el servidor de índices usa para el índice de contenido. Para obtener más información, vea Planeación de la redundancia (Office SharePoint Server).

Para calcular los requisitos de espacio en disco para el disco duro que contiene el índice de contenido:

  1. Calcule cuánto contenido va a rastrear y el tamaño promedio de cada archivo. Si no conoce el tamaño promedio de los archivos en el corpus, utilice 10 KB por cada documento como punto de partida.

    Use la fórmula siguiente para calcular cuánto espacio en disco necesita para almacenar el índice de contenido:

    GB de espacio en disco necesario = Tamaño_total_del_corpus (en GB) x Modificador_de_tamaño_de_archivo x 2,85

    donde Modificador_de_tamaño_de_archivo es un número entre los siguientes valores, según el promedio de tamaño de los archivos del conjunto:

    • 1,0 si el corpus contiene archivos muy pequeños (promedio de tamaño de archivo = 1 KB).

    • 0,12 si el corpus contiene archivos de tamaño medio (promedio de tamaño de archivo = 10 KB).

    • 0.,05 si el corpus contiene archivos de gran tamaño (promedio de tamaño de archivo = 100 KB o superior).

Nota

El objeto de esta ecuación sólo es establecer una estimación de partida. Los resultados reales pueden variar bastante en función del tamaño y tipo de documentos que se indicen y de la cantidad de metadatos que se indice durante una operación de rastreo.

En esta ecuación, se multiplica Tamaño_total_del_corpus (en GB) x Modificador_del_tamaño_de_archivo para obtener el tamaño estimado del archivo de índice. A continuación, multiplíquelo por 2,85 para dar cabida a la carga de combinaciones principales cuando los datos rastreados se combinan con el índice. El resultado final es el requisito de espacio en disco estimado.

Por ejemplo, para un tamaño de corpus de 1 GB que principalmente contiene archivos con un tamaño de 10 KB de promedio, use los valores siguientes para calcular el tamaño estimado del archivo de índice:

1 GB x 0,12 = 0,12 GB

Según este cálculo, el tamaño estimado del archivo de índice es 120 MB.

A continuación, multiplique el tamaño estimado del archivo de índice por 2,85:

120 MB x 2,85 = 342 MB

Por lo tanto, el espacio en disco necesario para el archivo de índice y para dar cabida a las operaciones de indización es de 342 MB o 0,342 GB.

Nota

El volumen de los datos rastreados puede variar en función del contenido que se esté rastreando. Un origen de contenido es un conjunto de opciones que se puede usar para especificar el protocolo que usar durante el rastreo, las direcciones URL a partir de las cuales iniciar el rastreo y los niveles que se van a rastrear.

  1. Según la estimación, si el índice de contenido se ajusta al espacio disponible en el disco duro en los servidores de índices y consultas, vaya al paso 3. De lo contrario, agregue espacio al disco o bien vuelva a realizar el cálculo del paso 1 antes de seguir adelante con el paso 3.

  2. Rastree parte del contenido.

  3. Calcule el tamaño del índice de contenido y el número de archivos que se han rastreado. Use esta información para aumentar la precisión del cálculo llevado a cabo en el paso 1.

  4. Si el espacio restante en el disco duro es suficiente, rastree más contenido. De lo contrario, agregue al disco duro el espacio que sea necesario o bien vuelva a efectuar el cálculo del contenido para planear el rastreo.

  5. Repita los pasos que van del 3 al 5 hasta haber rastreado todo el contenido.

    Una vez rastreado todo el corpus, se recomienda conservar un registro del tamaño del índice de contenido y de la base de datos de búsqueda para cada rastreo para poder determinar el promedio de la tasa de crecimiento. Como el corpus tiende a crecer con el paso del tiempo debido a la adición de contenido nuevo en la granja de servidores, se debe supervisar el espacio disponible en disco para asegurarse de disponer de la capacidad adecuada para poder realizar las operaciones de indización.

Requisitos de espacio en disco para la base de datos de búsqueda

La base de datos de búsqueda, que almacena la información de historial del rastreador y los metadatos del sistema de búsqueda, suele requerir más espacio en disco que el índice. Es así si se rastrean principalmente sitios de SharePoint, que contienen un gran número de metadatos.

Nota

Tanto los metadatos de todo el contenido indizado como el historial del rastreador de datos se almacenan en la base de datos de búsqueda. Por este motivo, la base de datos de búsqueda necesita más espacio de almacenamiento que el índice de contenido.

Utilice la siguiente fórmula para calcular la cantidad de espacio en disco que necesita para la base de datos de búsqueda:

GB de espacio en disco necesario = Tamaño_total_del_corpus (en GB) x Modificador_de_tamaño_de_archivo x 4

donde Modificador_de_tamaño_de_archivo es un número entre los siguientes valores, según el promedio de tamaño de los archivos del conjunto:

  • 1,0 si el corpus contiene archivos muy pequeños (promedio de tamaño de archivo = 1 KB).

  • 0,12 si el corpus contiene archivos de tamaño medio (promedio de tamaño de archivo = 10 KB).

  • 0,05 si el corpus contiene archivos de gran tamaño (tamaño de archivo promedio 100 KB o mayor)

Por ejemplo, para un tamaño de corpus de 1 GB que principalmente contiene archivos con un tamaño de 10 KB de promedio, sustituya los valores siguientes de la ecuación para calcular el tamaño estimado del archivo de índice:

1 GB x 0,12 = 0,12 GB o 120 MB

A continuación, multiplique el tamaño estimado del archivo de índice por 4:

120 MB x 4 = 480 MB

Por lo tanto, el espacio en disco necesario para la base de datos de búsqueda es 480 MB o 0,48 GB.

Determinación de las especificaciones de los servidores de índices, consultas y base de datos

En Office SharePoint Server 2007, la búsqueda es un servicio compartido que está disponible en el nivel del SSP. El sistema de búsqueda de Office SharePoint Server 2007 se compone de dos funciones de servidor principales: el servidor de índices y el servidor de consultas.

El rastreo y la indización son operaciones que consumen muchos recursos. El rastreo de contenido es el proceso mediante el cual el sistema tiene acceso al contenido y sus propiedades, y los analiza para generar un índice de contenido a partir del cual se pueden resolver las consultas de búsqueda. El rastreo consume recursos de procesamiento y memoria en el servidor de índices, el servidor de consultas o los servidores que atienden las operaciones de rastreo, el servidor o los servidores que hospedan el repositorio de contenido que se rastrea y el servidor de base de datos que atiende la granja de servidores de Office SharePoint Server 2007.

Las operaciones de rastreo afectan al rendimiento global del sistema y, directamente, al tiempo de respuesta de los usuarios y al rendimiento de otros servicios compartidos de la granja de servidores, así como del servicio web del servidor de consultas que se ocupa de las operaciones de rastreo. Se puede tener un servidor de consultas dedicado a las operaciones de rastreo para reducir la carga en los demás servidores de la granja.

La indización del contenido rastreado puede afectar también al rendimiento general del sistema si las operaciones de rastreo no se asignan a un servidor de consultas dedicado. Si las operaciones relacionadas con la búsqueda representan una parte importante de las operaciones de la granja de servidores, piense en implementar un servidor de consultas dedicado. Para obtener más información, consulte la sección "Servidor de consultas dedicado a operaciones de rastreo" de este artículo.

Determinación de las especificaciones de los servidores de índices

Use la información de esta sección para especificar los requisitos de los servidores de índices de una granja de servidores de Office SharePoint Server 2007.

CPU del servidor de índices

La velocidad de procesador del servidor de índices influye en la velocidad del rastreo y en el número de subprocesos de rastreo de los que se pueden crear instancias. Aunque no existe una recomendación exacta para el tipo de procesador o el número de procesadores, debe tener en cuenta la cantidad de contenido que se va a rastrear para determinar los requisitos del servidor de índices. En un entorno empresarial, el servidor de índices debe tener varios procesadores para controlar una carga de indización grande.

En la tabla siguiente se muestra cómo aumenta la velocidad de rastreo a medida que aumenta el número de procesadores disponibles en el servidor de índices.

Número de procesadores Porcentaje de aumento de la velocidad de rastreo

1

0,00

2

10,89

4

19,77

8

30,77

Memoria del servidor de índices

En el servidor de índices, los documentos se cargan en búferes para que los procese el motor del rastreador. En una granja de servidores con un volumen aproximado de 1 millón de documentos, el servidor de índices requiere aproximadamente 1,5 GB de memoria. Después de que un documento se procesa en memoria, se escribe en el disco. Cuanto mayor sea la capacidad de memoria, más documentos podrá procesar el rastreador en paralelo, lo que aumentará la velocidad de la operación de rastreo.

Recomendamos, como mínimo, 4 GB de memoria RAM en el servidor de índices para rastrear un volumen de más de un millón de documentos.

Velocidad de disco del servidor de índices

Recomendamos que especifique RAID 10 con tiempos de acceso de 2 milisegundos (ms) y tiempos de escritura superiores a 150 MB/segundo para escrituras en disco rápidas.

Importancia de un único índice

En SharePoint Portal Server 2003, el índice de contenido se podía dividir entre varios servidores para crear subconjuntos de contenido indizado con vistas al crecimiento futuro. Aunque Office SharePoint Server 2007 admite el uso de varios servidores de índices para el escalado horizontal, cada servidor de índices requiere un SSP independiente y no hay forma de combinar los distintos índices.

Número de servidores de índices

Puede implementar varios servidores de índices en una granja si desea aislar completamente los SSP o ampliar el sistema mediante el uso de más servidores (escalado horizontal). Aunque no se impone ningún límite estricto en el número de servidores de índices de una granja de servidores, las pruebas se han realizado con un número máximo de cuatro servidores de índices en una sola granja.

El número de servidores de índices que se usa en una granja de servidores depende de la forma en que se desee plantear la experiencia de búsqueda. Si la experiencia de búsqueda requiere que el contenido rastreado se incluya en un único conjunto de resultados, debería implementarse un solo SSP con un solo servidor de índices. La mayoría de las organizaciones desean que los usuarios tengan la posibilidad de buscar en todo el contenido rastreado y, por tanto, no requieren varios ámbitos de búsqueda.

Si la experiencia de búsqueda se puede dividir entre distintos ámbitos para proporcionar conjuntos de resultados de búsqueda relevantes independientes según distintos repositorios de contenido, se pueden usar varios SSP y servidores de índices. Un ejemplo de escenario en el que se desearían distintos ámbitos de búsqueda sería el de una empresa con una división donde se mantienen documentos confidenciales en los que sólo puede realizar búsquedas un grupo específico de usuarios.

En función de cuales sean sus requisitos de escalabilidad y seguridad, puede asociar todos los SSP a un solo servidor de índices o puede asociar cada SSP a un servidor de índices independiente.

Nota

En Office SharePoint Server 2007 no se admiten las consultas en varios SSP para obtener un único conjunto de resultados relevantes.

Un único servidor de índices con una configuración de hardware eficaz puede admitir hasta 50 millones de documentos. Si se va a generar un solo índice de este tamaño, recomendamos que no se use más de un servidor de índices en la granja de servidores, ya que el índice se propaga a todos los servidores de consultas de la granja. Si se agrega un segundo servidor de índices, los índices de éste se propagarán también a todos los servidores de consultas de la granja de servidores, lo que aumentará la carga en esos servidores.

Si desea aumentar la capacidad de búsqueda mediante la adición de SSP, también necesitará realizar un escalado en horizontal. Como mínimo, debe agregar otro servidor de índices, otro servidor de base de datos y otro servidor web dedicado. Si actualmente el hardware admite la indización de 10 millones de documentos con un solo SSP, se puede realizar un escalado en vertical y usar el mismo hardware para hospedar 20 SSP.

Nota

En Microsoft Office SharePoint Server 2007 for Search sólo se puede usar un SSP.

Esto le permitirá indizar aproximadamente 2 millones de documentos por cada SSP para unos 40 millones de documentos en total.

Nota

Un SSP siempre está asociado a un solo servidor de índices, pero un servidor de índices puede hospedar varios SSP.

Servidor de consultas dedicado a operaciones de rastreo

Dedicar un servidor de consultas a las operaciones de rastreo es un procedimiento recomendado.

En una granja de servidores habilitada para la búsqueda, todos los servidores de consultas de la granja se ocupan de las operaciones de rastreo de manera predeterminada. Cuando comienza una operación de rastreo, el servidor de índices envía una solicitud a los servidores de consultas, los cuales recuperan a su vez el contenido que se debe rastrear y lo entregan al servidor de índices. Cuando la carga de usuarios es grande, una operación de rastreo puede reducir la capacidad de respuesta del sistema a las solicitudes de los usuarios.

Para minimizar el impacto de las operaciones de rastreo en el rendimiento de la granja de servidores, se puede configurar un servidor de consultas dedicado para el rastreo. De esta forma, todas las operaciones de rastreo deberán realizarse a través del servidor dedicado, mientras que los demás servidores de consultas de la granja de servidores seguirán resolviendo las solicitudes de los usuarios. Esta configuración es especialmente útil para entornos en los que las operaciones de rastreo no se pueden restringir a un período de tiempo durante la noche o para entornos distribuidos geográficamente en los que los usuarios realizan solicitudes a todas horas.

Para obtener más información acerca de cómo dedicar un servidor de consultas para el rastreo, vea Configuración de un servidor cliente web dedicado para el rastreo (Office SharePoint Server 2007).

Nota

Dedicar un servidor de consultas para el rastreo podría afectar a otros servicios que se ejecutan en el servidor. No se puede equilibrar la carga de un servidor de consultas configurado de este modo, que tampoco atenderá las solicitudes de los usuarios finales.

Optimización del rendimiento del servidor de índices

Las operaciones de indización aumentan la carga del servidor de base de datos y pueden reducir la capacidad de respuesta de la granja de servidores. Las operaciones de indización también pueden afectar a otros servicios compartidos en el servidor de aplicaciones que ejecuta el servicio de indización de búsqueda. Se puede usar uno de los tres valores siguientes para ajustar el nivel de rendimiento de la indización para cada servidor de índices:

  • Reducido

  • Parcialmente reducido

  • Máximo

El valor predeterminado es Reducido. Sólo se puede configurar esta opción para un servidor de índices específico, no para el SSP.

Los rastreos afectan al rendimiento del servidor de base de datos porque el servicio de búsqueda de Office SharePoint Server escribe todos los metadatos recopilados de los documentos rastreados en tablas de base de datos. Es posible que el servidor o los servidores de índices generen datos a una velocidad que pueda sobrecargar el servidor de base de datos.

Debería realizar sus propias pruebas para compensar la velocidad de rastreo, la latencia de red, la carga de la base de datos y la carga de los repositorios de contenido que se rastrean.

En la tabla siguiente se muestra la relación entre la configuración de nivel de rendimiento y el uso de CPU en los servidores de índices y de base de datos sometidos a prueba.

Configuración de nivel de rendimiento Porcentaje de uso de CPU del servidor de índices Porcentaje de uso de CPU del servidor de base de datos

Reducido

20

20

Parcialmente reducido

24

24

Máximo

25

26

Tenga en cuenta los escenarios y las recomendaciones siguientes para la configuración del nivel de rendimiento:

  • Si el servidor de índices y los servidores de base de datos se usan sólo para el servicio de búsqueda de Office SharePoint Server, puede establecer el nivel en Máximo. Sin embargo, recomendamos que el incremento máximo del uso de la CPU del servidor de base de datos respecto a la actividad del servidor de índices no sea superior al 30%. Si el incremento de uso de la CPU del servidor de base de datos supera el 30% cuando el nivel de rendimiento está establecido en Máximo, recomendamos establecer el nivel de rendimiento en el siguiente valor más bajo.

  • Si el servidor de aplicaciones y el servidor de base de datos se usan en varios servicios compartidos, como el servicio de búsqueda de Office SharePoint Server y Excel Calculation Services, recomendamos que seleccione una configuración de nivel de rendimiento inferior. Sin embargo, al reducir la actividad de indización máxima permitida se reduce la velocidad a la que se indizan los elementos, lo que puede generar resultados de búsqueda obsoletos. Supervise el rendimiento del servidor local para determinar mejor el nivel de rendimiento adecuado para el servidor de índices.

Realice el procedimiento siguiente para configurar el nivel de rendimiento del servidor de índices.

Ajuste del rendimiento del servidor de índices

  1. Haga clic en Inicio, elija Todos los programas, elija Microsoft Office Server y, a continuación, haga clic en Administración central de SharePoint 3.0.

  2. En la página principal de Administración central, haga clic en Operaciones.

  3. En la página Operaciones, en la sección Topología y servicios, haga clic en Servicios del servidor.

  4. En la página Servicios del servidor, en el menú Servidor, seleccione el servidor de índices que desea administrar.

  5. En la sección Inicie los servicios de la tabla siguiente, haga clic en Office SharePoint Server Search.

  6. En la página Configuración del servicio de búsqueda de Office SharePoint Server en el servidor, en la sección Rendimiento de indizador, seleccione el nivel de rendimiento que desee aplicar.

  7. Haga clic en Aceptar para guardar los cambios.

Reglas de impacto del rastreador

Las reglas de impacto del rastreador son valores de configuración de la búsqueda en el nivel de la granja de servidores que especifican el número de solicitudes simultáneas que el servicio de búsqueda de Office SharePoint Server genera al realizar operaciones de rastreo con el origen de contenido especificado. Cuanto mayor sea el número de solicitudes simultáneas, mayor será la velocidad de rastreo. Tenga en cuenta que la frecuencia de las solicitudes especificada en una regla de impacto del rastreador afecta directamente a la carga del servidor de base de datos y a la carga del servidor que hospeda el contenido que se rastrea. Si se aumenta la frecuencia de las solicitudes para un sitio determinado, se deben supervisar detenidamente los servidores que se van a rastrear para evaluar si esta mayor carga es aceptable.

El valor predeterminado es el número de procesos del servidor de índices. Por lo tanto, para un equipo con cuatro procesadores, el valor predeterminado es ocho. Recomendamos que ajuste el valor y mida la carga del servidor de destino para determinar el número óptimo de solicitudes simultáneas. Puede seleccionar el número de solicitudes simultáneas entre estos valores disponibles: 1, 2, 4, 8, 16, 32 y 64.

Además, se puede crear una regla para solicitar un documento cada vez y esperar el número de segundos especificado entre las solicitudes. Esta regla puede ser útil para rastrear un sitio que tenga una carga de usuarios constante.

En la tabla siguiente se muestra la relación entre el número de solicitudes simultáneas y el uso de CPU en los servidores de índices y de base de datos.

Número de subprocesos de rastreo Porcentaje de uso de CPU del servidor de índices Porcentaje de uso de CPU del servidor de base de datos

4

35

12

8

40

15

12

45

15

16

60

20

Para crear una regla de impacto del rastreador, realice el procedimiento siguiente.

Creación de reglas de impacto del rastreador

  1. Haga clic en Inicio, elija Todos los programas, elija Microsoft Office Server y, a continuación, haga clic en Administración central de SharePoint 3.0.

  2. En la página principal de Administración central, haga clic en Administración de aplicaciones.

  3. En la página Administración de aplicaciones, en la sección Búsqueda, haga clic en Administrar el servicio de búsqueda.

  4. En la página Administrar el servicio de búsqueda, en la sección Configuración de búsqueda en granjas de servidores, haga clic en Reglas de impacto del rastreador.

  5. En la página Reglas de impacto del rastreador, haga clic en Agregar regla.

  6. En la página Agregar regla de impacto del rastreador, en la sección Sitio, escriba el nombre del sitio para el que desea crear una regla. No incluya el protocolo (por ejemplo, http://).

  7. En la sección Frecuencia de solicitudes , especifique la frecuencia con la que el rastreador solicitará documentos de este sitio.

    1. Para que se soliciten simultáneamente varios documentos, seleccione Solicitar simultáneamente el número de documentos especificado como máximo y no esperar entre solicitudes y, a continuación, seleccione el valor que desee en la lista Solicitudes simultáneas.

    2. Para que se solicite un documento cada vez, seleccione Solicitar documentos de uno en uno y esperar el tiempo especificado entre solicitudes y, a continuación, escriba el número de segundos que se debe esperar entre las solicitudes en el cuadro Tiempo de espera (en segundos).

  8. Haga clic en Aceptar para crear la regla.

Determinación de las especificaciones de los servidores de consultas

Use la información de esta sección para determinar las especificaciones de los servidores de consultas de una granja de servidores de Office SharePoint Server 2007.

Memoria del servidor de consultas

Cuanta más memoria esté disponible, menos veces necesitará tener acceso al disco duro el servicio de búsqueda de Office SharePoint Server para ejecutar una consulta determinada. Una cantidad de memoria adecuada también aumenta la eficacia del almacenamiento en la memoria caché. Lo ideal es instalar en los servidores de consultas memoria suficiente para dar cabida al índice completo.

En la ilustración siguiente se muestra la relación entre el tamaño del índice en los servidores de consultas y el tiempo de respuesta de usuario por consulta.

Análisis de rendimiento y capacidad para la búsqueda

Velocidad de disco del servidor de consultas

Se recomienda usar RAID 10 para escrituras rápidas de disco.

Número de servidores de consultas

Puede implementar varios servidores de consultas en la granja de servidores para obtener redundancia y equilibrio de carga. El número de servidores de consultas que use dependerá de cuántos usuarios estén presentes en la granja de servidores y de la carga prevista en los períodos de máxima actividad. Hemos probado hasta ocho servidores de consultas por granja de servidores.

En la ilustración siguiente se muestra el rendimiento de las consultas, el porcentaje de uso de CPU del servidor de base de datos para la base de datos de búsqueda y el porcentaje de uso de CPU del servidor de consultas a medida que se agregan servidores de consultas a la granja de servidores. En la prueba en la que se generaron estos datos, el servidor de base de datos se compartía entre bases de datos de contenido y bases de datos de servicios.

Gráfico de rendimiento del servidor de búsqueda

Latencia del servidor remoto

La latencia del servidor es un factor clave que afecta al rendimiento del rastreo. Es importante equilibrar el rendimiento entre los servidores de la granja para que el rendimiento general de las operaciones de rastreo alcance todo su potencial. Por ejemplo, un servidor de índices eficaz puede funcionar al 25% de su capacidad si el servidor de base de datos que se rastrea no puede responder lo suficientemente rápido. En este caso, se puede aumentar la capacidad (escalar en vertical) el servidor de base de datos, lo que a su vez aumentará la velocidad de rastreo en toda la granja de servidores.

Debe realizar sus propias pruebas para evaluar la capacidad de respuesta de los servidores de su entorno. El servidor de base de datos que atiende la granja de servidores de destino suele ser el cuello de botella cuando el rendimiento del rastreo es deficiente. Para mejorar el rendimiento del rastreo, puede:

  • Escalar en vertical el hardware del servidor de base de datos al agregar o actualizar los procesadores, agregar memoria y cambiar a discos duros con tiempos de búsqueda y escritura más rápidos.

  • Aumentar la memoria de los servidores de consultas de la granja de servidores

  • Realizar las operaciones de rastreo durante los períodos de menos actividad para que el servidor de base de datos que se rastrea pueda atender el tráfico de los usuarios durante el día y responder a las operaciones de rastreo durante las horas de menos actividad.

Determinación de las especificaciones de los servidores de base de datos

El sistema de búsqueda de Office SharePoint Server 2007 rastrea tanto datos de texto como los metadatos asociados al contenido. En Office SharePoint Portal Server 2003, todos los metadatos recopilados por el sistema de indización se guardaban en un almacén de propiedades de base de datos JET. En Office SharePoint Server 2007, el índice de texto invertido se almacena en el servidor de índices y los metadatos se almacenan en la base de datos de búsqueda. El servidor de índices escribe los metadatos en la base de datos y los servidores de consultas leen los datos para procesar las consultas basadas en propiedades ejecutadas por los usuarios.

Use la información de esta sección para determinar las especificaciones de los servidores de base de datos de una granja de servidores de Office SharePoint Server 2007.

Rendimiento de la base de datos

El almacén de metadatos de la base de datos se comparte entre el servidor de índices y todos los servidores de consultas de la granja de servidores. El servidor de índices escribe todos los metadatos y los servidores de consultas leen estos datos para procesar las solicitudes de búsqueda. El rendimiento de las consultas depende en gran medida de la capacidad de respuesta del almacén de metadatos.

A medida que aumenta el número de servidores de consultas de la granja de servidores, también aumenta la carga del servidor de base de datos, lo que afecta al rendimiento de las consultas en general. Debe supervisar cuidadosamente el servidor de base de datos cuando agregue servidores de índices o de consultas a la granja de servidores para asegurarse de que el rendimiento de la base de datos se mantiene en el nivel adecuado.

Distribución del disco duro del servidor de base de datos

Dado que el servicio de búsqueda de Office SharePoint Server escribe una gran cantidad de datos en la base de datos de búsqueda durante las operaciones de rastreo, recomendamos que se usen cilindros de disco independientes para las bases de datos SharedServices_Search_Db, SharedServices_Db y TempDb para aumentar el rendimiento en los escenarios en los que el índice contiene más de 5 millones de elementos.

Velocidad de disco del servidor de base de datos

Se recomienda usar RAID 10 para escrituras rápidas de disco.

Descarga de este libro

En este tema se incluye el siguiente libro descargable para facilitar la lectura y la impresión:

Vea la lista completa de libros disponibles en la página que muestra el contenido descargable para Office SharePoint Server 2007.

Vea también

Conceptos

Configuración de un servidor cliente web dedicado para el rastreo (Office SharePoint Server 2007)