Planeación del rastreo de contenido (Office SharePoint Server)

En este artículo:

  • Rastreo e indización del contenido

  • Identificación de los orígenes de contenido que se desean rastrear

  • Planeación de los orígenes de contenido

  • Planeación de la autenticación

  • Planeación de los controladores de protocolo

  • Planeación de la administración del impacto del rastreo

  • Planeación de las reglas de rastreo

  • Planeación de la configuración de búsqueda que se administra en el nivel de granja de servidores

  • Indización del contenido en idiomas diferentes

  • Hoja de trabajo

El objeto de este artículo es ayudar a los administradores del servicio de búsqueda a comprender el rastreo y la indización de contenido en Microsoft Office SharePoint Server 2007 y a planear el rastreo de contenido.

Para que los usuarios finales puedan usar la funcionalidad de búsqueda empresarial de Office SharePoint Server 2007 para realizar búsquedas de contenido, primero es necesario rastrear el contenido que se desea que esté disponible para que consulten los usuarios.

Para el propósito de este artículo, contenido es cualquier elemento que se puede rastrear, como una página web, un documento de Microsoft Office Word, datos profesionales o un archivo de mensaje de correo electrónico.

Cuando planee el rastreo de contenido, plantéese las preguntas siguientes:

  • ¿Cuál es la ubicación física del contenido que desea rastrear?

  • ¿Parte del contenido que desea rastrear se encuentra almacenado en tipos de orígenes diferentes, como recursos compartidos de archivos, sitios de SharePoint, sitios web u otros lugares?

  • ¿Desea rastrear todo el contenido de orígenes específicos o sólo una parte?

  • ¿Qué tipos de archivos componen el contenido que desea rastrear?

  • ¿Cuándo y con qué frecuencia debería rastrear el contenido?

  • ¿Cómo se protege este contenido?

Use la información de este artículo para responder a estas preguntas y tomar las decisiones de planeación necesarias sobre el contenido que desea rastrear y cómo y cuándo desea rastrearlo.

En determinados puntos clave de este artículo le pediremos que rellene una sección de una hoja de trabajo que guarda relación con la información que ha leído. Puede ir registrando sus decisiones en la hoja de trabajo mientras trabaja con este artículo o puede hacerlo al final. De una u otra forma, la hoja de trabajo completada le será útil cuando implemente la solución de búsqueda.

Nota

En este artículo se describe el proceso de planeación para rastrear e indizar contenido en un índice. Si, mientras planea cómo rastrear el contenido, descubre que desea usar un índice de contenido adicional, registre sus decisiones de diseño para cada proveedor de servicios compartidos (SSP) en una hoja de trabajo distinta.

Office SharePoint Server 2007 incluye el servicio Office SharePoint Server Search, que se usa para rastrear e indizar contenido. Este servicio forma parte de un SSP y todo el contenido rastreado mediante un SSP determinado se indiza en un solo índice. Para obtener información acerca de cómo elegir el número de SSP que hay que usar para indizar contenido, vea Planeación de los proveedores de servicios compartidos.

Rastreo e indización del contenido

El rastreo y la indización del contenido es el proceso a través del cual el sistema tiene acceso y analiza el contenido y sus propiedades, a veces denominadas metadatos, para generar un índice de contenido a partir del cual se pueden resolver las consultas de búsqueda.

Si el contenido se rastrea correctamente, el rastreador tiene acceso y lee los archivos o fragmentos de contenido individuales que se desea que estén disponibles para las consultas de búsqueda. Las palabras clave y los metadatos de esos archivos se almacenan en el índice de contenido, que en ocasiones también se denomina índice. El índice está formado por las palabras clave que están almacenadas en el sistema de archivos del servidor de índices y los metadatos que se almacenan en la base de datos de búsqueda. El sistema mantiene una asignación entre las palabras clave, los metadatos asociados a los fragmentos de contenido individuales en los que se rastrean las palabras clave y la dirección URL del origen desde el que se rastreó el contenido.

Nota

El rastreador no efectúa ningún cambio en los archivos de los servidores host, sino que simplemente tiene acceso a ellos y los lee; el texto y los metadatos de esos archivos se envían al servidor de índices para su indización. Sin embargo, dado que el rastreador lee el contenido del servidor host, algunos servidores que hospedan ciertos orígenes de contenido podrían actualizar la fecha de último acceso de los archivos que han sido rastreados.

Identificación de los orígenes de contenido que se desean rastrear

En muchos casos, es posible que las necesidades de la organización requieran que simplemente se rastree todo el contenido de los sitios de SharePoint de la granja de servidores de la organización. En ese caso, no sería necesario identificar los orígenes de contenido que se desean rastrear, ya que todas las colecciones de sitios de una granja de servidores se pueden rastrear con el origen de contenido predeterminado. Para obtener más información acerca del origen de contenido predeterminado, vea Planeación de los orígenes de contenido más adelante en este artículo.

Muchas organizaciones también necesitan rastrear contenido situado fuera de la granja de servidores, como recursos compartidos de archivos o sitios web en Internet. Office SharePoint Server 2007 puede rastrear e indizar contenido hospedado en otros Windows SharePoint Services o en granjas de servidores de Office SharePoint Server, sitios web, recursos compartidos de archivos, carpetas públicas de Microsoft Exchange, servidores de IBM Lotus Notes y datos profesionales que se almacenan en bases de datos. Esto aumenta considerablemente la cantidad de contenido para el que se pueden realizar consultas de búsqueda.

Sin embargo, en muchos casos es posible que no se desee rastrear todas las colecciones de sitios de la granja de servidores, ya que el contenido almacenado en algunas colecciones de sitios podría no ser relevante en los resultados de búsqueda. En este caso, debe realizar una de estas acciones, o ambas:

  • Tome nota de las colecciones de sitios que no desea rastrear. Si decide usar el origen de contenido predeterminado, debe asegurarse de que las direcciones de inicio de las colecciones de sitios que no desea rastrear no aparecen en el origen de contenido predeterminado.

  • Tome nota de cada una de las direcciones de inicio de las colecciones de sitios que no desea rastrear. Si decide crear orígenes de contenido adicionales para usarlos para rastrear este contenido, necesita conocer las direcciones de inicio. Dispone de información sobre cuándo se debe usar uno o más orígenes de contenido en la sección Planeación de los orígenes de contenido de este artículo.

Con la Actualización de infraestructura para servidores de Microsoft Office instalada, existen dos formas de procesar las consultas de búsqueda para devolver los resultados de la búsqueda a los usuarios. Puede consultar el índice de contenido de Search Server o puede usar la búsqueda federada.

Sugerencia

Tenga en cuenta que la Actualización de infraestructura para servidores de Microsoft Office proporciona a Office SharePoint Server 2007 la capacidad de realizar búsquedas federadas, presentada por primera vez en Search Server 2008.

Cada enfoque tiene sus ventajas. Para obtener información acerca de la comparación de estos dos enfoques para procesar consultas de búsqueda, vea la introducción a la búsqueda federada (en inglés) (https://go.microsoft.com/fwlink/?linkid=122651&clcid=0xC0A) (en inglés). Para obtener acceso a una lista y una breve descripción de los artículos acerca de la comprensión y el uso de la federación, vea Trabajo con la federación (Office SharePoint Server). Para obtener más información acerca de la actualización de la infraestructura para servidores de Microsoft Office, vea Instalación de la Actualización de infraestructura para los servidores de Microsoft Office system (Office SharePoint Server 2007).

Planeación de los orígenes de contenido

Para poder rastrear contenido, antes debe determinar dónde se encuentra y en qué tipos de servidores se hospeda. Una vez recopilada esta información, un administrador de servicios compartidos puede crear uno o varios orígenes de contenido para usarlos para rastrear el contenido. Estos orígenes de contenido proporcionan la información siguiente al rastreador durante la operación de rastreo:

  • Tipo de contenido que se desea rastrear (por ejemplo, un sitio de SharePoint o un recurso compartido de archivos).

  • Dirección de inicio a partir de la cual iniciar el rastreo.

  • Comportamiento que se usará en el rastreo (por ejemplo, hasta qué profundidad se rastreará desde la dirección de inicio o cuántos saltos de servidor se permitirán).

  • Programación de rastreo.

Nota

En ocasiones, rastrear contenido con un origen de contenido concreto se denomina "rastrear el origen de contenido".

Esta sección ayuda a planear los orígenes de contenido que requiere la organización.

El origen de contenido predeterminado se llama Sitios locales de Office SharePoint Server. Los administradores de servicios compartidos pueden usar este origen de contenido para rastrear e indizar todo el contenido de todas las aplicaciones web asociadas con el SSP. De forma predeterminada, Office SharePoint Server 2007 agrega la dirección de inicio (en este caso, una dirección URL) del sitio de nivel superior de cada colección de sitios creada en la aplicación web que usa el mismo SSP al origen de contenido predeterminado.

Para algunas organizaciones, el simple uso del origen de contenido predeterminado para rastrear todos los sitios de las colecciones de sitios satisface sus requisitos de búsqueda, pero muchas organizaciones necesitan orígenes de contenido adicionales.

En ocasiones es necesario crear orígenes de contenido adicionales para:

  • Rastrear distintos tipos de contenido.

  • Rastrear contenido según una programación diferente a la de otro contenido.

  • Limitar o aumentar la cantidad de contenido que se rastrea.

Los administradores de servicios compartidos pueden crear hasta 500 orígenes de contenido en cada SSP y cada origen de contenido puede contener hasta 500 direcciones de inicio. Para hacer que la administración sea lo más sencilla posible, sólo debe crear los orígenes de contenido que sean absolutamente necesarios.

Rastreo de distintos tipos de contenido

Sólo se puede rastrear un tipo de contenido por origen de contenido. Dicho de otro modo, se puede crear un origen de contenido que incluya direcciones URL para sitios de SharePoint y otro que incluya direcciones URL para recursos compartidos de archivos, pero no se puede crear un solo origen de contenido que incluya direcciones URL para sitios de SharePoint y recursos compartidos de archivos. En la tabla siguiente se enumeran los tipos de orígenes de contenido que se pueden configurar.

Este tipo de origen de contenido Incluye este tipo de contenido

Sitios de SharePoint

Sitios de SharePoint de la misma granja de servidores o granjas de servidores de Office SharePoint Server 2007, Windows SharePoint Services 3.0 o diferentes

Sitios de SharePoint de Microsoft Office SharePoint Portal Server 2003 o de granjas de servidores de Microsoft Windows SharePoint Services 2.0

Nota

A diferencia de lo que sucede cuando se rastrean sitios de SharePoint en Office SharePoint Server 2007, Windows SharePoint Services 3.0 o , el rastreador no puede rastrear automáticamente todos los subsitios de una colección de sitios de versiones anteriores de Productos y Tecnologías de SharePoint. Por lo tanto, al rastrear sitios de SharePoint de versiones anteriores, se debe especificar la dirección URL de cada sitio de nivel superior y cada subsitio que se desee rastrear. Los sitios enumerados en el Directorio de sitios de granjas de servidores de Microsoft Office SharePoint Portal Server 2003 se rastrean al mismo tiempo que el sitio del portal. Para obtener más información sobre el Directorio de sitios, vea la página acerca del Directorio de sitios (en inglés) (https://go.microsoft.com/fwlink/?linkid=88227&clcid=0xC0A) (en inglés)

Sitios web

Otro contenido web en su organización que no se encuentre en sitios de SharePoint

Contenido en sitios web de Internet

Recursos compartidos de archivos

Contenido en recursos compartidos de archivos de la organización

Carpetas públicas de Exchange

Contenido de Microsoft Exchange Server

Lotus Notes

Mensajes de correo electrónico almacenados en bases de datos Lotus Notes

Nota

A diferencia de todos los demás tipos de orígenes de contenido, la opción de origen de contenido de Lotus Notes no aparece en la interfaz de usuario hasta que haya instalado y configurado el software de requisitos previos adecuado. Para obtener más información, vea Configuración del servicio de búsqueda de Office SharePoint Server para rastrear Lotus Notes (Office SharePoint Server 2007).

Datos profesionales

Datos profesionales almacenados en aplicaciones de línea de negocio

Planeación de los orígenes de contenido para datos profesionales

Los orígenes de contenido de datos profesionales requieren que las aplicaciones que hospedan los datos estén registradas antes en el Catálogo de datos profesionales. Debe crear uno o más orígenes de contenido independientes de los tipos de orígenes de contenido de datos profesionales para rastrear datos profesionales. Puede crear un origen de contenido para rastrear todas las aplicaciones registradas en el Catálogo de datos profesionales, o puede crear orígenes de contenido independientes para rastrear aplicaciones individuales registradas en el Catálogo de datos profesionales.

A menudo, las personas que planean la integración de los datos profesionales en sus colecciones de sitios no son las mismas personas implicadas en el proceso de planeación de contenido general. Por lo tanto, incluya a los administradores de aplicaciones profesionales en sus equipos de planeación de contenido para que puedan aconsejarle cómo integrar sus datos en su otro contenido y presentarlo de forma eficaz en las colecciones de sitios.

Para obtener información adicional acerca de la planeación de la búsqueda de datos profesionales, vea Planeación de la búsqueda de datos profesionales.

Rastreo de contenido según programaciones diferentes

Los administradores de servicios compartidos a menudo deben decidir si un contenido se rastrea más frecuentemente que otro. Cuanto mayor sea el volumen de contenido que se rastrea, existen más probabilidades de que se rastree contenido de orígenes diferentes, que podrían ser o no ser del mismo tipo y estar hospedados en servidores de velocidad diferente.

Estos factores aumentan las posibilidades de que se requieran orígenes de contenido adicionales para rastrear el contenido diferente en momentos diferentes.

Entre las razones principales por las que el contenido se deba rastrear según programaciones diferentes, se pueden citar las siguientes:

  • Para admitir los períodos de inactividad y de uso máximo.

  • Para rastrear con más frecuencia el contenido que se actualiza más a menudo.

  • Para rastrear el contenido hospedado en servidores host más lentos en un proceso independiente del contenido de servidores host más rápidos.

En muchos casos no es posible conocer toda esta información hasta después de implementar Office SharePoint Server 2007 y usarlo durante algún tiempo. Algunas de estas decisiones se toman durante la fase de operaciones. Sin embargo, recomendamos tener en cuenta estos factores durante la planeación para anticipar las programaciones de rastreo según la información que esté disponible.

En las dos secciones siguientes se proporciona más información sobre el rastreo de contenido según programaciones diferentes.

Períodos de inactividad y de uso máximo

Tenga en cuenta los períodos de inactividad y de uso máximo de los servidores que hospedan el contenido que desea rastrear. Por ejemplo, si va a rastrear contenido hospedado en muchos servidores diferentes fuera de la granja de servidores, es probable que las copias de seguridad de estos servidores se realicen según programaciones diferentes y tengan distintos períodos de uso máximo. Lo normal es que no pueda controlar la administración de los servidores que no pertenecen a su granja de servidores, por lo que es recomendable que coordine las operaciones de rastreo con los administradores de los servidores que hospedan el contenido que desea rastrear para asegurarse de que no intenta rastrear contenido en sus servidores durante períodos de inactividad o de uso máximo.

Es habitual que el contenido que se encuentra fuera del control de su organización esté relacionado con el contenido de sus sitios de SharePoint. Puede agregar las direcciones de inicio de este contenido a un origen de contenido existente o crear un nuevo origen de contenido para el contenido externo. Como la disponibilidad de los sitios externos varía considerablemente, resulta útil agregar orígenes de contenido independientes para el contenido externo diferente. De esta forma, los orígenes del contenido externo se pueden rastrear en un momento distinto al de los demás orígenes de contenido. Después, puede actualizar el contenido externo según una programación de rastreo que tenga en cuenta la disponibilidad de cada sitio.

Contenido que se actualiza con frecuencia

Cuando planee las programaciones de rastreo, tenga en cuenta que algunos orígenes de contenido suelen actualizarse con más frecuencia que otros. Por ejemplo, si sabe que el contenido de algunas colecciones de sitios u orígenes externos se actualiza solamente los viernes, malgastaría recursos si rastrease el contenido más de una vez a la semana. Sin embargo, es posible que la granja de servidores contenga otras colecciones de sitios que se actualizan continuamente de lunes a viernes, pero no los sábados o los domingos. En este caso, podría ser conveniente realizar el rastreo varias veces al día, pero solamente una vez o dos los fines de semana.

La manera en que se almacena el contenido en las colecciones de sitios del entorno puede servirle de guía para crear orígenes de contenido adicionales para cada colección de sitios de cada aplicación web. Por ejemplo, si una colección de sitios almacena solamente información archivada posiblemente no necesite rastrear ese contenido con tanta frecuencia como una colección de sitios que almacene contenido que se actualiza a menudo. En este caso, rastrearía las dos colecciones de sitios con orígenes de contenido diferentes para poder usar distintas programaciones y no tener que rastrear los sitios de información archivada con tanta frecuencia como el resto del contenido.

Programaciones de rastreo completas e incrementales

Los administradores de servicios compartidos pueden configurar las programaciones de rastreo de manera independiente para cada origen de contenido. Pueden especificar, para cada origen de contenido, una hora para realizar rastreos completos y otra hora para realizar rastreos incrementales. Recuerde que es necesario realizar primero un rastreo completo de un origen de contenido dado para poder realizar uno incremental. Si elige realizar un rastreo incremental de contenido que todavía no se ha rastreado, el sistema realizará un rastreo completo.

Nota

Dado que un rastreo completo rastrea todo el contenido que el rastreador haya encontrado y para el que tenga acceso de lectura como mínimo, independientemente de si ya se ha rastreado previamente, los rastreos completos tardan bastante más en completarse que los incrementales.

Es recomendable que planee las programaciones de rastreo teniendo en cuenta la disponibilidad, el rendimiento y el ancho de banda de los servidores en los que se ejecuta el servicio de búsqueda y los servidores que hospedan el contenido rastreado.

Cuando planee las programaciones de rastreo, tenga presentes los siguientes procedimientos recomendados:

  • Agrupe las direcciones de inicio de los orígenes de contenido según una disponibilidad similar y con un uso de recursos generales aceptable para los servidores que hospedan el contenido.

  • Programe rastreos incrementales para cada origen de contenido durante períodos en los que los servidores que hospedan el contenido estén disponibles pero cuya demanda de recursos sea baja.

  • Escalone las programaciones de rastreo para que la carga en los servidores de la granja de servidores se distribuya en el tiempo.

  • Programe rastreos completos sólo cuando sea necesario, por las razones expuestas en la sección siguiente. Es recomendable que los rastreos completos sean menos frecuentes que los incrementales.

  • Programe los cambios de administración que requieran un rastreo completo de forma que tengan lugar poco antes de la programación de rastreos completos que ha planeado. Por ejemplo, es recomendable que intente programar la creación de la regla de rastreo antes del siguiente rastreo completo programado de forma que no sea necesario realizar otro rastreo completo.

  • Programe los rastreos simultáneos según la capacidad que tenga el servidor de índices. La recomendación es que escalone las programaciones de rastreo de forma que el servidor de índices no rastree usando varios orígenes de contenido al mismo tiempo. Para que el rendimiento sea óptimo, es conveniente que escalone las programaciones de rastreo de los orígenes de contenido. El rendimiento del servidor de índices y de los servidores que hospedan el contenido determina hasta qué punto se pueden superponer los rastreos. Con el tiempo, según se vaya familiarizando con lo que suelen durar los rastreos para cada origen de contenido, estará preparado para desarrollar una estrategia de programación.

Razones para realizar un rastreo completo

Las razones por las cuales un administrador del servicio de búsqueda puede realizar un rastreo completo son:

  • Se instalaron uno o varios Service Pack o revisiones en servidores de la granja de servidores. Para obtener más información, consulte las instrucciones de la revisión o Service Pack.

  • Un administrador de SSP agregó una nueva propiedad administrada.

  • Para volver a indizar páginas ASPX en sitios de Windows SharePoint Services 3.0 o Office SharePoint Server 2007.

    Nota

    El rastreador no puede detectar cuándo han cambiado las páginas ASPX en los sitios de Windows SharePoint Services 3.0 o Office SharePoint Server 2007. Por ello, en los rastreos incrementales no se vuelven a indizar las vistas o páginas principales cuando se eliminan elementos de lista individuales. Es recomendable que realice periódicamente rastreos completos de los sitios que contengan archivos ASPX para asegurarse de que estas páginas se vuelven a indizar.

  • Para solucionar errores consecutivos en los rastreos incrementales. En algunos casos aislados, si un rastreo incremental genera un error cientos de veces seguidas en cualquier nivel de un repositorio, el servidor de índices quita el contenido afectado del índice.

  • Se han agregado, eliminado o modificado reglas de rastreo.

  • Para reparar un índice dañado.

  • El administrador de los servicios de búsqueda ha creado una o más asignaciones de nombres de servidor.

  • La cuenta asignada a la regla de rastreo o cuenta de acceso a contenido predeterminado ha cambiado.

El sistema realiza un rastreo completo cuando se solicita un rastreo incremental en las siguientes circunstancias:

  • Un administrador de SSP detuvo el rastreo anterior.

  • Se restauró una base de datos de contenido de la copia de seguridad.

    Nota

    Si está ejecutando la Actualización de infraestructura para servidores de Microsoft Office, puede utilizar la operación restore de la herramienta de línea de comandos stsadm para cambiar si una restauración de base de datos de contenido causa un rastreo completo.

  • Un administrador de granja de servidores ha separado y vuelto a adjuntar una base de datos de contenido.

  • Nunca se ha realizado un rastreo completo del sitio.

  • El registro de cambios no contiene entradas para las direcciones que se están rastreando. Sin entradas en el registro de cambios de los elementos que se están rastreando, no se pueden realizar rastreos incrementales.

  • La cuenta asignada a la regla de rastreo o cuenta de acceso a contenido predeterminado ha cambiado.

  • Para reparar un índice dañado.

    En función de la gravedad del daño, el sistema puede intentar realizar un rastreo completo si se detecta que el índice está dañado.

Puede ajustar las programaciones después de la implementación inicial basándose en el rendimiento y la capacidad de los servidores en la granja de servidores y los servidores que hospedan el contenido.

Acción de hoja de trabajo

Registre las decisiones que tome sobre los orígenes de contenido para la implementación inicial en las tablas de la sección Orígenes de contenido de la hoja de trabajo del plan de rastreo de contenido (en inglés) (https://go.microsoft.com/fwlink/?linkid=73748&clcid=0xC0A) (en inglés).

Limitación o aumento de la cantidad de contenido que se rastrea

Es posible seleccionar el grado de rastreo de las direcciones de inicio de cada origen de contenido. También se especifica el comportamiento de rastreo, lo que a veces se conoce como configuración de rastreo. Las opciones que se pueden elegir para un origen de contenido concreto varían en función del tipo de origen de contenido que se seleccione. No obstante, la mayoría de las opciones determinan la profundidad de la jerarquía que se rastrea a partir de cada dirección de inicio enumerada en el origen de contenido. Tenga en cuenta que este comportamiento se aplica a todas las direcciones de inicio de un origen de contenido determinado. Si es necesario rastrear algunos sitios en mayor profundidad, se pueden crear orígenes de contenido adicionales que abarquen esos sitios.

Las opciones disponibles en las propiedades de cada origen de contenido varían en función del tipo de origen de contenido que se seleccione. En la tabla siguiente se describen las opciones de configuración del rastreo para cada tipo de origen de contenido.

Tipo de origen de contenido Opciones de configuración del rastreo

Sitios de SharePoint

Todo lo que se encuentre bajo el nombre de host de cada dirección de inicio

Sólo el sitio de SharePoint de cada dirección de inicio

Sitios web

Sólo en el servidor de cada dirección de inicio

Sólo la primera página de cada dirección de inicio

Personalizado (se especifica la profundidad de página y el número de saltos de servidor).

Nota

El valor predeterminado de esta opción es una profundidad de página y un número de saltos de servidor ilimitados.

Recursos compartidos de archivos

La carpeta y todas las subcarpetas de cada dirección de inicio

Sólo la carpeta de cada dirección de inicio

Carpetas públicas de Exchange

La carpeta y todas las subcarpetas de cada dirección de inicio

Sólo la carpeta de cada dirección de inicio

Datos profesionales

Rastrear todo el Catálogo de datos profesionales

Rastrear las aplicaciones seleccionadas

Como demuestra la tabla anterior, los administradores de servicios compartidos pueden usar opciones de configuración de rastreo para limitar o aumentar la cantidad de contenido que se rastrea.

En la tabla siguiente se describen los procedimientos recomendados para definir las opciones de configuración del rastreo.

Para este tipo de origen de contenido En estas circunstancias Use esta opción de configuración de rastreo

Sitios de SharePoint

Desea incluir el contenido del propio sitio.

O bien,

No desea incluir el contenido disponible en los subsitios o desea rastrearlos según una programación diferente.

Rastrear sólo el sitio de SharePoint de cada dirección de inicio

Sitios de SharePoint

Desea incluir el contenido del propio sitio.

O bien,

Desea rastrear todo el contenido situado bajo la dirección de inicio según la misma programación.

Rastrear todo lo que se encuentre bajo el nombre de host de cada dirección de inicio

Sitios web

El contenido del propio sitio es relevante.

O bien,

El contenido disponible en los sitios vinculados seguramente no sea relevante.

Rastrear sólo en el servidor de cada dirección de inicio

Sitios web

El contenido relevante se encuentra solamente en la primera página.

Rastrear sólo la primera página de cada dirección de inicio

Sitios web

Desea limitar la profundidad de rastreo de los vínculos en las direcciones de inicio.

Personalizado (especifique el número de niveles de páginas y el número de saltos de servidor que se deben rastrear)

Nota

Es recomendable que comience con un número pequeño en un sitio con muchas conexiones, ya que, si especifica una profundidad de más de tres páginas o más de tres saltos de servidor, se podría rastrear todo Internet.

Recursos compartidos de archivos

Carpetas públicas de Exchange

El contenido disponible en las subcarpetas seguramente no sea relevante.

Rastrear sólo la carpeta de cada dirección de inicio

Recursos compartidos de archivos

Carpetas públicas de Exchange

El contenido de las subcarpetas seguramente sea relevante.

Rastrear la carpeta y subcarpeta de cada dirección de inicio

Datos profesionales

Todas las aplicaciones registradas en el Catálogo de datos profesionales tienen contenido relevante.

Rastrear todo el Catálogo de datos profesionales

Datos profesionales

No todas las aplicaciones registradas en el Catálogo de datos profesionales tienen contenido relevante.

O bien,

Desea rastrear algunas aplicaciones en una programación diferente.

Rastrear las aplicaciones seleccionadas

Planeación de los tipos de archivos incluidos e IFilters

El contenido se rastrea sólo si la extensión de nombre de archivo correspondiente forma parte de la lista de tipos de archivo incluidos y se ha instalado en el servidor de índices un IFilter que los admita. Durante la instalación inicial se incluyen automáticamente varios tipos de archivo. Cuando planee los orígenes de contenido en la implementación inicial, determine si el contenido que desea rastrear usa tipos de archivos que no están incluidos. En ese caso, deberá agregarlos en la página Administrar tipos de archivo durante la implementación y asegúrese de que se ha instalado y registrado un IFilter para admitir el tipo de archivo.

Office SharePoint Server 2007 proporciona varios IFilter, además de los que proporcionan Microsoft y otros fabricantes. Para obtener más información sobre el procedimiento de instalación y registro de los IFilter adicionales que están disponibles en Microsoft, vea el artículo acerca del registro de Microsoft Filter Pack con SharePoint Server 2007 y Search Server 2008 (https://go.microsoft.com/fwlink/?linkid=110532&clcid=0xC0A). Si es necesario, los programadores de software pueden crear IFilters para tipos de archivo nuevos.

Por otra parte, si desea excluir del rastreo algunos tipos de archivo, puede eliminar la extensión de nombre de archivo correspondiente de la lista de tipos de archivo incluidos. De esta forma, no se rastrearán los nombres de archivo que tengan esa extensión.

En la tabla siguiente se enumeran los tipos de archivo admitidos por los IFilters que se instalan de manera predeterminada y los tipos de archivo que están habilitados en la página Administrar tipos de archivo de manera predeterminada.

Extensión de nombre de archivo Compatible con IFilter de manera predeterminada Tipo de archivo incluido de manera predeterminada

ascx

asm

No

asp

aspx

bat

No

c

No

cmd

No

cpp

No

css

No

cxx

No

def

No

dic

No

doc

docm

docx

dot

eml

exch

No

h

No

hhc

No

hht

No

hpp

No

hta

No

htm

html

htw

No

htx

No

jhtml

No

jsp

No

lnk

No

mht

mhtml

mpx

No

msg

mspx

No

nsf

No

odc

one

No

No

php

No

pot

No

pps

No

ppt

pptm

pptx

pub

stm

No

tif

tiff

No

trf

No

txt

url

No

vdx

No

vsd

No

vss

No

vst

No

vsx

No

vtx

No

xlb

No

xlc

No

xls

xlsm

xlsx

xlt

No

xml

IFilters y Microsoft Office OneNote

No se proporciona un IFilter para la extensión de nombre de archivo .one usada por Microsoft Office OneNote. Si desea que los usuarios puedan buscar contenido en archivos de Office OneNote, deberá instalar un IFilter para OneNote. Para hacerlo, debe realizar una de las acciones siguientes:

Acción de hoja de trabajo

Registre las decisiones que tome sobre las inclusiones de tipos de archivo e IFilters para la implementación inicial en la sección Inclusiones de tipos de archivo e IFilters de la hoja de trabajo del plan de rastreo de contenido (en inglés) (https://go.microsoft.com/fwlink/?linkid=73748&clcid=0xC0A) (en inglés).

Limitación o exclusión de contenido mediante reglas de rastreo

Si agrega una dirección de inicio a un origen de contenido y acepta el comportamiento predeterminado, se rastrearán todos los subsitios o carpetas que se encuentren debajo de dicha dirección a menos que los excluya mediante una o varias reglas de rastreo.

Para obtener más información sobre las reglas de rastreo, vea Planeación de las reglas de rastreo más adelante en este artículo.

Otras consideraciones al planear orígenes de contenido

No puede rastrear las mismas direcciones mediante varios orígenes de contenido. Por ejemplo, si usa un origen de contenido determinado para rastrear una colección de sitios y todos sus subsitios, no podrá usar un origen de contenido diferente para rastrear uno de dichos subsitios por separado en otra programación. Para incluir esta restricción, es recomendable que rastree algunos de estos sitios por separados. Considere el escenario siguiente:

El administrador del SSP de Contoso desea rastrear http://contoso, el cual contiene los subsitios http://contoso/sites/site1 y http://contoso/sites/site2. Desea rastrear http://contoso/sites/site2 en una programación diferente que los demás sitios. Para ello, agrega las direcciones http://contoso y http://contoso/sites/site1 a un origen de contenido y selecciona la opción Rastrear sólo el sitio de SharePoint de cada dirección de inicio. A continuación, agrega http://contoso/sites/site2 a otro origen de contenido y especifica una programación diferente para dicho origen de contenido.

Además de rastrear las programaciones, existen otras cuestiones que deben tenerse en cuenta a la hora de planear orígenes de contenido. Por ejemplo, si agrupa direcciones de inicio en un solo origen de contenido o si crea orígenes de contenido adicionales para rastrear las direcciones de inicio que dependen principalmente de consideraciones administrativas. Con frecuencia, los administradores realizan cambios que requieren una actualización completa de un origen de contenido determinado. Los cambios realizados en un origen de contenido requieren un rastreo completo de dicho origen de contenido. Para facilitar la administración, organice los orígenes de contenido de modo que la actualización de orígenes de contenido, de reglas de rastreo y el rastreo de contenido resulten cómodos para los administradores.

Resumen de orígenes de contenido

Tenga en cuenta lo siguiente a la hora de planear orígenes de contenido:

  • Un origen de contenido determinado se puede usar para rastrear sólo uno de los siguientes tipos de contenido: sitios de SharePoint, sitios web que no son sitios de SharePoint, recursos compartidos de archivos, carpetas públicas de Exchange, bases de datos de Lotus Notes y datos profesionales.

  • Los administradores de servicios compartidos pueden crear hasta 500 orígenes de contenido en cada SSP y cada origen de contenido puede contener hasta 500 direcciones de inicio. Para hacer que la administración sea lo más sencilla posible, sólo debe crear los orígenes de contenido que sean absolutamente necesarios.

  • Cada dirección URL de un origen de contenido determinado debe ser del mismo tipo de origen de contenido.

  • En el caso de un origen de contenido determinado, puede elegir el alcance del rastreo desde las direcciones de inicio. Estas opciones de configuración se aplican a todas las direcciones de inicio del origen de contenido. Las opciones disponibles del alcance según el cual se pueden rastrear las direcciones de inicio varían según el tipo de origen de contenido que se seleccione.

  • Puede programar el momento en que se realizará un rastreo completo o incremental para todo el origen de contenido. Para obtener más información sobre la programación de rastreos, vea el apartado sobre las programaciones de rastreo que aparece anteriormente en este artículo.

  • Los administradores de los servicios compartidos pueden modificar el origen de contenido predeterminado, crear orígenes de contenido adicionales para el rastreo de otro contenido o bien pueden llevar a cabo ambas acciones. Por ejemplo, pueden configurar el origen de contenido predeterminado para rastrear también contenido en otra granja de servidores o pueden crear origen de contenido nuevo para rastrear otro contenido.

  • Para rastrear de forma eficaz todo el contenido necesario para la organización, use tantos orígenes de contenido como crea necesario para los tipos de orígenes que desee rastrear, así como para la frecuencia según la cual desea planear el rastreo de los mismos.

Planeación de la autenticación

Cuando el rastreador tenga acceso a las direcciones de inicio que aparecen en los orígenes de contenido, los servidores que hospedan dicho contenido deberá autenticar y conceder acceso al rastreador. Esto significa que la cuenta de dominio usada por el rastreador debe tener al menos el permiso de lectura para el contenido.

La cuenta predeterminada de acceso al contenido es la cuenta que se usa de forma predeterminada a la hora de rastrear orígenes de contenido. El administrador de los servicios compartidos se encarga de especificar esta cuenta. Como alternativa, puede usar las reglas de rastreo para especificar otra cuenta de acceso al contenido para usarla al rastrear un contenido determinado. Independientemente de si usa la cuenta predeterminada de acceso al contenido u otra cuenta de acceso al contenido especificado por una regla de rastreo, la cuenta de acceso al contenido que use deberá tener acceso de lectura para todo el contenido que se rastree. En caso contrario, el contenido no se rastreará y no estará disponible para las consultas.

Es recomendable que seleccione una cuenta predeterminada de acceso al contenido que tenga el acceso más amplio a la mayoría del contenido rastreado y sólo usar las demás cuentas de acceso al contenido cuando las consideraciones de seguridad requieran cuentas de acceso al contenido independientes. Para obtener más información sobre la creación de cuentas de acceso al contenido independientes para rastrear contenido que no puede leerse mediante la cuenta predeterminada de acceso al contenido, vea el apartado Planeación de las reglas de rastreo más adelante en este artículo.

Para cada origen de contenido que planee, identifique las direcciones de inicio a las que la cuenta predeterminada de acceso al contenido no puede tener acceso y planee agregar reglas de rastreo para los patrones de direcciones URL que abarquen dichas direcciones de inicio.

Nota

Asegúrese de que la cuenta de dominio usada para la cuenta predeterminada de acceso al contenido o cualquier otra cuenta de acceso al contenido no sea la misma cuenta de dominio usada por un grupo de aplicaciones asociado con la aplicación web que se rastrea. Al hacerlo, podría hacer que se rastreara e indexara contenido no publicado de sitios de SharePoint y versiones secundarias de archivos (historial) de los sitios de SharePoint.

Para obtener más información sobre las consideraciones relativas a la planeación de cuentas de acceso al contenido, vea el apartado Planeación de las reglas de rastreoque aparece más adelante en este artículo.

Acción de hoja de trabajo

Registre la cuenta de acceso a contenido predeterminada que el rastreador usará al rastrear contenido en la sección Cuenta predeterminada de acceso al contenido de la hoja de trabajo del plan de rastreo de contenido (en inglés) (https://go.microsoft.com/fwlink/?linkid=73748&clcid=0xC0A) (en inglés).

Otra consideración importante es que el rastreador debe usar el mismo modo de autenticación que el servidor host. De forma predeterminada, el rastreador intenta autenticar mediante la autenticación NTLM. Puede configurar el rastreador para que use otro método de autenticación en caso necesario. Para obtener más información, vea "Requisitos de autenticación para el rastreo de contenido" del apartado Planeación de métodos de autenticación (Office SharePoint Server).

Planeación de controladores de protocolo

Todo el contenido que se rastrea requiere el uso de un controlador del protocolo para obtener acceso a dicho contenido. Office SharePoint Server 2007 proporciona controladores del protocolo para todos los protocolos de Internet comunes. Sin embargo, si desea rastrear contenido que requiera un controlador del protocolo no instalado con Office SharePoint Server 2007, deberá instalar un controlador del protocolo de terceros o personalizado para poder rastrear dicho contenido.

En la siguiente tabla se muestran los controladores de protocolo que se instalan de forma predeterminada.

Controlador de protocolo Usado para rastrear

Bdc

Catálogo de datos profesionales

Bdc2

Direcciones URL del Catálogo de datos profesionales (protocolo interno)

File

Recursos compartidos de archivos

http

Sitios web

https

Sitios web a través de la Capa de sockets seguros (SSL)

Notes

Bases de datos de Lotus Notes

Rb

Carpetas públicas de Exchange

Rbs

Carpetas públicas de Exchange a través de SSL

Sps

Perfiles personales de granjas de servidores de Windows SharePoint Services 2.0

Sps3

Rastreos de perfiles personales sólo de granjas de servidores de Windows SharePoint Services 3.0

Sps3s

Rastreos de perfiles personales sólo de granjas de servidores de Windows SharePoint Services 3.0 a través de SSL

Spsimport

Importación de perfiles personales

Spss

Importación de perfiles personales de granjas de servidores de Windows SharePoint Services 2.0 a través de SSL

Sts

Direcciones URL raíz de Windows SharePoint Services 3.0 (protocolo interno)

Sts2

Sitios de Windows SharePoint Services 2.0

Sts2s

Sitios de Windows SharePoint Services 2.0 a través de SSL

Sts3

Sitios de Windows SharePoint Services 3.0

Sts3s

Sitios de Windows SharePoint Services 3.0 a través de SSL

Acción de hoja de trabajo

Registre las decisiones que tome sobre los controladores de protocolo para la implementación inicial en la sección Controladores de protocolo de la hoja de trabajo del plan de rastreo de contenido (en inglés) (https://go.microsoft.com/fwlink/?linkid=73748&clcid=0xC0A) (en inglés).

Planeación para administrar el impacto del rastreo

El rastreo de contenido puede reducir significativamente el rendimiento de los servidores que hospedan el contenido. El impacto que esto tiene en un servidor determinado varía en función de la carga que el servidor host experimente y si el servidor dispone de suficientes recursos (particularmente CPU y RAM) para mantener los acuerdos de nivel de servicio durante condiciones de uso normales o de horas punta.

Las reglas de impacto del rastreador permiten a los administradores de granjas gestionar el impacto que el rastreador tiene en los servidores que se rastrean. Para cada regla de impacto del rastreador, puede especificar una sola dirección URL o usar caracteres comodín en la dirección URL para incluir un bloque de direcciones URL al cual se aplica la regla. A continuación, puede especificar el número de solicitudes simultáneas para páginas realizadas para la dirección URL especificada u optar por solicitar sólo un documento cada vez y esperar el intervalo en segundos que elija entre las solicitudes.

Las reglas de impacto del rastreador reducen o incrementan la velocidad a la que el rastreador solicita contenido de una dirección de inicio o de un intervalo de direcciones de inicio determinados (a veces denominado nombre de sitio), independientemente del origen de contenido usado para rastrear dichas direcciones. En la tabla siguiente, se muestran los caracteres comodín que se pueden usar en el nombre del sitio al agregar una regla.

Comodín a usar Resultado

* como el nombre del sitio

Aplica la regla a todos los sitios.

*.* como el nombre del sitio

Aplica la regla a los sitios con puntos en el nombre.

*.*nombre_sitio*.com como nombre del sitio

Aplica la regla a todos los sitios del dominio *nombre_sitio*.com (por ejemplo, *.adventure-works.com).

*.*nombre_dominio_nivel_superior* como nombre del sitio

Aplica la regla a todos los sitios que finalizan con un nombre de dominio de nivel superior específico, por ejemplo *.com o *.net.

?

Reemplaza un único carácter en una regla. Por ejemplo, *.adventure-works?.com se aplicará a todos los sitios de los dominios adventure-works1.com, adventure-works2.com, etc.

Puede crear una regla de impacto del rastreador que se aplique a todos los sitios de un dominio de nivel superior determinado. Por ejemplo, *.com se aplica a todos los sitios de Internet con direcciones que acaban en .com. Y, por ejemplo, un administrador de un sitio del portal puede agregar un origen de contenido para samples.microsoft.com. La regla de *.com se aplicará a este sitio a menos que agregue una regla de impacto del rastreador específicamente para samples.microsoft.com.

Solicitar demasiado contenido en servidores externos o realizar consultas con demasiada frecuencia puede ocasionar que los administradores de dichos sitios limiten su acceso futuro si los rastreos están usando demasiados recursos o demasiado ancho de banda. Por lo tanto, el procedimiento recomendado es realizar un rastreo más lentamente. De este modo, puede mitigar el riesgo de perder acceso para rastrear el contenido en cuestión.

Durante la implementación inicial, establezca las reglas de impacto del rastreador de modo que ejerzan el menor impacto posible en otros servidores mientras se sigue rastreando con frecuencia el suficiente contenido para garantizar la validez del contenido rastreado.

Durante la fase de operaciones, puede ajustar las reglas de impacto del rastreador basándose en sus experiencias y datos de los registros de rastreo.

Acción de hoja de trabajo

Registre las decisiones que tome sobre las reglas de impacto del rastreador para la implementación inicial en la sección Reglas de impacto del rastreador de la hoja de trabajo del plan de rastreo de contenido (en inglés) (https://go.microsoft.com/fwlink/?linkid=73748&clcid=0xC0A) (en inglés).

Planeación de las reglas de rastreo

Las reglas de rastreo se aplican a una dirección URL o a un conjunto de direcciones URL determinado representado mediante comodines (también conocido como la ruta de acceso a la que se aplica la regla). Puede usar reglas de rastreo para llevar a cabo las operaciones siguientes:

  • Evite rastrear contenido irrelevante excluyendo una o varias direcciones URL. Esto también ayuda a reducir el uso de recursos del servidor y el tráfico de red, así como a incrementar la relevancia de los resultados de la búsqueda.

  • El rastreo se vincula a la dirección URL sin rastrear la dirección URL en sí. Esta opción es útil en aquellos sitios con vínculos de contenido pertinente cuando la página que contiene los vínculos no contiene información relevante.

  • Permitir que se rastreen las direcciones URL complejas. Esta opción rastrear las direcciones URL que contienen un parámetro de consulta especificado con un signo interrogativo. En función del sitio, estas direcciones URL pueden o no incluir contenido relevante. Puesto que las direcciones URL complejas con frecuencia pueden redireccionar a sitios no relevantes, es una buena idea habilitar únicamente esta opción en sitios donde se sepa que el contenido disponible de las direcciones URL complejas es relevante.

  • Permitir que el contenido en sitios de SharePoint se rastree como páginas HTTP. Esta opción permite al servidor de índices rastrear sitios de SharePoint que se encuentra detrás de un firewall o en escenarios en los que el sitio que se está rastreando restringe el acceso al servicio web usado por el rastreador.

  • Especifique si se debe usar la cuenta predeterminada de acceso al contenido, una cuenta de acceso al contenido diferente o un certificado de cliente para rastrear la dirección URL especificada.

Nota

Las reglas de rastreo se aplican simultáneamente a todos los orígenes de contenido en el SSP.

Con frecuencia, la mayoría del contenido de una dirección de un sitio determinado es pertinente, pero no un subsitio ni un intervalo de sitios debajo de dicha dirección de sitio. Al seleccionar una combinación más específica de direcciones URL para las cuales deben crearse reglas de rastreo que excluyan elementos innecesarios, los administradores de servicios compartidos puede maximizar la relevancia del contenido en el índice a la vez que minimizan el impacto en el rendimiento del rastreo y el tamaño de las bases de datos de búsqueda. La creación de reglas de rastreo para excluir direcciones URL es particularmente útil a la hora de planear direcciones de inicio para contenido externo, cuyo impacto en el uso de los recursos no está bajo control del personal de la organización.

Al crear una regla de rastreo, puede usar los caracteres comodín estándar en la ruta de acceso. Por ejemplo:

  • http://servidor1/carpeta* contiene todos los recursos web con una dirección URL que comienza con http://servidor1/carpeta.

  • *://*.txt incluye cada documento con la extensión de nombre de archivo .txt.

Como el contenido de rastreo consume recursos y ancho de banda, es mejor incluir menos cantidad de contenido que sepa que es importante que una cantidad mayor de contenido que pueda ser no importante. Después de la implementación inicial, puede revisar los registros de consulta y de rastreo y ajustar los orígenes de contenido y las reglas de rastreo para que sean más importantes e incluyan más contenido.

Especificación de una cuenta de acceso al contenido diferente

En el caso de las reglas de rastreo que incluyen contenido, los administradores tienen la opción de cambiar la cuenta de acceso al contenido para la regla. Se usa la cuenta predeterminada de acceso al contenido a no ser que se especifique otra cuenta en una regla de rastreo. La razón principal para usar una cuenta de acceso al contenido distinta para una regla de rastreo es que la cuenta predeterminada de acceso al contenido no tenga acceso a todas las direcciones de inicio. En el caso de dichas direcciones de inicio, puede crear una regla de rastreo y especificar una cuenta que no tenga acceso.

Nota

Asegúrese de que la cuenta de dominio usada para la cuenta predeterminada de acceso al contenido o cualquier otra cuenta de acceso al contenido no sea la misma cuenta de dominio usada por un grupo de aplicaciones asociado con la aplicación web que se rastrea. Al hacerlo, podría hacer que se rastreara e indexara contenido no publicado de sitios de SharePoint y versiones secundarias de archivos (historial) de los sitios de SharePoint.

Acción de hoja de trabajo

Registre las decisiones que tome sobre las reglas de rastreo para la implementación inicial en la sección Reglas de rastreo de la hoja de trabajo del plan de rastreo de contenido (en inglés) (https://go.microsoft.com/fwlink/?linkid=73748&clcid=0xC0A) (en inglés).

Planeación de la configuración de búsqueda que se administra en el nivel de granja de servidores

Además de las opciones que se configuran a nivel del SSP, existen varias opciones que se administran a nivel de granja que afectan al modo en que se rastrea el contenido. Considere las siguientes opciones de configuración de búsqueda a nivel de granja de servidores a la hora de planear el rastreo:

  • Dirección de correo electrónico de contacto: el rastreo de contenido afecta a los recursos de los servidores que se están rastreando. Para poder rastrear contenido, primero deberá especificar, en las opciones de configuración, la dirección de correo electrónico de la persona de la organización con la que deben ponerse en contacto los administradores en el caso de que el rastreo afecte negativamente a los servidores. Esta dirección de correo electrónico aparece en los registros de los administradores de los servidores que se están rastreando de modo que dichos administradores puedan ponerse en contacto con alguna persona si el impacto del rastreo en su rendimiento o ancho de banda es demasiado alto o si se producen otros problemas.

    La dirección de correo electrónico de contacto debe pertenecer a una persona que tenga la experiencia y la disponibilidad necesarias para responder rápidamente a las solicitudes. Como alternativa, puede usar un alias de una lista de distribución supervisada rigurosamente como dirección de correo electrónico de contacto. Con independencia de si el contenido rastreado se almacena internamente en la organización o no, es importante que el tiempo de respuesta sea rápido.

  • Configuración del servidor proxy: puede optar por usar un servidor proxy a la hora de rastrear contenido. El servidor proxy que se va a usar depende de la topología de la implementación Office SharePoint Server 2007 y de la arquitectura de otros servidores de la organización.

  • Configuración de tiempo de espera: la configuración del tiempo de espera se usa para limitar el tiempo que espera el servidor de búsqueda mientras se conecta a otros servicios.

  • Configuración de SSL: la configuración de la capa de sockets seguros (SSL) determina si el certificado SSL debe coincidir exactamente para rastrear contenido.

Acción de hoja de trabajo

Registre las decisiones que tome sobre la configuración de la búsqueda a nivel de granja de servidores para la implementación inicial en la sección Configuración de búsquedas en conjuntos de servidores de la hoja de trabajo del plan de rastreo de contenido (en inglés) (https://go.microsoft.com/fwlink/?linkid=73748&clcid=0xC0A) (en inglés).

Indización de contenido en idiomas diferentes

Cuando se rastrea contenido, el rastreador determina cada palabra individual en el contenido que encuentra. Los idiomas que tienen palabras separadas por espacios en blanco simplifican la tarea del rastreador de distinguir cada palabra. En otros idiomas, la búsqueda del límite entre las palabras puede ser más compleja.

Office SharePoint Server 2007 proporciona separadores de palabras y analizadores lingüísticos de manera predeterminada para ayudar a rastrear e indizar contenido en muchos idiomas. Los separadores de palabras encuentran los límites de las palabras en los datos de texto indizado, mientras que los analizadores lingüísticos conjugan verbos.

Si se rastrea alguno de los idiomas de la tabla que se muestra a continuación, Office SharePoint Server 2007 usa de forma automática el separador de palabras y el analizador lingüístico adecuado para dicho idioma. Un asterisco (*) indica que la característica de análisis lingüístico está activada de forma predeterminada.

Idioma admitido de forma predeterminada Idioma admitido de forma predeterminada

Árabe

Lituano*

Bengalí

Malayo

Búlgaro*

Malayalam*

Catalán

Marathi

Croata

Noruego (Bokmaal)

Checo*

Polaco*

Danés

Portugués

Neerlandés

Portugués (Brasil)

Inglés

Punyabí

Finés*

Rumano*

Francés*

Ruso*

Alemán*

Serbio (cirílico)*

Griego*

Serbio (latino)*

Gujarati

Eslovaco*

Hebreo

Esloveno*

Hindi

Español*

Húngaro*

Sueco

Islandés*

Tamil*

Indonesio

Telugu*

Italiano

Tailandés

Japonés

Turco*

Kannada*

Ucraniano*

Coreano

Urdú*

Letón*

Vietnamita

Cuando el rastreador indiza el contenido de un idioma que no está admitido, se usa el separador neutro. Si el separador neutro no proporciona los resultados esperados, puede intentar soluciones de terceros que funcionan con Office SharePoint Server 2007.

Como procedimiento recomendado, asegúrese de instalar el separador de palabras y el analizador lingüístico adecuados para cada uno de los idiomas para los que necesita compatibilidad. Los separadores de palabras y los analizadores lingüísticos deben instalarse en todos los servidores que ejecuten el servicio Office SharePoint Server Search.

Para obtener más información sobre los separadores de palabras y los analizadores lingüísticos, vea Planeación de sitios multilingües.

Acción de hoja de trabajo

Registre las decisiones que tome sobre los separadores de palabras y los lematizadores para la implementación inicial en la sección Separadores de palabras y lematizadores de la hoja de trabajo del plan de rastreo de contenido (en inglés) (https://go.microsoft.com/fwlink/?linkid=73748&clcid=0xC0A) (en inglés).

Hoja de trabajo

Si todavía no lo ha hecho, registre las decisiones de planeación sobre los orígenes de contenido y otras decisiones acerca del rastreo de contenido en la hoja de trabajo siguiente:

Si decide crear sólo algunos de los orígenes de contenido planeados y reglas de rastreo durante la implementación y la configuración iniciales, podrá usar esta hoja de trabajo como parte de las operaciones en curso.

Descarga de este libro

En este tema se incluye el siguiente libro descargable para facilitar la lectura y la impresión:

Vea la lista completa de libros disponibles en la página que muestra el contenido descargable para Office SharePoint Server 2007.