Compartir a través de


Acerca de los orígenes de contenido (Search Server 2008)

Actualizado: 2009-04-28

Nota

A menos que se especifique lo contrario, la información de este artículo se aplica a Microsoft Search Server 2008 y Microsoft Search Server 2008 Express.

El contenido es cualquier elemento que se puede rastrear, como una página web, un documento de Microsoft Office Word, datos profesionales o un mensaje de correo electrónico. El contenido se incluye en un repositorio de contenido, como un sitio web, un recurso compartido de archivos o un sitio de SharePoint. Un origen de contenido especifica la configuración que define cómo y qué contenido programado se rastrea. Incluye una o más direcciones de un repositorio de contenido desde las que se inicia el rastreo, llamadas también direcciones de inicio. Esta configuración se aplica a todas las direcciones de inicio del origen de contenido completo.

Origen de contenido predeterminado

Si la organización necesita rastrear solo el contenido incluido en los sitios de SharePoint, es posible que no necesite crear un origen de contenido adicional. Search Server 2008 define un origen de contenido predeterminado durante la implementación inicial. El origen de contenido predeterminado se llama Local Office SharePoint Server sites. Las direcciones de inicio de todas las aplicaciones web de la granja de servidores se incluyen automáticamente como parte del origen de contenido predeterminado. Este origen de contenido no se rastrea de forma predeterminada. Para indizar el contenido del origen de contenido predeterminado, debe programar o iniciar manualmente los rastreos.

Creación de un nuevo origen de contenido

Al crear un origen de contenido, debe especificar la configuración que define el tipo de contenido que se va a rastrear, cuándo se rastrea el contenido y el comportamiento de rastreo, como la profundidad de rastreo en el espacio de nombres de la dirección de inicio o cuántos saltos de servidor se van a permitir. Si tiene varios tipos de repositorios de contenido que desea rastrear o si desea rastrear algunos repositorios de contenido con distintas programaciones, debe crear orígenes de contenido adicionales. Servidor de búsqueda incluye un proveedor de servicios compartidos (SSP) que admite hasta 500 orígenes de contenido. Para obtener más información, vea la sección acerca de la planeación de orígenes de contenido de Planeación del rastreo de contenido(Search Server 2008). Para obtener más información acerca de cómo configurar el comportamiento de rastreo, vea Limitación o aumento de la cantidad de contenido que se rastrea (Search Server 2008).

Tipos de repositorios de contenido

Sólo se puede rastrear un tipo de contenido por origen de contenido. Es decir, se puede crear un origen de contenido que incluya direcciones URL para sitios de SharePoint y otro que incluya direcciones URL para recursos compartidos de archivos, pero no se puede crear un solo origen de contenido que incluya direcciones URL para sitios de SharePoint y recursos compartidos de archivos.

En la siguiente tabla se indican los tipos de contenido que Servidor de búsqueda puede rastrear e indizar:

Este tipo de origen de contenido Incluye este tipo de contenido

Sitios de SharePoint

  • Sitios de SharePoint de la misma granja de servidores o granjas de servidores de Microsoft Office SharePoint Server 2007, Windows SharePoint Services 3.0 o Search Server 2008 diferentes

  • Sitios de SharePoint de Microsoft Office SharePoint Portal Server 2003 o de granjas de servidores de Microsoft Windows SharePoint Services 2.0

    NoteNota:
    El rastreador de Search Server 2008 puede rastrear automáticamente todos los sitios y subsitios de Office SharePoint Server 2007, Windows SharePoint Services 3.0 y Search Server 2008. El rastreador puede rastrear las versiones anteriores de Productos y Tecnologías de SharePoint. No obstante, debe especificar la dirección URL de cada sitio de nivel superior (colección de sitios) y de cada subsitio que desee rastrear. Los sitios incluidos en el Directorio de sitios de granjas de servidores de Microsoft Office SharePoint Portal Server 2003 se rastrean cuando se rastrea el sitio del portal. Para obtener más información acerca del Directorio de sitios, vea el tema que trata acerca del Directorio de sitios (en inglés) (https://go.microsoft.com/fwlink/?linkid=88227&clcid=0xC0A) (en inglés).

Sitios web

  • Contenido web de la organización no encontrado en los sitos de SharePoint

  • Contenido en sitios web de Internet

    NoteNota:
    El rastreador se comporta de la misma forma cuando se usa el tipo de contenido de sitios web o el tipo de contenido de sitios de SharePoint. Solo difieren las opciones de rastreo que puede configurar para estos tipos de origen de contenido.

Recursos compartidos de archivos

  • Contenido en recursos compartidos de archivos de la organización

Carpetas públicas de Exchange

  • Contenido de Microsoft Exchange Server

Lotus Notes

  • Contenido almacenado en bases de datos de Lotus Notes

    NoteNota:
    La opción de origen de contenido de Lotus Notes no se muestra en la interfaz de usuario hasta haber configurado el servidor de índices para que funcione con Lotus Notes. Para obtener más información, vea Preparación para el rastreo de Lotus Notes (Search Server 2008).

Direcciones de inicio de contenido

Cada origen de contenido mantiene una lista de direcciones de inicio que el rastreador usa para establecer la conexión con el repositorio de contenido. Cada origen de contenido puede incluir hasta 500 direcciones de inicio. No puede rastrear las mismas direcciones con varios orígenes de contenido. Por ejemplo, si usa un origen de contenido concreto para rastrear una colección de sitios y todos sus subsitios, no puede usar otro origen de contenido para rastrear uno de estos subsitios con otra programación.

Rastreo de contenido

Puede usar un origen de contenido para iniciar manualmente un rastreo o programar cuándo y con qué frecuencia se va a rastrear el origen de contenido seleccionado. Si desea rastrear el contenido de una parte del origen de contenido con otra programación, debe crear un origen de contenido independiente para dicho contenido. Por motivos de rendimiento y facilidad de administración, se recomienda usar el menor número posible de orígenes de contenido. Para obtener más información acerca de cómo iniciar manualmente o programar un rastreo, vea Rastreo de contenido (Search Server 2008).

Autenticación

Cuando el rastreador obtiene acceso a las direcciones de inicio incluidas en un origen de contenido, los servidores que hospedan el contenido deben autenticar dicho rastreador y concederle acceso. La cuenta de usuario usada por el rastreador debe tener como mínimo permiso de lectura para poder rastrear el contenido. De forma predeterminada, Servidor de búsqueda usa la cuenta de acceso al contenido predeterminada y NTLM para la autenticación en los servidores. Para obtener más información, vea Definición del modo de autenticación del rastreador (Search Server 2008).

Vea también

Conceptos

Planeación del rastreo de contenido(Search Server 2008)
Configuración de las búsquedas para devolver resultados de entradas de blog (Search Server 2008)
Configuración de certificados de cliente para rastrear un sitio SSL (Search Server 2008)
Configuración de propiedades de elementos web (Search Server 2008)