Planeación y diseño de la colección de contenido (FAST Search Server 2010 for SharePoint)

 

Se aplica a: FAST Search Server 2010

Última modificación del tema: 2016-11-29

Importante

Este artículo se ha traducido con traducción automática; vea la declinación de responsabilidades. Para su referencia, puede encontrar la versión en inglés de este artículo aquí.

En este artículo se describe la planeación para el rastreo de contenido y se proporciona ayuda para comprender el modo en que Microsoft FAST Search Server 2010 for SharePoint rastrea e indiza el contenido.

Antes de que los usuarios finales pueden utilizar la funcionalidad de búsqueda en FAST Search Server 2010 for SharePoint, primero se debe rastrear el contenido que se ejecutan consultas en.

El término “ contenido ” hace referencia a un elemento que se puede rastrear, por ejemplo, un sitio Web, un documento de Microsoft Office Word o un archivo de mensaje de correo electrónico.

Cuando planee el rastreo de contenido, plantéese las preguntas siguientes:

  • ¿Dónde está ubicado físicamente?

  • ¿Es el contenido que se almacena en diferentes orígenes, por ejemplo, recursos compartidos de archivos, sitios de SharePoint, sitios Web y otras ubicaciones?

  • ¿Desea rastrear todo el contenido que se almacena en el origen o una parte del mismo?

  • ¿Qué tipos de archivos que desea rastrear

  • ¿Cuándo y con qué frecuencia debería rastrear el contenido?

Utilice la información de este artículo para ayudarle a responder estas preguntas y tomar las decisiones de diseño necesarias sobre el contenido que se va a rastrear y cómo y cuándo desea que el contenido de rastreo.

En este artículo:

  • Identificación de los orígenes de contenido que se desean rastrear

  • Rastreo e indización del contenido

  • Acerca de los conectores integrados de Index Server

  • Creación de modelos de conector en el marco de trabajo de conector

  • Los conectores de indización de la FAST Search Server 2010 para SharePoint

  • Acerca de cómo el rastreador Web de búsqueda FAST

  • Acerca de la búsqueda FAST conector de bases de datos

  • Acerca de cómo el conector de búsqueda de Lotus Notes FAST

  • Limitar el contenido que se va a rastrear

  • Establecimiento de programaciones de rastreo

Identificación de los orígenes de contenido que se desean rastrear

FAST Search Server 2010 for SharePoint utiliza conectores distintos de Index Server de distintos orígenes de contenido. La elección del conector de Index Server se ve afectada por el tipo de contenido que se va a rastrear, preferencias y necesidades específicas de su organización.

Se pueden rastrear los orígenes de contenido más con los diversos conectores de Index Server a través de Microsoft SharePoint Server 2010. La colección de estos conectores de Index Server también se conoce como es el conector FAST Search. Tener en cuenta, sin embargo, que no lo es, independiente de la indización de conector, sino más bien una colección de los conectores. El conector FAST Search está asociado con una o más orígenes de contenido (y los conectores, por tanto, Index Server) a través de la FAST buscar contenido Search Service Application (SSA). El contenido SSA también se conecta el Microsoft SharePoint Server 2010 de aplicaciones para usuario con los servicios de fondo de FAST Search Server 2010 for SharePoint.

Al instalar FAST Search Server 2010 for SharePoint, tendrá acceso a los conectores de Index Server específicos de tres FAST Search Server 2010 for SharePoint. Estos conectores pueden enviar contenido Web, base de datos y Lotus Notes en el índice. La tabla resumen los conectores de Index Server disponibles y sus usos recomendados.

Tipo de contenido Conector de Index Server Caso de uso recomendado

R/C de

Conector de indización de SharePoint

Se utiliza en todos los casos de uso.

Recursos compartidos de archivos

Conector de indización de recurso compartido de archivos

Se utiliza en todos los casos de uso.

Exchange

Indización de conector de Exchange

Se utiliza en todos los casos de uso.

Perfiles de personas

Conector de la indización de perfiles de personas

Se utiliza en todos los casos de uso.

Este tipo de contenido se rastrea mediante el FAST buscar consultas Search Service Application.

Sitios web

Conector de sitio Web de Index Server

Utilícelo cuando disponga de una cantidad limitada de los sitios Web se rastrean, sin contenido dinámico.

Agente de búsqueda de FAST Search

Se utiliza cuando tiene muchos sitios Web que va a rastrear.

Se utiliza cuando el contenido del sitio Web contiene datos dinámicos, incluidos JavaScript.

Utilice esta opción cuando la organización necesita tener acceso al Web avanzada de rastreo, configuración y las opciones de programación.

Se utiliza para rastrear el contenido de Web de RSS.

Se utiliza cuando el contenido del sitio Web usa opciones avanzadas de inicio de sesión.

Base de datos

Conectores de indización basada en el catálogo de datos de negocio

Utilizar si el método de configuración preferida consiste en utilizar el Microsoft SharePoint Designer 2010.

Se utiliza cuando desea utilizar la marca de tiempo en función de detección de cambios para los rastreos incrementales de la base de datos.

Se utiliza cuando el método preferido de la operación consiste en utilizar la administración central de Microsoft SharePoint Server 2010.

Utilice esta opción cuando desee habilitar el rastreo se basa en el registro de cambios. Esto puede lograrse mediante la modificación del archivo de modelo de conector y la creación de un procedimiento almacenado en la base de datos directamente.

Conector de bases de datos de FAST Search

Se utiliza cuando el método de configuración preferida consiste en utilizar las consultas SQL.

Se utiliza cuando desea unirse a las opciones de la operación a través de consultas SQL de datos avanzados.

Se utiliza cuando desea utilizar características avanzadas de actualización incremental. Conector de bases de datos de FAST Search utiliza detección de cambios en función de la suma de comprobación para rastreos incrementales, si no hay ninguna información de actualización disponible. El conector también admite la detección de cambios en función de marca de tiempo y en función de actualización de detección de cambios y eliminar los indicadores.

Lotus Notes

La indización de conector de Lotus Notes

Se utiliza cuando el método preferido de la operación consiste en utilizar la administración central de Microsoft SharePoint Server 2010.

Conector de Lotus Notes para FAST Search

Utilice esta opción cuando la compatibilidad total con la seguridad de Lotus Notes es necesario, incluida la compatibilidad con las funciones de Lotus Notes.

Se utiliza cuando desea rastrear bases de datos de Lotus Notes como datos adjuntos.

Línea de datos profesionales

Conectores de indización basada en el catálogo de datos de negocio

Utilice esta opción cuando los datos del origen de contenido contienen los datos en aplicaciones empresariales.

Utilice esta opción cuando desee habilitar el rastreo se basa en el registro de cambios. Esto puede lograrse mediante la modificación del archivo de modelo de conector y la creación de un procedimiento almacenado en la base de datos directamente.

Rastreo e indización del contenido

El resultado de correctamente rastreo de contenido es que los archivos individuales o partes del contenido que desea que esté disponible para las consultas de búsqueda se tiene acceso y leer el conector de Index Server. Al rastrear el contenido, se crea un conjunto de propiedades rastreadas para esos artículos. Se asignan a estas propiedades rastreadas a propiedades administradas que se almacenan en el índice de búsqueda, también conocido como el índice.

Nota

Los conectores de Index Server no cambien los archivos en los servidores de host. Los archivos en los servidores host sólo se tiene acceso y leer, no se modifican. En algunos casos, puede actualizarse la última fecha de acceso de los archivos que se ha rastreado, como los conectores de Index Server lee el contenido en el servidor host. Esto aplica sólo a algunos servidores que alojan determinados orígenes de contenido.

Acerca de los conectores integrados de Index Server

Se pueden rastrear los orígenes de contenido más utilizando los conectores de Index Server integrados en SharePoint Server 2010. Utilice la administración central de SharePoint Server 2010 para la mayoría de las tareas de configuración y funcionamiento.

Estos conectores de Index Server se configuran mediante la configuración del aplicación de servicios de búsqueda de contenido (Content SSA) de conector FAST Search. Entre otras cosas, el contenido SSA permite la comunicación con los servicios de fondo de FAST Search Server 2010 for SharePoint. En el contenido de SSA especifique la ubicación de los orígenes de contenido, la programación de rastreo y otra información. El nombre de la colección de contenido predeterminado es el Service Pack.

El conector FAST Search rastrea el:

  • Sitios de SharePoint

  • Sitios web

  • Recursos compartidos de archivos que contienen contenido como, por ejemplo, documentos Microsoft Office

  • Carpetas públicas de Exchange

  • Línea de negocio, como contenido de los datos de bases de datos

  • Repositorios personalizados, tiene acceso con un conector personalizadas

Creación de modelos de conector en el marco de trabajo de conector

Para rastrear algunos repositorios, por ejemplo, las bases de datos o servicios Web, necesita el marco del conector SharePoint Server 2010. Este marco le permite utilizar modelos de servicios de conectividad de negocio (BCS) para rastrear los orígenes de datos externos. Estos modelos definen los detalles de conexión y la estructura del origen de contenido externo que se va a rastrear. Los modelos BCS se importan en el servicio de conectividad de negocio. Al configurar el origen de contenido de tipo de línea de datos de Business apuntará a un modelo.

Hay varios modelos BCS prediseñadas que puede utilizar para el contenido de la base de datos, servicios Web (WCF) y código personalizado. NET. También es posible crear su propio, modelo BCS personalizado. Además, puede crear su propias, mediante el marco del conector y modelos BCS de conector personalizado.

Para generar en el marco del conector SharePoint Server 2010, debe utilizar SharePoint Designer o Microsoft Visual Studio 2010, dependiendo de los objetivos y requisitos específicos.

Utilice SharePoint Designer para:

  • Crear modelos BCS que son necesarios para rastrear fuera de los orígenes de contenido externo compatible con el cuadro como, por ejemplo, las bases de datos y servicios Web.

  • Importación y exportación de modelos de entre las aplicaciones de BCS

Utilice Microsoft Visual Studio para:

  • Implementar métodos de .NET BCS Connector

  • Escribir un conector personalizado para el repositorio

Varios orígenes de contenido pueden extraer todo desde el mismo servicio de conectividad de Business (BCS), y puede señalar a diferentes aplicaciones de servicios de búsqueda para el mismo modelo en un BCS compartida.

Rastrear el contenido de Lotus Notes con el conector de la indización de Lotus Notes

No hay requisitos previos adicionales y las configuraciones para rastrear el contenido de Lotus Notes con el conector de la indización de Lotus Notes. Estos están relacionadas principalmente con la configuración de Lotus Domino.

Los conectores de indización de la FAST Search Server 2010 para SharePoint

Además de los conectores integrados de indización, FAST Search Server 2010 for SharePoint ofrece los conectores para Lotus Notes, Web y de base de datos de contenido de la indización de contenido adicional.

Estos conectores de Index Server se configuran principalmente mediante la edición de archivos XML y Windows PowerShell cmdlets y puede hacerlas funciona a través de la línea de comandos.

Acerca de cómo el rastreador Web de búsqueda FAST

El Agente de búsqueda de FAST Search es un conector de indización alto grado de personalización que se utiliza para rastrear el contenido de sitio Web. Puede escalar la Agente de búsqueda de FAST Search para entornos de gran tamaño, por ejemplo, cuando rastrea la organización muchos sitios Web externos. Además, el Agente de búsqueda de FAST Search puede rastrear el contenido dinámico, como, por ejemplo, sitios Web con JavaScript.

El Agente de búsqueda de FAST Search recopila contenido de un conjunto de sitios Web definidos, que pueden ser internos o externos. La configuración de la Agente de búsqueda de FAST Search se realiza mediante la edición de una copia de un archivo XML. Puede utilizar el Agente de búsqueda de FAST Search a través de varias herramientas de línea de comandos.

El Agente de búsqueda de FAST Search suele ser un componente dentro de una instalación FAST Search Server 2010 for SharePoint. Internamente, se organiza el Agente de búsqueda de FAST Search como una colección de los procesos y entidades lógicas, que, en la mayoría de los casos, ejecutan en un único servidor. Cuando el número de sitios Web o el número total de páginas que se va a rastrear es grande, se puede escalar la Agente de búsqueda de FAST Search mediante la distribución de estos procesos entre varios hosts. Esto requiere una configuración adicional.

El Agente de búsqueda de FAST Search puede rastrear el contenido HTTP, HTTPS y FTP y es compatible con NTLM versión 1 (y a una limitación extender versión 2), de texto implícita, autenticación básica y autenticación de inicio de sesión basado en el formulario. Se admite la programación de RSS y se pueden marcar los documentos vinculados de la fuente.

Acerca de la búsqueda FAST conector de bases de datos

El Conector de bases de datos de FAST Search es un conector de Index Server especializado que recopila el contenido de la base de datos orígenes de contenido.

El conector de Index Server está configurado con una plantilla XML. El conector funciona mediante el uso de las opciones de línea de comandos en el archivo jdbcconnector.bat. Después de ejecutar el conector configurado, asigna propiedades rastreadas a propiedades administradas en la administración central de SharePoint Server 2010 para habilitar y personalizar la búsqueda en el contenido recopilado por el conector.

El conector utiliza una instrucción SQL para ejecutar en la base de datos de rastreo. Esta instrucción es completamente personalizable. El Conector de bases de datos de FAST Search utiliza detección de cambios de la suma de comprobación en función de rastreos incrementales si no hay ninguna información de actualización disponible. El conector también admite la detección de cambios en función de marca de tiempo y en función de actualización de detección de cambios y eliminar los indicadores. Además, puede indicar la versión anterior y contabilizar los procedimientos de operación que deben realizarse a la base de datos antes de que se rastrea, lo que puede ser una ventaja en ciertos casos de uso.

Acerca de cómo el conector de búsqueda de Lotus Notes FAST

El Conector de Lotus Notes para FAST Search es un conector de Index Server especializado que consta de dos partes: un conector de directorios de usuario y un conector de contenido. El conector de contenido recopila el contenido de un origen de contenido de Lotus Notes. El conector de directorios de usuario, se garantiza que los usuarios finales sólo pueden buscar contenido que tienen acceso a los de Lotus Notes. El conector de directorios de usuario asigna el directorio de usuario de Active Directory con las cuentas de usuario de Lotus Notes y está estrechamente integrado con autorización de búsqueda FAST.

El conector está configurado con dos plantillas XML, uno para el conector de directorios de usuario y uno para el conector de contenido. Se utiliza el conector a través de las opciones de línea de comandos de los archivos lotusnotesconnector.bat y lotusnotessecurity.bat. Después de ejecutar el conector de contenido configurado, asigna propiedades rastreadas a propiedades administradas en la administración central de SharePoint Server 2010 para habilitar y personalizar la búsqueda en el contenido recopilado por el conector de contenido.

El Conector de Lotus Notes para FAST Search es compatible con Lotus Notes versión 6.5.6, 7.x y 8.x y Lotus Domino versión 6.5, 7.x y 8.x.

El conector completamente compatible con la seguridad de Lotus Notes, incluyendo funciones y puede indizar las bases de datos de Lotus Notes como datos adjuntos.

Limitar el contenido que se va a rastrear

Al utilizar los conectores integrados de Index Server para rastrear el contenido, puede utilizar la interfaz de usuario de la administración central de SharePoint Server 2010 para indicar qué desea excluir el rastreo de contenido. Los conectores específicos de FAST Search Server 2010 for SharePoint cada uno tiene los parámetros en sus respectivos archivos de configuración para indicar incluyen y excluir las reglas.

Importante

No sobrecargar los orígenes de contenido que se va a rastrear.

Para el contenido de la organización que están rastreando otros administradores, puede coordinar con los administradores para definir el impacto de las reglas que se basan en el rendimiento y capacidad de los servidores. La mayor parte de los sitios, esta coordinación no es posible. Solicitar demasiado contenido en los servidores externos o realizar solicitudes con demasiada frecuencia puede hacer que los administradores de dichos sitios limiten su acceso futuro si los rastreos están utilizando demasiados recursos o demasiado ancho de banda. Por lo tanto, la práctica recomendada es rastrear más despacio. En este modo, puede reducir el riesgo de perder el acceso para rastrear el contenido pertinente.

Con el Agente de búsqueda de FAST Search, puede para controlar la frecuencia de rastreo, establezca un retraso de solicitud, establecer un máximo para el número de solicitudes simultáneas que se envían con el mismo sitio Web al mismo tiempo o activar o desactivar simultáneas rastreo de una dirección IP donde se alojan varios sitios. You can also limit the bandwidth of the Agente de búsqueda de FAST Search by limiting the number of concurrent Web sites to crawl at the same time.

Establecimiento de programaciones de rastreo

Cuando se utilizan los conectores integrados de Index Server para rastrear el contenido, puede utilizar la interfaz de usuario de la administración central de SharePoint Server 2010 para indicar si desea rastrear el contenido. El Conector de Lotus Notes para FAST Search y la Conector de bases de datos de FAST Search utilizan al programador de tareas de Windows para programar rastreos. Es posible programar rastreos para el Agente de búsqueda de FAST Search estableciendo los parámetros en el archivo de configuración XML.

Sugerencia

Se recomienda que complete un ciclo de rastreo completo iniciado manualmente antes de programar rastreos adicionales. Esta opción para averiguar cuánto se tarda en ejecutar un rastreo completo y para evitar que se inicia un rastreo incremental o de nuevo antes de que ha finalizado el rastreo inicial.

Nota

Declinación de responsabilidades de traducción automática: Este artículo se ha traducido con un sistema informático sin intervención humana. Microsoft ofrece estas traducciones automáticas para que los hablantes de otros idiomas distintos del inglés puedan disfrutar del contenido sobre los productos, los servicios y las tecnologías de Microsoft. Puesto que este artículo se ha traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática.

See Also

Concepts

Planeación de la implementación de los conectores específicos de FAST Search (FAST Search Server 2010 for SharePoint)