Share via


Planeación de la implementación de los conectores específicos de FAST Search (FAST Search Server 2010 for SharePoint)

 

Se aplica a: FAST Search Server 2010

Última modificación del tema: 2010-11-04

Importante

Este artículo se ha traducido con traducción automática; vea la declinación de responsabilidades. Para su referencia, puede encontrar la versión en inglés de este artículo aquí.

Antes de iniciar el rastreo de contenido con los conectores específicos de FAST Search para Lotus Notes, la base de datos o el contenido web, debe tener en cuenta una serie de consideraciones. Primero identifique las necesidades de búsqueda y la organización de los orígenes de contenido que se van a rastrear y recopile información importante. A continuación podrá configurar los conectores de forma más eficaz.

Considere la posibilidad de crear varias colecciones de contenido

FAST Search Server 2010 for SharePoint utiliza una colección de contenido para contenido rastreado de alimentación en el índice de FAST Search Server 2010 for SharePoint. Puede elegir la fuente de todo el contenido a la misma colección de contenido, que el valor predeterminado es sp.

Sin embargo, en ocasiones es necesario quitar el contenido de una configuración específica de conector específico FAST Search de la colección de contenido, lo que requiere que se borra la colección de contenido. Para ello, se debe ejecutar un comando de Windows PowerShell borra todo el contenido de la colección de contenido determinado. En ese caso tendrá que re-crawl todos los orígenes de contenido a esa colección de contenido determinada, que puede llevar mucho tiempo.

Considere la posibilidad de crear colecciones de contenido independientes para la configuración de conector específico FAST Search si espera que el contenido de un determinado conjunto de contenido tienen que eliminarse en algún momento en el futuro. Si crea colecciones diferentes de contenido para cada o en algunas configuraciones de conector específico FAST Search, evitar perder el contenido del índice y evitar tener que re-crawl cualquier otro origen de contenido a la misma colección.

Antes de implementar el conector de búsqueda de Lotus Notes FAST, tenga en cuenta:

  • Los servidores de Domino que mantenga indizar y rastrear datos.

  • Las bases de datos en cada servidor deben ser rastreado y indizado.

  • La vista de base de datos (si existe) debe utilizarse para seleccionar que harán que se pueden buscar documentos de Lotus Notes.

  • Los tipos de datos adjuntos (por ejemplo: pdf, txt, doc, sin fondos, ppt) debe o no se deben realizar para búsquedas.

  • Las cuentas que se pueden utilizar para tener acceso a los datos con los permisos necesarios.

  • Los metadatos de la base de datos se deben realizar para búsquedas.

  • ¿Cuál es el número total de documentos de Lotus Notes para ser rastreado y indizado.

    • El número total de documentos de Lotus Notes para que se va a rastrear afecta el tipo de base de datos de SQL Server que se debe utilizar para realizar el seguimiento de los datos de estado del conector. El tamaño máximo de una base de datos de SQL Server Express es de aproximadamente 4 GB. Esto equivale a alrededor de 2 millones de elementos de Lotus Notes. Si estás de planificación para rastrear más elementos, utilice SQL Server 2008 Enterprise (o posterior).

    • Encontrará instrucciones sobre cómo cambiar a un estado diferente de base de datos de seguimiento en Configuración del conector de Lotus Notes para FAST Search.

  • ¿Con qué frecuencia el conector debe ejecutar, por ejemplo, diariamente, semanalmente o mensualmente.

    • Diferentes tipos de contenido de Lotus Notes pueden tener diferentes peticiones de actualización. Por ejemplo, pueden tener bases de datos de correo electrónico para que se va a rastrear todos los días que se pueden rastrear bases de datos de almacenamiento de forma semanal (o incluso mensual). En ese caso, debe crear unas configuraciones independientes para cada uno de estos conjuntos de contenido.
  • Si es necesario crear varias configuraciones de conector separado. Puede haber varias razones para dividir el rastreo en dos o más configuraciones y, a continuación, programar cada configuración por separado:

    • Demandas de diferentes para la actualización.

    • Reglas de incluir o excluir diferentes para distintos contenidos. Por ejemplo, no indizar adjuntos a mensajes de correo electrónico, pero la conexión a bases de datos de proyecto; de bases de datos de Lotus Notes de índice de bases de datos de Lotus Notes

    • Asignaciones de propiedades diferentes para distintas partes del contenido. Por ejemplo, la propiedad “ última modificada ” en mensajes de correo electrónico puede ser una marca de hora que indica cuándo su última modificación mientras la propiedad “ última modificada ” en una base de datos de proyecto puede ser una cadena que indica quién modificó el documento por última vez. No se puede indizar estas dos propiedades en la misma propiedad administrada, ya que son de tipo diferente. Por lo tanto, es necesaria una asignación de propiedades independientes para los dos. Esto se realiza mediante la configuración de las configuraciones diferentes.

    • La necesidad de avance de contenido diferente para separar el contenido de las colecciones en el motor de búsqueda. Si es probable que se elimina una configuración (y el contenido correspondiente) en algún momento en el futuro, utilice un conjunto de contenido independiente para esa configuración. Esto le permite eliminar todo el contenido indizado para dicha configuración mediante la eliminación de la colección de contenido, sin perder ningún otro dato de rastreo para las diferentes configuraciones. Consulte la sección Consideraciones al modificar los filtros en el artículo Administración de reglas de rastreo (conector de Lotus Notes para FAST Search) para decidir si desea utilizar colecciones de contenido independientes o no.

  • Si desea utilizar seguimiento de estado de elemento o no.

    • Monitores de la característica de seguimiento cuando cada elemento por última vez se ha rastreado el estado del elemento y el estado de este rastreo, incluidos los mensajes de error. Esta información se almacena en una tabla de base de datos que no se vacía automáticamente. En función del número de elementos en cada rastreo y con qué frecuencia se ejecuta un rastreo, en esta tabla puede llegar a ser bastante grande.

      Puede desactivar el estado del elemento de seguimiento, establezca el parámetro de archivo de configuración de Conector de contenido de Lotus Notes para FAST SearchConnectorExecution/EnableStatustracker en false. Como alternativa, puede eliminar manualmente el contenido de la tabla connectors.statustracker a intervalos regulares cuando el conector no está en ejecución.

Antes de implementar el conector de base de datos FAST Search, tenga en cuenta:

  • Los servidores que contienen las bases de datos con indizar y rastrear datos.

  • Las bases de datos/tablas que contienen indizar y rastrear datos.

  • Esté preparado para formular una consulta SQL para cada origen de datos que se rastrean y indiza (o tiene un propietario de la base de datos de formular). Como ayuda para esto, se pueden utilizar herramientas de cliente de la base de datos.

  • Para cada consulta SQL, determine qué columnas deben servir como el identificador de documentos.

  • Determinar si el resultado de la consulta SQL devuelve las filas que tengan el mismo identificador que se deben combinar en un solo documento Conector de Lotus Notes para FAST Search.

  • Cómo se deben configurar las actualizaciones incrementales. Averigüe si la base de datos incluye una columna de marca de tiempo que se puede utilizar para buscar las filas actualizadas o si se puede agregar una columna de este tipo. Si esta columna no está presente o no se puede agregar una columna de este tipo, se puede utilizar una suma de comprobación o enfoque basado en el indicador.

  • Si desea utilizar seguimiento de estado de elemento o no.

    • Monitores de la característica de seguimiento cuando cada elemento por última vez se ha rastreado el estado del elemento y el estado de este rastreo, incluidos los mensajes de error. This information is stored in a database table that is not emptied automatically. Depending on the number of items in each crawl and how often a crawl is run, this table can become quite big.

      Puede desactivar el estado del elemento de seguimiento, establezca el parámetro de archivo de configuración de Conector de bases de datos de FAST SearchConnectorExecution/EnableStatusTracker en false. Como alternativa, puede eliminar manualmente el contenido de la tabla connectors.statustracker a intervalos regulares cuando el conector no está en ejecución.

Antes de implementar el rastreador Web de búsqueda FAST, tenga en cuenta:

  • Las configuraciones de rastreador de datos que se va a utilizar. Puede utilizar varias configuraciones de Agente de búsqueda de FAST Search cuando tiene varios sitios Web independientes para rastrear que requieren las reglas de configuración de rastreo distinta. Tenga en cuenta que en muchos casos, es posible utilizar las colecciones de sub en su lugar.

  • ¿Cuántos servidores Agente de búsqueda de FAST Search que se va a utilizar. Considere el uso de varios servidores de Agente de búsqueda de FAST Search (conocidos como un rastreador de Web de varios nodos) cuando tiene un gran número de sitios Web que va a rastrear. Tenga en cuenta que un único dominio DNS (por ejemplo *. contoso.com) sólo se puede rastrear un servidor único Agente de búsqueda de FAST Search.

  • Los sitios Web que contenga los datos que se rastreará y se indizan.

  • Tenga en cuenta el número de sitios Web para que se va a rastrear, ¿con qué rapidez se debe solicitar contenido y con qué frecuencia debe re-visited los sitios Web.

  • No se debe indizar los sitios Web o parte de los sitios Web. Por ejemplo, servidores de cliente de repositorio CVS u otros sistemas que tienen un Web front-end que puede contaminan el índice con datos no deseados o colocar una carga en el servidor Web que no se escalan para controlar.

  • Los sitios Web que requieren autenticación, qué tipo de autenticación es necesaria, y qué cuentas se pueden utilizar para tener acceso a los datos con los permisos necesarios.

Nota

Declinación de responsabilidades de traducción automática: Este artículo se ha traducido con un sistema informático sin intervención humana. Microsoft ofrece estas traducciones automáticas para que los hablantes de otros idiomas distintos del inglés puedan disfrutar del contenido sobre los productos, los servicios y las tecnologías de Microsoft. Puesto que este artículo se ha traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática.