Topología de la granja de servidores de FAST Search Server (FAST Search Server 2010 for SharePoint)

 

Se aplica a: FAST Search Server 2010

Última modificación del tema: 2012-01-20

Importante

Este artículo se ha traducido con traducción automática; vea la declinación de responsabilidades. Para su referencia, puede encontrar la versión en inglés de este artículo aquí.

En este tema se describe la topología de granja de servidores de Microsoft FAST Search Server 2010 for SharePoint, incluidos los distintos componentes que se pueden escalar en varios servidores por razones de rendimiento y tolerancia a errores.

Para obtener más información sobre la topología del conjunto Microsoft SharePoint Server 2010 general, vea Planeación de la topología de la granja de servidores (FAST Search Server 2010 for SharePoint).

En este artículo:

  • El flujo de contenido

  • Componentes dentro de la búsqueda FAST para el conjunto de servidores de SharePoint

  • Conceptos de implementación

El flujo de contenido

FAST Search Server 2010 for SharePoint recupera contenido para la indización con uno o varios de los conectores de indización admitidos. El FAST contenido Search Service Application (SSA) es el conector de Index Server predeterminada y recupera el contenido de varios orígenes de contenido, como repositorios de contenido de SharePoint, los servidores Web, las carpetas de Exchange, la línea de negocio de servidores de archivos y datos. Puede utilizar otros conectores de indización FAST Search Server 2010 for SharePoint para escenarios de recuperación de contenido más específicas. Para obtener más información acerca de las opciones del conector de Index Server, consulte Planeación y diseño de la colección de contenido (FAST Search Server 2010 for SharePoint).

Extrae el contenido que se pueden buscar documentos recuperados de procesamiento del elemento y procesa los elementos basándose en el lenguaje escrito.

El componente de indización, convierte el contenido de la búsqueda en índices invertidos que a su vez se utilizan de forma que coincida con la consulta.

El procesamiento de consultas procesa las consultas de usuario mediante la realización de transformaciones de la consulta, como sinónimo de expansión, antes de la consulta real en el índice de coincidencia.

Coincidencia de la consulta, los índices de búsqueda utiliza para devolver los elementos que coinciden con una consulta de usuario. Los datos que se devuelven en una lista de aciertos de consultas que se ordena por la relevancia para la consulta especificada.

FAST Search Server 2010 for SharePoint interactúa con la infraestructura de Active Directory y las solicitudes para resolver los permisos y pertenencias a grupos. A continuación, sólo devuelve los elementos que se permite al usuario actual para ver, de acuerdo con la configuración del origen de contenido.

Componentes dentro de la FAST Search Server 2010 para el conjunto de servidores de SharePoint

FAST Search Server 2010 for SharePoint puede ejecutarse en un único nodo. O bien, se puede escalar para ejecutar uno o varios de los componentes en varios nodos. En ese caso el sistema puede indizar un mayor número de elementos, controlar más actualizaciones de producto, reducir la latencia de indización o responder a más consultas por segundo.

La figura siguiente muestra los componentes principales de la FAST Search Server 2010 for SharePoint.

Búsqueda rápida para la topología del conjunto de servidores de SharePoint

Topología de granja de FAST Search Server

Las subsecciones siguientes describen la funcionalidad de cada componente.

Procesamiento del elemento

El elemento procesando el componente recibe los elementos se indizará de indización de los conectores. y procesar los elementos según la configuración dada. A continuación, envía los elementos procesados para el servicio de Index Server.

Características clave del producto de servicio de procesamiento son:

  • Administra la asignación de las propiedades rastreadas a propiedades.   Las propiedades administradas incluyen el contenido que se indizarán incluidos los metadatos asociados con los elementos.

    En primer lugar, verá las propiedades rastreadas en un conjunto inicial de los elementos rastreados. Según esto, puede cambiar la asignación a propiedades administradas.

  • Análisis de los formatos de documento como Word, Excel y PDF.   Esto incluye la extracción de búsqueda de texto y los metadatos de estos formatos.

  • Extraer las propiedades del contenido rastreado.   Property extraction detects various properties such as names and dates, and maps them into managed properties. In this manner you can query these properties, and also apply query refinement based on these properties. Key extracted properties are company names, people names, locations, and dates.

    También es posible crear propiedades personalizadas extractores de datos en uso, por ejemplo, un diccionario de nombres de productos relevantes para su organización.

  • Linguistic processing of items before indexing.   En la búsqueda, lingüísticas se definen como el uso de la información acerca de la estructura y la variación de lenguajes para que los usuarios pueden encontrar más fácilmente la información pertinente. De relevancia del elemento con respecto a una consulta no necesariamente decide basándose en las palabras comunes para la consulta y el documento, pero en su lugar la medida en que su contenido ajusta a un usuario necesita la información.

    El procesamiento lingüístico incluye la detección del lenguaje escrito y la normalización lingüística del contenido de acuerdo con el idioma especificado. Normalización lingüístico incluye la normalización de caracteres y la normalización de bases de las variaciones.

FAST Search Server 2010 for SharePoint le permite personalizar cómo se procesan los elementos, por ejemplo, especificando los tipos de propiedades para extraer y cómo se puede consultar.

El distribuidor de contenido se comunica con los conectores de indización y la organiza de la alimentación de documentos de indización de los conectores para el servicio de Index Server. Puede establecer un principal y un distribuidor de contenido de copia de seguridad para la tolerancia a errores.

Puede configurar múltiples nodos para el rendimiento y tolerancia a errores de procesamiento de productos. Algunas operaciones de procesamiento del elemento manejan gran cantidad de procesamiento y requieren más de un elemento de nodo para controlar la velocidad de alimentación de procesamiento.

Análisis de vínculos de Web (Web Analyzer)

El analizador de Web tiene dos funciones principales: IT analiza los registros de clickthrough de búsqueda y las estructuras de hipervínculo. Ambos contribuyan al mejor clasificados resultados.

Items that show many clicks in the search clickthrough log are popular and therefore receive better rank scores than less-viewed items. También se perciban los elementos que están vinculados de muchos otros elementos más importantes para el usuario y, por tanto, recibir mejores puntuaciones de rango.

El analizador de la Web mejora la relevancia de búsqueda analizando el gráfico de vínculo y agregando los textos de anclaje y una mejora de consulta independientes rango basándose en la cardinalidad de los vínculos a los elementos en el índice. Delimitador de texto, describe los elementos que hacen referencia a y mejorarán la recuperación y relevancia al término de la consulta coincide con el texto del delimitador. Los elementos con varios vínculos señalando a ellos se clasificarse superior

El analizador de la Web puede escalar a muchos de los nodos para reducir el tiempo total necesario para el análisis. Para ello, se debe agregar los componentes de base de datos de búsqueda dedicados y componentes que se utilizan durante el análisis de vínculo de procesamiento de vínculo.

El componente de procesamiento de vínculo recibe las tareas desde el analizador de la Web durante el procesamiento de vínculo. Las instalaciones de gran escala, utilicen varios procesadores de vínculo.

El componente de base de datos de la búsqueda representa un servidor de búsqueda de clave/valor que se recupera la información de los vínculos generada por el procesamiento de vínculos. El procesamiento del elemento busca la información de vínculo de un elemento utilizando la dirección URL como clave. Las instalaciones de gran escala, utilizan varios componentes de base de datos de búsqueda.

Clúster de búsqueda

The search cluster provides the main topology for indexing and query matching. These components require their own scaling models using a matrix of servers in a row/column configuration. The following figure shows the key concepts used in a search cluster topology.

Arquitectura de clúster de FAST Search

Arquitectura de clúster de FAST Search

  • Índice de columna   El índice de búsqueda completado puede dividirse en varias columnas de índice discontinuo cuando el índice completo es demasiado grande para que se encuentran en un servidor. Una consulta que se evaluará con todas las columnas de índice dentro del clúster de búsqueda y los resultados de cada columna de índice se combinan en la lista de visitas de final de la consulta.

  • Fila de la búsqueda   Un conjunto de nodos de búsqueda que contienen todos los elementos indizados en el clúster de búsqueda. Una fila de la búsqueda se compone de un nodo de búsqueda para cada columna de índice dentro del clúster de búsqueda. Utilizar varias filas de la búsqueda para proporcionar equilibrio de carga de rendimiento y tolerancia a errores.

  • Principales y de copia de seguridad indizador   Puede configurar un nodo de indizador de copia de seguridad para la tolerancia a errores. Los dos indizadores producen el mismo conjunto de índices, pero sólo el indizador principal distribuye los índices de la consulta que coinciden con los nodos.

Importante

Los nodos primarios y de reserva de indizador se especifican como indizador filas en el archivo de configuración de implementación (deployment.xml). Las filas de la búsqueda y las filas de indizador utilizan la misma fila en la numeración en el archivo de configuración de implementación.

Indexing

El componente de indización crea índices invertidos, en función de los elementos que lo recibe. El componente de indización envía estos índices invertidos a la consulta que coincida con el componente para su uso posterior durante la evaluación de la consulta.

El servicio de Index Server está formado por dos componentes: el componente de distribuidor de indización y el componente de indización. Si el servicio de Index Server se implementa en varios nodos, las instancias de estos componentes también se implementará en varios nodos.

Si tiene más de una columna de índice, debe combinar los índices de los resultados de búsqueda coherente. En este caso, tendrá que implementar un nodo de Index Server para cada columna de índice. The indexing dispatcher manages the routing of processed items to the correct column.

El servicio de Index Server se escala con el número de elementos. Si el servicio de Index Server se ejecuta en un único nodo, se limita tanto el número de elementos que puede controlar por segundo y el número total de elementos que se puede incluir en el índice. Para escalar servicios de Index Server, se puede implementar a través de más de una columna de índice. Cada columna de índice contiene una parte del índice y el conjunto combinado de columnas de índice forman el índice completo. En este caso, cada nodo de Index Server va a controlar sólo una parte del índice completa y, por lo tanto, que se escala el número de elementos que pueden indizarse por segundo y el número total de elementos. Además, la indización de los nodos de la copia de seguridad puede proporcionar tolerancia a errores.

También es posible utilizar varios distribuidores de indización por dos razones de rendimiento y tolerancia a errores. Normalmente implementa el distribuidor de Index Server en el mismo nodo que el nodo principal de Index Server.

Coincidencia de la consulta

El servicio de consulta correspondiente, utiliza los índices de apertura creados por el servicio de Index Server para recuperar los elementos que coinciden con una consulta y, a continuación, devuelven estos elementos como una lista de aciertos de la consulta. Normalmente, una consulta contiene varios términos combinados con operadores de consulta, como, por ejemplo, AND y OR. La consulta que coincida con el servicio busca cada término en el índice y recupera una lista de elementos en el que aparece ese término. En el caso de un operador AND, por ejemplo, la lista de aciertos de la consulta constará de conjunto de elementos que contienen todos los términos. El orden de los artículos devueltos se basa en el mecanismo de clasificación solicitado, que normalmente es una clasificación compleja que se calcula a partir de varias propiedades de elemento o un criterio de ordenación que se basa en una o varias de las propiedades del elemento.

La consulta que coincida con el servicio también puede devolver un resumen resaltado de visitas para cada elemento en la lista de aciertos de la consulta. Un resumen resaltado de visitas consiste en un fragmento del elemento original en el que se resaltan los términos de consulta correspondiente.

La consulta que coincida con el servicio es responsable de perfeccionamiento profunda que está asociado con los resultados de consulta. Perfeccionamiento de la consulta habilita la obtención de detalles de resultados de una consulta mediante el uso de los datos estadísticos agregados que fue calculados para el resultado de consulta. La consulta que coincida con el servicio conserva las estructuras de datos de agregación para habilitar el perfeccionamiento de profundidad a través de grandes conjuntos de resultados.

Puede implementar la consulta que coincida con el servicio en el programa de instalación de una fila o columna para lograr tolerancia a errores y el ajuste de escala en el volumen de contenido y la consulta. Las columnas de índice proporcionan métodos para escalar en horizontal para el volumen de contenido, por el índice general de la partición en un conjunto de columnas discontinuas. Las filas de la búsqueda ofrecen métodos para escalar en horizontal para el volumen de la consulta, duplicando la misma partición del índice a través de más de un nodo de consulta correspondiente.

Importante

El número de columnas de la consulta que coinciden con los servicios siempre es igual a número de columnas en el servicio de indizador. La razón es que las columnas de índice representan una partición del índice y cada consulta que coincida con el nodo puede controlar sólo una partición de este tipo de índice.

Las filas de la búsqueda y las filas de indizador escalan independientemente. Una fila de la búsqueda duplica otra fila de la búsqueda para proporcionar tolerancia a errores y una capacidad mayor para las consultas. Fila de una indizador es un mecanismo de copia de seguridad para fines de tolerancia a errores durante la indización.

Procesamiento de consultas

The query processing component performs pre-processing of queries and post-processing of results. Query processing includes query–language parsing, linguistic processing, and item-level security processing. Procesamiento de los resultados incluye la combinación de los resultados de varias columnas de índice, el formato de la lista de aciertos de la consulta, formato a los datos de mejora de la consulta y quita los duplicados.

The query processing component interacts with the Autorización de búsqueda FAST (FSA) component to make sure that the user performing a query sees only the results that he or she is authorized to see. El servicio de procesamiento de la consulta, por tanto, valida los permisos del usuario y vuelve a escribir la consulta entrante con un filtro de acceso que corresponde a la pertenencia de grupo y usuario actual.

El servicio de procesamiento de consultas se puedan escalar a través de varios nodos para controlar la tolerancia a errores y más consultas por segundo. En este caso, todos los nodos deben estar definida en la misma manera.

Administración del sistema

The SharePoint Server 2010 Central Administration and site collection user interfaces provide the administrative interfaces for managing the FAST Search Server 2010 for SharePoint deployment and features. Common system administration services include UI and cmdlet based system and feature configuration, logging, index schema administration and search authorization.

Importante

Sólo se pueden realizar determinadas operaciones administrativas mediante el uso de cmdlets de Windows PowerShell o mediante el uso de herramientas de línea de comandos.

El componente de administración contiene funcionalidad para controlar la experiencia de búsqueda, por ejemplo, determine cómo realizar la extracción de propiedad, determinar qué sinónimos para utilizar, y determinar los elementos que se utilice como la mejor apuesta.

El Administrador de FSA es una parte del servicio de administración que administra la autorización de usuario para el contenido indizado. Esto garantiza que sólo los elementos que un usuario tiene derecho a leer aparecen en los resultados de consulta. El Administrador de FSA se comunica con los servicios de afirmaciones, servicios de Active Directory o en otro LDAP basado en servicios de directorio para administrar el proceso de autorización.

Administración de esquemas de índice

A key part of the administration service is the index schema administration. The index schema contains all the configuration entities that are needed to generate the configuration files that are related to the index schema for all the other services in the system.

El esquema de índice controla qué propiedades administradas de un elemento se indizarán, cómo se indizarán las propiedades y las propiedades que se pueden devolver en la lista de aciertos de la consulta.

El perfil de rango es una parte del esquema de índice que controla cómo se va a ordenar la lista de aciertos de la consulta por relevancia. Puede configurar el cálculo de relevancia, con un conjunto de parámetros del perfil de la jerarquía.

Autorización de búsqueda FAST (FSA)

El Administrador de Autorización de búsqueda FAST (FSA) es una parte del servicio de administración que administra la autorización de usuario para el contenido indizado.

El Administrador de FSA concede acceso a los usuarios para indizar los elementos en función de usuario de permisos de lectura de los repositorios de origen de contenido. Esto garantiza que sólo los elementos que un usuario tiene derecho a leer aparecen en los resultados de consulta.

El Administrador de FSA comunica con otro LDAP o de servicios de Active Directory, servicios de directorio en función de para administrar el proceso de autorización.

El rastreador Web de búsqueda FAST es un conector de indización opcional que se puede utilizar para los escenarios de rastreo de Web complejos que implica una combinación de los sitios de Internet e intranet.

You can find more information about the differences between crawling Web sites with the FAST Search Content SSA and with the FAST Search Web Crawler in Planeación y diseño de la colección de contenido (FAST Search Server 2010 for SharePoint).

El rastreador Web de búsqueda FAST lee las páginas Web y sigue los vínculos de las páginas para procesar una red completa de los elementos. A continuación, pasa los elementos recuperados para el elemento servicio de procesamiento.

For further architecture details on the FAST Search Web crawler, see Rastreo de contenido web mediante el agente de búsqueda de FAST Search.

Conceptos de implementación

Los siguientes términos se utilizan en el proceso de implementación.

  • Host (servidor)   Un equipo de servidor que puede alojar los componentes de FAST Search Server 2010 for SharePoint en una arquitectura distribuida. Un host puede ejecutar varios nodos de los tipos mismos o diferentes. Un host se identifica con su dominio nombre completo (FQDN).

  • Nodo   Una instancia de un componente de software implementado en un único host. Ejemplos: Artículos de procesamiento de nodo, el nodo de indizador, el nodo de consulta asociada. Los nodos se implementan a través de un conjunto de servidores.

    Importante

    La ejecución de varios nodos del mismo tipo en un único servidor puede representar un cuello de botella de rendimiento y normalmente no se recomienda.

  • Clúster de búsqueda   El clúster de búsqueda representa la topología de la consulta asociada y la indización de los nodos de la implementación. Estos componentes requieren su propia escala modelos mediante una matriz de servidores en una configuración de la fila o columna como se describió anteriormente.

Nota

Declinación de responsabilidades de traducción automática: Este artículo se ha traducido con un sistema informático sin intervención humana. Microsoft ofrece estas traducciones automáticas para que los hablantes de otros idiomas distintos del inglés puedan disfrutar del contenido sobre los productos, los servicios y las tecnologías de Microsoft. Puesto que este artículo se ha traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática.

See Also

Concepts

Planeación de la topología de la granja de servidores (FAST Search Server 2010 for SharePoint)
Opciones de implementación de granja de servidores de FAST Search Server (FAST Search Server 2010 for SharePoint)
Planeación y diseño de la colección de contenido (FAST Search Server 2010 for SharePoint)
Redundancia y disponibilidad de la granja de servidores de FAST Search Server

Other Resources

Planeación del esquema de índice (FAST Search Server 2010 for SharePoint) (traducción automática)