Topologie de la batterie de serveurs FAST Search Server (FAST Search Server 2010 for SharePoint)

 

S’applique à : FAST Search Server 2010

Dernière rubrique modifiée : 2012-01-20

Important

Cet article a été traduit automatiquement, voir l’avertissement. Vous pouvez consulter la version en anglais de cet article ici.

Cet article décrit la topologie de la batterie de serveurs Microsoft FAST Search Server 2010 for SharePoint, notamment les différents composants qui peuvent subir une montée en puissance parallèle sur plusieurs serveurs pour des raisons de performance et de tolérance de panne.

Pour plus d'informations sur la topologie de batterie de serveurs Microsoft SharePoint Server 2010 globale, voir la rubrique Planifier la topologie de la batterie de serveurs (FAST Search Server 2010 for SharePoint).

Dans cet article :

  • Le flux de contenu

  • Composants au sein de la rapide recherche Server 2010 pour la batterie de serveurs SharePoint

  • Concepts de déploiement

Le flux de contenu

FAST Search Server 2010 for SharePoint extraire le contenu d'indexation à l'aide d'un ou plusieurs des connecteurs pris en charge l'indexation. La FAST contenu Search Service Application (SSA) est le connecteur de l'indexation par défaut et récupère le contenu à partir de diverses sources de contenu telles que des référentiels de contenu SharePoint, les serveurs Web, les dossiers Exchange, la ligne de données et des fichiers serveurs d'entreprise. Vous pouvez utiliser les autres connecteurs indexation FAST Search Server 2010 for SharePoint pour les scénarios d'extraction du contenu plus spécifiques. Pour plus d'informations sur les options de lien d'indexation, voir la rubrique Planifier et concevoir une collection de contenu (FAST Search Server 2010 for SharePoint).

Traitement de l'élément extrait le contenu disponible pour la recherche à partir de documents récupérés et traite les éléments selon le langage écrit.

Le composant d'indexation convertit le contenu disponible pour la recherche dans l'index inversés qui servent à son tour par la correspondance de la requête.

Traitement de requêtes traite les requêtes utilisateur en effectuant des transformations de la requête, telles que l'expansion de synonyme, avant de la requête réelle par rapport à l'index de correspondance.

Correspondance de la requête utilise les index de recherche pour retourner les éléments qui correspondent à une requête utilisateur. Les articles sont retournés dans une liste de test de requête est triée par la pertinence pour la requête spécifiée.

FAST Search Server 2010 for SharePoint interagit avec l'infrastructure Active Directory ou les demandes pour résoudre les autorisations et appartenances aux groupes. Elle renvoie ensuite seulement l'utilisateur actuel est autorisé à consulter, conformément aux paramètres de la source de contenu des éléments.

Composants au sein de la rapide recherche Server 2010 pour la batterie de serveurs SharePoint

FAST Search Server 2010 for SharePoint peut s'exécuter sur un seul nœud. Ou bien, vous pouvez évoluer pour exécuter une ou plusieurs des composants sur plusieurs nœuds. Dans ce cas le système peut indexer un plus grand nombre d'éléments, gérer des mises à jour de l'élément de plus, réduire la latence de l'indexation ou répondre à plus de requêtes par seconde.

La figure suivante illustre les principaux composants de la FAST Search Server 2010 for SharePoint.

Recherche rapide pour la topologie de batterie de serveurs SharePoint

Topologie de batterie de serveurs FAST Search Server

Les sous-sections suivantes décrivent les fonctionnalités de chaque composant.

Traitement de l'élément

L'élément de traitement du composant reçoit les éléments à indexer à partir de l'indexation des connecteurs. et traiter les éléments en fonction de la configuration donnée. Il envoie ensuite les éléments transformés pour le service d'indexation.

Fonctionnalités clés de l'article de service de traitement sont les suivantes :

  • Mappage de propriétés analysées à gérer les propriétés.   Les propriétés gérées contiennent le contenu qui n'est pas indexé, y compris les métadonnées des éléments.

    Tout d'abord, vous allez découvrir les propriétés analysées sur un ensemble initial des éléments analysés. En fonction de cela, vous pouvez modifier le mappage pour les propriétés gérées.

  • Lors du traitement des formats de document tels que Word, Excel et PDF.   Cela inclut l'extraction de texte pouvant être recherchés et les métadonnées à partir de ces formats.

  • Extraction des propriétés du contenu analysé.   Extraction des propriétés détecte plusieurs propriétés telles que les noms et les dates et les mappe en propriétés gérées. De cette manière, vous pouvez interroger ces propriétés et aussi appliquer affinement de la requête en fonction de ces propriétés. Principales propriétés extraites sont des noms de sociétés, les noms de personnes, les emplacements et les dates.

    Il est également possible de créer des extracteurs de propriété personnalisée à l'aide, par exemple, un dictionnaire de noms de produit relatives à votre organisation.

  • Traitement de linguistiques des articles avant de l'indexation.   Dans la recherche, linguistiques est défini en tant que l'utilisation des informations sur la structure et une variation de langues afin que les utilisateurs peuvent trouver plus facilement les informations pertinentes. Pertinence de l'élément à une requête n'est pas nécessairement choisi en fonction des mots communs à la requête et de document, mais au lieu de cela, l'étendue que son contenu répond à l'utilisateur est nécessaire pour plus d'informations.

    Le traitement linguistique comprend la détection de la langue écrite et la normalisation linguistique du contenu en fonction de la langue donnée. Normalisation linguistique inclut la normalisation des caractères et la normalisation de recherche par radical des variations.

FAST Search Server 2010 for SharePoint permet de personnaliser le mode de traitement des éléments — par exemple, en spécifiant les types de propriétés à extraire et comment ils peuvent être interrogés.

Le serveur de distribution de contenu communique avec les connecteurs d'indexation et les organise de l'alimentation de documents à partir de l'indexation des connecteurs vers le service d'indexation. Vous pouvez configurer un serveur principal et un serveur de distribution de contenu sauvegarde pour la tolérance de panne.

Vous pouvez définir des élément plusieurs nœuds pour la tolérance de panne et les performances de traitement. Certaines opérations de traitement des articles sont traitement intensif et requièrent plus d'un élément de nœud pour gérer l'alimentation taux de traitement.

Analyse du lien Web (Web Analyzer)

L'Analyseur de Web a deux fonctions principales : il analyse les journaux de clic de la recherche et les structures de lien hypertexte. Les deux contribuent aux résultats de la mieux classée recherche.

Éléments ayant un nombre de clics dans le journal recherche des taux de clics publicitaires sont populaires et donc recevoir les meilleurs scores rang que les éléments affichés à la moins. Éléments qui sont liés à de nombreux autres éléments sont également perçue comme plus pertinents pour l'utilisateur et de recevoir, par conséquent, les meilleurs scores rang.

L'Analyseur de Web améliore la pertinence de la recherche en analysant la courbe du lien et en ajoutant des textes d'ancrage et un renforcement de rang indépendant requête en fonction de la cardinalité de lien aux éléments de l'index. Textes d'ancrage décrivant les éléments qu'ils font référence à et amélioreront leur pertinence et de rappel lorsqu'un terme de requête correspond à du texte d ' ancrage. Éléments avec de nombreux liens pointant vers les seront classés plus haut

L'Analyseur de Web peut évoluer vers différents nœuds pour réduire le temps total nécessaire pour l'analyse. Pour cela, vous devez ajouter des composants de base de données de recherche dédié et de liaison de composants qui sont utilisés lors de l'analyse du lien de traitement.

Le composant de traitement de liaison reçoit des tâches à partir de l'Analyseur de Web au cours de traitement des liaisons. Installations à grande échelle utilisent plusieurs processeurs de lien.

Le composant de base de données de liste de choix représente un serveur de recherche de clé/valeur qui récupère les informations des liens générées par le traitement des liaisons. Le traitement de l'élément recherche les informations de liaison pour un article à l'aide de l'URL en tant que clé. Installations à grande échelle utilisent plusieurs composants de base de données de liste de choix.

Cluster de la recherche

Le cluster de recherche fournit la topologie de principale pour l'indexation et la correspondance de la requête. Ces composants nécessitent leurs propres modèles à l'aide d'une matrice des serveurs dans une configuration de la ligne ou une colonne d'échelle. La figure suivante illustre les concepts clés utilisés dans une topologie de cluster de recherche.

Architecture de cluster FAST Search

Architecture de cluster FAST Search

  • Index de colonne   L'index de recherche complet peut être divisé en plusieurs colonnes disjointes index lors de l'index complet est trop volumineux pour être résident sur un serveur. Une requête est évaluée par rapport à toutes les colonnes d'index au sein du cluster de la recherche et les résultats à partir de chaque colonne d'index sont fusionnés dans la liste d'accès de requête finale.

  • Ligne de recherche   Un ensemble de nœuds de recherche contenant tous les éléments indexés dans le cluster de la recherche. Une ligne de recherche se compose d'un nœud de recherche pour chaque colonne d'index au sein du cluster de la recherche. Plusieurs lignes de recherche vous permet de fournir la tolérance de panne et de partage de la charge de performances.

  • Principales et de sauvegarde indexeur   Vous pouvez configurer un nœud de l'indexeur de sauvegarde pour la tolérance de pannes. Les deux indexeurs produisent le même jeu d'index, mais seulement l'indexeur principal distribue les index de la requête de nœuds correspondants.

Important

Les nœuds principaux et secondaires indexeur sont spécifiées sous forme de lignes de l'indexeur dans le fichier de configuration de déploiement (deployment.xml). Lignes de la recherche et les lignes de l'indexeur utilisent la même ligne que la numérotation dans le fichier de configuration de déploiement.

L'indexation

Le composant d'indexation crée des index renversé, selon les éléments qu'il reçoit. Le composant d'indexation envoie ces index inversé pour la requête de mise en correspondance composants pour une utilisation ultérieure lors de l'évaluation de la requête.

Le service d'indexation est constituée de deux composants : le composant d'indexation de répartiteur et le composant d'indexation. Si le service d'indexation est déployé sur plusieurs nœuds, les instances de ces composants seront également déployés sur plusieurs nœuds.

Si vous avez plusieurs colonnes d'index, vous devez combiner les index afin de produire des résultats de recherche cohérent. Dans ce cas, vous devez déployer un seul nœud de l'indexation pour chaque colonne d'index. Le répartiteur d'indexation gère le routage des éléments transformés à la colonne appropriée.

Le service d'indexation s'adapte à sur le nombre d'éléments. Si le service d'indexation s'exécute sur un seul nœud, à la fois le nombre d'éléments, qu'il peut traiter par seconde et le nombre total d'éléments qu'il peut inclure dans l'index sont limitées. Pour déployer le service d'indexation, vous pouvez le déployer sur plusieurs colonnes d'index. Chaque colonne d'index contient une partie de l'index et l'ensemble combiné des colonnes d'index forment l'index complet. Dans ce cas, chaque nœud d'indexation doit gérer qu'une partie de la totalité de l'index et par conséquent, qu'elle s'adapte à la fois le nombre d'éléments pouvant être indexées par seconde et le nombre total d'éléments. En outre, l'indexation des nœuds de sauvegarde peut fournir une tolérance de pannes.

Il est également possible d'utiliser plusieurs répartiteurs d'indexation pour les deux raisons de performances et de tolérance de pannes. Normalement, vous déployez le répartiteur d'indexation sur le même nœud comme nœud principal de l'indexation.

Correspondance de la requête

Le service correspondant de requête utilise l'index inversés créés par le service d'indexation pour extraire les éléments qui correspondent à une requête et renvoient ensuite ces éléments sous la forme d'une liste d'accès de requête. Une requête contient généralement plusieurs termes combinés à des opérateurs de requête, telles que AND et OR. La requête service de mise en correspondance chacun des termes dans l'index de recherche et récupère une liste d'éléments dans lesquels apparaît ce terme. Dans le cas d'un opérateur AND, par exemple, la liste d'accès de requête sera formée de l'ensemble des éléments qui contiennent tous les termes. L'ordre des articles retournés est basé sur le mécanisme de tri demandé est généralement un classement complexe qui est calculé à partir de diverses propriétés d'élément ou un tri basé sur un ou plusieurs des propriétés d'élément.

La requête de mise en correspondance service peut aussi renvoyer un résumé en surbrillance d'accès pour chaque élément dans la liste d'accès de requête. Un résumé en surbrillance d'accès se compose d'un fragment de l'élément d'origine dans laquelle les termes de requête correspondants sont mis en surbrillance.

La requête de mise en correspondance service est responsable de perfectionnement profonde qui est associé aux résultats de la requête. Optimisation de requête permet la descente dans un résultat de requête à l'aide des données statistiques agrégées qui a été calculées pour le résultat de requête. La service de mise en correspondance de requête met à jour des structures de données d'agrégation pour activer l'optimisation complète sur grands ensembles de résultats.

Vous pouvez déployer la service dans un programme d'installation de ligne/colonne pour atteindre la tolérance de panne et de dimensionnement dans le volume de contenu et les requêtes de correspondance de requête. Index de colonnes permettent de faire évoluer pour le volume de contenu, en partitionnant l'index global en un ensemble de colonnes disjointes. Lignes de la recherche permettent de faire évoluer pour le volume de la requête, en dupliquant la même partition de l'index sur une seule requête de nœud correspondant.

Important

Le nombre de colonnes dans la requête de mise en correspondance service toujours est égal au nombre de colonnes dans le service de l'indexeur. La raison est que les colonnes d'index représentent un partitionnement de l'index, et que chaque requête de filtrage de nœud peut gérer qu'une seule partition de ce type de l'index.

Lignes de la recherche et les lignes de l'indexeur évolution horizontale indépendamment. Une ligne de recherche duplique une autre ligne de recherche pour fournir une tolérance de pannes et une capacité accrue pour les requêtes. Une ligne de l'indexeur est utilisé comme mécanisme de sauvegarde pour des raisons de tolérance de pannes lors de l'indexation.

Traitement de requête

Le composant de traitement de requête exécute des requêtes de prétraitement et post-traitement des résultats. Traitement de requête inclut query–language lors de l'analyse, de traitement linguistique et de traitement de la sécurité au niveau de l'élément. Traitement des résultats inclut fusionner les résultats à partir de plusieurs colonnes d'index, la mise en forme de la liste d'accès de requête, la mise en forme les données d'optimisation de requête et la suppression des doublons.

Le composant de traitement de requête interagit avec le composant FAST Search Authorization (FSA) pour vous assurer que l'utilisateur qui exécute une requête peut voir uniquement les résultats, qu'il ou elle est autorisée à voir. Par conséquent, le service de traitement de requête valide les autorisations de l'utilisateur et réécrit de la requête entrante avec un filtre d'accès qui correspond à l'appartenance des utilisateurs et de groupes en cours.

La service de traitement de requête peut être distribuée horizontalement sur plusieurs nœuds pour gérer la tolérance de panne et plus de requêtes par seconde. Dans ce cas, tous les nœuds doivent être définis dans la même manière.

Administration du système

Interfaces d'utilisateur SharePoint Server 2010 site d'administration centrale et collection fournissent des interfaces d'administration pour gérer les fonctionnalités et de déploiement FAST Search Server 2010 for SharePoint. Services d'administration système courantes comprennent l'interface utilisateur et l'applet de commande en fonction de configuration système et de fonctionnalité, journalisation, l'autorisation de recherche et d'administration de schéma index.

Important

Certaines opérations d'administration ne peuvent être effectuées à l'aide des cmdlets Windows PowerShell ou à l'aide des outils de ligne de commande.

Le composant d'administration contient des fonctionnalités pour contrôler l'expérience de recherche, par exemple pour déterminer comment faire pour effectuer l'extraction des propriétés, déterminer les synonymes à utiliser, et déterminer les éléments à utiliser en tant que meilleure PARI.

Le Gestionnaire de FSA fait partie du service d'administration qui gère l'autorisation des utilisateurs pour le contenu indexé. Cela garantit que seuls les éléments dont un utilisateur est autorisé à lire sont affichés dans les résultats de requête. Le Gestionnaire de FSA communique avec les services de revendications, services Active Directory ou autre LDAP basée les services d'annuaire pour gérer le processus d'autorisation.

Administration de schéma de l'index

Un rôle clé dans le service d'administration est l'administration de schéma d'index. Le schéma de l'index contient toutes les entités de configuration sont nécessaires pour générer les fichiers de configuration qui concernent le schéma d'index de tous les autres services du système.

Le schéma de l'index détermine les propriétés d'un élément managées ne sont pas indexées, comment les propriétés ne sont pas indexées, et les propriétés qui peuvent être retournées dans la liste d'accès de requête.

Le profil de rang est une partie du schéma d'index qui contrôle la façon dont la liste d'accès de requête sont triée par pertinence. Vous pouvez configurer le calcul de pertinence à l'aide d'un ensemble de paramètres de classement de profil.

Autorisation de recherche rapide (FSA)

Le Gestionnaire de FAST Search Authorization (FSA) fait partie du service d'administration qui gère l'autorisation des utilisateurs pour le contenu indexé.

Le Gestionnaire de FSA accorde aux utilisateurs d'accéder à indexer les éléments en fonction de l'utilisateur d'autorisations de lecture sur les référentiels de source de contenu. Cela garantit que seuls les éléments dont un utilisateur est autorisé à lire sont affichés dans les résultats de requête.

Le Gestionnaire de FSA communique avec les services Active Directory ou autre LDAP services d'annuaire en fonction de gérer le processus d'autorisation.

Le robot d'indexation Web de recherche rapide est un connecteur de l'indexation facultatif qui peut être utilisé pour les scénarios d'analyse Web complexes, impliquant une combinaison de sites Internet et intranet.

Vous trouverez plus d'informations sur les différences entre l'analyse de sites Web avec la FAST recherche contenu SSA et avec la FAST recherche WebCrawler dans Planifier et concevoir une collection de contenu (FAST Search Server 2010 for SharePoint).

Le robot d'indexation rapide recherche Web lit les pages Web et suit les liens sur les pages pour traiter un site Web complet d'articles. Il passe ensuite les éléments récupérés à l'article de service de traitement.

Pour plus architecture d'informations sur l'outil d'analyse rapide recherche Web, consultez Analyse de contenu Web avec le robot d’indexation FAST Search.

Concepts de déploiement

Les termes suivants sont utilisés dans le processus de déploiement.

  • Hôte (serveur)   Si l'ordinateur serveur peut héberger des composants FAST Search Server 2010 for SharePoint dans une architecture distribuée. Un hôte peut exécuter plusieurs nœuds des types identiques ou différents. Un hôte est identifié avec son domaine nom complet (FQDN).

  • Nœud   Une instance d'un composant de logiciel déployée vers un hôte unique. Exemples : Articles de traitement nœud, nœud de l'indexeur, correspondance de la requête nœud. Noeuds sont déployés sur un ensemble de serveurs.

    Important

    Plusieurs nœuds du même type en cours d'exécution sur un serveur unique peut représenter un goulet d'étranglement de performances et est généralement pas recommandé.

  • Cluster de la recherche   Le cluster de recherche représente la topologie pour la requête de mise en correspondance et l'indexation de nœuds dans votre déploiement. Ces composants nécessitent leur propre mise à l'échelle des modèles à l'aide d'une matrice des serveurs dans une configuration de ligne/colonne, comme décrit ci-dessus.

Notes

Avertissement traduction automatique : cet article a été traduit par un ordinateur, sans intervention humaine. Microsoft propose cette traduction automatique pour offrir aux personnes ne maîtrisant pas l’anglais l’accès au contenu relatif aux produits, services et technologies Microsoft. Comme cet article a été traduit automatiquement, il risque de contenir des erreurs de grammaire, de syntaxe ou de terminologie.

See Also

Concepts

Planifier la topologie de la batterie de serveurs (FAST Search Server 2010 for SharePoint)
Options de déploiement de la batterie de serveurs FAST Search Server (FAST Search Server 2010 for SharePoint)
Planifier et concevoir une collection de contenu (FAST Search Server 2010 for SharePoint)
Redondance et disponibilité de la batterie de serveurs FAST Search Server

Other Resources

Planifier le schéma d’index (FAST Search Server 2010 for SharePoint) (traduction automatique)