Déploiement de l'indexation de texte intégral

 

Dernière rubrique modifiée : 2005-05-12

Le Gestionnaire système Exchange permet de déployer l'indexation de texte intégral. Ce déploiement comprend les tâches suivantes :

  • création d'un index de texte intégral ;
  • optimisation de l'indexation de texte intégral ;
  • exécution d'un remplissage complet ;
  • définition d'une planification pour les remplissages incrémentiels ;
  • activation des requêtes d'indexation de texte intégral ;
  • notification aux utilisateurs.

Parmi ces tâches, le processus de remplissage complet sollicite considérablement le serveur. Il peut durer de quelques minutes pour une petite base de données jusqu'à plusieurs jours pour une base de données volumineuse. Toutefois, vous pouvez exécuter le processus de remplissage en arrière-plan pendant les heures de bureau sans affecter outre mesure les temps de réponse du système pour les utilisateurs.

Création d'un index de texte intégral

Avant de pouvoir utiliser l'indexation de texte intégral, vous devez créer un index initial (catalogue) pour chaque banque de boîtes aux lettres ou de dossiers publics à indexer. Ce processus crée la structure de fichier nécessaire que vous modifierez lorsque vous optimiserez l'index.

Pour obtenir la procédure détaillée pour la création d'un index de texte intégral, voir la rubrique Procédure de création d'un index de texte intégral initial.

Optimisation de l'indexation de texte intégral

Cette section décrit la procédure d'optimisation de l'indexation de texte intégral sur votre ordinateur Exchange Server 2003. En répartissant sur un volume RAID les fichiers faisant l'objet d'un accès fréquent, vous pouvez améliorer les performances de votre système.

Il existe cinq catégories principales de fichiers d'indexation de texte intégral. Par défaut, ces fichiers sont installés sur le lecteur système qui ne possède généralement pas le débit des E/S du volume RAID. Organisez les emplacements de ces fichiers sur le disque (comme indiqué dans le tableau suivant) pour optimiser les performances de l'indexation de texte intégral. Dans certains cas, cette rubrique fournit des procédures distinctes pour déplacer des fichiers dans des topologies en clusters et dans des topologies sans clusters. Les cinq catégories principales de fichiers d'indexation de texte intégral sont les suivantes :

  • Catalogues   Index principaux. Il n'existe qu'un seul catalogue pour chaque banque de dossiers publics ou de boîtes aux lettres dans Exchange Server 2003.
  • Banque de propriétés   Base de données qui contient diverses propriétés d'éléments indexés dans le catalogue. Il n'existe qu'une seule banque de propriétés par serveur.
  • Journaux de la banque de propriétés   Fichiers journaux associés à la base de données de la banque de propriétés.
  • Fichiers temporaires   Fichiers qui contiennent des informations temporaires utilisées par le service Microsoft Search.
  • Journaux de collecte   Fichiers journaux qui contiennent des informations de journal pour le service d'indexation. Il existe un ensemble de journaux pour chaque index.

Cette section fait référence aux outils suivants pour le déplacement des fichiers :

  • Pstoreutl   Situé dans Program Files\Common Files\System\MSSearch\Bin.
  • SetTempPath   Situé dans Program Files\Common Files\System\MSSearch\Bin.
  • Catutil   Situé dans Program Files\Common Files\System\MSSearch\Bin.

Emplacements recommandés pour les fichiers d'indexation de texte intégral

Type de fichier Emplacement recommandé Procédure de spécification de l'emplacement

Catalogue

Volume RAID

Spécifiez un emplacement sur le volume RAID lorsque vous créez le catalogue à l'aide du Gestionnaire système Exchange.

noteRemarque :
Si l'index a déjà été créé à un autre emplacement, utilisez l'outil Catutil pour le déplacer.

Banque de propriétés

Volume RAID

Utilisez l'outil Pstoreutl.

Journaux de la banque de propriétés

Volume RAID, au même emplacement que la banque de propriétés

Utilisez l'outil Pstoreutl.

Fichiers temporaires

Volume RAID

noteRemarque :
Sur un cluster, placez ces fichiers sur un lecteur qui ne fera pas l'objet d'un basculement, comme un lecteur local ou un lecteur situé sur le volume RAID ou sur un réseau SAN (Storage Area Network) configuré pour ne s'exécuter que sur un ordinateur désigné.

Utilisez l'outil SetTempPath.

Journaux de collecte

Laissez-les à l'emplacement par défaut ou déplacez-les vers l'emplacement de votre choix.

Définissez l'emplacement dans la clé de Registre StreamLogsDirectory.

Pour obtenir la procédure détaillée pour l'optimisation d'un index de texte intégral, voir la rubrique Procédure d'optimisation de l'indexation de texte intégral.

Déplacement de la banque de propriétés et des journaux de la banque de propriétés

Lors de la création du premier index sur votre serveur, Exchange Server 2003 crée une nouvelle base de données de la banque de propriétés sur votre lecteur système Exchange Server 2003. Pour améliorer les performances, déplacez les fichiers de la base de données de la banque de propriétés vers votre volume RAID. Le déplacement de la banque de propriétés et des journaux de la banque de propriétés ne doit être effectué qu'une seule fois pour chaque serveur, car tous les index d'un serveur utilisent la même banque de propriétés.

Pour obtenir la procédure détaillée pour le déplacement de la banque de propriétés dans un environnement sans clusters, voir la rubrique Procédure de déplacement de la banque de propriétés et des journaux de la banque de propriétés pour une indexation de texte intégral dans un environnement sans clusters.

Pour obtenir la procédure détaillée pour le déplacement de la banque de propriétés dans un environnement en clusters, voir la rubrique Procédure de déplacement de la banque de propriétés et des journaux de la banque de propriétés pour une indexation de texte intégral dans un environnement en clusters.

Déplacement du répertoire temporaire

Par défaut, les fichiers temporaires de filtre et de collecte (également appelés fichiers temp) se trouvent sur le lecteur système Exchange Server 2003, qui ne dispose généralement pas du débit E/S du volume RAID. L'outil SetTempPath permet de déplacer le répertoire temporaire vers le volume RAID. Le déplacement de ce répertoire ne doit être effectué qu'une seule fois pour chaque serveur, car tous les index d'un serveur utilisent le même répertoire temporaire.

Pour obtenir la procédure détaillée pour le déplacement du répertoire temporaire du service Microsoft Search, voir la rubrique Procédure de déplacement du répertoire temporaire du service Microsoft Search.

Déplacement de l'index (Catalogue)

L'index doit se trouver sur le volume RAID. Si vous n'avez pas spécifié cet emplacement lors de la création de l'index, utilisez l'outil Catutil pour le déplacer.

Pour obtenir la procédure détaillée pour le déplacement d'un index, voir la rubrique Procédure de déplacement de l'index (catalogue) pour l'indexation de texte intégral.

Déplacement des journaux de collecte

Les fichiers de collecte sont créés sur le lecteur système Exchange Server 2003, qui ne dispose généralement pas du débit E/S du volume RAID. Vous pouvez choisir de laisser les journaux de collecte à l'emplacement par défaut ou spécifier un emplacement sur un lecteur offrant de meilleures performances.

Pour obtenir la procédure détaillée pour le déplacement de journaux de collecte, voir la rubrique Procédure de déplacement des journaux de collecte pour l'indexation de texte intégral.

Augmentation de la taille limite des messages

Par défaut, l'index comprend des messages (y compris les pièces jointes) dont la taille maximale est de 16 Mo. Par conséquent, les messages contenant des pièces jointes volumineuses risquent d'être exclus de l'index et des résultats de recherche des utilisateurs. Pour éviter des problèmes liés aux performances, il est recommandé d'augmenter la taille limite au paramètre maximal de 4 000 Mo pour que les messages et pièces jointes plus volumineux soient indexés.

Pour obtenir la procédure détaillée pour l'augmentation de la taille limite des messages, voir la rubrique Procédure d'augmentation de la taille limite des messages pour l'indexation de texte intégral.

Configuration du script de vérification

Il est vivement recommandé d'utiliser le script de vérification fourni avec Microsoft Exchange 2000 Server SP2 pour éviter d'éventuels problèmes d'indexation. Si le service Microsoft Search s'arrête de manière anormale pendant un remplissage incrémentiel de l'index, certains dossiers et messages risquent de ne pas être indexés correctement. (Un remplissage incrémentiel est un processus qui met à jour un index existant avec des données modifiées depuis le remplissage précédent.) Le script de vérification résout ce problème en tenant à jour les fichiers de sauvegarde suivants dans le répertoire du catalogue :

  • deux fichiers d'enregistrement des points de contrôle : <catalogue>.chk1.gthr et <catalogue>.chk2.gthr ;
  • environ 13 fichiers constitués du dernier ensemble présumé complet et correct de fichiers de catalogue enregistré dans le sous-répertoire de sauvegarde.

Ce script n'est pas activé par défaut, car il nécessite une quantité non négligeable d'espace disque supplémentaire. La taille de fichier supplémentaire correspond à environ 200 octets pour chaque document de la base de données. Par exemple, 5 000 000 messages ou documents dans votre base de données génèrent des fichiers de vérification totalisant 1 giga-octet (Go). Plus la base de données comporte de documents, plus la taille de ces fichiers augmente. Assurez-vous que l'espace disque est suffisant avant d'exécuter le script de vérification. Il est recommandé de disposer d'au moins 15 % d'espace disponible sur le disque où les catalogues d'indexation de texte intégral sont stockés.

Pour obtenir la procédure détaillée pour la configuration de scripts de vérification, voir la rubrique Procédure de configuration d'un script de vérification pour l'indexation de texte intégral.

Exécution d'un remplissage complet

Une fois l'index créé, vous devez exécuter un remplissage complet (également appelé « analyse ») pour placer des données dans l'index. Le paramètre d'utilisation des ressources pour l'indexation de texte intégral se trouve sous l'onglet Indexation de texte intégral de la boîte de dialogue Propriétés du serveur. Par défaut, ce paramètre est défini sur Faible. Il est recommandé d'utiliser ce paramètre par défaut. Un paramètre supérieur offre peu d'avantages et peut ralentir l'accès utilisateur au serveur sur lequel Exchange Server 2003 est exécuté.

Lorsque le paramètre d'utilisation des ressources est défini sur Faible, le processus de remplissage s'exécute en arrière-plan et peut s'effectuer pendant les heures de bureau. Les threads du processus de remplissage utilisent le temps de traitement d'inactivité. Le système donne la priorité aux activités utilisateur. Comme l'indexation de texte intégral n'utilise que des cycles qui sont de toute façon inactifs, elle ne ralentit pas excessivement l'accès utilisateur au serveur. Attendez-vous à ce que l'utilisation de l'unité centrale soit proche des 100 %. Il s'agit là d'une conséquence normale du processus de remplissage.

noteRemarque :
Si vous rencontrez des problèmes de performances avec le serveur Exchange lorsque le service Microsoft Search effectue un remplissage incrémentiel ou complet, vous pouvez réduire l'utilisation des ressources au niveau Minimum. En définissant l'utilisation des ressources sur Minimum, vous réduisez davantage la quantité de ressources utilisables par le service Microsoft Search. Par conséquent, les remplissages incrémentiels ou complets sont plus longs à exécuter, mais aucune donnée n'est perdue.

Pour obtenir la procédure détaillée pour le démarrage d'un remplissage complet, voir la rubrique Procédure de démarrage d'un remplissage complet d'une indexation de texte intégral.

Le remplissage complet initial peut nécessiter beaucoup de temps. Dans une configuration Exchange Server 2003 standard, les performances du remplissage sont généralement comprises entre 10 et 20 messages par seconde. Les performances varient en fonction de la configuration matérielle, du type et de la taille des messages, ainsi que des ressources de serveur disponibles. Par conséquent, le temps total nécessaire à un remplissage complet peut varier de quelques minutes pour une petite base de données à plusieurs jours pour une base de données volumineuse.

La langue du contenu des documents se trouvant sur votre serveur peut également avoir une incidence sur la durée du remplissage. Par exemple, le remplissage d'un index sur un serveur qui contient des documents rédigés pour l'essentiel dans des langues d'Extrême-Orient peut prendre jusqu'à cinq fois plus de temps que pour un serveur contenant des documents rédigés dans des langues d'Europe de l'Ouest. Les dossiers contenant des échanges de News Internet peuvent augmenter considérablement la durée du remplissage si les dossiers contiennent des messages au format UUEncode.

Pour obtenir la procédure détaillée pour l'affichage de l'état du processus de remplissage, voir la rubrique Comment afficher l'état d'un remplissage d'indexation de texte intégral.

Pour obtenir la procédure détaillée pour la suspension d'un remplissage complet, voir la rubrique Comment suspendre le remplissage complet d'une indexation de texte intégral.

Définition d'une planification pour les remplissages incrémentiels

Déterminez la fréquence des remplissages incrémentiels souhaitée pour la mise à jour de l'index. Étant donné qu'un remplissage incrémentiel s'exécute en arrière-plan de la même manière qu'un remplissage complet, les mises à jour fréquentes ont peu d'incidence sur les temps de réponse du système pour les utilisateurs. Même si vous devez planifier au moins un remplissage incrémentiel quotidien, vous pouvez planifier des mises à jour plus fréquentes afin de garantir l'actualité de l'index. Vous devez également prendre en compte la durée nécessaire à un remplissage incrémentiel. Par exemple, une planification standard définit des mises à jour incrémentielles au début de chaque heure. Toutefois, si la mise à jour dure plus d'une heure, le remplissage incrémentiel suivant commence au début de l'heure suivante.

La planification du remplissage incrémentiel ne détermine que l'heure de démarrage du processus de remplissage. Elle n'impose aucune limite quant à la durée de ce processus. Par conséquent, il est possible qu'un remplissage incrémentiel dépasse l'heure programmée.

noteRemarque :
Généralement, si la taille de la banque de dossiers publics ou de boîtes aux lettres est inférieure ou égale à 6 Go, vous pouvez effectuer des mises à jour incrémentielles toutes les heures. Si la taille de la banque est supérieure à 6 Go ou si l'utilisation de la mémoire du serveur est intensive, vous pouvez mettre à jour l'index moins fréquemment.

Pour obtenir la procédure détaillée pour la planification du remplissage incrémentiel, voir la rubrique Procédure de planification du remplissage incrémentiel d'une indexation de texte intégral.

Activation des requêtes d'indexation de texte intégral

Après le remplissage initial et l'exécution complète d'au moins un remplissage incrémentiel, vous pouvez activer l'utilisation de l'index afin de permettre aux utilisateurs d'effectuer des recherches de texte intégral dans l'index.

Pour obtenir la procédure détaillée pour l'activation de l'utilisation d'un index de texte intégral, voir la rubrique Procédure d'activation des requêtes d'indexation de texte intégral.

Notification et formation des utilisateurs

Après avoir activé les requêtes, vous devez avertir les utilisateurs que les index sont disponibles pour des recherches et leur apprendre ce qu'ils peuvent espérer obtenir lorsqu'ils effectuent des recherches dans des index de texte intégral. Pour ce faire, vous pouvez par exemple envoyer un message électronique pour avertir les utilisateurs.