Administration du service d'indexation

Sur cette page

Administration du service d'indexation Administration du service d'indexation
Mise en route du service d'indexation Mise en route du service d'indexation
Utilisation du service d'indexation Utilisation du service d'indexation
Notions fondamentales relatives au service d'indexation Notions fondamentales relatives au service d'indexation
Recherche dans les catalogues Recherche dans les catalogues
Tâches fondamentales d'administration du service d'indexation Tâches fondamentales d'administration du service d'indexation
Configuration des ressources Web à indexer Configuration des ressources Web à indexer
Affichage et création de catalogues Affichage et création de catalogues
Affichage de l'état d'indexation Affichage de l'état d'indexation
Démarrage, arrêt et suspension du service d'indexation Démarrage, arrêt et suspension du service d'indexation
Configuration des propriétés du service d'indexation Configuration des propriétés du service d'indexation
Optimisation des performances du service d'indexation Optimisation des performances du service d'indexation
Gestion des catalogues Gestion des catalogues
Affichage des propriétés des catalogues et des répertoires indexés Affichage des propriétés des catalogues et des répertoires indexés
Ajout de répertoires physiques à un catalogue Ajout de répertoires physiques à un catalogue
Forcer de nouvelles analyses complètes et incrémentielles des répertoires Forcer de nouvelles analyses complètes et incrémentielles des répertoires
Démarrage, arrêt et suspension de catalogues individuels Démarrage, arrêt et suspension de catalogues individuels
Fusion de catalogues Fusion de catalogues
Spécification de sites Web ou NNTP à inclure dans les catalogues Spécification de sites Web ou NNTP à inclure dans les catalogues
Test de catalogues à l'aide de requêtes Test de catalogues à l'aide de requêtes

Administration du service d'indexation

Le service d'indexation est utilisé pour construire des catalogues de documents dans lesquels il est possible d'effectuer des recherches. Lorsque vous ajoutez cette fonctionnalité à un site Web, celle-ci permet aux utilisateurs de rechercher des rubriques à l'aide d'un formulaire HTML (Hypertext Markup Language) standard. Tout comme IIS (Internet Information Services), le service d'indexation est intégré au système d'exploitation Microsoft Windows et peut être utilisé sur les réseaux intranet, extranet et Internet. En tant qu'administrateur Web, vous pouvez configurer les catalogues dont le service d'indexation a besoin, configurer l'indexation de contenu et gérer l'indexation au jour le jour.

La gestion du service d'indexation est très différente de celle de IIS. Avant d'utiliser le service d'indexation, vous devez procéder de la façon suivante :

  1. Installez le service d'indexation sur le site ou le serveur virtuel que vous souhaitez indexer. Le service d'indexation est configuré pour démarrer manuellement par défaut. Vous devrez modifier ce comportement pour que le service d'indexation démarre automatiquement.

  2. Créez un catalogue de documents à rechercher. Chaque catalogue doit être associé à un site Web spécifique et peut également être associé à un serveur virtuel NNTP (Network News Transfer Protocol).

  3. Spécifiez les répertoires et fichiers à indexer. Spécifiez les options d'indexation de contenu à l'aide du composant logiciel enfichable Internet Information Services.

  4. Créez une page de recherche sur le site Web. Cette page est utilisée pour accéder au catalogue et extraire les informations correspondant aux paramètres de recherche de l'utilisateur. La page de recherche doit spécifier l'emplacement physique du catalogue à l'aide de la variable CiCatalog. D'autres variables sont également disponibles pour la configuration de la recherche dans l'index.

Une fois que vous avez installé et configuré le service d'indexation, celui-ci crée et met à jour automatiquement les index. Le service tente également de gérer ses catalogues, de sorte que les données qu'ils contiennent soient cohérentes et actuelles. Les données des catalogues sont parfois désynchronisées ; lorsque cela se produit, vous pouvez être amené à reconstruire le catalogue ou à forcer le service d'indexation à procéder à une nouvelle analyse des documents qui doivent être indexés. Ces tâches, ainsi que d'autres tâches d'administration, sont étudiées dans ce chapitre.

Mise en route du service d'indexation

Le service d'indexation extrait des informations de documents spécifiques et organise les résultats dans un catalogue qui permet une recherche rapide et facile. Les informations extraites incluent le contenu (texte) des documents ainsi que leurs propriétés, comme par exemple le titre et l'auteur du document. Pour comprendre comment fonctionne le service d'indexation, étudions les questions suivantes :

  • Comment utiliser et installer le service d'indexation ?

  • Comment le service d'indexation construit-il les index et les catalogues ?

  • Comment rechercher et manipuler des index ?

Utilisation du service d'indexation

Le service d'indexation indexe les types de documents suivants :

  • HTML (.htm ou .html) ;

  • fichiers texte ASCII (.txt) ;

  • documents Microsoft Word (.doc) ;

  • feuilles de calcul Microsoft Excel (.xls) ;

  • présentations Microsoft PowerPoint (.ppt) ;

  • messagerie et News Internet (lorsque vous indexez des serveurs virtuels NNTP).

D'autres documents pour lesquels un filtre de document est installé peuvent également être indexés. Si le service d'indexation n'est pas installé sur votre serveur Web, vous pouvez l'installer à l'aide de l'Assistant Composants de Windows. Pour accéder à cet Assistant et l'utiliser, procédez de la façon suivante :

  1. Ouvrez une session sur l'ordinateur à l'aide d'un compte disposant de privilèges administratifs.

  2. Cliquez sur Démarrer, pointez sur Paramètres, puis cliquez sur Panneau de configuration.

  3. Double-cliquez sur Ajout/Suppression de programmes. La boîte de dialogue Ajout/Suppression de programmes s'affiche.

  4. Démarrez l'Assistant Composants de Windows en cliquant sur Ajouter/Supprimer des composants Windows.

  5. Sélectionnez Service d'indexation, puis cliquez sur Suivant pour continuer. L'Assistant installe alors le service d'indexation.

Une fois que vous avez installé le service d'indexation, vous gérez le service à l'aide du composant logiciel enfichable Service d'indexation de la console MMC (Microsoft Management Console) ou via le nœud Service d'indexation de la console Gestion de l'ordinateur. Indépendamment de l'option choisie, vous pouvez travailler avec des serveurs locaux ou distants, via les mêmes techniques. La seule tâche différente est la connexion aux serveurs distants.

Avec le composant logiciel enfichable, vous définissez le serveur avec lequel vous souhaitez travailler lorsque vous ajoutez le composant logiciel enfichable à une console de gestion. Voici la procédure permettant d'ajouter le composant logiciel enfichable Service d'indexation à une console de gestion et de sélectionner un serveur avec lequel travailler :

  1. Ouvrez la boîte de dialogue Exécuter en cliquant sur Démarrer, puis en cliquant sur Exécuter.

  2. Tapez mmc dans le champ Ouvrir, puis cliquez sur OK. La console MMC (Microsoft Management Console) s'ouvre.

  3. Dans MMC, cliquez sur Console, puis cliquez sur Ajouter/Supprimer un composant logiciel enfichable. La boîte de dialogue Ajouter/Supprimer un composant logiciel enfichable s'ouvre.

  4. Sous l'onglet Autonome, cliquer sur Ajouter.

  5. Dans la boîte de dialogue Ajout d'un composant logiciel enfichable autonome, cliquez sur Service d'indexation, puis sur Ajouter.

  6. Sélectionnez L'ordinateur local : (l'ordinateur sur lequel cette console s'exécute) pour vous connecter à l'ordinateur sur lequel s'exécute la console. Vous pouvez également sélectionner Un autre ordinateur, puis taper le nom d'un ordinateur distant.

  7. Cliquez sur Terminer. Ensuite, cliquez sur Fermer, puis sur OK.

Avec la console Gestion de l'ordinateur, vous vous connectez automatiquement au serveur local lorsque vous démarrez l'utilitaire. Vous pouvez vous connecter à un autre ordinateur en cliquant avec le bouton droit sur le nœud Gestion de l'ordinateur, en sélectionnant Se connecter à un autre ordinateur, puis en suivant les invites. La figure 9-1 affiche le nœud Service d'indexation de Gestion de l'ordinateur. Comme vous pouvez le voir, le fait de sélectionner le nœud Service d'indexation affiche un aperçu des catalogues actuellement installés, lesquels incluent les catalogues par défaut System et Web. Le récapitulatif du catalogue offre les informations suivantes :

  • Catalogue Le nom descriptif qui a été défini lors de la création du catalogue

Utilisez le noeud Service d'indexation de Gestion de l'ordinateur pour gérer le service d'indexation

Figure 9-1 Utilisez le nœud Service d'indexation de Gestion de l'ordinateur pour gérer le service d'indexation.

  • Emplacement L'emplacement physique du catalogue, comme par exemple D:\Catalogs\WWW\

  • Taille (Mo) La taille du catalogue en mégaoctets

    Remarque Le catalogue typique représente 25 à 40 % de la taille totale des documents indexés. Cela signifie que si vous indexez 1 gigaoctet (Go) de documents, vous devrez disposer de 250 à 400 Mo d'espace de stockage supplémentaire pour le catalogue associé.

  • Nombre total des documents Le nombre total de documents désignés pour l'indexation dans ce catalogue

  • Documents à indexer Le nombre total de documents qui restent à indexer

  • Indexation différée Le nombre total de documents qui doivent être indexés, mais qui ne peuvent pas l'être parce qu'ils sont en cours d'utilisation

    Remarque Le service d'indexation diffère l'indexation des documents en cours d'utilisation et tente de les indexer lorsqu'ils ne sont plus utilisés.

  • Listes de mots Le nombre de listes de mots associées au catalogue et stockées dans la mémoire du système

  • Index enregistrés Le nombre d'index enregistrés dans le catalogue

  • État L'état du processus d'indexation

Si vous accédez au service d'indexation via la console Gestion de l'ordinateur, vous verrez que deux catalogues par défaut ont été créés lors de l'installation du service. Ces catalogues sont les suivants :

  • System Le catalogue System contient un index de tous les documents sur tous les disques durs reliés au serveur.

  • Web Le catalogue Web contient un index du site Web par défaut.

    Conseil Je recommande la suppression du catalogue System. Ce catalogue n'est généralement pas utilisé sur un serveur IIS, et la gestion du catalogue consomme des ressources du système qui pourraient être utilisées ailleurs.

Vous pouvez à tout moment créer des catalogues supplémentaires. Lorsque vous créez un catalogue, vous pouvez l'associer à un site Web et à un serveur virtuel NNTP. Le service utilise ensuite les paramètres d'indexation sur les répertoires associés au site ou au serveur virtuel pour déterminer quels documents doivent être indexés. Vous configurez les paramètres d'indexation sur les répertoires à l'aide du composant logiciel enfichable Internet Information Services.

Notions fondamentales relatives au service d'indexation

Le service d'indexation stocke les informations du catalogue au format Unicode. Cela permet au service d'indexer et de rechercher le contenu dans plusieurs langues. Le service d'indexation effectue trois fonctions principales pour traiter le contenu des documents :

  • Indexation L'indexation est le processus qui consiste à extraire les informations des documents. L'index contient le contenu du corps des documents, mais pas les mots des listes d'exceptions associées au catalogue. Les index sont compressés afin d'économiser de l'espace.

  • Construction de catalogue La construction de catalogue est le processus qui consiste à stocker les informations de l'index dans un emplacement nommé. Les catalogues contiennent le contenu extrait sous la forme d'index et les propriétés stockées pour un ensemble de documents.

  • Fusion La fusion est le processus qui consiste à combiner des index temporaires afin de créer des index combinés ou des index maître. La fusion des index améliore les performances du service d'indexation et réduit la quantité de mémoire vive utilisée pour stocker les index temporaires en mémoire.

L'indexation et la construction de catalogue ont lieu automatiquement en arrière-plan lorsque le service d'indexation s'exécute. Lors du premier démarrage, le service d'indexation effectue un inventaire des répertoires associés à chaque catalogue afin de déterminer quels documents doivent être indexés. Cette opération est appelée "analyse". Le service d'indexation peut procéder à deux types d'analyses :

  • Complète

  • Incrémentielle

Les analyses complètes examinent l'ensemble des documents associés à un catalogue. Le service d'indexation exécute une analyse complète dans les cas suivants :

  • lorsque le service s'exécute pour la première fois après l'installation ;

  • lorsqu'un dossier est ajouté à un catalogue ;

  • dans le cadre de la récupération, en cas d'erreur grave ;

  • lorsque vous décidez de procéder manuellement à cette analyse.

Les analyses incrémentielles examinent uniquement les documents qui ont été modifiés depuis la dernière analyse complète ou incrémentielle. Le service d'indexation exécute une analyse incrémentielle dans les cas suivants :

  • lorsque vous démarrez ou redémarrez le service d'indexation ;

  • lorsque vous modifiez un document local ;

  • lorsque le service d'indexation perd les notifications de changements ;

  • chaque fois que vous démarrez manuellement une analyse incrémentielle.

    Remarque Les notifications de changement du système de fichiers sont des éléments importants du processus d'analyse incrémentielle. Les notifications de changements sont générées par le système d'exploitation et sont lues par le serveur d'indexation chaque fois que des documents locaux sont modifiés. Dans la plupart des cas, les notifications de changements concernant les documents de systèmes distants ne parviennent pas jusqu'au service d'indexation local. Pour tenir compte de ce fait, le service d'indexation effectue régulièrement des analyses incrémentielles sur les répertoires distants associés à un catalogue.

Après avoir effectué une analyse des documents à indexer, le service d'indexation commence à construire les catalogues nécessaires. Pour ce faire, il lit chaque document à l'aide d'un filtre de document. Les filtres sont des composants logiciels qui interprètent la structure d'un type de document particulier, tel qu'un fichier texte ASCII, un document Word ou un document HTML. À l'aide du filtre approprié, le service d'indexation extrait le contenu du document et ses propriétés, stockant ainsi les propriétés et le chemin d'accès du document dans l'index. Ensuite, le service d'indexation utilise le filtre pour déterminer la langue dans laquelle le document est écrit, puis il fractionne le corps du document (le contenu) en mots individuels. Chaque langue prise en charge possède une liste d'exceptions, contenant les mots que le service d'indexation doit ignorer.

Vous trouverez les listes d'exceptions dans le répertoire \%SystemRoot%\System32. Ces fichiers sont stockés sous forme de fichiers texte ASCII et sont nommés Noise.lang, où lang est une extension à trois lettres indiquant la langue de la liste d'exceptions. Vous pouvez ajouter ou supprimer des entrées de la liste d'exceptions à l'aide d'un éditeur de texte ou d'un traitement de texte standard.

Le service d'indexation stocke également les valeurs des propriétés sélectionnées des documents dans le cache de propriétés. Le cache de propriétés est un emplacement de stockage pour les valeurs des propriétés que vous pouvez rechercher ou afficher dans la liste des résultats des recherches. Dans le cache de propriétés, il existe deux niveaux de stockage : le niveau principal et le niveau secondaire. Le niveau de stockage principal est destiné aux valeurs qui sont accédées fréquemment et ces valeurs sont donc stockées de façon à pouvoir être extraites rapidement et facilement. Le niveau de stockage secondaire est destiné aux valeurs qui sont utilisées moins souvent.

Après avoir éliminé les mots de la liste d'exceptions et mis à jour le cache de propriétés, le service d'indexation stocke le reste du contenu du document dans une liste de mots. Une ou plusieurs listes de mots peuvent être associées à chaque document. Les listes de mots sont combinées afin de constituer des index temporaires appelés index secondaires. Les index secondaires sont stockés sur disque dans un format de fichier compressé. Plusieurs index secondaires peuvent se trouver (et se trouvent généralement) simultanément dans le catalogue à un instant donné. À mesure que le temps passe, le nombre d'index secondaires peut augmenter considérablement. Il en va ainsi lorsque des documents sont ajoutés ou modifiés dans des répertoires indexés.

Le service d'indexation utilise un processus appelé "fusion secondaire" pour combiner des listes de mots et des index temporaires, réduisant ainsi le nombre de ressources temporaires utilisées et améliorant le temps de réponse global du service. Les fusions secondaires se produisent lors des analyses et dans le cadre du processus normal de gestion des disques implémenté par le service d'indexation. Les principaux événements qui déclenchent une fusion secondaire sont les suivants : lorsque le nombre de listes de mots stockées en mémoire est trop élevé (20 par défaut) ou lorsque la taille totale de toutes les listes de mots dépasse une valeur prédéfinie (256 Ko par défaut).

Le résultat final du processus d'indexation est un index maître. Chaque catalogue possède un, et un seul, index maître. L'index maître est créé la première fois que vous créez un catalogue et est maintenu à jour grâce à sa fusion périodique avec les index secondaires, créant ainsi un nouvel index maître. Ce processus de fusion des index secondaires avec l'index maître est appelé "fusion principale". Une fois la fusion principale terminée, un seul index sera associé à un catalogue. Cet index est l'index maître.

Les fusions maître sont déclenchées automatiquement en fonction de la taille des index secondaires, de la quantité d'espace libre sur le disque du catalogue et du nombre de changements de documents dans les répertoires indexés. Des fusions maîtres automatiques sont également planifiées, quelles que soient les conditions, toutes les nuits à minuit. Si nécessaire, vous pouvez imposer une fusion principale. La raison principale qui peut vous amener à imposer une fusion principale est de forcer le service d'indexation à mettre à jour un catalogue de sorte à refléter immédiatement toutes les modifications dans les résultats des recherches. Comme vous l'imaginez, le processus de fusion principale utilise les ressources de façon intensive, de sorte qu'il n'est pas souhaitable de forcer une fusion principale pendant les heures de pointe.

Les paramètres qui contrôlent l'analyse, la fusion et les autres processus du service d'indexation se trouvent dans la clé de Registre suivante :

     HKEY_LOCAL_MACHINE
     \SYSTEM
     \CurrentControlSet
     \Control
     \ContentIndex

Les paramètres du Registre qui contrôlent l'analyse et la fusion sont les suivants :

  • MasterMergeCheckpointInterval Définit l'intervalle permettant de déterminer si une fusion principale doit être effectuée. La valeur par défaut est de 2048 secondes.

  • MasterMergeTime Définit l'heure par défaut à laquelle une fusion principale quotidienne doit être effectuée. La valeur par défaut est de 0, ce qui signifie zéro secondes après le début d'une nouvelle journée.

  • MaxFilesizeFiltered Définit la taille maximale du contenu filtré pour un document particulier. Par défaut, ce paramètre est défini sur 256 Ko.

  • MaxFreshCount Définit le nombre maximum de mises à jour et de modifications de documents qui déclenchent une fusion principale. Par défaut, si plus de 20 000 documents sont modifiés, une fusion principale est déclenchée.

  • MaxIndexes Définit le nombre maximum d'index qui doivent être associés à un catalogue avant de forcer une fusion secondaire. Par défaut, si plus de 25 index sont associés à un catalogue, le service d'indexation effectue une fusion secondaire.

  • MaxShadowIndexSize Définit la taille maximale des index secondaires, par tranches de 128 Ko. Ce paramètre est utilisé avec MinDiskFreeForceMerge pour forcer des fusions maître lorsque l'espace disque est faible et que la taille de l'index secondaire dépasse cette valeur. La valeur par défaut est de 15 (15 * 128 Ko = 1920 Ko).

  • MaxWordLists Définit le nombre maximal de listes de mots pouvant exister dans un catalogue. Lorsque ce nombre est dépassé, une fusion secondaire est déclenchée. Par défaut, ce paramètre est défini sur 20.

  • MaxWordlistSize Définit la taille maximale de toutes les listes de mots associées à un catalogue. Cette valeur est définie par tranches de 128 Ko, et lorsqu'elle est dépassée, une fusion secondaire est déclenchée. Par défaut, cette valeur est définie sur 20 (20 * 128 Ko = 2560 Ko).

  • MinDiskFreeForceMerge Définit l'espace disque minimum. Si un disque contenant des catalogues dispose de moins d'espace disque que cette valeur et que la taille totale utilisée par les index secondaires dépasse MaxShadowIndexSize, le service d'indexation procède à une fusion principale. La valeur par défaut est de 15 Mo.

  • MinSizeMergeWordlists Définit la taille minimale pour la fusion des listes de mots dans un index secondaire. Si la taille des listes de mots dépasse cette valeur, une fusion secondaire est déclenchée. La valeur par défaut est de 256 Ko.

Recherche dans les catalogues

La recherche est le processus qui consiste à examiner le catalogue afin de trouver des informations. Les utilisateurs peuvent rechercher dans le catalogue de différentes façons. La technique la plus utilisée avec les serveurs Web consiste à construire un formulaire de requête qui sera utilisé pour faire la recherche dans le catalogue. Le service d'indexation inclut pour chaque catalogue un formulaire de requête pouvant être utilisé pour tester l'installation. Vous pouvez également créer des formulaires de requête à l'aide de pages ASP (Active Server Pages) et de fichiers IDQ (Internet Data Query).

Avec les pages ASP, vous pouvez créer le formulaire de requête et traiter les résultats à l'aide d'une combinaison de scripts côté serveur qui utilisent des objets ASP, des fichiers HTML et des scripts côté client. Les scripts que vous utilisez peuvent être écrits dans n'importe quel langage de script ; Microsoft VBScript et Microsoft JScript sont installés par défaut. En général, vous utiliserez la même page pour implémenter le formulaire de requête et pour afficher les résultats une fois que l'utilisateur aura saisi les paramètres de recherche. Par exemple, vous pouvez créer une page nommée QUERY.ASP qui implémente le formulaire de requête et qui comporte un script intégré qui envoie les paramètres de recherche, puis met en forme les résultats.

IDQ est quant à lui un langage spécial conçu pour envoyer des requêtes au service d'indexation. Avec IDQ, vous créez des pages distinctes pour le traitement de chaque étape du processus de requête. Vous utilisez les éléments suivants :

  • une page HTML qui se termine par l'extension .htm ou .html pour implémenter le formulaire de requête ;

  • une page IDQ qui se termine par l'extension .idq pour définir les paramètres de requête fixes pour les recherches ;

  • un fichier HTML qui se termine par l'extension .htx pour mettre en forme les résultats de la requête.

Un des avantages de IDQ par rapport à ASP est que les requêtes IDQ sont plus rapides et plus efficaces dans leur utilisation des ressources du service d'indexation. Que vous utilisiez ASP ou IDQ pour traiter les recherches, vous devez définir des paramètres de base qui contiennent les valeurs par défaut pour le service d'indexation. Les paramètres que vous devez définir sont résumés dans le tableau 9-1.

Remarque La plupart des organisations disposent de développeurs Web dont le travail consiste à créer les pages Web nécessaires à la recherche, au traitement et à l'affichage des résultats. En tant qu'administrateur Web, vous assistez l'équipe de développement dans la définition des paramètres et dans la publication des pages Web lorsqu'elles sont terminées.

Tableau 9-1 Paramètres de base pour le service d'indexation

Paramètre
Description
Exemple de valeur pour IDQ
CiCatalog
Définit l'emplacement du fichier de catalogue dans lequel effectuer la recherche. Si vous ne définissez pas ce paramètre, le service d'indexation recherche dans le répertoire Inetpub afin de trouver un catalogue par défaut.
CiCatalog = D:\Catalogs\WWW
CiFlags
Définit les indicateurs de recherche pour la requête. L'indicateur DEEP indique au service d'indexation de rechercher tous les sous-répertoires dans l'étendue actuelle.
CiFlags = DEEP
CiMaxRecordsIn ResultSet
Définit le nombre maximum d'enregistrements à renvoyer dans le jeu de résultat.
CiMaxRecordsInResultSet = 100
CiMaxRecords PerPage
Définit le nombre maximum d'enregistrements à renvoyer dans une même page.
CiMaxRecordsPerPage = 20
CiRestriction
Stocke les valeurs de recherche saisies par l'utilisateur dans le formulaire de requête.
CiRestriction = %CiRestriction%
CiScope
Définit l'étendue de la requête dans le catalogue. Si l'étendue est définie sur /, la recherche commence au sommet (ou à la racine) de l'arborescence des documents.
CiScope = /Docs

Tâches fondamentales d'administration du service d'indexation

Maintenant que vous savez comment fonctionne le service d'indexation, voyons les techniques fondamentales de gestion du service d'indexation. Dans cette section, vous apprendrez comment spécifier les ressources à indexer, créer des catalogues, optimiser les performances, etc.

Configuration des ressources Web à indexer

Vous pouvez configurer les ressources Web pour l'indexation à l'aide du composant logiciel enfichable Internet Information Services. Les paramètres d'indexation peuvent être appliqués de façon globale ou locale. Les paramètres globaux affectent tous les sites Web IIS qui héritent des paramètres, ce qui signifie que tous les fichiers indexables de tous les sites et de tous les sous-répertoires utilisent ce paramètre. Pour configurer les paramètres d'indexation globale, procédez de la façon suivante :

  1. Dans le composant logiciel enfichable Internet Information Services, cliquez avec le bouton droit sur le nœud du serveur souhaité, puis cliquez sur Propriétés.

  2. Cliquez sur Modifier dans le panneau Propriétés principales, puis sélectionnez l'onglet Répertoire de base.

  3. Activez l'indexation pour tous les sites Web du serveur en activant la case à cocher Indexer cette ressource, puis en cliquant sur OK. Les paramètres d'indexation sont hérités automatiquement par tous les sites Web. Les modifications sont également propagées automatiquement vers tous les répertoires des sites.

  4. Désactivez l'indexation pour tous les sites Web du serveur en désactivant la case à cocher Indexer cette ressource, puis en cliquant sur OK. Avant d'appliquer ces paramètres, IIS vérifie les paramètres actuellement utilisés pour tous les sites Web. Si un site Web utilise une valeur différente, une boîte de dialogue Héritages outrepassés s'affiche. Utilisez cette boîte de dialogue pour sélectionner les sites qui doivent utiliser le nouveau paramètre, puis cliquez sur OK.

Les paramètres locaux peuvent être appliqués aux sites et répertoires Web individuels. Avec les sites, le dossier racine et tous les répertoires associés héritent automatiquement des paramètres d'indexation du site, ce qui signifie que les fichiers indexables du dossier racine et des répertoires associés utilisent ce paramètre. Avec les répertoires, le répertoire sélectionné et tous les sous-répertoires héritent des paramètres d'indexation du répertoire, ce qui signifie que les fichiers indexables du dossier sélectionné et des sous-répertoires utilisent ce paramètre.

Pour configurer les paramètres d'indexation pour des sites ou répertoires individuels, procédez de la façon suivante :

  1. Dans le composant logiciel enfichable Internet Information Services, cliquez avec le bouton droit sur le site ou répertoire Web que vous souhaitez gérer, puis cliquez sur Propriétés.

  2. Sélectionnez l'onglet Répertoire de base, Répertoire ou Répertoire virtuel, selon le cas.

  3. Activez l'indexation pour la ressource actuellement sélectionnée et pour tous ses sous-répertoires en activant la case à cocher Indexer cette ressource, puis en cliquant sur OK. Les paramètres d'indexation sont hérités automatiquement.

  4. Désactivez l'indexation pour la ressource actuellement sélectionnée et pour tous ses sous-répertoires en désactivant la case à cocher Indexer cette ressource, puis en cliquant sur OK. Les paramètres d'indexation sont hérités automatiquement.

Affichage et création de catalogues

Les catalogues sont créés et gérés au niveau du site. Chaque site que vous souhaitez indexer doit posséder un catalogue. Un site peut posséder plusieurs catalogues. Par exemple, vous pouvez créer un catalogue pour les index de vos répertoires produit, et un autre catalogue pour les index des répertoires de vos services.

Chaque catalogue que vous créez doit être créé sur un système de fichiers local et stocké dans un dossier distinct des autres catalogues. Pour faciliter la gestion des catalogues multiples, vous pouvez créer un répertoire de niveau supérieur, appelé Catalogs, puis créer des sous-répertoires dans ce répertoire pour chaque catalogue que vous souhaitez créer. Le répertoire du catalogue doit être créé avant de créer le catalogue.

Pour créer un catalogue pour un site, procédez de la façon suivante :

  1. Démarrez la console Gestion de l'ordinateur, puis développez le nœud Services et applications en cliquant sur le signe plus (+) se trouvant à côté.

    Remarque Lors du premier accès, la console Gestion de l'ordinateur se connecte automatiquement au système local. Vous pouvez vous connecter à un autre ordinateur en cliquant avec le bouton droit sur le nœud Gestion de l'ordinateur, en sélectionnant Se connecter à un autre ordinateur, puis en suivant les invites. Rappelez-vous que vous ne pouvez pas ajouter un catalogue à un ordinateur distant si les partages administratifs par défaut ont été supprimés sur l'ordinateur distant.

  2. Cliquez avec le bouton droit sur le nœud Service d'indexation, pointez sur Nouveau, puis cliquez sur Catalogue. La boîte de dialogue Ajout d'un catalogue s'affiche, comme le montre la figure 9-2.

    Utilisez la boîte de dialogue Ajout d'un catalogue pour créer un nouveau catalogue sur le serveur

    Figure 9-2 Utilisez la boîte de dialogue Ajout d'un catalogue pour créer un nouveau catalogue sur le serveur.

  3. Dans le champ Nom, tapez le nom du catalogue.

  4. Dans le champ Emplacement, tapez le chemin complet du dossier du catalogue, ou cliquez sur Parcourir pour sélectionner le dossier dans lequel vous souhaitez placer le catalogue.

  5. Cliquez sur OK. Après avoir créé un catalogue, vous devez arrêter, puis redémarrer le service d'indexation pour remplir le catalogue avec des index.

Affichage de l'état d'indexation

L'indexation doit être contrôlée périodiquement afin de vérifier que la maintenance des catalogues est assurée. Une des valeurs que vous pouvez utiliser pour assurer le suivi du service d'indexation est l'état d'indexation. Comme le montre le tableau 9-2, l'état d'indexation indique l'état actuel du moteur d'indexation. Si les utilisateurs rencontrent des problèmes lors de l'extraction des résultats des recherches, il se peut que le service d'indexation soit suspendu ou arrêté, qu'une fusion soit en cours ou que le service procède actuellement à une nouvelle analyse des catalogues. En général, vous voyez l'état d'indexation suivi du mot clé Démarré. Le mot clé Démarré fait référence à l'état du service d'indexation lui-même. Dans ce cas, le service est actif.

Tableau 9-2 Aide-mémoire pour les conditions d'état du service d'indexation

État
Description
(Vide)
Le service d'indexation est arrêté et doit être démarré pour reprendre l'indexation.
Indexation suspendue (E/S hautes)
L'indexation est suspendue en raison d'un niveau élevé d'activité d'entrée/sortie (E/S). Vous souhaiterez peut-être fermer certaines applications afin de réduire l'activité d'E/S.
Indexation suspendue (mémoire insuffisante)
L'indexation est suspendue, car la mémoire virtuelle est insuffisante. Vous souhaiterez peut-être fermer certaines applications afin de libérer de la mémoire.
Indexation suspendue (gestion de l'alimentation)
L'indexation est suspendue afin d'économiser l'énergie de la batterie. Cet état ne se rencontre généralement que sur les portables.
Indexation mise en pause (utilisateur actif)
L'indexation est suspendue afin de réduire les interférences avec l'activité de l'utilisateur. Les utilisateurs peuvent travailler avec un grand nombre de fichiers dont l'indexeur a besoin, ou un administrateur peut apporter des modifications à la configuration du service d'indexation dans la console Gestion de l'ordinateur.
Fusion principale (en pause)
La fusion principale est suspendue, car les ressources disponibles sont insuffisantes. Il se peut que vous rencontriez un problème avec la quantité de mémoire, l'espace libre pour les fichiers ou le débit du système.
Fusion
Une fusion est en cours. La fusion utilise les ressources de façon intensive et peut provoquer un problème temporaire de performances sur le système.
Requête seule
Le service d'indexation est démarré et est disponible uniquement pour les requêtes.
Récupération en cours de
Le service d'indexation récupère le catalogue suite à un arrêt brutal.
Analyse requise
Un ou plusieurs documents ont été ajoutés ou modifiés dans les répertoires de ce catalogue. L'indexeur doit automatiquement procéder à une analyse. Si tel n'est pas le cas, consultez le journal des événements de Windows.
Analyse en cours de
Un ou plusieurs répertoires sont en cours d'analyse afin de rechercher les documents ajoutés ou modifiés.
Analyse en cours (NTFS)
Un ou plusieurs volumes NTFS sont en cours d'analyse afin de rechercher les documents ajoutés ou modifiés.
Démarré
Le service d'indexation a démarré pour ce catalogue.
Démarrage
Le service d'indexation est en cours de démarrage.
Arrêté
L'indexation du catalogue a été arrêtée.

Vous pouvez afficher les conditions d'état du service d'indexation en procédant de la façon suivante :

  1. Démarrez la console Gestion de l'ordinateur, puis développez le nœud Services et applications en cliquant sur le signe plus (+) se trouvant à côté.

  2. Développez le nœud Service d'indexation dans le volet de gauche. Le volet de droite affiche les conditions d'état de chaque catalogue individuel. Gardez à l'esprit que chaque catalogue peut présenter un état différent.

Démarrage, arrêt et suspension du service d'indexation

Le service d'indexation peut être démarré, arrêté et suspendu comme tout autre service. Les utilisateurs peuvent exécuter des requêtes et obtenir les résultats uniquement lorsque le service d'indexation fonctionne. Ils ne peuvent obtenir aucun résultat lorsque le service d'indexation est arrêté ou suspendu.

Vous pouvez gérer le service d'indexation en procédant de la façon suivante :

  1. Démarrez la console Gestion de l'ordinateur, puis développez le nœud Services et applications en cliquant sur le signe plus (+) se trouvant à côté.

  2. Développez le nœud Service d'indexation dans le volet de gauche. Le volet de droite affiche les conditions d'état de chaque catalogue individuel.

    Cliquez avec le bouton droit sur le nœud Service d'indexation dans le volet de gauche. Vous pouvez désormais :

    • cliquer sur Démarrer pour démarrer le service d'indexation ;

    • cliquer sur Arrêter pour arrêter le service d'indexation ;

    • cliquer sur Pause pour suspendre le service d'indexation ; une fois l'indexation suspendue, cliquez sur Démarrer pour reprendre le cours normal des opérations.

    Remarque Chaque fois que vous arrêtez, puis redémarrez l'indexation, le service d'indexation procède à une analyse incrémentielle de tous les catalogues associés à tous les sites du serveur.

Configuration des propriétés du service d'indexation

Le service d'indexation présente plusieurs propriétés qui peuvent être configurées pour personnaliser la façon dont l'indexation fonctionne. Ces propriétés sont résumées dans le tableau 9-3. Comme pour la plupart des autres propriétés du service d'indexation, vous pouvez définir ces valeurs de façon globale ou locale. Les valeurs globales sont héritées par tous les catalogues, excepté si vous remplacez ces paramètres globaux.

Tableau 9-3 Propriétés pouvant être configurées pour le service d'indexation

Onglet Propriété
Propriété
Description
Génération
Indexer les fichiers ayant des extensions inconnues
Spécifie si le service d'indexation indexe les fichiers comportant des extensions non enregistrées. Ces fichiers sont indexés par défaut, ce qui peut ralentir le processus d'indexation si vous disposez d'un grand nombre de fichiers avec des extensions non enregistrées.
 
Générer des abstractions
Spécifie si le service d'indexation génère des abstractions pour les fichiers trouvés lors d'une recherche et les renvoie avec les résultats. Les abstractions contiennent des informations essentielles sur les documents qui correspondent aux paramètres de recherche. Les abstractions sont générées par défaut.
 
Taille maximale (en caractères)
Définit le nombre maximal de caractères dans les abstractions renvoyées avec une recherche. La valeur par défaut est de 320. La plage de valeurs autorisées est comprise entre 10 et 10 000. Gardez à l'esprit que cette propriété est disponible uniquement lorsque vous activez l'option Générer des abstractions.
Suivi
Ajouter l'alias de partage réseau automatiquement
Spécifie si le service d'indexation utilise automatiquement les noms des partages réseau comme alias pour les lecteurs réseau partagés. Si vous ne sélectionnez pas cette option, vous devez configurer manuellement des alias pour chaque partage réseau que vous souhaitez indexer, comme cela est expliqué dans la section "Ajout de répertoires physiques à un catalogue" de ce chapitre.

Vous pouvez configurer des paramètres globaux pour les propriétés en procédant de la façon suivante :

  1. Démarrez la console Gestion de l'ordinateur, puis développez le nœud Services et applications en cliquant sur le signe plus (+) se trouvant à côté.

  2. Cliquez avec le bouton droit sur le nœud Service d'indexation, puis sélectionnez Propriétés.

  3. Sous l'onglet Génération, définissez les propriétés qui contrôlent la façon dont l'indexation et les résultats des recherches sont traités. Activez ou désactivez ces propriétés, selon le cas.

  4. Sous l'onglet Suivi, définissez les propriétés de suivi des partages réseau. Activez ou désactivez la propriété associée, selon le cas.

  5. Cliquez sur OK. Si vous souhaitez que les catalogues héritent de ces valeurs, vérifiez les propriétés de chaque catalogue afin de vous assurer que l'option Hériter les paramètres ci-dessus à partir du service est sélectionnée sous les onglets Génération et Suivi.

Les catalogues individuels peuvent hériter des paramètres globaux ou les remplacer. Pour cela, procédez de la façon suivante :

  1. Démarrez la console Gestion de l'ordinateur. Développez le nœud Services et applications en cliquant sur le signe plus (+) se trouvant à côté, puis développez le nœud Service d'indexation.

  2. Vous devez voir s'afficher une liste de catalogues configurés sur le serveur. Cliquez avec le bouton droit sur le catalogue souhaité, puis cliquez sur Propriétés.

  3. Sous l'onglet Génération, définissez les propriétés qui contrôlent la façon dont l'indexation et les résultats des recherches sont traités. Si vous souhaitez que le catalogue hérite des paramètres globaux, activez la case à cocher Hériter les paramètres ci-dessus à partir du service. Dans le cas contraire, désactivez-la et modifiez les propriétés s'il y a lieu.

  4. Sous l'onglet Suivi, définissez les propriétés de suivi des partages réseau. Si vous souhaitez que le catalogue hérite des paramètres globaux, activez la case à cocher Hériter les paramètres ci-dessus à partir du service. Dans le cas contraire, désactivez-la et modifiez les propriétés s'il y a lieu.

  5. Cliquez sur OK.

Optimisation des performances du service d'indexation

Vous pouvez optimiser les performances du service d'indexation en fonction de l'utilisation prévue. Vous contrôlez pour cela la façon dont le service d'indexation gère les processus d'indexation et de requête. Chaque processus présente différents paramètres de performances qui peuvent être définis à l'aide de valeurs d'optimisation fixes ou personnalisées. Pour l'indexation, les options de performances sont les suivantes :

  • Lent Le service d'indexation minimise la quantité de ressources système réservées à l'indexation. En outre, le service d'indexation ne répond pas immédiatement aux demandes de notification de changement provenant du système d'exploitation, ce qui réduit la fréquence d'analyse. Ce paramètre est adapté aux environnements dans lesquels les documents sont mis à jour ou modifiés peu souvent.

  • Modérée Le service d'indexation réserve la quantité normale de ressources système pour les index et tente de traiter les demandes de notification de changement de façon rapide. C'est la valeur par défaut. Ce paramètre est adapté à un environnement classique dans lequel des modifications sont apportées quotidiennement aux documents configurés pour l'indexation.

  • Directe Le service d'indexation réserve des ressources système supplémentaires pour l'indexation et répond immédiatement aux demandes de notification de changement, ce qui implique une fréquence d'analyse plus élevée que la normale pour la recherche de documents nouveaux ou modifiés. Par conséquent, les changements et ajouts de documents apparaissent rapidement dans les catalogues. Ce paramètre est adapté aux environnements dans lesquels les documents évoluent rapidement et dans lesquels vous devez répercuter rapidement ces changements.

Les paramètres d'optimisation disponibles sont les suivants :

  • Charge faible Le service d'indexation réduit la quantité de ressources système réservées aux requêtes. Ainsi, le service d'indexation ne peut traiter qu'un nombre limité de requêtes simultanées. Ce paramètre est adapté aux environnements dans lesquels les requêtes sont peu fréquentes. Si le nombre de requêtes augmente trop, le temps de réponse du service sera médiocre.

  • Charge modérée Le service d'indexation réserve la quantité normale de ressources système pour les requêtes et tente de traiter plusieurs requêtes simultanément. C'est la valeur par défaut. Ce paramètre est adapté à un environnement classique, dans lequel les utilisateurs effectuent régulièrement des requêtes et dans lequel vous souhaitez traiter ces requêtes rapidement.

  • Charge élevée Le service d'indexation réserve des ressources système supplémentaires pour les requêtes et peut traiter un nombre de requêtes simultanées plus important que la normale. Ce paramètre est conseillé lorsque vous devez traiter un grand nombre de requêtes et que vous ne vous préoccupez pas de savoir si le service d'indexation utilise plus de mémoire et de ressources processeur que d'habitude.

Vous pouvez optimiser les performances du service d'indexation en procédant de la façon suivante :

  1. Démarrez l'application Gestion de l'ordinateur, puis développez le nœud Services et applications en cliquant sur le signe plus (+) se trouvant à côté.

  2. Développez le nœud Service d'indexation dans le volet de gauche. Le volet de droite affiche les conditions d'état de chaque catalogue individuel.

  3. Cliquez avec le bouton droit sur le nœud Service d'indexation dans le volet de gauche, puis cliquez sur Arrêter.

  4. Cliquez de nouveau avec le bouton droit sur le nœud Service d'indexation, pointez sur Toutes les tâches, puis cliquez sur Réglage de la performance. La boîte de dialogue Utilisation du service d'indexation s'affiche, comme le montre la figure 9-3.

    Utilisez la boîte de dialogue Utilisation du service d'indexation pour optimiser l'indexation et les requêtes

    Figure 9-3 Utilisez la boîte de dialogue Utilisation du service d'indexation pour optimiser l'indexation et les requêtes.

    Vous pouvez définir une valeur d'optimisation fixe ou personnalisée. Pour définir des valeurs fixes, sélectionnez une des options suivantes dans la boîte de dialogue Utilisation du service d'indexation :

    • Serveur dédié Définit les options d'indexation directe et de requête à charge élevée.

    • Souvent utilisé, mais non dédié à ce service Définit les options d'indexation lente et de requête à charge modérée.

    • Utilisé occasionnellement Définit les options d'indexation lente et de requête à charge faible.

    • Jamais utilisé Désactive le service d'indexation (comme si vous l'aviez désactivé à partir du nœud Services). Une fois cette option sélectionnée, le service d'indexation s'arrête de façon permanente, jusqu'à ce que vous le réactiviez de façon manuelle.

    Pour définir une valeur d'optimisation personnalisée, sélectionnez l'option Personnaliser, puis cliquez sur le bouton Personnaliser. Comme le montre la figure 9-4, vous pouvez procéder de la façon suivante :

    • Utilisez le curseur Indexation pour configurer une des options suivantes pour l'indexation : Lent, Modérée ou Directe. La valeur Modérée est l'option intermédiaire et n'est pas étiquetée.

    • Utilisez le curseur Exécution d'une requête pour configurer une des options suivantes pour le traitement des requêtes : Charge faible, Charge modérée ou Charge élevée. La valeur Charge modérée est l'option intermédiaire et n'est pas étiquetée.

  5. Cliquez sur OK. Cliquez de nouveau sur OK pour enregistrer vos paramètres et revenir au composant logiciel enfichable Gestion de l'ordinateur.

    Vous pouvez personnaliser la façon dont l'indexation et les requêtes sont effectuées via la boîte de dialogue Performances souhaitées

    Figure 9-4 Vous pouvez personnaliser la façon dont l'indexation et les requêtes sont effectuées via la boîte de dialogue Performances souhaitées.

Gestion des catalogues

Le service d'indexation stocke toutes les informations que vous indexez dans des catalogues. Les catalogues contiennent les informations extraites du corps des documents ainsi que des métadonnées qui décrivent le document et ses propriétés. Au cours du processus de création du catalogue, vous spécifiez à quel site Web vous souhaitez associer le catalogue. Une fois un catalogue créé pour un site Web, les utilisateurs peuvent effectuer des recherches à l'aide d'un formulaire de requête Web.

Les catalogues sont gérés automatiquement par le service d'indexation et sont mis à jour via les processus d'analyse et de fusion. Vous pouvez également contrôler manuellement les catalogues en démarrant, en arrêtant ou en suspendant le moniteur de mise à jour du catalogue. Vous pouvez aussi forcer le service d'indexation à fusionner des index distincts dans l'index maître afin d'améliorer les performances globales et le temps de réponse du service d'indexation.

Affichage des propriétés des catalogues et des répertoires indexés

Chaque catalogue configuré sur le serveur présente un jeu de propriétés distinct que vous pouvez modifier. Ces propriétés contrôlent le suivi des partages réseau, la génération d'abstractions de documents et la configuration de l'indexation. Vous pouvez également configurer les catalogues avec des paramètres uniques pour les propriétés ou pour qu'ils héritent des propriétés globales du service d'indexation.

Les catalogues peuvent être associés à un site Web, un site NNTP et un ou plusieurs répertoires externes. Les répertoires externes peuvent inclure des ressources locales et distantes. Lorsque vous associez un catalogue à un site Web ou NNTP, vous utilisez le composant logiciel enfichable Internet Information Services pour spécifier quelles ressources sont indexées. Lorsque vous associez un catalogue à un partage réseau, vous pouvez choisir d'indexer le répertoire lorsque vous l'ajoutez au catalogue.

Pour afficher les paramètres actuels des propriétés d'un catalogue, ainsi que les répertoires qui sont actuellement indexés, procédez de la façon suivante :

  1. Démarrez la console Gestion de l'ordinateur. Développez le nœud Services et applications en cliquant sur le signe plus (+) se trouvant à côté, puis développez le nœud Service d'indexation.

  2. Vous devez voir s'afficher une liste de catalogues configurés sur le serveur. Développez le nœud d'un catalogue en cliquant sur le signe plus (+) se trouvant à côté. Sélectionnez le nœud Répertoires dans le volet de gauche afin d'afficher une liste de répertoires externes associés à un catalogue dans le volet de droite.

  3. Si vous souhaitez afficher les propriétés d'un catalogue, cliquez avec le bouton droit sur le catalogue avec lequel vous souhaitez travailler, puis cliquez sur Propriétés. Une boîte de dialogue Propriétés s'affiche, dans laquelle vous pouvez afficher ou définir les propriétés.

Ajout de répertoires physiques à un catalogue

Vous pouvez ajouter à un catalogue des répertoires externes qui peuvent être indexés avec le contenu d'un site Web ou NNTP. Ces répertoires externes peuvent se trouver sur le système de fichiers local ou sur un système de fichiers distant. Si vous n'activez pas la case à cocher Ajouter l'alias de partage réseau automatiquement, vous devez configurer manuellement des alias pour chaque partage réseau que vous souhaitez indexer.

Pour ajouter un répertoire externe à un catalogue, procédez de la façon suivante :

  1. Démarrez la console Gestion de l'ordinateur. Développez le nœud Services et applications en cliquant sur le signe plus (+) se trouvant à côté, puis développez le nœud Service d'indexation.

  2. Vous devez voir s'afficher une liste de catalogues configurés sur le serveur. Cliquez avec le bouton droit sur le catalogue souhaité, pointez sur Nouveau, puis cliquez sur Répertoire. La boîte de dialogue Ajout d'un répertoire s'affiche, comme le montre la figure 9-5.

    Figure 9-5 Vous pouvez ajouter des répertoires physiques à un catalogue et les mapper sur des alias à l'aide de cette boîte de dialogue.

  3. Dans le champ Chemin d'accès, tapez le chemin d'accès complet du répertoire que vous souhaitez indexer. Si vous ne le connaissez pas, cliquez sur Parcourir afin de rechercher le répertoire.

  4. Si vous configurez l'indexation pour un partage réseau, tapez l'alias du partage réseau que vous souhaitez utiliser pour ce répertoire dans le champ Alias (UNC). Cet alias doit être au format UNC (Uniform Naming Convention) et est renvoyé aux clients dans les résultats de la recherche. Par exemple, vous pouvez définir l'alias \\mon_serveur\data pour le mapper vers le chemin réel du partage réseau \\Galileo\reports\fy2001.

    Conseil Lorsque vous travaillez avec des systèmes distants, vous devez autoriser le service d'indexation à mapper des partages administratifs. S'il ne peut pas mapper des partages administratifs, le service d'indexation ne pourra pas indexer le contenu.

  5. Si vous configurez l'indexation pour un partage réseau, vous pouvez également définir le nom d'utilisateur et le mot de passe que le service d'indexation peut utiliser pour s'authentifier sur le système distant.

  6. Ensuite, sélectionnez Oui pour spécifier que le répertoire doit être inclus dans l'index du catalogue. Sélectionnez Non pour exclure le répertoire de l'index.

  7. Cliquez sur OK.

Forcer de nouvelles analyses complètes et incrémentielles des répertoires

Le service d'indexation examine les demandes de notification de changement provenant du système d'exploitation afin de déterminer si des fichiers ont été ajoutés ou modifiés dans des répertoires définis pour l'indexation. Lorsqu'une requête est reçue, le service d'indexation planifie une analyse incrémentielle pour le répertoire associé. Il peut arriver que le service d'indexation perde les notifications de changements. Cela peut se produire lors des périodes intensives de traitement E/S ou processeur ; il se peut alors que le service d'indexation n'arrive pas à suivre les notifications de changement. Cela peut également arriver lorsque le service d'indexation ne peut pas recevoir les notifications de changement pour les répertoires situés sur les systèmes distants.

En général, vous pouvez identifier un problème d'analyse en recherchant des documents qui ont été récemment mis à jour ou ajoutés à un répertoire indexé. Si les résultats de la recherche ne contiennent pas de références à ces documents, vous pouvez être amené à forcer une nouvelle analyse complète ou incrémentielle. Vous pouvez le faire uniquement au niveau des répertoires externes.

Pour forcer une nouvelle analyse d'un répertoire externe, procédez de la façon suivante :

  1. Démarrez la console Gestion de l'ordinateur. Développez le nœud Services et applications en cliquant sur le signe plus (+) se trouvant à côté, puis développez le nœud Service d'indexation.

  2. Vous devez voir s'afficher une liste de catalogues configurés sur le serveur. Double-cliquez sur le catalogue souhaité, puis sélectionnez le nœud Répertoires associé.

  3. Dans le volet de droite, vous devez voir s'afficher une liste de répertoires externes configurés pour le catalogue. Cliquez avec le bouton droit sur le répertoire souhaité, pointez sur Toutes les tâches, puis cliquez sur Analyser de nouveau (Complètement) ou sur Nouvelle analyse (Incrémentielle), selon le cas.

  4. Lorsque vous êtes invité à confirmer l'action, cliquez sur Oui. Gardez à l'esprit que les nouvelles analyses de répertoires comportant un grand nombre de documents peuvent utiliser les ressources de façon intensive. Cela signifie que vous utiliserez davantage le processeur, la mémoire et les ressources d'E/S au cours de la nouvelle analyse.

Démarrage, arrêt et suspension de catalogues individuels

Lorsque vous devez procéder à un grand nombre de mises à jour de répertoires contrôlés par un catalogue, il est bon de suspendre ou d'arrêter de façon temporaire le catalogue. La suspension ou l'arrêt du catalogue indique au service d'indexation qu'il ne doit pas traiter les demandes de notification de changement pour ce catalogue. La différence entre la suspension et l'arrêt d'un catalogue est importante. Lorsque vous arrêtez un catalogue, le service d'indexation arrête les activités d'indexation et de requête, ce qui signifie que les répertoires associés ne sont plus indexés et que les utilisateurs ne peuvent pas effectuer de recherches dans le catalogue. Lorsque vous suspendez un catalogue, le service d'indexation arrête l'indexation, mais il continue d'autoriser le traitement des requêtes en cours.

Pour démarrer, arrêter ou suspendre un catalogue, procédez de la façon suivante :

  1. Démarrez la console Gestion de l'ordinateur. Développez le nœud Services et applications en cliquant sur le signe plus (+) se trouvant à côté, puis développez le nœud Service d'indexation.

  2. Cliquez avec le bouton droit sur le catalogue souhaité, pointez sur Toutes les tâches, puis cliquez sur Démarrer, Pause ou Arrêter, selon le cas.

    Remarque Le service d'indexation effectue automatiquement une analyse incrémentielle lorsque vous arrêtez, puis redémarrez un catalogue. Ceci permet de garantir que les documents nouveaux ou mis à jour sont indexés correctement.

Fusion de catalogues

Lorsque le service d'indexation met à jour le catalogue, il crée des index temporaires, appelés index secondaires, qui étendent l'index maître. Ces index secondaires reflètent les modifications des répertoires des catalogues. À mesure que le temps passe, le nombre d'index secondaires peut augmenter de façon significative ; cette augmentation est reflétée par le nombre Index enregistrés associé à un catalogue. Dans la mesure où les index secondaires contiennent des pointeurs et informations complémentaires, ils utilisent davantage d'espace qu'un index maître entièrement fusionné. À mesure que le nombre d'index secondaires augmente, le temps de réponse aux requêtes adressées au catalogue augmente.

Vous pouvez améliorer le temps de réponse du service d'indexation et réduire l'utilisation de l'espace de stockage en fusionnant les index temporaires avec l'index maître. Pour cela, procédez de la façon suivante :

  1. Démarrez la console Gestion de l'ordinateur. Développez le nœud Services et applications en cliquant sur le signe plus (+) se trouvant à côté, puis développez le nœud Service d'indexation.

  2. Cliquez avec le bouton droit sur le catalogue souhaité, pointez sur Toutes les tâches, puis cliquez sur Fusionner.

  3. Lorsque vous êtes invité à confirmer l'action, cliquez sur Oui. Comme dans le cas d'une nouvelle analyse, le processus de fusion peut utiliser de façon intensive les ressources et le temps de réponse du service d'indexation peut augmenter de façon temporaire. En revanche, lorsque la fusion est terminée, le service d'indexation doit répondre plus rapidement aux requêtes des utilisateurs.

Spécification de sites Web ou NNTP à inclure dans les catalogues

Chaque catalogue peut être associé à un site Web et à un site NNTP. Après avoir associé un site à un catalogue, vous pouvez utiliser le composant logiciel enfichable Internet Information Services pour spécifier les ressources qui doivent être indexées. Pour spécifier le site à inclure dans un catalogue, procédez de la façon suivante :

  1. Démarrez la console Gestion de l'ordinateur. Développez le nœud Services et applications en cliquant sur le signe plus (+) se trouvant à côté, puis développez le nœud Service d'indexation.

  2. Cliquez avec le bouton droit sur le catalogue souhaité, puis cliquez sur Propriétés. Sélectionnez l'onglet Suivi.

    Comme le montre la figure 9-6, vous pouvez désormais effectuer une des actions suivantes :

    • utiliser le menu Serveur WWW de l'onglet Suivi pour spécifier le site Web que vous souhaitez associer à un catalogue ;

    • utiliser le menu Serveur NNTP de l'onglet Suivi pour spécifier le site NNTP que vous souhaitez associer à un catalogue ;

  3. cliquer sur OK.

    Figure 9-6 Spécifiez le site à indexer sous l'onglet Suivi.

Test de catalogues à l'aide de requêtes

Après avoir configuré un catalogue pour l'indexation, vous devez interroger le catalogue afin de vous assurer que vous avez obtenu les résultats attendus. Le service d'indexation propose un formulaire de requête intégré permettant d'effectuer cette tâche. Pour accéder à ce formulaire et saisir une requête, procédez de la façon suivante :

  1. Démarrez la console Gestion de l'ordinateur. Développez le nœud Services et applications en cliquant sur le signe plus (+) se trouvant à côté, puis développez le nœud Service d'indexation.

  2. Vous devez voir s'afficher une liste de catalogues configurés sur le serveur. Double-cliquez sur le catalogue souhaité, puis sélectionnez Interroger le catalogue dans le volet de gauche.

  3. Comme le montre la figure 9-7, tapez la requête souhaitée dans le champ Entrez votre requête en texte libre ci-dessous, puis cliquez sur Rechercher. Si l'indexation est configurée correctement, le service d'indexation doit afficher les résultats de la recherche. Cliquez ensuite sur le titre d'un document ou sur un chemin pour vous assurer que les documents sont accessibles à partir de la page de résultats. Si vous rencontrez des problèmes avec l'une ou l'autre de ces procédures, vérifiez la configuration de l'indexation.

Après avoir configuré l'indexation, vérifiez la configuration à l'aide du formulaire de requête prédéfini

Figure 9-7 Après avoir configuré l'indexation, vérifiez la configuration à l'aide du formulaire de requête prédéfini.

Dernière mise à jour le lundi 22 octobre 2001