Partager via


IFilters et gestionnaires de protocole (Office SharePoint Server 2007)

Mise à jour : 2009-04-16

Dans Microsoft Office SharePoint Server 2007, le robot utilise des gestionnaires de protocole pour accéder au contenu, puis des filtres IFilter pour extraire le contenu des fichiers analysés. Les filtres IFilter suppriment la mise en forme spécifique de l’application avant que le moteur indexe le contenu d’un document. Seuls les types de fichiers pour lesquels un gestionnaire de protocole et un IFilter sont installés sont analysés par Office SharePoint Server 2007.

Cette section décrit les filtres IFilter et les gestionnaires de protocole inclus par défaut dans une installation Office SharePoint Server 2007 et explique comment installer et inscrire d’autres filtres IFilter et gestionnaires de protocole.

Le robot utilise les gestionnaires de protocole et les filtres IFilter de la manière suivante :

  1. Le robot récupère les adresses de départ des sources de contenu et il appelle le gestionnaire de protocole en fonction du préfixe de l’URL.

  2. Le gestionnaire de protocole se connecte à la source de contenu et extrait les métadonnées au niveau du système et les informations des listes de contrôle d’accès.

  3. Le gestionnaire de protocole identifie le type de fichier de chaque élément de contenu, en fonction de l’extension du nom de fichier, puis il appelle le filtre IFilter qui est associé à ce type de fichier.

  4. Le filtre IFilter extrait le contenu, en supprimant toute mise en forme incorporée, puis il récupère les métadonnées de l’élément de contenu.

  5. Le contenu est analysé par un ou plusieurs analyseurs lexicaux propres à la langue, puis il est ajouté dans l’index de recherche en texte intégral, également appelé index de contenu. Les métadonnées et les listes de contrôle d’accès sont ajoutées à la base de données de recherche.

Dans cette section :

Voir aussi

Concepts

Ajouter des sources de contenu (Office SharePoint Server 2007)