Share via


IFilters und Protokollhandler (Office SharePoint Server 2007)

Der Crawler in Microsoft Office SharePoint Server 2007 verwendet Protokollhandler zum Zugreifen auf Inhalte und dann iFilters zum Extrahieren von Inhalten aus gecrawlten Dateien. Mit iFilters werden anwendungsspezifische Formatierungen entfernt, bevor der Inhalt eines Dokuments vom Modul indiziert wird. Nur Dateitypen, für die ein Protokollhandler und ein IFilter installiert ist, werden von Microsoft Office SharePoint Server 2007 gecrawlt.

In diesem Abschnitt werden die iFilters und Protokollhandler beschrieben, die standardmäßig in einer Microsoft Office SharePoint Server 2007-Installation enthalten sind. Außerdem wird beschrieben, wie Sie zusätzliche iFilters und Protokollhandler installieren und registrieren können.

Protokollhandler und iFilters werden vom Crawler wie folgt verwendet:

  1. Der Crawler ruft die Startadressen von Inhaltsquellen ab und ruft basierend auf dem Präfix der URL den Protokollhandler auf.

  2. Der Protokollhandler stellt eine Verbindung mit der Inhaltsquelle her und extrahiert Metadaten auf Systemebene sowie Informationen zu Zugriffssteuerungslisten.

  3. Der Protokollhandler identifiziert basierend auf der Dateinamenerweiterung den Dateityp der einzelnen Inhaltselemente und ruft den entsprechenden diesem Dateityp zugeordneten IFilter auf.

  4. Der IFilter extrahiert Inhalte und entfernt dabei alle eingebetteten Formatierungen. Anschließend werden die Metadaten des Inhaltselements abgerufen.

  5. Der Inhalt wird von mindestens einer der Sprache entsprechenden Wörtertrennung analysiert und dem Inhaltsindex hinzugefügt, der auch als Volltextindex bezeichnet wird. Metadaten und Zugriffssteuerungslisten werden der Suchdatenbank hinzugefügt.

In diesem Abschnitt:

Siehe auch

Konzepte

Hinzufügen von Inhaltsquellen (Office SharePoint Server 2007)