Bereitstellen der Volltextindizierung

 

Letztes Änderungsdatum des Themas: 2005-05-12

Verwenden Sie zum Bereitstellen der Volltextindizierung den Exchange-System-Manager. Die Bereitstellung umfasst die folgenden Aufgaben:

  • Erstellen eines Volltextindexes
  • Optimieren der Volltextindizierung
  • Durchführen einer vollständigen Auffüllung
  • Festlegen eines Zeitplans für das inkrementelle Auffüllen
  • Aktivieren von Volltextindexabfragen
  • Benachrichtigen der Benutzer

Unter diesen Aufgaben ist die Auslastung des Servers bei der vollständigen Auffüllung am größten, deren Dauer bei einer kleinen Datenbank wenige Minuten und bei einer großen Datenbank bis zu mehrere Tage betragen kann. Sie können jedoch die Auffüllung während der Geschäftszeit im Hintergrund durchführen, ohne dass die Systemreaktionszeit für die Benutzer wesentlich verlängert wird.

Erstellen eines Volltextindexes

Bevor Sie die Volltextindizierung verwenden können, müssen Sie für jeden zu indizierenden Postfachspeicher oder Informationsspeicher für Öffentliche Ordner einen anfänglichen Index (Katalog) erstellen. Dabei wird die erforderliche Dateistruktur erstellt, die Sie beim Optimieren des Index ändern.

Weitere Informationen zum Erstellen eines anfänglichen Volltextindexes finden Sie unter Erstellen eines anfänglichen Volltextindex.

Optimieren der Volltextindizierung

In diesem Abschnitt wird beschrieben, wie Sie die Volltextindizierung auf einem Computer mit Exchange Server 2003 optimieren. Sie können die Systemleistung erhöhen, indem Sie Dateien mit häufigem Zugriff an verschiedenen Speicherorten eines RAID-Arrays ablegen.

Es werden fünf Hauptkategorien von Dateien mit Volltextindizierung unterschieden. Diese Dateien werden in der Standardeinstellung auf dem Systemlaufwerk installiert, das normalerweise über keinen E/A-Durchsatz (Eingabe/Ausgabe) des RAID-Arrays verfügt. Wählen Sie (wie in der folgenden Tabelle beschrieben) die Speicherorte dieser Dateien auf dem Laufwerk so aus, dass die Leistung der Volltextindizierung optimiert wird. Einige Teile dieses Themas enthalten Anleitungen zum Verschieben von Dateien in Clustertopologien und Topologien ohne Cluster. Im Folgenden sind die fünf Hauptkategorien von Dateien mit Volltextindizierung aufgeführt:

  • Kataloge   Die Hauptindizes. Für jeden Postfachspeicher oder Informationsspeicher für Öffentliche Ordner in Exchange Server 2003 ist jeweils nur ein Katalog vorhanden.
  • Eigenschaftenspeicher   Eine Datenbank, die verschiedene Eigenschaften im Katalog indizierter Objekte enthält. Es ist pro Server nur ein einziger Informationsspeicher für Eigenschaften vorhanden.
  • Eigenschaftenspeicherprotokolle   Die der Eigenschaftenspeicherdatenbank zugeordneten Protokolldateien.
  • Temporäre Dateien   Dateien, die temporäre Informationen enthalten, die vom Microsoft Search-Dienst verwendet werden.
  • Sammelprotokolle   Protokolldateien, die Protokollinformationen für den Indexdienst enthalten. Für jeden Index ist ein Satz von Protokollen vorhanden.

In diesem Abschnitt werden die folgenden Tools zum Verschieben von Dateien beschrieben:

  • Pstoreutl   Unter Programme\Gemeinsame Dateien\System\MSSearch\Bin.
  • SetTempPath   Unter Programme\Gemeinsame Dateien\System\MSSearch\Bin.
  • Catutil   Unter Programme\Gemeinsame Dateien\System\MSSearch\Bin.

Empfohlene Speicherorte für Dateien der Volltextindizierung

Dateityp Empfohlener Speicherort Methode zum Angeben des Speicherorts

Katalog

RAID-Array

Geben Sie einen Speicherort im RAID-Array an, wenn Sie den Katalog mit dem Exchange-System-Manager erstellen.

noteAnmerkung:
Wenn der Index bereits an einem anderen Speicherort erstellt wurde, können Sie ihn mit dem Tool Catutil verschieben.

Eigenschaftenspeicher

RAID-Array

Verwenden Sie das Tool Pstoreutl

Eigenschaftenspeicherprotokolle

Im RAID-Array am selben Speicherort wie der Eigenschaftenspeicher

Verwenden Sie das Tool Pstoreutl

Temporäre Dateien

RAID-Array

noteAnmerkung:
Speichern Sie diese Dateien in einem Cluster auf einem Laufwerk ohne Failover, z. B. einem lokalen Laufwerk oder einem Laufwerk im RAID-Array oder SAN (Storage Area Network), das nur zur Ausführung auf einem bestimmten Computer konfiguriert ist.

Verwenden Sie das Tool SetTempPath.

Sammelprotokolle

Belassen Sie diese am Standardspeicherort, oder verschieben Sie sie an einen gewünschten Speicherort.

Weisen Sie den Speicherort im Registrierungsschlüssel StreamLogsDirectory zu.

Weitere Informationen zum Optimieren der Volltextindizierung finden Sie unter Optimieren der Volltextindizierung.

Verschieben des Eigenschaftenspeichers und der Eigenschaftenspeicherprotokolle.

Beim Erstellen des ersten Indexes auf dem Server wird in Exchange Server 2003 auf dem Exchange Server 2003-Systemlaufwerk eine neue Eigenschaftenspeicher-Datenbank erstellt. Um die Leistung zu erhöhen, verschieben Sie die Dateien der Eigenschaftenspeicherdatenbank in das RAID-Array. Sie müssen den Eigenschaftenspeicher und die Eigenschaftenspeicherprotokolle nur einmal für jeden Server verschieben, da für alle Indizes auf einem Server derselbe Eigenschaftenspeicher verwendet wird.

Weitere Informationen zum Verschieben des Eigenschaftenspeichers in einer Umgebung ohne Cluster finden Sie unter Verschieben des Eigenschaftenspeichers und der Eigenschaftenspeicherprotokolle für Volltextindizierung in einer Umgebung ohne Cluster.

Weitere Informationen zum Verschieben des Eigenschaftenspeichers in einer Umgebung mit Clustern finden Sie unter Verschieben des Eigenschaftenspeichers und der Eigenschaftenspeicherprotokolle für Volltextindizierung in einer Clusterumgebung.

Verschieben des temporären Verzeichnisses

Die temporären Dateien zum Erfassen und Filtern befinden sich auf dem Systemlaufwerk von Exchange Server 2003, das normalerweise keinen E/A-Durchsatz des RAID-Arrays aufweist. Verschieben Sie das temporäre Verzeichnis mithilfe des SetTempPath-Tools in das RAID-Array. Sie müssen dieses Verzeichnis nur einmal für jeden Server verschieben, da für alle Indizes auf einem Server dasselbe temporäre Verzeichnis verwendet wird.

Weitere Informationen zum Verschieben des temporären Verzeichnisses des Microsoft Search-Diensts finden Sie unter Verschieben des temporären Verzeichnisses des Microsoft Search-Servers.

Verschieben des Indexes (Katalog)

Der Index sollte sich in einem RAID-Array befinden. Wenn Sie diesen Speicherort nicht beim Erstellen des Indexes angegeben haben, verschieben Sie ihn mit dem Tool Catutil.

Weitere Informationen zum Verschieben eines Indexes finden Sie unter Verschieben des Index (Katalogs) für die Volltextindizierung.

Verschieben der Sammelprotokolle

Die Sammelprotokolle werden auf dem Systemlaufwerk von Exchange Server 2003 erstellt, das normalerweise keinen E/A-Durchsatz des RAID-Arrays aufweist. Sie können die Sammelprotokolle am Standardspeicherort belassen oder einen Speicherort auf einem Laufwerk mit höherer Leistung angeben.

Weitere Informationen zum Verschieben der Sammelprotokolle finden Sie unter Verschieben der Sammelprotokolle für die Volltextindizierung.

Erhöhen des Grenzwerts für die Nachrichtengröße

Der Index enthält in der Standardeinstellung Nachrichten (einschließlich Anlagen), deren Größe höchstens 16 MB beträgt. Daher sind Nachrichten mit umfangreichen Anlagen möglicherweise nicht im Index und den Suchergebnissen von Benutzern enthalten. Es wird empfohlen, zum Vermeiden von Leistungsproblemen, diesen Grenzwert auf die maximale Einstellung von 4.000 MB zu erhöhen, sodass größere Nachrichten und Anlagen indiziert werden.

Weitere Informationen zur Erhöhung der Beschränkung der Nachrichtengröße finden Sie unter Erhöhen der Beschränkung der Nachrichtengröße für die Volltextindizierung.

Einrichten von Prüfpunkten

Es wird dringend empfohlen, das in Microsoft Exchange 2000 Server SP2 enthaltene Skript für Prüfpunktvorgänge zu verwenden, um mögliche Indizierungsprobleme zu vermeiden. Wenn der Microsoft Search-Dienst während einer inkrementellen Indexauffüllung mit einem Fehler beendet wird, werden einige Ordner und Nachrichten möglicherweise nicht ordnungsgemäß indiziert. (Bei der inkrementellen Auffüllung wird ein vorhandener Index mit Daten aktualisiert, die sich seit der vorangegangenen Auffüllung geändert haben.) Durch Prüfpunkte wird dieses Problem behoben, da im Katalogverzeichnis die folgenden Sicherungsdateien angelegt werden.

  • Zwei Dateien mit Prüfpunktdatensätzen: <Katalog>.chk1.gthr und <Katalog>.chk2.gthr.
  • Etwa 13 Dateien mit den zuletzt bekannten vollständigen und unbeschädigten Katalogdateien, die in einem Unterverzeichnis zur Sicherung gespeichert werden.

Das Prüfpunkt-Feature ist in der Standardeinstellung nicht aktiviert, da es eine beträchtliche Menge zusätzlichen Festplattenspeichers benötigt. Die zusätzliche Dateigröße beträgt für jedes Dokument in der Datenbank etwa 200 Bytes. So werden bei 5.000.000 Nachrichten oder Dokumenten in der Datenbank Prüfpunktdateien mit einer Gesamtgröße von 1 GB erstellt. Die Größe dieser Dateien nimmt mit zunehmender Anzahl der Dokumente in der Datenbank zu. Stellen Sie sicher, dass genügend Festplattenspeicher verfügbar ist, bevor Sie das Prüfpunktskript ausführen. Auf der Festplatte, auf der Volltextindexkataloge abgelegt werden, sollten mindestens 15 % freier Speicher verfügbar sein.

Weitere Informationen zum Einrichten von Prüfpunkten finden Sie unter Einrichten von Prüfpunkten für die Volltextindizierung.

Durchführen einer vollständigen Auffüllung

Nachdem Sie einen Index erstellt haben, müssen Sie eine vollständige Auffüllung (auch als Crawl bezeichnet) des Index mit Daten durchführen. Die Einstellung für die Ressourcenauslastung bei der Volltextindizierung befindet sich im Dialogfeld Eigenschaften des Servers auf der Registerkarte Volltextindizierung. Die Standardeinstellung lautet Niedrig. Es wird empfohlen, die Standardeinstellung zu verwenden. Die Vorteile einer höheren Einstellung sind gering und können zu einer Verringerung der Geschwindigkeit des Benutzerzugriffs auf den Server führen, auf dem Exchange Server 2003 ausgeführt wird.

Mit der Einstellung Niedrig für die Ressourcenauslastung wird die Auffüllung im Hintergrund ausgeführt und kann während der Geschäftszeit erfolgen. Die Threads des Auffüllungsvorgangs verwenden Leerlaufzeiten. Benutzeraktivitäten erhalten im System Vorrang. Da für die Volltextindizierung nur Prozessorzyklen verwendet werden, die andernfalls nicht genutzt werden, wird die Geschwindigkeit des Benutzerzugriffs auf den Server nicht wesentlich verringert. Sie können davon ausgehen, dass die Prozessorauslastung während der Auffüllung normalerweise annähernd 100 Prozent beträgt.

noteAnmerkung:
Wenn während einer vollständigen oder inkrementellen Auffüllung durch den Microsoft Search-Dienst Leistungsprobleme am Exchange-Server auftreten, können Sie den Wert für die Ressourcenauslastung auf Minimum verringern. Wenn Sie die Ressourcenauslastung auf Minimum festlegen, wird die Menge der Ressourcen verringert, die der Microsoft Search-Dienst verwenden kann. Daher nimmt die Zeit für die Durchführung vollständiger oder inkrementeller Auffüllungen zu, doch es tritt kein Datenverlust auf.

Weitere Informationen zum Starten einer Volltextindizierung finden Sie unter Starten einer vollständigen Auffüllung eines Volltextindex.

Die erste vollständige Auffüllung kann sehr lange dauern. Bei einer typischen Exchange Server 2003-Konfiguration beträgt die Auffüllungsgeschwindigkeit in der Regel zwischen 10 und 20 Nachrichten pro Sekunde. Die Geschwindigkeit hängt von der Hardwarekonfiguration, dem Typ und der Größe der Nachrichten und den verfügbaren Serverressourcen ab. Daher kann die Gesamtzeit für eine vollständige Auffüllung zwischen einigen Minuten bei einer kleinen und bis zu mehreren Tagen bei einer großen Datenbank liegen.

Die für die Auffüllung erforderliche Zeit hängt auch von der Sprache des Inhalts der Dokumente auf dem Server ab. Beispielsweise kann das Auffüllen eines Index auf einem Server, der zum Großteil in ostasiatischen Sprachen verfasste Dokumente enthält, über fünfmal mehr Zeit beanspruchen als bei einem Server mit Dokumenten, die in westeuropäischen Sprachen verfasst wurden. Ordner mit Internetnewsfeeds können außerdem die Auffüllungszeit beträchtlich verlängern, wenn die Ordner Nachrichten im UUEncode-Format enthalten.

Weitere Informationen zum Anzeigen des Status des Auffüllvorgangs finden Sie unter Anzeigen des Status einer Auffüllung eines Volltextindex.

Weitere Informationen zum Anhalten einer Volltextindizierung finden Sie unter Anhalten einer vollständigen Auffüllung eines Volltextindex.

Festlegen eines Zeitplans für inkrementelle Auffüllungen

Ermitteln Sie, wie oft inkrementelle Auffüllungen zur Aktualisierung des Indexes ausgeführt werden sollen. Da inkrementelle Auffüllungen wie vollständige Auffüllungen im Hintergrund ausgeführt werden, entstehen für die Benutzer auch bei häufigen Aktualisierungen nur unwesentliche Verlängerungen der Systemantwortzeiten. Planen Sie mindestens einmal täglich eine inkrementelle Auffüllung. Häufigere Planungen einer Aktualisierung werden ebenfalls empfohlen, da der Index nur nach einer Auffüllung den aktuellen Status wiedergibt. Berücksichtigen Sie auch die Zeit, die für das Abschließen einer inkrementellen Auffüllung benötigt wird. In einem typischen Zeitplan werden inkrementelle Aktualisierungen z. B. zu Beginn jeder Stunde geplant. Wenn die Aktualisierung jedoch länger als eine Stunde dauert, wird die nächste Aktualisierung erst zu Beginn der darauffolgenden Stunde begonnen.

Im Zeitplan für inkrementelle Auffüllungen wird nur festgelegt, wann eine Auffüllung beginnen kann. Es ist keine Zeitbegrenzung für die Auffüllung vorgesehen. Daher ist es möglich, dass eine inkrementelle Auffüllung erst nach Überschreiten der geplanten Zeit beendet wird.

noteAnmerkung:
Wenn der Postfachspeicher oder der Informationsspeicher für Öffentliche Ordner 6 GB nicht überschreitet, können Sie stündlich inkrementelle Aktualisierungen durchführen. Wenn der Speicher größer ist als 6 GB oder auf dem Server eine hohe Speicherauslastung vorliegt, muss die Aktualisierung des Indexes weniger häufig durchgeführt werden.

Weitere Informationen zum Festlegen eines Zeitplans zum inkrementellen Auffüllen finden Sie unter Festlegen des Zeitplans für das inkrementelle Auffüllen des Volltextindex.

Aktivieren der Abfragefunktion für die Volltextindizierung

Aktivieren Sie nach der ersten Auffüllung und dem Durchführen mindestens einer inkrementellen Auffüllung die Verwendung des Indexes, um Benutzern die Volltextsuche im Index zu ermöglichen.

Weitere Informationen zum Aktivieren der Verwendung eines Volltextindexes finden Sie unter Aktivieren von Volltextindexabfragen.

Benachrichtigung und Einführung der Benutzer

Teilen Sie den Benutzern mit, dass die Indizes für Suchvorgänge zur Verfügung stehen, sobald Sie die Abfragefunktion aktiviert haben, und weisen Sie die Benutzer darauf hin, welche Ergebnisse bei Volltextsuchen in einem Index zu erwarten sind. Sie können die Benutzer beispielsweise durch eine E-Mail-Ankündigung informieren.