Überwachen der fortlaufenden Replikation

 

Gilt für: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1

Letztes Änderungsdatum des Themas: 2007-08-22

In Microsoft Exchange Server 2007 Service Pack 1 (SP1) werden neue, verbesserte Funktionen zur Überwachung von Umgebungen mit fortlaufender Replikation eingeführt. Durch diese Änderungen wurden die Features zur Clusterberichterstattung in der RTM-Version (Release to Manufacturing) von Microsoft Exchange Server 2007 optimiert. Sie beinhalten zusätzliche Funktionen für die proaktive Überwachung von Umgebungen mit fortlaufender Replikation. Im Speziellen werden in Exchange 2007 SP1 Verbesserungen am Cmdlet Get-StorageGroupCopyStatus eingeführt, und das neue Cmdlet Test-ReplicationHealth wurde hinzugefügt. Ferner stellt die Anwendung eine verbesserte Einsichtnahmen in das vom Transportpapierkorb abgedeckte Verlustfenster bereit. Neben der Überwachung der fortlaufenden Replikation mit diesen Cmdlets können Sie ebenfalls mehrere Leistungsindikatoren verwenden, die vom Microsoft Exchange-Replikationsdienst veröffentlicht werden.

Verbesserungen am Get-StorageGroupCopyStatus-Cmdlet in SP1

In Exchange 2007 RTM gibt es mehrere Umstände, unter denen der von Get-StorageGroupCopyStatus gemeldete Status und die Leistungsindikatoren der fortlaufenden Replikation ungenau oder irreführend sind:

  • Eine Speichergruppe, die nicht aktiv ist (d. h. sich nicht ändert), kann als Fehlerfrei gemeldet werden, obwohl sie möglicherweise nicht fehlerfrei ist. Diese Situation tritt ein, weil der fehlerhafte Zustand erst erkannt wird, wenn ein Protokoll wiedergegeben wird.

  • Während der Initialisierung der Replikation wird der Replikationsstatus bewertet und ist möglicherweise nicht mehr genau. Nach Abschluss der Initialisierung wird der Status aktualisiert.

  • Der Wert des Felds LastLogGenerated kann falsch sein, wenn die Bereitstellung der Datenbank in der Speichergruppe aufgehoben wird.

  • Wenn in der Mitte eines Protokolldatenstroms mindestens eine Protokolldatei fehlt, werden weiterhin Wiederherstellungsversuche für die passive Kopie durchgeführt, wodurch der Replikationsstatus ständig zwischen den Zuständen Fehler und Fehlerfrei wechselt. Wenn dies eintritt, wachsen die Wiedergabe- und Kopiewarteschlangen weiterhin an.

  • Unter seltenen Umständen kann ein Protokoll erfolgreich überprüft werden, aber dennoch nicht fehlerfrei wiedergegeben werden. In dieser Situation wechselt das System während der Wiederherstellungsversuche ständig zwischen den Zuständen Fehler und Fehlerfrei. Wenn dies eintritt, wachsen die Wiedergabe- und Kopiewarteschlangen weiterhin an.

Exchange 2007 RTM verwendet die Clusterdatenbank und die Registrierung für die Kommunikation zwischen dem Microsoft Exchange-Replikationsdienst und den Exchange-Verwaltungsaufgaben, die einen asynchronen Prozess darstellt. Da der Prozess asynchron ist, kann er zu dem oben beschriebenen unzuverlässigen Zustand führen.

In Exchange 2007 SP1 wurden die beschriebenen Probleme gelöst, indem der zugrundlegende Mechanismus der Kommunikation zwischen dem Microsoft Exchange-Replikationsdienst und den Exchange-Verwaltungsaufgaben überarbeitet wurde. Statt den Clusterdienst oder die Registrierung zu verwenden, kommunizieren die Verwaltungsaufgaben jetzt durch Remoteprozeduraufrufe (Remote Procedure Calls, RPCs) direkt mit dem Microsoft Exchange-Replikationsdienst.

Darüber hinaus wurde das Cmdlet Get-StorageGroupCopyStatus durch Hinzufügen neuer Statusinformationen verbessert:

  • Das Cmdlet Get-StorageGroupCopyStatus meldet einen SummaryCopyStatus von "ServiceDown", wenn nicht über das Netzwerk auf den Microsoft Exchange-Replikationsdienst auf dem Zielcomputer zugegriffen werden kann.

  • Das Cmdlet Get-StorageGroupCopyStatus meldet einen SummaryCopyStatus von "Initialisieren", wenn der Microsoft Exchange-Replikationsdienst auf dem Zielcomputer die Anfangstests beim Startvorgang noch nicht abgeschlossen hat. Es wurde außerdem ein neuer Leistungsindikator erstellt, um diesen Status als Booleschen Wert darstellen zu können.

  • Das Cmdlet Get-StorageGroupCopyStatus meldet einen SummaryCopyStatus von Wird synchronisiert, wenn ein inkrementelles erneutes Seeding nicht abgeschlossen wurde.

Die neuen Zustände für den Wert SummaryCopyStatus sind nur bei Verwendung der Exchange 2007 SP1-Version der Exchange-Verwaltungstools sichtbar. Wenn Sie die Exchange-Verwaltungstools der RTM-Version von Exchange 2007 verwenden, wird der Status aller vorangehenden Zustände als fehlerhaft gemeldet.

Test-ReplicationHealth-Cmdlet

Mit Exchange 2007 SP1 wird ein neues Cmdlet namens Test-ReplicationHealth eingeführt. Dieses Cmdlet ist auf die proaktive Überwachung der fortlaufenden Replikation sowie der fortlaufenden Replikationspipeline ausgelegt. Das Cmdlet Test-ReplicationHealth ist so konzipiert, dass es lokal auf einem Postfachserver ausgeführt werden kann, um den Replikationsstatus in Umgebungen mit fortlaufender lokaler Replikation (Local Continuous Replication, LCR), fortlaufender Clusterreplikation (Cluster Continuous Replication, CCR) und fortlaufender Standbyreplikation (Standby Continuous Replication, SCR) zu prüfen. Das Cmdlet Test-ReplicationHealth ist ebenfalls für die enge Integration mit dem Management Pack für Microsoft Operations Manager (MOM) ausgelegt, um einfache, genaue Detailinformationen bezüglich des Zustands der fortlaufenden Replikation für den Postfachserver bereitzustellen. Die Prüfungen erfolgen nach Schweregrad; kritische Tests werden zuerst ausgeführt. Schlägt eine dieser Prüfungen fehl, wird vorausgesetzt, dass die weniger kritischen Tests ebenfalls fehlschlagen würden oder nicht relevant sind.

Das Cmdlet Test-ReplicationHealth prüft alle Aspekte der Replikation, der Clusterdienste, der Speichergruppenreplikation und des Wiedergabestatus, um einen vollständigen Überblick über das Replikationssystem bereitzustellen. Insbesondere wenn das Cmdlet Test-ReplicationHealth auf einem Knoten im Cluster ausgeführt wird, führt es die in der folgenden Tabelle beschriebenen Tests aus.

Vom Test-ReplicationHealth-Cmdlet ausgeführte Tests

Test Beschreibung

Status des passiven Knotens (PassiveNodeUp)

Überprüft, ob der passive Knoten bei Verwendung in einer CCR-Umgebung einen aktiven Status aufweist.

Status des Clusternetzwerks (ClusterNetwork)

Überprüft, ob alle auf dem lokalen Knoten gefundenen clusterverwalteten Netzwerke ausgeführt werden.

Zustand der Quorumgruppe (QuorumGroup)

Überprüft, ob die Clustergruppe, die die Quorumressource enthält, fehlerfrei ist.

Zustand des Dateifreigabequorums (FileShareQuorum)

Überprüft, ob der Wert von FileSharePath, der vom Hauptknotensatz-Quorum mit Dateifreigabenzeuge verwendet wird, erreichbar ist.

Zustand der Postfachclusterserver-Gruppe (CmsGroup)

Überprüft, ob der Postfachclusterserver fehlerfrei ist, indem sichergestellt wird, dass alle Ressourcen in der Gruppe online sind.

Knotenzustand (NodePaused)

Überprüft, dass keiner der Knoten im Cluster sich im Zustand Angehalten befindet.

Status der DNS-Registrierung (DnsRegistrationStatus)

Überprüft, ob alle clusterverwalteten Netzwerkschnittestellen, für die Erfolgreiche DNS-Registrierung vorschreiben festgelegt ist, die DNS-Registrierung (Domain Name System) durchlaufen haben.

Status des Replikationsdiensts (ReplayService)

Überprüft, ob der Microsoft Exchange-Replikationsdienst auf dem lokalen Knoten in einem fehlerfreien Zustand ist.

Nach Failover bereitgestellte Datenbanken (DBMountedFailover)

Überprüft, ob nach einem Failover Bereitstellungen von Datenbanken aufgehoben wurden oder Datenbankfehler aufgetreten sind. Mit diesem Test wird nur das Vorhandensein von Datenbanken überprüft, die als Folge eines Failovers fehlerhaft sind.

Speichergruppenkopie angehalten (SGCopySuspended)

Überprüft, ob die fortlaufende Replikation für eine Speichergruppe auf dem Postfachclusterserver angehalten wurde.

Speichergruppenkopie mit Fehler (SGCopyFailed)

Überprüft, ob eine Speichergruppenkopie mit einem fehlerhaften Zustand vorhanden ist.

Speichergruppeninitialisierung (SGInitializing)

Überprüft, ob eine Speichergruppenkopie sich in dem Zustand Initialisieren befindet.

Länge der Speichergruppenkopie-Warteschlange (SGCopyQueueLength)

Überprüft, ob die Länge der Replikationskopie-Warteschlange einer Speichergruppe über den in den bewährten Methoden angegebenen Schwellenwerten liegt. Zurzeit handelt es sich bei diesen Schwellenwerten um folgende:

  • Warnung   Die Warteschlangenlänge entspricht 3 bis 5 Protokolldateien.

  • Fehler   Die Warteschlangenlänge ist größer oder gleich 6 Protokolldateien.

Länge der Speichergruppenwiedergabe-Warteschlange (SGReplayQueueLength)

Überprüft, ob die Länge der Replikationswiedergabe-Warteschlange einer Speichergruppe über den in den bewährten Methoden angegebenen Schwellenwerten liegt. Zurzeit handelt es sich bei diesen Schwellenwerten um folgende:

  • Warnung   Die Warteschlangenlänge entspricht 30 bis 59 Protokolldateien.

  • Fehler   Die Warteschlangenlänge ist größer oder gleich 60 Protokolldateien.

Überwachungskontext für Test-ReplicationHealth

Das Cmdlet Test-ReplicationHealth beinhaltet einen Parameter namens MonitoringContext, mit dem Überwachungsereignisse und Leistungsindikatoren in die Ergebnisse eines Tasks aufgenommen werden. Dieser Parameter wird vom Management Pack für MOM verwendet. Die beiden möglichen Werte für diesen Parameter sind $true oder $false. Wenn Sie "$true" angeben, beinhalten die Ergebnisse zusätzlich zu den Informationen über Dienste auch Überwachungsereignisse und Leistungsindikatoren.

Wenn der Überwachungskontext angegeben wird, können für einen aktiven Knoten nur die folgenden Prüfungen durchgeführt werden:

  • PassiveNodeUp

  • ClusterNetwork

  • QuorumGroup

  • FileShareQuorum

  • CmsGroup

  • NodePaused

  • DnsRegistrationStatus

  • ReplayService

  • DBMountedFailover

Wenn der Überwachungskontext angegeben wird, können für einen passiven Knoten nur die folgenden Prüfungen durchgeführt werden:

  • ClusterNetwork

  • DnsRegistrationStatus

  • ReplayService

  • SGCopySuspended

  • SGCopyFailed

  • SGInitializing

  • SGCopyQueueLength

  • SGReplayQueueLength

Vom Microsoft Exchange-Replikationsdienst veröffentlichte Leistungsindikatoren

Der Microsoft Exchange-Replikationsdienst stellt Leistungsindikatoren bereit, die sowohl bei LCR als auch bei CCR zur Überwachung des Zustands der Replikation eingesetzt werden. Die nachfolgend beschrieben Indikatoren sollten zur Überwachung und Behebung von Leistungsproblemen zusammengestellt und ausgewertet werden.

Empfohlene Leistungsindikatoren des Microsoft Exchange-Replikationsdiensts

Der Microsoft Exchange-Replikationsdienst erstellt für jede Speichergruppenkopie eine Instanz der Indikatoren in der folgenden Tabelle. Auf diese Weise können Sie den Zustand und die Leistung der einzelnen Speichergruppen unabhängig voneinander überwachen. Zustand und Status der einzelnen Speichergruppen können Sie durch Überwachung der Indikatoren ReplayQueueLength und CopyQueueLength unter dem Leistungsobjekt MSExchange Replication überwachen.

Hinweis

Wie bereits erwähnt, zeigt das Cmdlet Get-StorageGroupCopyStatus ebenfalls die Werte dieser Indikatoren an.

Indikatorname Indikatorbeschreibung

Warteschlange überschreitet Bereitstellungsschwellenwert (nur bei CCR)

Gibt an, ob die Länge der Kopierwarteschlange über dem Schwellenwert liegt, der über AutoDatabaseMountDial angegeben ist. In einer CCR-Umgebung lautet der Wert für diesen Indikator 1, wenn der Schwellenwert AutoDatabaseMountDial überschritten wird. In einer LCR-Umgebung ist dieser Wert immer 0.

CopyGenerationNumber

Gibt die Generierungssequenznummer der letzten kopierten Protokolldatei an.

CopyNotificationGenerationNumber

Gibt die Generierungssequenznummer der letzten Protokolldatei an, die dem Microsoft Exchange-Replikationsdienst bekannt ist.

CopyQueueLength

Gibt die Anzahl der zu kopierenden und zu überprüfenden Protokolldateien an.

Fehler

Der Wert 1 gibt an, dass die fortlaufende Replikation sich in dem Zustand Fehler befindet (Speichergruppe). Andernfalls lautet der Wert 0.

Initialisieren

Der Wert 1 gibt an, dass die fortlaufende Replikation sich in dem Zustand Initialisieren befindet (Speichergruppe). Dieser Zustand gibt an, dass die Speichergruppenkopie beim Startvorgang Anfangstests durchführt oder dass der Microsoft Exchange-Replikationsdienst ein inkrementelles erneutes Seeding durchführt. Der Wert 0 gibt an, dass sich die fortlaufende Replikation nicht in dem Zustand Initialisieren befindet.

InspectorGenerationNumber

Gibt die Generierungssequenznummer der letzten überprüften Protokolldatei an.

ReplayBatchSize

Gibt die Anzahl an Protokolldateien an, die zusammen wiedergegeben wurden.

ReplayGenerationNumber

Gibt die Generierungssequenznummer der letzten erfolgreich wiedergegebenen Protokolldatei an.

ReplayGenerationsComplete

Gibt die Anzahl der wiedergegebenen Protokolldateien im aktuellen Batch an.

ReplayGenerationsPerMinute

Gibt die Wiedergaberate (in Protokollgenerierungen pro Minute) für den aktuellen Batch an.

ReplayGenerationsRemaining

Gibt die Anzahl der Protokollgenerierungen an, die aus dem aktuellen Batch noch wiedergegeben werden müssen.

ReplayNotificationGenerationNumber

Gibt die Generierungssequenznummer der letzten Protokolldatei an, die dem Microsoft Exchange-Replikationsdienst bekannt ist.

ReplayQueueLength

Gibt die Anzahl an Protokolldateien an, die noch wiedergegeben werden müssen.

Angehalten

Der Wert 1 gibt an, dass die fortlaufende Replikation angehalten wurde. Angehalten bedeutet, dass die Protokolldateien nicht in die passive Kopie kopiert bzw. dort nicht wiedergegeben werden.

TruncatedGenerationNumber

Gibt die Generierungssequenznummer der letzten Protokolldatei an, die vom Microsoft Exchange-Replikationsdienst abgeschnitten wurde.

Zusätzlich zu den Indikatoren der vorangehenden Tabelle wird der Indikator Seeding abgeschlossen: % unter dem Leistungsobjekt MSExchange-Replikatseedingmodul veröffentlicht. Dieser Indikator gibt den bereits abgeschlossenen Prozentsatz des Seedings an. Der Wert des Indikators kann zwischen 0 und 100 % liegen, und er wird nur für Speichergruppen veröffentlicht, für die aktuell ein Seeding durchgeführt wird.