Wiederherstellen eines Einzelkopieclusters

 

Gilt für: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1, Exchange Server 2007

Letztes Änderungsdatum des Themas: 2007-10-26

Einzelkopiecluster (Single Copy Clusters, SCCs) bieten Redundanz für Dienste, die den Zugriff auf Daten ermöglichen. Dienstredundanz ermöglicht schnelles Wiederherstellen ohne Datenverlust in Fällen, in denen der Hostknoten fehlschlägt. Da ein Einzelkopiecluster den Speicher, der die Datenbank enthält, als Teil eines Failoverdiensts an den neuen Knoten übergibt, sollte der Dienst ohne Datenverlust wiederhergestellt werden.

In einem Einzelkopieclustern ist das Speichersubsystem jedoch eine einzelne Fehlerquelle. Ein vollständiger Ausfall des Speichersubsystems führt normalerweise zu einem eintägigen Ausfall mit einem durchschnittlichen Datenverlust von 12 Stunden. Eine vollständige Sicherung einmal am Tag wird hierbei vorausgesetzt. Außerdem ist die Speicherkonfiguration für eine SCC-Lösung hinsichtlich Installation und Betrieb komplexer als bei der fortlaufenden Clusterreplikation (Cluster Continuous Replication, CCR), dem anderen Typ von Exchange-Clusterlösung. Weitere Informationen zur fortlaufenden Clusterreplikation finden Sie unter Fortlaufende Clusterreplikation.

Das SCC-Wiederherstellungsverhalten lässt sich in zwei Typen von Ausfällen unterteilen:

  • Geplante Ausfälle   Geplante Ausfälle werden durch den Administrator ausgelöst. Ein geplanter Ausfall kann für die Wiederherstellung nach einem vom Überwachungssystem erkannten Fehler oder für bestimmte administrative Aufgaben, beispielsweise Hardwarewartung oder die Installation von Software oder Softwareupdates, verwendet werden.

  • Ungeplante Ausfälle   Ungeplante Ausfälle werden vom System als Wiederherstellungsaktion nach einer Ausfallerkennung initiiert. Diese Ausfälle werden vom Windows-Clusterdienst erkannt, der auch die Wiederherstellung auslöst.

In der folgenden Tabelle werden die erwarteten Wiederherstellungsaktionen für eine Reihe von Ausfällen beschrieben. Bei einigen Ausfällen muss der Administrator die Wiederherstellung initiieren, wohingegen bei anderen Ausfällen der Windows-Clusterdienst automatisch aktiv wird.

Trotz unterschiedlicher Auslösung wird sowohl bei geplanten als auch bei ungeplanten Ausfällen der passive Knoten aktiviert und die Datenbanken werden bereitgestellt, vorausgesetzt, die Übergabe der freigegebenen Datenträger war erfolgreich. Wenn die Übergabe der freigegebenen Datenträger vielleicht aufgrund eines Konfigurationsfehlers nicht ordnungsgemäß durchgeführt wurde, werden die betroffenen Datenbanken nicht bereitgestellt.

Hinweis

Auf einem passiven Knoten kann nur jeweils ein Postfachclusterserver gleichzeitig aktiviert werden. Wenn ein Knoten bereits als Host eines aktiven Postfachclusterservers fungiert, kann er keinen anderen Server in den Onlinestatus versetzen.

Hinweis

Im Gegensatz zu früheren Versionen von Exchange löst Microsoft Exchange Server 2007 keine ungeplanten automatischen SCC-Ausfälle (Failover) als Folge von Datenbankfehlern aus.

Wiederherstellungsaktionen bei Ausfällen

Ausfallbeschreibung Aktion Kommentare

Betriebssystem-Abbruchfehler, Betriebssystem reagiert nicht mehr, vollständiger Stromausfall eines Knotens, nicht behebbarer Fehler des Prozessorchips, des Motherboards oder der Backplane oder vollständiger Kommunikationsfehler für einen Knoten.

Automatischer Failover auf passiven Knoten, wenn verfügbar. Datenbanken werden bereitgestellt, sobald der jeweilige Speicher in den Onlinestatus versetzt wird.

Damit ein passiver Knoten verfügbar ist, muss es möglich sein, nach dem Ausfall ein Quorum einzurichten. Dies bedeutet, dass der verbleibende Knoten auf den Quorumdatenträger zugreifen kann.

Volständiger Speicherausfall auf dem aktiven Knoten

Speicherausfälle werden an und durch das Überwachungssystem gemeldet. Der Administrator kann den Speicher wiederherstellen oder Sicherungen zur Wiederherstellung verwenden.

Automatischer Failover auf den passiven Knoten, wenn verfügbar. Datenbanken werden bereitgestellt, sobald der jeweilige Speicher in den Onlinestatus versetzt wird.

Damit ein passiver Knoten verfügbar ist, muss es möglich sein, nach dem Ausfall ein Quorum einzurichten. Dies bedeutet, dass der verbleibende Knoten auf den Quorumdatenträger zugreifen kann.

Vollständiger Speicherausfall

Speicherausfälle werden an und durch das Überwachungssystem gemeldet. Der Administrator kann den Speicher wiederherstellen oder Sicherungen zur Wiederherstellung verwenden.

Dieser Fehler wird als Fehler des Clusters (und aller seiner Ressourcen) gemeldet, weil auf das Quorum und die Datenbanken nicht zugegriffen werden kann.

Ausfall des Datenzentrums

Automatischer Failover wird ohne eine Replikationslösung eines Drittanbieters nicht unterstützt.

Beim Replizieren von Livedaten muss die Replikation synchron ausgeführt werden.

Betriebssystem-Laufwerkfehler

Keine automatische Wiederherstellungsaktion. Wird nicht von Exchange erkannt, es sei denn, ein Betriebssystemfehler tritt auf. Wird basierend auf offensichtlichen Fehlern und nicht anhand der eigentlichen Ursache erkannt.

Ein Betriebssystem-Laufwerkfehler wird von den Diensten für die Betriebssystemüberwachung gemeldet und führt ggf. zu einem Betriebssystemfehler.

Nicht genügend Speicherplatz auf dem Betriebssystemlaufwerk

Automatischer Failover auf den passiven Knoten, wenn verfügbar. Datenbanken werden bereitgestellt, sobald der jeweilige Speicher in den Onlinestatus versetzt wird.

Dieser Ausfall wird an die und durch die Überwachungsdienste gemeldet. Wenn der automatische Failover nicht auftritt oder nicht auftreten kann, wird die Wiederherstellungsaktion für dieses Szenario vom Administrator festgelegt.

Fehler des öffentlichen Netzwerks des Clusters auf dem aktiven Knoten

Gleiche Wiederherstellungsaktion wie im Szenario mit vollständigem Stromausfall.

Der Status des öffentlichen Netzwerks wird nicht über die Hardware und Software hinaus erkannt, die für die Kommunikation zwischen den aktiven und passiven Knoten verwendet wird. Die Überprüfung der tatsächlichen Clientverbindung wird von Exchange 2007 nicht zur Verfügung gestellt.

Vollständiger Ausfall des öffentlichen Netzwerks des Clusters

Keine automatische Wiederherstellungsaktion.

Wenn ein Verlust des öffentlichen Netzwerks eintritt, gehen die IP-Adressressourcen in einen Fehlerzustand über. Nachdem der Fehler des öffentlichen Netzwerks behoben wurde, können die Ressourcen erneut online geschaltet werden.

Verlust des Clusterquorums

Postfachclusterserver und Clusterquorum sind offline.

Dieses Szenario führt zu Dienstausfall, wenn kein Quorum gebildet werden kann.

Informationsspeicherfehler

Automatischer Neustart der Informationsspeicherressource.

Nach wiederholten Fehlern kann der Administrator versuchen, den Postffachclusterserver manuell auf einen passiven Knoten zu verschieben, um zu versuchen, ihn online zu schalten.

Anwendungslaufwerkfehler (Binärdateien)

Keine automatische Wiederherstellungsaktion.

Im Allgemeinen führt dieses Szenario zu anderen Fehlern, die an und durch die Überwachungsdienste gemeldet und vom Administrator behoben werden können. Die Wiederherstellungsaktion für dieses Szenario wird vom Administrator festgelegt.

Nicht genügend Speicherplatz auf dem Anwendungslaufwerk (Binärdateien)

Keine automatische Wiederherstellungsaktion.

Die Überwachungsdienste melden diese Bedingung. Die Wiederherstellungsaktion für dieses Szenario wird vom Administrator festgelegt.

Vollständiger Verlust der Datenbank oder Speichergruppe oder vollständiger Datenbankfehler

Automatischer Versuch, die betroffenen Datenbanken erneut bereitzustellen. Wenn bei diesem Versuch ein Fehler auftritt, verbleibt die Datenbank in einem Fehlerzustand, es tritt jedoch kein Failover des Postfachclusterservers auf.

Die Bereitstellung der Speichergruppe oder Datenbank wird aufgrund eines Softwarefehlers oder Fehlers aufgehoben, oder es ist ein Hardwarefehler aufgetreten. Eine Speichergruppe führt z. B. eine erzwungene Aufhebung der Bereitstellung aller Datenbanken durch, wenn ihr Protokollverzeichnis nicht verfügbar ist. Der Administrator legt die Korrekturmaßnahme fest. Die Wiederherstellung kann ein geplanter Ausfall sein, um den passiven Knoten zu aktivieren.

Teilweiser Fehler einer Speichergruppe oder Datenbank, einige Daten sind nicht verfügbar oder Datenbankfehler bei der anfänglichen Bereitstellung

Keine automatische Wiederherstellungsaktion.

Teilweiser Fehler bedeutet, dass einige Fehler gemeldet wurden, diese Fehler jedoch keine Aufhebung der Bereitstellung der Speichergruppe oder Datenbank erzwungen haben. Wenn eine Datenbank nicht beim Start bereitgestellt wird, wird keine Aktion ausgeführt, und die Überwachungsdienste melden den Fehler. Wenn diese Bedingung erkannt wird, generiert der Postfachserver Ereignisse, die von den Überwachungsdiensten gemeldet werden können. Die Überwachung erkennt und meldet außerdem Datenbanken, deren Bereitstellung aufgehoben wurde.

Fehlerhaftes Protokoll für Speichergruppe erkannt

Keine automatische Wiederherstellungsaktion.

Die Überwachungsdienste melden diese Bedingung.

Nicht genügend Speicherplatz auf dem Datenbank- oder Transaktionsprotokolllaufwerk

Keine automatische Wiederherstellungsaktion. Die Bereitstellung der Datenbanken in der Speichergruppe wird aufgehoben.

Der Mangel an freiem Speicherplatz wird durch das Überwachungssystem gemeldet. Der Administrator legt die Korrekturmaßnahme fest.