Wiederherstellungsverhalten der fortlaufenden Clusterreplikation

 

Gilt für: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1, Exchange Server 2007

Letztes Änderungsdatum des Themas: 2007-10-29

Die fortlaufende Clusterreplikation (Cluster Continuous Replication, CCR) gewährleistet die vollständige Redundanz sowohl der Daten als auch der Dienste, die den Zugriff auf diese Daten ermöglichen. Durch vollständige Redundanz wird die schnelle Wiederherstellung in den Fällen ermöglicht, in denen eine freigegebene Kopie der Postfachdaten keine schnelle Wiederherstellung erlauben würde.

Das CCR-Wiederherstellungsverhalten lässt sich in zwei Typen von Ausfällen unterteilen:

  • Geplante Ausfälle   Geplante Ausfälle werden durch den Administrator ausgelöst. Ein geplanter Ausfall kann für die Wiederherstellung nach einem vom Überwachungssystem erkannten Fehler oder für bestimmte administrative Aufgaben, beispielsweise Hardwarewartung, Softwareinstallation oder Softwareupdates, verwendet werden.

  • Ungeplante Ausfälle   Ungeplante Ausfälle werden vom System als Wiederherstellungsaktion nach einem erkannten Fehler ausgelöst. Diese Ausfälle werden vom Windows-Clusterdienst erkannt, der auch die Wiederherstellung auslöst.

Die folgende Tabelle beschreibt die erwarteten Wiederherstellungsaktionen für verschiedene Fehler. Einige Fehler erfordern, dass der Administrator die Wiederherstellung startet, und andere Fehler werden automatisch von der Exchange-Clusterlösung behandelt.

Wiederherstellungsaktionen bei Fehlern

Beschreibung Aktion Kommentare

Betriebssystem-Abbruchfehler, erkannter Betriebssystemhänger (Betriebssystem reagiert nicht mehr), vollständiger Stromausfall eines Knotens, nicht behebbarer Fehler des Prozessorchips, des Motherboards, der Backplane oder vollständiger Kommunikationsfehler für einen Knoten.

Automatischer Failover auf den passiven Knoten, wenn verfügbar. Der Administrator kann außerdem wahlweise die automatische Bereitstellung unabhängig vom Datenverlust erzwingen, wenn die Wiederherstellung innerhalb des konfigurierten Zeitraums nicht stattgefunden hat. Wenn nach dem Failover keine Datenbanken bereitgestellt werden, der ursprünglich aktive Knoten erneut online arbeitet und sein gesamter Speicher in Betrieb ist, werden die fehlenden Protokolle kopiert und die Datenbanken automatisch bereitgestellt.

Damit ein passiver Knoten verfügbar ist, muss es möglich sein, nach dem Fehler ein Quorum einzurichten. Der verbleibende Knoten muss also in der Lage sein, auf das Dateifreigabequorum zuzugreifen. Alternativ dazu muss die Mehrheit der Knoten im Cluster in Betrieb und in der Lage sein, miteinander zu kommunizieren.

Ausfall des gesamten Speichers auf dem aktiven Knoten

Speicherausfälle werden an und durch das Überwachungssystem gemeldet. Der Administrator kann den Speicher wiederherstellen oder einen geplanten Ausfall des passiven Knotens auslösen.

Dieser Fehler würde als Ausfall aller Datenbanken gemeldet.

Datencenterfehler

Wenn der aktive Knoten im primären Datencenter ausfällt, erfolgt ein automatischer Failover des Postfachclusterservers auf den passiven Knoten im zweiten Datencenter.

Andere Exchange-Verzeichnisdienste, Netzwerkdienste und Server müssen wiederhergestellt werden, um den Mailzugriff zu ermöglichen. E-Mail-Daten sind innerhalb weniger Minuten verfügbar und aktuell.

Betriebssystem-Laufwerkfehler

Keine automatische Wiederherstellungsaktion. Wird nicht von Exchange erkannt, es sei denn, ein Betriebssystemfehler tritt auf. Wird basierend auf offensichtlichen Fehlern und nicht anhand der eigentlichen Ursache erkannt.

Der Betriebssystem-Laufwerkfehler wird von den Betriebssystem-Überwachungsdiensten gemeldet und kann zu einem Ausfall des Betriebssystems führen.

Nicht genügend Speicherplatz auf dem Betriebssystemlaufwerk

Automatischer Failover auf passiven Knoten, wenn verfügbar.

Dieser Fehler wird an die und durch die Überwachungsdienste gemeldet. Wenn die automatische Wiederherstellung nicht auftritt oder nicht auftreten kann, wird die Wiederherstellungsaktion für dieses Szenario vom Administrator festgelegt.

Vollständiger Ausfall des öffentlichen Netzwerks des Clusters

Keine automatische Wiederherstellungsaktion.

Wenn ein Verlust des öffentlichen Netzwerks eintritt, gehen die IP-Adressressourcen in einen Fehlerzustand über. Nachdem der Fehler des öffentlichen Netzwerks behoben wurde, können die Ressourcen erneut online geschaltet werden.

Verlust des Clusterquorums

Postfachclusterserver und Clusterquorum offline.

Dieses Szenario führt zu Dienstausfall, wenn kein Quorum gebildet werden kann.

Informationsspeicherfehler

Automatischer Neustart der Informationsspeicherressource. Wenn der Fehler der Informationsspeicherressource während eines Neustarts auftritt, wird ein Failover ausgelöst.

Nach wiederholten Fehlern kann der Administrator versuchen, den Postffachclusterserver manuell auf den passiven Knoten zu verschieben, um zu versuchen, ihn online zu schalten.

Anwendungslaufwerkfehler (Binärdateien)

Keine automatische Wiederherstellungsaktion.

Im Allgemeinen führt dieses Szenario zu anderen Fehlern, die an und durch die Überwachungsdienste gemeldet und vom Administrator behoben werden können. Die Wiederherstellungsaktion für dieses Szenario wird vom Administrator festgelegt.

Nicht genügend Speicherplatz auf dem Anwendungslaufwerk (Binärdateien)

Keine automatische Wiederherstellungsaktion.

Dies wird an die und durch die Überwachungsdienste gemeldet. Die Wiederherstellungsaktion für dieses Szenario wird vom Administrator festgelegt.

Vollständiger Verlust der Datenbank oder Speichergruppe oder vollständiger Datenbankfehler

Automatischer Versuch, die betroffenen Datenbanken erneut bereitzustellen. Wenn bei diesem Versuch ein Fehler auftritt, verbleibt die Datenbank in einem Fehlerzustand, es tritt jedoch kein Failover des Postfachclusterservers auf.

Die Bereitstellung der Speichergruppe oder Datenbank wird aufgrund eines Softwarefehlers oder Fehlers aufgehoben, oder es ist ein Hardwarefehler aufgetreten. Eine Speichergruppe führt z. B. eine erzwungene Aufhebung der Bereitstellung aller Datenbanken durch, wenn ihr Protokollverzeichnis nicht verfügbar ist. Der Administrator legt die Korrekturmaßnahme fest.

Teilweiser Fehler einer Speichergruppe oder Datenbank, einige Daten sind nicht verfügbar oder Datenbankfehler bei der anfänglichen Bereitstellung

Keine automatische Wiederherstellungsaktion.

Teilweiser Fehler bedeutet, dass ein bestimmter Fehler gemeldet wurde, dieser Fehler jedoch keine Aufhebung der Bereitstellung der Speichergruppe oder Datenbank erzwungen hat. Wenn eine Datenbank nicht beim Start bereitgestellt wird, wird keine Aktion ausgeführt, und die Überwachung meldet den Fehler. Wenn diese Bedingung erkannt wird, generiert der Postfachserver Ereignisse, die von den Überwachungsdiensten gemeldet werden können. Die Überwachung erkennt und meldet außerdem Datenbanken, deren Bereitstellung aufgehoben wurde.

Fehlerhaftes Protokoll für Speichergruppe erkannt

Keine automatische Wiederherstellungsaktion. Die Kopie erhält einen beschädigten Status, und es muss ein erneutes Seeding ausgeführt werden.

Die Überwachung meldet diese Bedingung.

Nicht genügend Speicherplatz auf dem Datenbank- oder Transaktionsprotokolllaufwerk

Keine automatische Wiederherstellungsaktion. Die Bereitstellung der Datenbanken in der Speichergruppe wird aufgehoben.

Der Mangel an freiem Speicherplatz wird durch das Überwachungssystem gemeldet. Der Administrator legt die Korrekturmaßnahme fest.

Der Administrator kann die Konfiguration der Wiederherstellung nach ungeplanten Ausfällen steuern. Weitere Informationen über geplante und ungeplante Ausfälle finden Sie unter Geplante und ungeplante Ausfälle.