Konfigurieren einer flexiblen Richtlinie für ein automatischen Failover für eine Always On-Verfügbarkeitsgruppe

Gilt für:SQL Server – nur Windows

In diesem Thema wird beschrieben, wie die flexible Failoverrichtlinie für eine Always On-Verfügbarkeitsgruppe mithilfe von Transact-SQL oder PowerShell in SQL Server konfiguriert wird. Eine flexible Failoverrichtlinie ermöglicht eine präzise Kontrolle über die Bedingungen, die ein automatisches Failover für eine Verfügbarkeitsgruppe verursachen. Durch eine Änderung der Fehlerbedingungen, die ein automatisches Failover und die Häufigkeit von Integritätsprüfungen auslösen, können Sie die Wahrscheinlichkeit für ein automatisches Failover erhöhen oder verringern, um das SLA für Hochverfügbarkeit zu unterstützen.

Die flexible Failoverrichtlinie für eine Verfügbarkeitsgruppe wird durch die Fehlerbedingungsebene und einen Schwellenwert für das Integritätsprüfungstimeout definiert. Sobald erkannt wird, dass eine Verfügbarkeitsgruppe ihre Fehlerbedingungsebene oder ihren Schwellenwert für das Integritätsprüfungstimeout überschritten hat, meldet die Ressourcen-DLL der Verfügbarkeitsgruppe dies dem WSFC-Cluster (Windows Server Failover Clustering). Der WSFC-Cluster initiiert dann ein automatisches Failover zum sekundären Replikat.

Hinweis

Die flexible Failoverrichtlinie für eine Verfügbarkeitsgruppe kann nicht mit SQL Server Management Studiokonfiguriert werden.

Einschränkungen beim automatischen Failover

  • Damit ein automatisches Failover ausgeführt werden kann, müssen das aktuelle primäre Replikat und ein sekundäres Replikat für den Verfügbarkeitsmodus für synchrone Commits und automatischem Failover konfiguriert und das sekundäre Replikat mit dem primären Replikat synchronisiert sein.

  • In SQL Server 2019 (15.x) wird die maximale Anzahl der synchronen Replikate von ehemals 3 in SQL Server 2017 (14.x) auf 5 erhöht. Sie können diese Gruppe aus fünf Replikaten für das automatische Failover in der Gruppe konfigurieren. Es gibt ein primäres Replikat sowie vier synchrone sekundäre Replikate.

  • Wenn eine Verfügbarkeitsgruppe den Schwellenwert für WSFC-Fehler überschreitet, versucht der WSFC-Cluster nicht, ein automatisches Failover für die Verfügbarkeitsgruppe auszuführen. Außerdem verbleibt die WSFC-Ressourcengruppe der Verfügbarkeitsgruppe so lange in einem fehlerhaften Zustand, bis der Clusteradministrator die fehlerhafte Gruppe manuell online schaltet oder bis der Datenbankadministrator ein manuelles Failover der Verfügbarkeitsgruppe ausführt. Der WSFC-Fehlerschwellenwert ist als maximale Anzahl von Fehlern definiert, die während eines bestimmten Zeitraums für die Verfügbarkeitsgruppe unterstützt werden. Der Standardzeitraum beträgt sechs Stunden, und der Standardwert für die maximale Anzahl von Fehlern während dieses Zeitraums entspricht n-1, wobei n für die Anzahl der WSFC-Knoten steht. Um den Fehlerschwellenwert für eine angegebene Verfügbarkeitsgruppe zu ändern, verwenden Sie die WSFC Failover Manager Console.

Voraussetzungen

  • Sie müssen mit der Serverinstanz verbunden sein, die das primäre Replikat hostet.

Berechtigungen

Aufgabe Berechtigungen
Konfigurieren der flexiblen Failoverrichtlinie für eine neue Verfügbarkeitsgruppe Erfordert die Mitgliedschaft in der festen Serverrolle sysadmin und die CREATE AVAILABILITY GROUP-Serverberechtigung, ALTER ANY AVAILABILITY GROUP-Berechtigung oder CONTROL SERVER-Berechtigung.
Ändern der Richtlinie einer vorhandenen Verfügbarkeitsgruppe Erfordert die ALTER AVAILABILITY GROUP-Berechtigung für die Verfügbarkeitsgruppe, die CONTROL AVAILABILITY GROUP-Berechtigung, die ALTER ANY AVAILABILITY GROUP-Berechtigung oder die CONTROL SERVER-Berechtigung.

Schwellenwert für das Integritätsprüfungstimeout

Die WSFC-Ressourcen-DLL der Verfügbarkeitsgruppe führt eine Integritätsprüfung am primären Replikat aus, indem sie die gespeicherte Prozedur sp_server_diagnostics auf der SQL Server-Instanz aufruft, die das primäre Replikat hostet. sp_server_diagnostics gibt Ergebnisse in einem Intervall zurück, das 1/3 des Schwellenwerts für das Integritätsprüfungstimeout für die Verfügbarkeitsgruppe entspricht. Der Standardschwellenwert für das Integritätsprüfungstimeout ist 30 Sekunden, und dies bedeutet, dass sp_server_diagnostics in einem Intervall von 10 Sekunden Ergebnisse zurückgibt. Wenn sp_server_diagnostics langsam ist oder keine Informationen zurückgibt, wartet die Ressourcen-DLL das gesamte Intervall des durch den Schwellenwert definierten Integritätsprüfungstimeouts ab, bevor festgestellt wird, dass das primäre Replikat nicht reagiert. Wenn das primäre Replikat nicht reagiert, wird ein automatisches Failover initiiert, sofern dies aktuell unterstützt wird.

Wichtig

sp_server_diagnostics führt keine Integritätsprüfungen auf Datenbankebene aus.

Fehlerbedingungsebene

Ob die Diagnosedaten und Zustandsinformationen, die von sp_server_diagnostics zurückgegeben wurden, ein automatisches Failover garantieren, hängt von der Fehlerbedingungsebene der Verfügbarkeitsgruppe ab. Die Fehlerbedingungsebene gibt an, welche Fehlerbedingungen ein automatisches Failover auslösen. Es gibt fünf Fehlerbedingungsebenen, die von der Ebene mit den wenigsten Einschränkungen (Ebene 1) bis zur Ebene mit den meisten Einschränkungen (Ebene 5) reichen. Jede Bedingungsebene umfasst stets auch die weniger restriktiven Ebenen. Daher schließt die strengste Ebene 5 die vier Bedingungsebenen mit weniger Einschränkungen ein usw.

Wichtig

Beschädigte und fehlerverdächtige Datenbanken werden von keiner Fehlerbedingungsebene erkannt. Deshalb werden automatische Failover niemals von Datenbanken ausgelöst, die beschädigt oder fehlerverdächtig sind (entweder aufgrund von Hardwarefehlern, Datenkorruption oder anderen Fehlern).

In der folgenden Tabelle wird die Fehlerbedingung beschrieben, die der jeweiligen Ebene entspricht.

Ebene Fehlerbedingung Transact-SQL-Wert PowerShell-Wert
Eine der Server ausfällt. Gibt an, dass ein automatisches Failover in den folgenden Fällen initiiert wird:

Der SQL Server -Dienst ist ausgefallen.

Das Leasing der Verfügbarkeitsgruppe für die Verbindung mit dem WSFC-Cluster läuft ab, da keine ACK-Meldung von der Serverinstanz empfangen wird. Weitere Informationen finden Sie unter How It Works: SQL Server Always On Lease Timeout (Funktionsweise: SQL Server Always On-Leasetimeout).



Dies ist die am wenigsten restriktive Ebene.
1 OnServerDown
Zwei der Server nicht reagiert. Gibt an, dass ein automatisches Failover in den folgenden Fällen initiiert wird:

Die Instanz von SQL Server stellt keine Verbindung mit dem Cluster her, und der vom Benutzer angegebene Schwellenwert für das Integritätsprüfungstimeout der Verfügbarkeitsgruppe wurde überschritten.

Das Verfügbarkeitsreplikat weist einen fehlerhaften Status auf.
2 OnServerUnresponsive
drei ein kritischer Serverfehler auftritt. Gibt an, dass bei kritischen internen SQL Server-Fehlern (etwa bei verwaisten Spinlocks, ernsten Schreibzugriffsverletzungen oder zu vielen Speicherabbilder in zu kurzer Zeit) ein automatisches Failover initiiert wird.

Dies ist der Standardebene.
3 OnCriticalServerError
4 (vier) ein mittelschwerer Serverfehler auftritt. Gibt an, dass ein automatisches Failover bei mittelschweren internen SQL Server -Fehlern initiiert wird, z. B. bei dauerhaft unzureichendem Arbeitsspeicher im internen SQL Server -Ressourcenpool. 4 OnModerateServerError
5 (fünf) eine qualifizierte Fehlerbedingung auftritt. Gibt an, dass ein automatisches Failover bei sämtlichen qualifizierten Fehlerbedingungen initiiert wird, einschließlich:

Erkennung eines Deadlocks des Schedulers

Erkennung eines unlösbaren Deadlocks.



Dies ist die restriktivste Ebene.
5 OnAnyQualifiedFailureConditions

Hinweis

Das Fehlen einer Reaktion auf Clientanforderungen durch eine SQL Server -Instanz ist für Verfügbarkeitsgruppen nicht relevant.

Verwenden von Transact-SQL

So konfigurieren Sie die flexible Failoverrichtlinie

  1. Stellen Sie eine Verbindung mit der Serverinstanz her, die das primäre Replikat hostet.

  2. Für eine neue Verfügbarkeitsgruppe verwenden Sie die Transact-SQL-Anweisung CREATE AVAILABILITY GROUP. Verwenden Sie zum Ändern einer vorhandenen Verfügbarkeitsgruppe die Transact-SQL-Anweisung ALTER AVAILABILITY GROUP.

    • Um die Failover-Bedingungsebene festzulegen, verwenden Sie die Option FAILURE_CONDITION_LEVEL = n , wobei n für eine ganze Zahl zwischen 1 und 5 steht.

      Beispielsweise wird mit der folgenden Transact-SQL-Anweisung die Fehlerbedingungsebene der vorhandenen Verfügbarkeitsgruppe AG1 in Ebene 1 geändert:

      
      ALTER AVAILABILITY GROUP AG1 SET (FAILURE_CONDITION_LEVEL = 1);  
      

      Diese ganzzahligen Werte stehen in folgender Beziehung zu den Fehlerbedingungsebenen:

      Transact-SQL-Wert Ebene Automatisches Failover wird initiiert, wenn...
      1 Eine der Server ausfällt. Der SQL Server-Dienst wird aufgrund eines Failovers oder Neustarts beendet.
      2 Zwei der Server nicht reagiert. Der Wert der Bedingungsebene wird unterschritten, der SQL Server-Dienst ist mit dem Cluster verbunden, und der Schwellenwert für das Timeout der Integritätsprüfung wird überschritten, oder das aktuelle primäre Replikat weist einen fehlerhaften Status auf.
      3 drei ein kritischer Serverfehler auftritt. Der Wert der Bedingungsebene wird unterschritten, oder es tritt ein interner kritischer Serverfehler auf.

      Dies ist der Standardebene.
      4 4 (vier) ein mittelschwerer Serverfehler auftritt. Der Wert der Bedingungsebene wird unterschritten, oder es tritt ein mittelschwerer Serverfehler auf.
      5 5 (fünf) eine qualifizierte Fehlerbedingung auftritt. Der Wert der Bedingungsebene wird unterschritten, oder es tritt eine qualifizierte Fehlerbedingung auf.

      Weitere Informationen zu den Failover-Bedingungsebenen finden Sie unter Flexible Failoverrichtlinie für automatisches Failover einer Verfügbarkeitsgruppe (SQL Server).

    • Um den Schwellenwert für das Timeout der Integritätsprüfung zu konfigurieren, verwenden Sie die Option HEALTH_CHECK_TIMEOUT = n , wobei n für eine ganze Zahl zwischen 15000 Millisekunden (15 Sekunden) und 4294967295 Millisekunden steht. Der Standardwert ist 30.000 Millisekunden (oder 30 Sekunden).

      Mit der folgenden Transact-SQL-Anweisung wird z. B. der Schwellenwert für das Timeout der Integritätsprüfung einer vorhandenen Verfügbarkeitsgruppe mit dem Namen AG1 in 60.000 Millisekunden (eine Minute) geändert.

      
      ALTER AVAILABILITY GROUP AG1 SET (HEALTH_CHECK_TIMEOUT = 60000);  
      

PowerShell

So konfigurieren Sie die flexible Failoverrichtlinie

  1. Legen Sie mit (cd) die Serverinstanz als Standard fest, die das primäre Replikat hostet.

  2. Verwenden Sie beim Hinzufügen eines Verfügbarkeitsreplikats zu einer Verfügbarkeitsgruppe das Cmdlet New-SqlAvailabilityGroup . Verwenden Sie beim Ändern eines vorhandenen Verfügbarkeitsreplikats das Cmdlet Set-SqlAvailabilityGroup.

    • Um die Failover-Bedingungsebene festzulegen, verwenden Sie den FailureConditionLevellevel-Parameter, wobei level für einen der folgenden Werte steht:

      Wert Ebene Automatisches Failover wird initiiert, wenn...
      OnServerDown Eine der Server ausfällt. Der SQL Server-Dienst wird aufgrund eines Failovers oder Neustarts beendet.
      OnServerUnresponsive Zwei der Server nicht reagiert. Der Wert der Bedingungsebene wird unterschritten, der SQL Server-Dienst ist mit dem Cluster verbunden, und der Schwellenwert für das Timeout der Integritätsprüfung wird überschritten, oder das aktuelle primäre Replikat weist einen fehlerhaften Status auf.
      OnCriticalServerError drei ein kritischer Serverfehler auftritt. Der Wert der Bedingungsebene wird unterschritten, oder es tritt ein interner kritischer Serverfehler auf.

      Dies ist der Standardebene.
      OnModerateServerError 4 (vier) ein mittelschwerer Serverfehler auftritt. Der Wert der Bedingungsebene wird unterschritten, oder es tritt ein mittelschwerer Serverfehler auf.
      OnAnyQualifiedFailureConditions 5 (fünf) eine qualifizierte Fehlerbedingung auftritt. Der Wert der Bedingungsebene wird unterschritten, oder es tritt eine qualifizierte Fehlerbedingung auf.

      Weitere Informationen zu den Failover-Bedingungsebenen finden Sie unter Flexible Failoverrichtlinie für automatisches Failover einer Verfügbarkeitsgruppe (SQL Server).

      Beispielsweise wird mit dem folgenden Befehl die Fehlerbedingungsebene der vorhandenen Verfügbarkeitsgruppe AG1in Ebene 1 geändert.

      Set-SqlAvailabilityGroup `   
      -Path SQLSERVER:\Sql\PrimaryServer\InstanceName\AvailabilityGroups\MyAg `   
      -FailureConditionLevel OnServerDown  
      
    • Um den Schwellenwert für das Timeout der Integritätsprüfung festzulegen, verwenden Sie den HealthCheckTimeoutn -Parameter, wobei n für eine ganze Zahl zwischen 15000 Millisekunden (15 Sekunden) und 4294967295 Millisekunden steht. Der Standardwert ist 30000 Millisekunden (oder 30 Sekunden).

      Mit dem folgenden Befehl wird z. B. der Schwellenwert für das Timeout der Integritätsprüfung der vorhandenen Verfügbarkeitsgruppe AG1in 120.000 Millisekunden (zwei Minuten) geändert.

      Set-SqlAvailabilityGroup `   
      -Path SQLSERVER:\Sql\PrimaryServer\InstanceName\AvailabilityGroups\MyAG `   
      -HealthCheckTimeout 120000  
      

Hinweis

Um die Syntax eines Cmdlets anzuzeigen, verwenden Sie das Get-Help -Cmdlet in der SQL Server PowerShell-Umgebung. Weitere Informationen finden Sie unter Get Help SQL Server PowerShell.

Einrichten und Verwenden des SQL Server PowerShell-Anbieters

Related Tasks

To configure automatic failover

Verwandte Inhalte

Weitere Informationen

Übersicht über Always On-Verfügbarkeitsgruppen (SQL Server)
Verfügbarkeitsmodi (Always On-Verfügbarkeitsgruppen)
Failover und Failovermodi (Always On-Verfügbarkeitsgruppen)
Windows Server-Failoverclustering (WSFC), mit SQL Server
Failover Policy for Failover Cluster Instances
sp_server_diagnostics (Transact-SQL)