Switchovers et basculements

Article
04/04/2023

Les basculements et les basculements sont les deux formes de pannes dans Microsoft Exchange Server :

Un basculement est une panne planifiée d’une base de données ou d’un serveur qui est explicitement lancée par une applet de commande ou par le système de disponibilité managé dans Exchange Server. Les permutations sont généralement effectuées pour préparer une opération de maintenance. Les permutations impliquent le déplacement de la copie de base de données de boîtes aux lettres active vers un autre serveur du groupe de disponibilité de base de données (DAG). Si aucune cible saine n’est trouvée pendant une permutation, les administrateurs reçoivent une erreur et la base de données de boîte aux lettres reste en exécution ou montée.
Un basculement désigne des événements inattendus qui provoquent l’indisponibilité des services, des données ou des deux. Un basculement suppose que la défaillance du système soit automatiquement réparée en activant une copie de base de données de boîtes aux lettres passive pour la convertir en copie active. Si aucune cible saine n'est trouvée pendant un basculement, la base de données de boîte aux lettres est démontée.

Exchange Server est conçu pour gérer les basculements et les basculements.

Souhaitez-vous rechercher des tâches de gestion liées à la haute disponibilité et la résilience de site ? Consultez la rubrique Gestion de la haute disponibilité et de la résilience de site.

Permutations

Il existe trois types de basculement dans Exchange Server :

Permutation de base de données
Permutation de serveur
Permutation de centre de données

Permutation de base de données

Une permutation de base de données est le processus par lequel une base de données active individuelle est permutée vers une autre copie de base de données (copie passive), qui est ensuite définie comme nouvelle copie de base de données active. Les permutations de base de données peuvent se produire dans un centre de données et entre plusieurs centres de données. Un basculement de base de données peut être effectué à l’aide du Centre d’administration Exchange (EAC) ou de l’environnement de ligne de commande Exchange Management Shell. Quelle que soit l'interface utilisée, le processus de permutation est le suivant :

L'administrateur initie une permutation de base de données pour déplacer la copie de base de données de boîtes aux lettres active vers un autre serveur.
Le client utilisé pour la tâche lance un appel de procédure distante au service de réplication Microsoft Exchange sur un membre du DAG.
Si le membre du DAG ne détient pas le rôle de gestionnaire Active Manager principal (PAM), il redirige la tâche vers le rôle PAM.
La tâche émet un appel de procédure distante (RPC) au service de réplication Microsoft Exchange sur le serveur qui détient le rôle PAM.
Le Gestionnaire Active Manager principal lit et met à jour les informations sur l'emplacement de la base de données qui sont stockées dans la base de données du cluster pour le DAG.
Le Gestionnaire Active Manager principal contacte le service de réplication Microsoft Exchange sur le membre du DAG dont la copie passive est activée en tant que nouvelle copie de base de données de boîtes aux lettres active.
Le service de réplication Microsoft Exchange du serveur cible interroge les services de réplication Microsoft Exchange sur tous les autres membres du DAG pour déterminer la source de journal optimale pour la copie de base de données.
La base de données est démontée du serveur actuel et le service de réplication Microsoft Exchange du serveur cible copie les journaux restants vers ce dernier.
Le service de réplication Microsoft Exchange du serveur cible sollicite le montage d'une base de données.
Le service de banque d'informations Microsoft Exchange sur le serveur cible relit les fichiers journaux et monte la base de données.
Tous les codes d'erreur sont renvoyés vers le service de réplication Microsoft Exchange du serveur cible.
Le Gestionnaire Active Manager principal met à jour les informations sur l'état de la copie de base de données dans la base de données du cluster pour le DAG.
Tous les codes d'erreur sont renvoyés par le service de réplication Microsoft Exchange du serveur cible vers le service de réplication Microsoft Exchange du Gestionnaire Active Manager principal.
Le service de réplication Microsoft Exchange du Gestionnaire Active Manager principal renvoie toutes les erreurs vers l'interface d'administration où la tâche a été appelée.
Remote PowerShell renvoie les résultats de l'opération vers l'interface d'administration appelante.

Pour connaître la procédure détaillée d'exécution d'une permutation de base de données, consultez la rubrique Activer une copie de la base de données de boîtes aux lettres.

Permutation de serveur

Une permutation de serveur est le processus par lequel toutes les bases de données actives sur un membre du DAG sont activées sur un ou plusieurs membres du DAG. Comme les basculements de base de données, un basculement de serveur peut se produire à la fois dans un centre de données et entre les centres de données, et il peut être lancé à l’aide du CENTRE d’administration Exchange et d’Exchange Management Shell. Quelle que soit l'interface utilisée, le processus de permutation de serveur est le suivant :

L'administrateur initie la permutation d'un serveur pour déplacer toutes les copies de base de données de boîtes aux lettres actives vers un ou plusieurs autres serveurs.
L'opération est constituée des mêmes étapes que celles décrites plus haut dans cette rubrique pour les permutations de base de données (étapes 2 à 4), pour chacune des bases de données actives sur le serveur actuel.
Le Gestionnaire Active Manager principal lit et met à jour les informations sur l'emplacement de la base de données qui sont stockées dans la base de données du cluster pour le DAG.
Il contacte le service de réplication Microsoft Exchange de chaque membre du DAG sur lequel une copie passive est activée.
Le service de réplication Microsoft Exchange des serveurs cible interroge les services de réplication Microsoft Exchange de tous les autres membres du DAG pour déterminer la source de journal optimale pour la copie de base de données.
La base de données est démontée du serveur actuel et le service de réplication Microsoft Exchange de chaque serveur cible copie les journaux restants.
Le service de réplication Microsoft Exchange de chaque serveur cible sollicite le montage d'une base de données.
Le service de banque d'informations Microsoft Exchange sur chaque serveur cible relit les fichiers journaux et monte la base de données.
Tous les codes d'erreur sont renvoyés vers le service de réplication Microsoft Exchange du serveur cible.
Le Gestionnaire Active Manager principal met à jour les informations sur l'état de la copie de base de données dans la base de données du cluster pour le DAG.
Tous les codes d'erreur sont renvoyés par le service de réplication Microsoft Exchange du serveur cible vers le service de réplication Microsoft Exchange du Gestionnaire Active Manager principal.
Le service de réplication Microsoft Exchange du Gestionnaire Active Manager principal renvoie toutes les erreurs vers l'interface d'administration où la tâche a été appelée.
Remote PowerShell renvoie les résultats de l'opération vers l'interface d'administration appelante.

Pour obtenir des instructions détaillées sur la façon d’effectuer un basculement de serveur, consultez Effectuer un basculement de serveur.

Permutation de centre de données

Dans une configuration de résilience de site, la récupération automatique suite à une défaillance au niveau du site peut se produire dans un DAG, ce qui permet au système de messagerie de conserver un état fonctionnel. Cette configuration nécessite au moins trois emplacements, car elle nécessite le déploiement de membres du DAG dans deux emplacements et le déploiement du serveur témoin du DAG dans un troisième emplacement.

Si vous n’avez pas trois emplacements, ou même si vous en avez trois, mais que vous souhaitez contrôler les actions de récupération au niveau du centre de données, vous pouvez configurer un DAG pour la récupération manuelle en cas de défaillance au niveau du site. Dans ce cas, vous devez exécuter un processus appelé permutation de centre de données. Comme dans de nombreux scénarios de récupération d’urgence, la planification et la préparation préliminaires d’une permutation de centre de données permettent de simplifier le processus de récupération et de réduire la durée de la panne. Pour plus d’informations sur la procédure de basculement d’un centre de données, consultez Basculements de centre de données

Basculements

Le basculement est un processus d’activation automatique qui peut se produire au niveau de la base de données, du serveur ou du centre de données. Les basculements ont lieu suite à la défaillance d'une base de données spécifique (perte de stockage isolé, par exemple), d'un serveur complet (défaut de la carte mère ou coupure de courant, par exemple) ou d'un site complet (perte de tous les membres du DAG d'un site, par exemple).

Les DAG et les copies de base de données de boîte aux lettres offrent une redondance complète et une récupération rapide des données et des services qui fournissent l’accès aux données. Le tableau suivant répertorie les actions de récupération attendues pour diverses défaillances. Certaines défaillances nécessitent que l’administrateur lance la récupération, et d’autres défaillances sont gérées automatiquement par le système.

Description	Activation automatique	Action de réparation automatique	État lors de la réparation : Actif	État lors de la réparation : Passif	Actions de réparation	Comments
Erreur logicielle de la base de données Extensible Storage Engine (ESE) : Les lecteurs de stockage de la base de données renvoient des erreurs lors de certaines opérations de lecture (par exemple, erreur -1018).	Brève interruption possible. Basculement automatique possible.	Correction automatique d'une page incorrecte.	Permutation manuelle, basculement automatique ou réparation en ligne.	Échec	Reconstruction RAID, réparation de la base de données et de la copie de base de données, restauration et exécution de la récupération, puis correction de la page ou correction de la page à partir de la copie.	Il existe d'autres codes d'erreur logicielle de base de données. N'inclut pas les erreurs de bloc du système de fichiers NTFS. Si une opération de basculement ou de permutation est effectuée, le serveur hôte est mis à jour.
Échec de base de données ESE « semi-soft » : les lecteurs stockant la base de données retournent des erreurs sur certaines écritures.	Brève interruption pendant le basculement automatique.	Reconstruction automatique du volume/disque après un éventuel remplacement du lecteur.	Démontée si elle ne peut pas être récupérée.	Failed	La reconstruction RAID peut remédier au problème. Copie et réparation, restauration et exécution de la récupération, ou reconstruction du volume/disque après un éventuel remplacement.	Le terme « erreur d'écriture semi-logicielle ESE » signifie que certaines opérations d'écriture aboutissent. N'inclut pas une erreur de bloc NTFS.
Erreur de journal « semi-logicielle » ESE : Les lecteurs de stockage des données du journal renvoient des erreurs non résolues lors de certaines opérations de lecture ou d'écriture.	Brève interruption pendant le basculement automatique.	Reconstruction automatique du volume/disque après un éventuel remplacement du lecteur.	Démontée si elle ne peut pas être récupérée.	Failed	La reconstruction RAID peut remédier au problème. Copie et réparation, restauration et exécution de la récupération, ou reconstruction du volume/disque après un éventuel remplacement.	Le terme « erreur de lecture/écriture semi-logicielle ESE » signifie que certaines opérations de lecture/écriture aboutissent. En cas d'échec de la base de données, la récupération automatique se produira avant le début du traitement de la récupération des données du journal.
Erreur logicielle ou épuisement des ressources ESE : Erreur d'interruption de l'instance par ESE (par exemple, ID d'événement 1022, profondeur excessive du point de contrôle).	Brève interruption pendant le basculement automatique.	Aucun.	Démontée si elle ne peut pas être récupérée.	Failed	Remédiez au problème de ressource sous-jacent.	Cette erreur peut dissimuler d'autres problèmes.
Erreurs de bloc NTFS : Les lecteurs de stockage de la base de données ou des journaux détectent une erreur de lecture ou d'écriture sur une structure de contrôle NTFS.	Brève interruption pendant le basculement automatique.	Volume reconstruit après remplacement possible du lecteur.	Démontée si elle ne peut pas être récupérée.	Failed	La reconstruction RAID peut remédier au problème. Les utilitaires NTFS peuvent résoudre les problèmes NTFS. Une récupération Exchange peut s'avérer nécessaire.	Cette situation est plus susceptible de se produire lorsque RAID n’est pas utilisé. Si ce scénario a un impact sur le volume de journaux actif, certains fichiers journaux récents sont perdus. N'inclut pas les erreurs automatiquement résolues par NTFS ni sa pile logicielle ou matérielle sous-jacente.
Échec de la base de données ou du lecteur de journal : un lecteur stockant la base de données ou les journaux a échoué et est inaccessible.	Brève interruption pendant le basculement automatique.	Reformatage ou remplacement du lecteur, suivi d'une reconstruction du volume complet.	Démontée si elle ne peut pas être récupérée.	Failed	Remplacement du lecteur suivi d'une éventuelle reconstruction RAID. Remplacement du lecteur suivi d'une reconstruction du volume complet. Reconstruction du volume complet.	Non applicable.
Échec du volume de base de données ou de journal : Le volume échoue en raison d'un problème lié à NTFS ou à un volume de niveau inférieur.	Brève interruption pendant le basculement automatique.	Reformatage ou remplacement du lecteur.	Démontée si elle ne peut pas être récupérée.	Failed	Remplacement du lecteur suivi d'une éventuelle reconstruction RAID. Remplacement du lecteur suivi d'une reconstruction du volume complet. Reconstruction du volume complet.	Non applicable.
Espace du volume de base de données ou de journal insuffisant : L'espace du système de fichiers NTFS, ainsi que des fichiers de base de données ou journaux est saturé.	Basculement automatique si une autre copie ne se trouve pas dans un état similaire.	Aucun.	Démontée.	Failed	Exécution de sauvegardes complètes ou incrémentielles, suppression manuelle des journaux, attente de l'expiration du délai, reprise de la copie de la base de donnés ou réparation de la copie de base de données défaillante.	Non applicable.
L'administrateur démonte la base de données incorrecte.	Si le basculement automatique n'est pas bloqué par l'administrateur, une brève interruption se produira. Si le basculement automatique est évité, une panne se produira jusqu'à ce que la base de données soit montée.	Aucun.	Démontée.	Non applicable	L'administrateur corrige l'erreur.	Non applicable.
L'administrateur suspend la copie de base de données incorrecte.	Selon la configuration et la copie affectée, la récupération automatique peut être évitée.	Aucun.	Non applicable.	Suspendu	L'administrateur corrige l'erreur.	Non applicable.
L'administrateur démonte une base de données pour le stockage, NTFS ou la maintenance du volume.	Si le basculement automatique n'est pas bloqué par l'administrateur, une brève interruption se produira. Si le basculement automatique est bloqué, une panne se produira jusqu'à ce que l'administrateur termine la tâche.	Aucun.	Démontée.	Non applicable	L'administrateur termine la tâche.	Non applicable.
L'administrateur suspend une copie de base de données pour le stockage, NTFS ou la maintenance du volume.	Selon la configuration et la copie affectée, la récupération automatique peut être évitée.	Aucun.	Non applicable.	Suspended	L'administrateur termine les opérations.	Non applicable.
L'administrateur démonte une base de données en vue de sa maintenance hors connexion.	Panne nécessitant une réparation.	Aucun.	Démontée.	Suspended	L'administrateur termine les opérations.	Les copies de base de données actives et passives sont différentes. L'administrateur doit suspendre les copies.
Défaillance du réseau de stockage (SAN), du disque ou du contrôleur de stockage.	Brève interruption pendant le basculement automatique.	Aucun.	Démontée.	N'importe lequel	Réparation du matériel.	Une copie de base de données passive sera à l'état dans lequel elle se trouvait avant la panne du système.
Maintenance du matériel de serveur.	Brève interruption pendant le basculement automatique (sauf en cas de blocage par un administrateur).	Aucun.	Démontée.	N'importe lequel	Achèvement des actions.	Une copie de base de données passive sera à l'état dans lequel elle se trouvait avant l'arrêt du système.
Maintenance du logiciel de serveur.	Brève interruption pendant le basculement automatique (sauf en cas de blocage par un administrateur).	Aucun.	Démontée.	N'importe lequel	Achèvement des actions.	Une copie de base de données passive sera à l'état dans lequel elle se trouvait avant l'arrêt du système.
Le service de banque d'informations Microsoft Exchange est arrêté ou a été interrompu par un administrateur.	Brève interruption pendant le basculement automatique.	Aucun.	Démontée.	N'importe lequel	Redémarrage du service de banque d'informations Microsoft Exchange.	Non applicable.
Échec du service de banque d'informations Microsoft Exchange ; le système d'exploitation fonctionne toujours.	Brève interruption pendant le basculement automatique.	Le Gestionnaire de contrôle des services redémarre le service de banque d'informations Microsoft Exchange.	Démontée.	N'importe lequel	Redémarrage manuel ou automatique du service de banque d'informations Microsoft Exchange.	Une copie de base de données passive sera à l'état dans lequel elle se trouvait avant l'échec du service de banque d'informations Exchange.
Échec partiel du service de banque d'informations Microsoft Exchange ; une partie de la banque Exchange cesse de fonctionner, mais n'est pas identifiée comme entièrement défaillante.	Brève interruption possible pendant le basculement automatique.	Aucun.	Montée et partiellement fonctionnelle.	N'importe lequel, mais peut ne fonctionner que partiellement	Redémarrage du système d'exploitation ou du service de banque d'informations Microsoft Exchange.	Non applicable.
Échec du serveur : Le serveur échoue pour l'une des raisons suivantes : Panne de courant totale Défaillance Échec non résolu du processeur, de la carte mère ou de la carte d'insertion Erreur d'arrêt du système d'exploitation Le système d'exploitation ne répond plus Échec total de la communication	Brève interruption pendant le basculement automatique.	Redémarrage de l'ordinateur.	Démontée.	N'importe lequel	Rétablissement de l'alimentation, modification des paramètres du système d'exploitation, modification des paramètres du matériel, remplacement du matériel, redémarrage du système d'exploitation, réparation du système d'exploitation, réparation du matériel ou résolution des problèmes de communication.	Non applicable.
Le DAG détecte une défaillance du quorum.	Panne nécessitant une réparation.	Aucun.	Démontée.	N'importe lequel	Réparation du quorum défaillant, affectation d'un nouveau quorum ou restauration du réseau responsable de la défaillance du quorum.	Une copie de base de données passive sera à l'état dans lequel elle se trouvait avant la panne du système.
Échec de communication du réseau MAPI : Le serveur n'est plus disponible sur le réseau MAPI.	Brève interruption pendant le basculement automatique ; doit être sans perte.	Aucun. Tentatives de communication répétées.	Démontée.	N'importe lequel	Résolution du problème de communication en remédiant aux problèmes matériels ou logiciels.	Non applicable.
Échec de communication du réseau de réplication : Le serveur ne peut pas recevoir de pulsations, journaliser les copies ni s'amorcer sur le réseau de réplication défaillant.	Brève interruption possible de la copie ou de l'amorçage lorsque la charge de travail est permutée vers un autre réseau.	Aucun. Tentatives de communication répétées.	Aucun.	N'importe lequel	Résolution du problème de communication en remédiant aux problèmes matériels ou logiciels.	Résilience affectée par une défaillance.
Plusieurs échecs de communication réseau : Le serveur ne peut pas recevoir de pulsations, journaliser les copies ni s'amorcer sur plusieurs réseaux.	Brève interruption pendant le basculement automatique ; doit être sans perte.	Aucun. Tentatives de communication répétées.	Démontée.	N'importe lequel	Résolution du problème de communication en remédiant aux problèmes matériels ou logiciels.	Au moins un réseau fonctionne toujours.
Échec partiel d'un ou de plusieurs réseaux : Les réseaux rencontrent un nombre d'erreurs élevé.	Échec non détecté ; aucune action.	Aucun.	Montée, mais problèmes de performances possibles.	N'importe lequel	Résolution du problème de communication en remédiant aux problèmes matériels ou logiciels.	Le réseau rencontre un nombre d'erreurs anormalement élevé.
Blocage du système d'exploitation non détecté : Le système d'exploitation ne répond plus, mais n'est pas détecté par l'analyse ou le clustering.	Aucun.	Aucun.	N'importe lequel.	N'importe lequel	Redémarrage ou arrêt des ressources qui ne répondent pas.	Le blocage n'est pas détecté. Par conséquent, aucune action n'est effectuée. Certaines fonctionnalités peuvent être opérationnelles.
Le lecteur du système d'exploitation détecte une erreur.	Brève interruption pendant le basculement automatique.	Aucun.	Démontée.	N'importe lequel	Remplacement du lecteur et reconstruction du serveur ou du volume via RAID.	Non applicable.
Espace du lecteur de système d'exploitation insuffisant.	Brève interruption pendant le basculement automatique.	Aucun.	Démontée.	N'importe lequel	Libération manuelle d'espace sur le volume.	Non applicable.
Le lecteur contenant les fichiers binaires Exchange détecte une défaillance du volume ou du lecteur.	Brève interruption pendant le basculement automatique.	Aucun.	Démontée.	N'importe lequel	Remplacement du lecteur et réinstallation de l'application ou reconstruction du volume via RAID.	Non applicable.
Espace du lecteur contenant les fichiers binaires Exchange insuffisant.	Brève interruption pendant le basculement automatique.	Aucun.	Démontée.	N'importe lequel	Libération manuelle d'espace sur le volume.	Non applicable.
Nouveau journal non valide détecté : La séquence du journal est entravée par un fichier existant.	Brève interruption pendant le basculement automatique ; problème interprété comme un événement isolé ne concernant pas les autres copies.	Aucun.	Démontée.	Failed	Suppression des journaux gênants après détermination de la source.	Les journaux gênants ne doivent pas être répliqués.
La fonctionnalité de réplication continue détecte un journal non valide : La fonctionnalité de relecture détecte un journal inapproprié pendant la copie ou la relecture.	Non applicable.	Suppression du journal.	Non applicable.	Failed	Suppression du journal non valide ; déplacement du flux de journaux à l'origine du problème.	Non applicable.

Basculement de base de données

Un basculement de base de données se produit lorsqu’une copie de base de données qui était active ne peut plus l’être. Les occurrences suivantes font partie d’un basculement de base de données :

La défaillance de la base de données est détectée par le service de banque d'informations Microsoft Exchange.
Le service de banque d'informations Microsoft Exchange écrit les événements d'erreur d'écriture dans le journal des événements du canal Crimson.
Le Gestionnaire Active Manager sur le serveur qui contient la base de données défaillante détecte les événements d'échec.
Le Gestionnaire Active Manager demande l'état de la copie de base de données aux autres serveurs qui contiennent une copie de la base de données.
Les autres serveurs renvoient l'état de la copie de base de données au Gestionnaire Active Manager.
Le Gestionnaire Active Manager principal initie un déplacement de la base de données active vers un autre serveur du groupe de disponibilité de base de données en utilisant un algorithme de sélection de la meilleure copie.
Le Gestionnaire Active Manager principal met l'emplacement de montage de la base de données à jour dans la base de données du cluster pour refléter le serveur sélectionné.
Le Gestionnaire Active Manager principal envoie une requête au Gestionnaire Active Manager sur le serveur sélectionné afin de devenir maître de la base de données.
Le Gestionnaire Active Manager sur le serveur sélectionné demande au service de réplication Microsoft Exchange d'essayer de copier les derniers journaux du serveur précédent et de définir l'indicateur montable pour la base de données.
Le service de réplication Microsoft Exchange copie les journaux du serveur qui contenait précédemment la copie active de la base de données.
Le Gestionnaire Active Manager lit le nombre maximal de journaux générés dans la base de données du cluster.
Le service de banque d'informations Microsoft Exchange monte la nouvelle copie de base de données active.

Basculement de serveur

Un basculement de serveur se produit lorsque le membre du DAG ne parvient plus à réparer le réseau MAPI, ou lorsque le service de cluster sur un membre du DAG ne peut plus contacter les autres membres du DAG. Les occurrences suivantes font partie d’un basculement de serveur :

Le service de cluster envoie une notification au Gestionnaire Active Manager principal dans l'un des deux cas :
Nœud arrêté : le serveur est accessible, mais ne peut pas participer aux opérations DAG.
Réseau MAPI arrêté : le serveur ne peut pas être contacté sur le réseau MAPI et ne peut donc pas participer aux opérations DAG.
Si le serveur est accessible, le Gestionnaire Active Manager principal contacte Active Manager sur le serveur affecté et demande le démontage immédiat de toutes les bases de données.
Pour chacune des copies de base de données affectées :
Le Gestionnaire Active Manager principal demande l'état de la copie de base de données à tous les serveurs du DAG.
Le Gestionnaire Active Manager principal reçoit une réponse de tous les membres du DAG accessibles et actifs.
Le Gestionnaire Active Manager principal tente de déterminer la source de journal optimale parmi tous les serveurs chargés de répondre en demandant à chacun des répondeurs le numéro de génération de journaux le plus récent.
Chacun des serveurs répond par le numéro de génération de journaux.
Le Gestionnaire Active Manager principal récupère l'état du catalogue d'indexation de recherche actuel dans la base de données du cluster.
Selon le numéro de génération de journaux et l'intégrité du catalogue de chaque copie de base de données, le Gestionnaire Active Manager principal sélectionne les meilleures copies à activer.
Le Gestionnaire Active Manager principal met l'emplacement monté de la base de données à jour dans la base de données du cluster.
Le Gestionnaire Active Manager principal lance le basculement de la base de données en communiquant avec Active Manager sur un ou plusieurs serveurs.
Le Gestionnaire Active Manager sur les serveurs sélectionné demande au service de réplication Microsoft Exchange d'essayer de copier les derniers journaux du serveur précédent et de définir l'indicateur montable.
Lorsque la base de données peut être montée, le Gestionnaire Active Manager sur les serveurs monte les bases de données.

Pour plus d'informations sur le processus de sélection de la meilleure copie par le Gestionnaire Active Manager, consultez la rubrique Active Manager.

Basculements de centres de données

Des modifications importantes ont été apportées depuis Exchange 2010 concernant la configuration de la résilience du site. Avec la simplification de l’espace de noms, la consolidation des rôles serveur, la séparation des services d’accès au client et de la récupération DAG (dans Exchange Server, l’espace de noms n’a pas besoin de se déplacer avec le DAG) et les modifications relatives à l’équilibrage de charge, Exchange Server fournit des options de résilience de site telles que la possibilité d’utiliser un espace de noms global unique. Si vous avez plus de deux emplacements dans lesquels déployer des composants de service de messagerie, Exchange Server permet également de configurer le service de messagerie pour le basculement automatique en réponse aux défaillances nécessitant une intervention manuelle dans les versions précédentes.

Exchange utilise la tolérance de panne intégrée à l’espace de noms par le biais de plusieurs adresses IP, de l’équilibrage de charge et, si nécessaire, de la possibilité de prendre des serveurs en service et hors service. Exchange Server permet d’utiliser la capacité des clients à mettre en cache plusieurs adresses IP retournées par un serveur DNS en réponse à une demande de résolution de noms. Les clients ayant la possibilité de mettre en cache plusieurs adresses IP (qui incluent presque tous les clients http dans Exchange Server, tels qu’Outlook, Outlook Anywhere, EAS, EWS, Outlook sur le web, EAC, RPS, etc.), ont tous la possibilité d’utiliser ces adresses IP multiples, ce qui permet un basculement côté client. Vous pouvez configurer DNS pour traiter plusieurs adresses IP vers un client lors de la résolution de noms. Le client demande mail.contoso.com et retourne deux adresses IP, ou quatre adresses IP, par exemple. Néanmoins, de nombreuses adresses IP reçues par le client seront utilisées de façon fiable par celui-ci. Cela s'avère bénéfique pour le client, car si l'une des adresses IP échoue, il peut se connecter à une ou plusieurs autres. Si un client en essaie une mais qu'elle échoue, il attend environ 20 secondes puis essaie la suivante dans la liste. Par conséquent, si vous perdez la connectivité à votre tableau de services d’accès au client (CAS) principal et que vous disposez d’une deuxième adresse IP publiée pour un deuxième tableau CAS, la récupération pour les clients se produit automatiquement (et dans environ 21 secondes).

Les clients HTTP modernes (systèmes d’exploitation et navigateurs Web qui ont dix ans ou moins) fonctionnent automatiquement avec cette redondance. La pile HTTP peut accepter plusieurs adresses IP pour un nom de domaine complet, et si la première adresse IP qu’elle tente échoue (par exemple, ne peut pas se connecter), elle essaiera l’adresse IP suivante dans la liste. En cas de défaillance logicielle (connexion perdue après l’établissement de la session, en raison d’une défaillance intermittente du service où, par exemple, un appareil supprime des paquets et doit être retiré du service), l’utilisateur peut avoir besoin d’actualiser son navigateur.

Avec la configuration appropriée, le basculement peut se produire au niveau du client et les clients sont automatiquement redirigés vers un deuxième centre de données où s’exécutent les services d’accès au client, et les serveurs qui exécutent les services d’accès au client remettent en proxy la communication vers le serveur de boîtes aux lettres de l’utilisateur, qui n’est pas affecté par la panne (car vous n’effectuez pas de basculement). Au lieu de travailler à la récupération du service, le service récupère lui-même et vous pouvez vous concentrer sur la résolution du problème principal (par exemple, le remplacement d’un équilibreur de charge défaillant).

Comme vous pouvez faire basculer l'espace de noms entre des centres de données, tout ce dont vous avez besoin pour réaliser un basculement du centre de données, c'est d'un mécanisme de basculement du rôle de boîtes aux lettres entre centres de données. Pour bénéficier d'un basculement automatique pour le DAG, vous concevez simplement une solution dans laquelle le DAG est uniformément réparti entre deux centres de données, puis placez le serveur témoin dans un troisième emplacement afin qu'il puisse être arbitré par des membres du DAG dans chaque centre de données, quel que soit l'état du réseau entre les centres de données contenant les membres du DAG. L'essentiel est que le troisième emplacement soit isolé des défaillances réseau susceptibles de se produire dans les emplacements contenant les membres du DAG.

Si vous n'avez que deux centres de données et que vous souhaitez pouvoir configurer un basculement automatique, vous pouvez utiliser Microsoft Azure comme troisième emplacement. Vous devez créer un réseau virtuel Azure et le connecter à vos deux centres de données à l'aide d'un VPN multi-points. Vous pourrez ensuite placer votre serveur témoin sur une machine virtuelle Microsoft Azure. Pour plus d'informations, voir Utilisation d'une machine virtuelle Microsoft Azure comme serveur témoin du groupe de disponibilité de base de données (DAG).