Surveillance de la réplication continue

 

S’applique à : Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1

Dernière rubrique modifiée : 2007-08-22

Microsoft Exchange Server 2007 Service Pack 1 (SP1) introduit des fonctionnalités nouvelles et améliorées pour la surveillance des environnements de réplication continue. Ces modifications apportent une amélioration pour la création de rapports de cluster par rapport à la version de publication (RTM) de Microsoft Exchange Server 2007 et incluent des fonctionnalités supplémentaires conçues pour une surveillance proactive des environnements de réplication continue. Pus particulièrement, Exchange 2007 SP1 apporte des améliorations à la cmdlet Get-StorageGroupCopyStatus, ajoute une cmdlet nommée Test-ReplicationHealth et améliore la visibilité de la fenêtre de perte couverte par le conteneur de dépôt de transport. Outre l'utilisation de ces cmdlets pour surveiller le fonctionnement de la réplication continue, vous pouvez utiliser plusieurs compteurs de performance publiés par le service de réplication Microsoft Exchange.

Améliorations apportées à la cmdlet Get-StorageGroupCopyStatus dans SP1

Dans Exchange 2007 RTM, il y a plusieurs situations où l'état rapporté par la cmdlet Get-StorageGroupCopyStatus et les compteurs de performance de réplication continue est inexact ou trompeur :

  • Un groupe de stockage inactif (c'est-à-dire qui ne change pas) peut signaler erronément un état sain. Cette situation se produit si la condition malsaine ne peut pas être détectée sans relecture du journal.

  • Durant l'initialisation de la réplication, l'état de la réplication est évalué et peut être imprécis. Une fois l'initialisation terminée, l'état est mis à jour.

  • La valeur du champ LastLogGenerated peut être erronée en cas de démontage de la base de données dans la groupe de stockage.

  • S'il manque un ou plusieurs fichiers journaux au milieu d'une séquence d'un flux de journal, la tentative de récupération par la copie passive se poursuit, ce qui a pour effet de faire basculer l'état de réplication entre les états d'échec et sain. Lorsque cela se produit, les files d'attente de relecture et de copie continuent à s'allonger.

  • Dans quelques rares situations, il est possible de vérifier un journal avec succès même s'il est impossible de le relire. Dans ce cas, pendant la tentative de récupération, le système bascule entre les états d'échec et sain. Lorsque cela se produit, les files d'attente de relecture et de copie continuent à s'allonger.

Exchange 2007 RTM utilise la base de données de cluster et le registre pour la communication entre le service de réplication Microsoft Exchange et les tâches de gestion d'Exchange, ce qui constitue un processus asynchrone. Le processus étant asynchrone, il peut aboutir à un état non fiable décrit précédemment.

Dans Exchange 2007 SP1, les problèmes précédents ont été résolus par une nouvelle conception du mécanisme sous-jacent utilisé pour la communication entre le service de réplication Microsoft Exchange et les tâches de gestion d'Exchange. Au lieu d'utiliser le service de cluster ou le registre, les tâches de gestion communiquent désormais directement avec le service de réplication Microsoft Exchange via des appels de procédure distante (RPC).

En outre, la cmdlet Get-StorageGroupCopyStatus a été améliorée par l'ajout de nouvelles informations d'état :

  • La cmdlet Get-StorageGroupCopyStatus rapport un état SummaryCopyStatus de ServiceDown lorsque le service de réplication Microsoft Exchange sur l'ordinateur cible n'est pas accessible sur le réseau.

  • La cmdlet Get-StorageGroupCopyStatus rapporte un état SummaryCopyStatus de Initializing lorsque le service de réplication Microsoft Exchange sur l'ordinateur cible n'a pas achevé ses vérifications initiales au démarrage. Un nouveau compteur de performance a également été créé pour représenter cet état comme une valeur booléenne.

  • La cmdlet Get-StorageGroupCopyStatus rapporte un état SummaryCopyStatus de Synchronizing lorsqu'elle n'a pas achevé un réamorçage incrémentiel.

Les nouveaux états pour la valeur SummaryCopyStatus ne sont visibles que si vous utilisez la version Exchange 2007 SP1 des outils de gestion Exchange. Si vous utilisez la version Exchange 2007 RTM des outils de gestion Exchange, l'état rapporté pour chacun des états précédents est Failed.

Cmdlet Test-ReplicationHealth

Exchange 2007 SP1 introduit une nouvelle cmdlet nommée Test-ReplicationHealth. Cette cmdlet est conçue pour exercer une surveillance proactive de la réplication continue et du pipeline de réplication continue. La cmdlet Test-ReplicationHealth est conçue pour s'exécuter localement sur un serveur de boîtes aux lettres pour vérifier l'état de la réplication dans un environnement de réplication continue locale (LCR), de réplication continue en cluster (CCR) et de réplication continue de secours (SCR). La cmdlet Test-ReplicationHealth est également conçue pour être étroitement intégrée avec le pack d'administration de Microsoft Operations Manager (MOM) pour fournir des informations simples et précises détaillant l'intégrité de la réplication continue pour le serveur de boîtes aux lettres. Les vérifications sont effectuées par ordre de gravité ; les tests les plus critiques sont effectués en premier lieu. Si l'une des vérifications échoue, les vérifications moins critiques sont supposées échouer également ou ne pas être pertinentes.

La cmdlet Test-ReplicationHealth vérifie tous les aspects de la réplication, des services de cluster et l'état de réplication et de relecture du groupe de stockage pour donner une vue d'ensemble complète du système de réplication. Plus particulièrement, en cas d'exécution sur un noeud du cluster, la cmdlet Test-ReplicationHealth effectue les tests décrits dans le tableau suivant.

Tests effectués par la cmdlet Test-ReplicationHealth

Test Description

État de noeud passif (PassiveNodeUp)

Vérifie que le noeud passif a un état Up en cas d'utilisation dans un environnement de CCR.

État de réseau en cluster (ClusterNetwork)

Vérifie que tous les réseaux gérés par des clusters trouvés sur le noeud local sont en cours d'exécution.

État de groupe quorum (QuorumGroup)

Vérifie que le groupe de clusters contenant la ressource quorum est sain.

État de quorum de partages de fichiers (FileShareQuorum)

Vérifie que la valeur de FileSharePath utilisée par le quorum jeu de noeud majoritaire avec témoin de partage de fichiers est accessible.

État de groupe de serveurs de boîtes aux lettres en cluster (CmsGroup)

Vérifie que le serveur de boîtes aux lettres en cluster est sain en contrôlant que toutes les ressources d'un groupe sont connectées.

État de noeud (NodePaused)

Vérifie qu'aucun des noeuds du cluster n'est en état de pause.

État d'enregistrement DNS (DnsRegistrationStatus)

Vérifie que toutes les interfaces réseau gérées par des clusters pour lesquelles l'option Exiger la réussite de l'enregistrement DNS est définie ont fait l'objet d'un enregistrement DNS (Domain Name System) réussi.

État du service de réplication (ReplayService)

Vérifie que le service de réplication Microsoft Exchange sur le noeud local est sain.

Bases de données montées après basculement (DBMountedFailover)

Vérifie si des bases de données sont démontées ou en échec après un basculement. Ce test vérifie uniquement l'existence de bases de données en échec à la suite d'un basculement.

Copie de groupe de stockage suspendue (SGCopySuspended)

Vérifie si la réplication continue a été suspendue pour un groupe de stockage sur le serveur de boîtes aux lettres en cluster.

Échec de copie de groupe de stockage (SGCopyFailed)

Vérifie s'il existe des copies de groupe de stockage dont l'état est Failed.

Groupe de stockage en cours d'initialisation (SGInitializing)

Vérifie si des groupes de stockage sont dans l'état Initializing.

Longueur de file d'attente de copie de groupe de stockage (SGCopyQueueLength)

Vérifie s'il y a un groupe de stockage dont la longueur de file d'attente de copie de réplication est supérieure aux seuils définis par les meilleures pratiques. Actuellement, ces seuils sont les suivants :

  • Avertissement   La longueur de la file d'attente est comprise entre 3 et 5 fichiers journaux.

  • Échec   La longueur de la file d'attente est égale ou supérieure à 6 fichiers journaux.

Longueur de file d'attente de relecture du groupe de stockage (SGReplayQueueLength)

Vérifie s'il y a un groupe de stockage dont la longueur de file d'attente de relecture de réplication est supérieure aux seuils définis par les meilleures pratiques. Actuellement, ces seuils sont les suivants :

  • Avertissement   La longueur de la file d'attente est comprise entre 30 et 59 fichiers journaux.

  • Échec   La longueur de la file d'attente est égale ou supérieure à 60 fichiers journaux.

Contexte de surveillance pour Test-ReplicationHealth

La cmdlet Test-ReplicationHealth inclut un paramètre nommé MonitoringContext, que vous pouvez utiliser pour inclure la surveillance d'événements et de compteurs de performance dans les résultats de la tâche. Ce paramètre est utilisé par le pack d'administration pour MOM. Les valeurs possibles pour ce paramètre sont $true ou $false. Si vous spécifiez $true, les résultats incluent la surveillance des événements et des compteurs de performance en plus des informations sur les services.

Si le contexte de surveillance est spécifié, seules les vérifications suivantes sont effectuées sur un noeud actif :

  • PassiveNodeUp

  • ClusterNetwork

  • QuorumGroup

  • FileShareQuorum

  • CmsGroup

  • NodePaused

  • DnsRegistrationStatus

  • ReplayService

  • DBMountedFailover

Si le contexte de surveillance est spécifié, seules les vérifications suivantes sont effectuées sur un noeud passif :

  • ClusterNetwork

  • DnsRegistrationStatus

  • ReplayService

  • SGCopySuspended

  • SGCopyFailed

  • SGInitializing

  • SGCopyQueueLength

  • SGReplayQueueLength

Compteurs de performance publiés par le service de réplication Microsoft Exchange

Le service de réplication Microsoft Exchange fournit des compteurs de performance permettant de surveiller l'intégrité de la réplication dans une LCR et une CCR. Il est recommandé de collecter et d'évaluer les compteurs présentés plus loin dans cette rubrique pour surveiller et dépanner les problèmes liés aux performances.

Compteurs de performance du service de réplication Microsoft Exchange recommandés

Le service de réplication Microsoft Exchange crée une instance des compteurs dans la tableau suivant pour chaque copie du groupe de stockage. Cela vous permet de surveiller indépendamment l'intégrité et la performance de chaque groupe de stockage. Vous pouvez surveiller l'intégrité et l'état de chaque groupe de stockage en surveillant les compteurs ReplayQueueLength et CopyQueueLength sous l'objet de performance MSExchange Replication.

Notes

Comme mentionné précédemment, la cmdlet Get-StorageGroupCopyStatus affiche également les valeurs de ces compteurs.

Nom du compteur Description du compteur

La file d'attente de copie dépasse le seuil de montage (CCR uniquement)

Indique si la longueur de file d'attente de copie est supérieure au seuil spécifié par la tonalité de montage automatique de base de données. Dans un environnement de CCR, la valeur de ce compteur est 1 en cas de dépassement du seuil de tonalité de montage automatique de base de données. La valeur est toujours 0 dans un environnement de LCR.

CopyGenerationNumber

Indique le numéro séquentiel de génération du dernier fichier journal copié.

CopyNotificationGenerationNumber

Indique le numéro séquentiel de génération du dernier fichier journal connu du service de réplication Microsoft Exchange.

CopyQueueLength

Indique le nombre de fichiers journaux en attente de copie et d'inspection.

Échec

La valeur 1 indique que la réplication continue est dans l'état Failed pour l'instance sélectionnée (groupe de stockage). La valeur 0 indique que la réplication continue n'est pas dans l'état Failed.

Initialisation en cours

La valeur 1 indique que la réplication continue est dans l'état Initializing pour l'instance sélectionnée (groupe de stockage). Cet état indique que la copie de groupe de stockage effectue des vérifications initiales au démarrage ou que le service de réplication Microsoft Exchange effectue un réamorçage incrémentiel. La valeur 0 indique que la réplication continue n'est pas dans l'état Initializing.

InspectorGenerationNumber

Indique le numéro séquentiel de génération du dernier fichier journal inspecté.

ReplayBatchSize

Indique le nombre de fichiers journaux qui ont été relus ensemble.

ReplayGenerationNumber

Indique le numéro séquentiel de génération du dernier fichier journal relu avec succès.

ReplayGenerationsComplete

Indique le nombre de fichiers journaux relus dans le lot en cours.

ReplayGenerationsPerMinute

Indique le taux de relecture (exprimé en générations de journal par minute) pour le lot en cours.

ReplayGenerationsRemaining

Indique le nombre de générations de journal restant à relire dans le lot en cours.

ReplayNotificationGenerationNumber

Indique le numéro séquentiel de génération du dernier fichier journal connu du service de réplication Microsoft Exchange.

ReplayQueueLength

Indique le nombre de fichiers journaux en attente de relecture.

Suspendu

La valeur 1 indique qu'une activité de réplication continue a été suspendue. Une suspension signifie que les fichiers journaux ne sont pas copiés ni relus dans la copie passive.

TruncatedGenerationNumber

Indique le numéro séquentiel de génération du dernier fichier journal tronqué par le service de réplication Microsoft Exchange.

Outre les compteurs répertoriés dans le tableau précédent, un compteur supplémentaire nommé % d'amorçage terminé est publié dans l'objet de performance Amorçage de réplica MSExchange. Ce compteur indique le pourcentage d'amorçage terminé. Sa valeur est comprise entre 0 et 100 pour cent et publiée uniquement pour les groupes de stockage en cours d'amorçage.