Supervisión de la replicación continua

 

Se aplica a: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1

Última modificación del tema: 2007-08-22

Microsoft Exchange Server 2007 Service Pack 1 (SP1) introduce funciones nuevas y mejoradas para la supervisión de entornos de replicación continua. Estos cambios aportan mejoras respecto a las características de informes de clúster en la versión RTM de Microsoft Exchange Server 2007 e incluyen funcionalidad adicional diseñada para la supervisión proactiva de entornos de replicación continua. En concreto, Exchange 2007 SP1 introduce mejoras al cmdlet Get-StorageGroupCopyStatus, agrega un nuevo cmdlet llamado Test-ReplicationHealth y proporciona mayor visibilidad para el intervalo de pérdida cubierto por el contenedor de transporte. Además de usar estos cmdlets para supervisar el estado de la replicación continua, también puede usar varios contadores de rendimiento publicados por el servicio de replicación de Microsoft Exchange.

Mejoras del cmdlet Get-StorageGroupCopyStatus en SP1

En Exchange 2007 RTM, existen diversas condiciones en las que el estado notificado por Get-StorageGroupCopyStatus y los contadores de rendimiento de replicación continua son imprecisos o confusos:

  • Un grupo de almacenamiento no activo (por ejemplo, que no cambia) puede notificar que está en buen estado, aunque esto no sea correcto. Esta situación se produce porque no se puede detectar que no está en buenas condiciones hasta que se vuelva a reproducir un registro.

  • Durante la inicialización de la replicación, se está evaluando el estado de replicación y es posible que no sea preciso. Cuando se complete la inicialización, se actualizará el estado.

  • El valor del campo LastLogGenerated puede ser incorrecto cuando se desmonta la base de datos del grupo de almacenamiento.

  • Cuando faltan uno o varios archivos de registro en medio de una secuencia de registros, la copia pasiva sigue intentando recuperarlos, lo que hace que el estado de replicación alterne entre con error y sin error. Cuando sucede esto, las colas de copia y reproducción siguen creciendo.

  • En raras ocasiones puede que se compruebe un registro correctamente, pero que aun así no se pueda reproducir. En esta situación, el sistema alternará entre estados con error y sin error mientras intenta recuperarlo. Cuando sucede esto, las colas de copia y reproducción siguen creciendo.

Exchange 2007 RTM usa la base de datos de clúster y el registro para la comunicación entre el servicio de replicación de Microsoft Exchange y las tareas de administración de Exchange, lo que constituye un proceso asincrónico. Puesto que el proceso es asincrónico, puede dar lugar al estado no confiable descrito anteriormente.

En Exchange 2007 SP1, los problemas anteriores se han resuelto gracias a un cambio del diseño del mecanismo subyacente que se usa para la comunicación entre el servicio de replicación de Microsoft Exchange y las tareas de administración de Exchange. En lugar de usar el servicio de clúster o el registro, ahora las tareas de administración se comunican directamente con el servicio de replicación de Microsoft Exchange mediante llamadas a procedimientos remotos (RPC).

Además, el cmdlet Get-StorageGroupCopyStatus se ha mejorado con la adición de nueva información de estado:

  • El cmdlet Get-StorageGroupCopyStatus notifica ServiceDown como SummaryCopyStatus cuando el servicio de replicación de Microsoft Exchange en el equipo de destino no está accesible en la red.

  • El cmdlet Get-StorageGroupCopyStatus notifica Initializing como SummaryCopyStatus cuando el servicio de replicación de Microsoft Exchange en el equipo de destino no ha completado las primeras comprobaciones de inicio. También se ha creado un nuevo contador de rendimiento para representar este estado como booleano.

  • El cmdlet Get-StorageGroupCopyStatus notifica Synchronizing como SummaryCopyStatus cuando no ha completado una reinicialización incremental.

Los nuevos estados del valor SummaryCopyStatus sólo se pueden ver cuando use la versión Exchange 2007 SP1 de las herramientas de administración de Exchange. Cuando use la versión RTM de Exchange 2007 de las herramientas de administración de Exchange, los anteriores estados se notificarán como Error.

Cmdlet Test-ReplicationHealth

Exchange 2007 SP1 introduce un nuevo cmdlet llamado Test-ReplicationHealth. Este cmdlet se ha diseñado para la supervisión proactiva de la replicación continua y la canalización de la replicación continua. El cmdlet Test-ReplicationHealth se ha diseñado para ejecutarse localmente en un servidor de buzones a fin de comprobar el estado de la replicación en un entorno de replicación continua local (LCR), replicación continua en clúster (CCR) y replicación continua en espera (SCR). El cmdlet Test-ReplicationHealth también se ha diseñado para integrarse estrechamente con el paquete de administración para Microsoft Operations Manager (MOM) a fin de proporcionar información simple y precisa sobre el estado de la replicación continua para el servidor de buzones. Las comprobaciones se realizan por orden de seriedad, empezando por las más críticas. Si se produce un error en una de estas comprobaciones, se supone que las menos críticas también presentarán un error o no son relevantes.

El cmdlet Test-ReplicationHealth comprueba todos los aspectos de la replicación, los servicios de clúster y el estado de replicación y reproducción del grupo de almacenamiento para proporcionar una visión completa del sistema de replicación. Específicamente, cuando se ejecuta en un nodo del clúster, el cmdlet Test-ReplicationHealth realiza las pruebas descritas en la siguiente tabla.

Pruebas realizadas por el cmdlet Test-ReplicationHealth

Test Descripción

Estado de nodo pasivo (PassiveNodeUp)

Comprueba que el nodo pasivo tenga el estado Activo cuando se use en un entorno de CCR.

Estado de la red de clúster (ClusterNetwork)

Comprueba que se estén ejecutando todas las redes administradas por clúster encontradas en el nodo local.

Estado del grupo de quórum (QuorumGroup)

Comprueba el buen estado del grupo de clúster que contiene el recurso de quórum.

Estado de quórum de recurso compartido de archivos (FileShareQuorum)

Comprueba que el valor del cmdlet FileSharePath usado por el quórum Conjunto de nodos mayoritario con testigo del recurso compartido de archivos sea accesible.

Estado de grupo de servidores de buzones de correo en clúster (CmsGroup)

Para comprobar que el estado del servidor de buzones de correo en clúster sea correcto, confirma que todos los recursos del grupo estén en línea.

Estado de nodo (NodePaused)

Comprueba que ninguno de los nodos del clúster esté en un estado de pausa.

Estado de registro DNS (DnsRegistrationStatus)

Comprueba que todas las interfaces de red administradas por clúster que tengan Requerir registro DNS para realizarse correctamente establecido hayan superado el registro DNS (Sistema de nombres de dominio).

Estado de servicio de replicación (ReplayService)

Comprueba que el servicio de replicación de Microsoft Exchange del nodo local esté en buen estado.

Bases de datos montadas tras conmutación por error (DBMountedFailover)

Comprueba si hay bases de datos desmontadas o con errores tras producirse una conmutación por error. Esta prueba sólo se centra en las bases de datos con errores como resultado de una conmutación por error.

Copia de grupo de almacenamiento suspendida (SGCopySuspended)

Comprueba si se ha suspendido la replicación continua para algún grupo de almacenamiento en el servidor de buzones de correo en clúster.

Error de copia de grupo de almacenamiento (SGCopyFailed)

Comprueba si existen copias de grupo de almacenamiento en un estado Error.

Inicialización de grupo de almacenamiento (SGInitializing)

Comprueba si hay grupos de almacenamiento en el estado Inicializando.

Longitud de la cola de copia de grupo de almacenamiento (SGCopyQueueLength)

Comprueba si algún grupo de almacenamiento tiene una longitud de cola de copia de replicación mayor que los umbrales recomendados. Actualmente, estos umbrales son:

  • Advertencia   La longitud de la cola es de entre 3 y 5 archivos de registro.

  • Error   La longitud de la cola es de 6 o más archivos de registro.

Longitud de la cola de reproducción de grupo de almacenamiento (SGReplayQueueLength)

Comprueba si algún grupo de almacenamiento tiene una longitud de cola de reproducción de replicación mayor que los umbrales recomendados. Actualmente, estos umbrales son:

  • Advertencia   La longitud de la cola es de entre 30 y 59 archivos de registro.

  • Error   La longitud de la cola es de 60 o más archivos de registro.

Contexto de supervisión de Test-ReplicationHealth

El cmdlet Test-ReplicationHealth incluye un parámetro llamado MonitoringContext, que puede usar para incluir contadores de rendimiento y eventos de supervisión en los resultados de la tarea. Este parámetro se usa con el paquete de administración para MOM. Los dos valores posibles de este parámetro son $true o $false. Si especifica $true, los resultados incluirán eventos de supervisión y contadores de rendimiento además de la información acerca de los servicios.

Si se especifica el contexto de supervisión, sólo se realizan las siguientes comprobaciones en un nodo activo:

  • PassiveNodeUp

  • ClusterNetwork

  • QuorumGroup

  • FileShareQuorum

  • CmsGroup

  • NodePaused

  • DnsRegistrationStatus

  • ReplayService

  • DBMountedFailover

Si se especifica el contexto de supervisión, sólo se realizan las siguientes comprobaciones en un nodo pasivo:

  • ClusterNetwork

  • DnsRegistrationStatus

  • ReplayService

  • SGCopySuspended

  • SGCopyFailed

  • SGInitializing

  • SGCopyQueueLength

  • SGReplayQueueLength

Contadores de rendimiento publicados por el servicio de replicación de Microsoft Exchange

El servicio de replicación de Microsoft Exchange proporciona contadores de rendimiento que pueden usarse para supervisar el estado de la replicación en LCR y CCR. Es recomendable recopilar y evaluar los contadores tratados más adelante en este tema para supervisar y solucionar problemas relacionados con el rendimiento.

Contadores de rendimiento recomendados del servicio de replicación de Microsoft Exchange

El servicio de replicación de Microsoft Exchange crea una instancia de los contadores de la siguiente tabla para cada copia de grupo de almacenamiento. Esto permite supervisar de forma independiente el estado y el rendimiento de cada grupo de almacenamiento. Puede supervisar el estado de cada grupo de almacenamiento si controla los contadores ReplayQueueLength y CopyQueueLength en el objeto de rendimiento Replicación de MSExchange.

Nota

Como se mencionó antes, el cmdlet Get-StorageGroupCopyStatus también muestra los valores de estos contadores.

Nombre del contador Descripción del contador

La cola de copias supera el límite de montaje (sólo CCR)

Indica si la longitud de la cola de copia es mayor que el umbral especificado por el marcado automático de montaje de base de datos. En un entorno de CCR, el valor de este contador será 1 si se supera el umbral de marcado automático de montaje de base de datos. El valor será siempre 0 en un entorno de replicación continua local (LCR).

CopyGenerationNumber

Indica el número de secuencia de generación del último archivo de registro copiado.

CopyNotificationGenerationNumber

Indica el número de secuencia de generación del último archivo de registro conocido para el servicio de replicación de Microsoft Exchange.

CopyQueueLength

Indica el número de archivos de registro que están esperando a copiarse e inspeccionarse.

Error

Con un valor de 1, indica que la replicación continua se encuentra en un estado Error para la instancia elegida (grupo de almacenamiento). Un valor de 0 indica que la replicación continua no está en un estado Error.

Inicializando

Con un valor de 1, indica que la replicación continua se encuentra en un estado Inicialización para la instancia elegida (grupo de almacenamiento). Este estado indica que la copia de grupo de almacenamiento está realizando las primeras comprobaciones de inicio o que el servicio de replicación de Microsoft Exchange está realizando una reinicialización incremental. Un valor de 0 indica que la replicación continua no está en un estado de inicialización.

InspectorGenerationNumber

Indica el número de secuencia de generación del último archivo de registro inspeccionado.

ReplayBatchSize

Indica el número de archivos de registro que se han reproducido juntos.

ReplayGenerationNumber

Indica el número de secuencia de generación del último archivo de registro reproducido correctamente.

ReplayGenerationsComplete

Indica el número de archivos de registro reproducidos en el lote actual.

ReplayGenerationsPerMinute

Indica la velocidad de reproducción (en generaciones de registros por minuto) para el lote actual.

ReplayGenerationsRemaining

Indica el número de generaciones de registros que quedan por reproducir en el lote actual.

ReplayNotificationGenerationNumber

Indica el número de secuencia de generación del último archivo de registro conocido para el servicio de replicación de Microsoft Exchange.

ReplayQueueLength

Indica el número de archivos de registro que están esperando a reproducirse.

Suspendido

Con un valor de 1, indica que la actividad de replicación continua está suspendida. Esto significa que los archivos de registro no se están copiando ni reproduciendo en la copia pasiva.

TruncatedGenerationNumber

Indica el número de secuencia de generación del último archivo de registro truncado por el servicio de replicación de Microsoft Exchange.

Además de los contadores de la tabla anterior, se publica un contador adicional llamado % de inicialización finalizada en el objeto de rendimiento Inicializador de réplicas de MSExchange. Este contador indica el porcentaje de inicialización finalizada. El valor oscila entre el 0 y el 100%, y se publica sólo para los grupos de almacenamiento que se estén inicializando.