Solucionar problemas de replicación continua agrupada

 

Se aplica a: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1, Exchange Server 2007

Última modificación del tema: 2008-01-14

En este tema se trata la solución de problemas relacionados con la replicación continua en clúster (CCR). Para obtener más información acerca de las herramientas que pueden ayudarle a solucionar problemas de CCR, consulte Herramientas para solucionar problemas en la implementación de alta disponibilidad.

Los procedimientos de este tema se centran en los siguientes problemas en un entorno de CCR:

  • Get-StorageGroupCopyStatus indica que se ha producido un "Error" en la base de datos y no se puede inicializar.

  • Get-StorageGroupCopyStatus informa de un "Error" en la base de datos. El valor FailedMessage indica que la copia del grupo de almacenamiento es divergente.

  • Get-StorageGroupCopyStatus informa de un "Error" en la base de datos. El valor FailedMessage proporciona información específica acerca del origen del error.

  • Las alertas, los contadores de rendimiento o Get-StorageGroupCopyStatus indican que se realizan copias de seguridad de las colas de copia o de reproducción para la copia del grupo de almacenamiento.

  • Get-StorageGroupCopyStatus notifica un tiempo transcurrido para LastInspectedLogTime.

  • La conmutación por error o Move-ClusteredMailboxServer se realiza correctamente, pero las bases de datos no se montan.

  • La conmutación por error se realiza correctamente, pero algunas bases de datos no se montan ni automática ni manualmente. De forma alternativa, Get-ClusteredMailboxServerStatus notifica uno o más errores de bases de datos.

  • No se puede montar una base de datos durante el inicio en un entorno de CCR.

  • El evento 2073 de MSExchangeRepl se registra alertando de que el servicio de replicación de Microsoft Exchange no encuentra un directorio.

  • Move-ClusteredMailboxServer no inicia ninguna interrupción programada debido a un problema de replicación.

  • La replicación no se vuelve a sincronizar después de una conmutación por error en uno o más grupos de almacenamiento.

  • Error en la inicialización.

Cuando se producen errores, diferentes de que los que aquí se indican, examine el registro de eventos de ambos nodos para determinar la causa y utilizar esa información para determinar las acciones de recuperación que deben llevarse a cabo. Una vez identificada la hora en la que se produjo el error, otros registros de eventos podrían ayudarle a comprender mejor el problema. Si esta información no es suficiente, conocer la hora en la que se produjo el problema podría facilitar su análisis y el tamaño de la ventana de revisión del cluster.log. El registro de clústeres proporciona información del nivel de seguimiento de las acciones llevadas a cabo por el sistema de administración de clústeres.

Antes de empezar

Para realizar este procedimiento, la cuenta que use debe tener delegada la función Administrador de Exchange Server y el grupo Administradores local del servidor de destino. Para obtener más información acerca de los permisos, la delegación de funciones y los derechos necesarios para administrar Microsoft Exchange Server 2007, consulte Consideraciones sobre permisos.

Procedimiento

Get-StorageGroupCopyStatus indica que se produjo un "Error" en la base de datos y no se puede inicializar.

  • Posibles causas   Un problema de configuración o que la copia de replicación no tiene ninguna copia mínima válida de la base de datos. Este problema podría estar causado por no inicializar la copia del grupo de almacenamiento al agregar el nodo pasivo.

  • Solución

    • Compruebe que el almacenamiento para la copia tiene la configuración correcta y esté operativo. Si detecta un error, puede desencadenar una nueva comprobación de la copia suspendiendo y reanudando el grupo de almacenamiento.

    • Compruebe que las rutas del grupo de almacenamiento y la base de datos estén configuradas correctamente con respecto al almacenamiento en el servidor pasivo. Lo puede hacer con el cmdlet Get-StorageGroup en la Consola de administración Exchange:

    • Use el cmdlet Update-StorageGroupCopy para inicializar la copia del grupo de almacenamiento.

Get-StorageGroupCopyStatus indica que se produjo un "Error" en la base de datos y el valor FailedMessage indica que la copia del grupo de almacenamiento es divergente.

  • Posibles causas   Se produce cuando existe una conmutación por error y se han perdido los suficientes registros como para que la base de datos del servidor activo anterior no pueda volver a sincronizarse con la base de datos activa actual sin una reinicialización completa. Esta situación no se puede producir en LCR.

  • Solución   Use el cmdlet Update-StorageGroupCopy para inicializar la copia del grupo de almacenamiento.

Get-StorageGroupCopyStatus indica que se produjo un "Error" en la base de datos y el valor FailedMessage proporciona información específica acerca del origen del error.

  • Posibles causas   Son muchas las causas potenciales que podrían producir que la copia del grupo de almacenamiento diera error. Los casos anteriores, la no inicialización y la divergencia, son dos ejemplos. El valor FailedMessage identifica específicamente el problema detectado.

  • Solución   Ejecute el cmdlet Get-StorageGroupCopyStatus para obtener el valor FailedMessage completo, lo que identifica el problema detectado. Analice la información suministrada por el valor FailedMessage y solucione la condición indicada. Si la condición indicada es un registro dañado o perdido, intente encontrar un registro no dañado con el número de generación correcto. Si no se encuentra el registro correcto, utilice el cmdlet Update-StorageGroupCopy para reinicializar. Si el mensaje implica que los registros del origen no están disponibles, quite el recurso compartido del directorio de registros del origen y reinicie el servicio de replicación en ese nodo.

Las alertas, los contadores de rendimiento o Get-StorageGroupCopyStatus indican que se realizan copias de seguridad de las colas de copia o de reproducción para la copia del grupo de almacenamiento.

  • Posibles causas   Un retraso en la copia o reproducción del registro podría indicar un problema o una situación transitoria en proceso de recuperación. Una situación transitoria se produce cuando un nodo pasivo previamente desconectado entra en línea, o una copia de grupo de almacenamiento se ha reanudado recientemente después de haberse suspendido durante un periodo significativo. La detención del Servicio de replicación de Microsoft Exchange del nodo pasivo tiene un efecto similar a la suspensión de todas las copias de grupos de almacenamiento del nodo. Si la situación no es transitoria, podría deberse a una de las causas siguientes:

    • Problema de configuración.

    • Copia de almacenamiento suspendida.

    • Servicio de reproducción detenido.

    • Error de almacenamiento o el almacenamiento está sin conexión.

    • El nodo pasivo está desconectado.

  • Solución   Determine si existe un problema real o se trata de una situación transitoria:

    • Determine si el Servicio de replicación de Microsoft Exchange está ejecutándose en ambos nodos. Esto se realiza mediante el complemento Servicios. Si el servicio se detiene en cualquiera de los nodos, deberá iniciarlo.

    • Ejecute el cmdlet del Shell de administración de Exchange Get-StorageGroupCopyStatus con la opción fl (lista con formato) y determine si está suspendida la copia pasiva. Si está suspendida, compruebe que los archivos de la copia pasiva aparecen de forma correcta y, a continuación, reanude la copia del grupo de almacenamiento con el cmdlet Resume-StorageGroupCopy.

    • Ejecute el cmdlet Get-StorageGroupCopyStatus con la opción fl y determine si la copia da “Correcto”. Si la copia da “Error”, revise la lista de los campos de estado para determinar la acción correctiva que sea necesaria.

    • Observe los contadores de rendimiento de la replicación durante un periodo de varios minutos para determinar si existe progreso. De forma específica, examine el número de generación de reproducción y el número de generación de inspección. Si la longitud de la cola de copia sigue aumentando, pero la longitud de la cola de reproducción es corta o se reduce, puede que haya un problema con el recurso compartido de archivos de red en el servidor activo o con el propio servidor activo. Compruebe que el directorio de registro de la copia activa del grupo de almacenamiento activo tiene definido en él un recurso compartido de archivos de red mediante el comando "net share", el Explorador de Windows o el complemento Administración de equipos. Puede determinar el GUID del grupo de almacenamiento mediante el cmdlet Get-StorageGroup con la opción fl en el Shell de administración de Exchange.

Get-StorageGroupCopyStatus informa de un tiempo anterior para LastInspectedLogTime.

  • **Posibles causas   **Existen tres posibles causas para este síntoma:

    • La base de datos de copia del grupo de almacenamiento activo está desmontada.

    • La copia del grupo de almacenamiento activo está montada, pero no cambia a una velocidad significativa. Por lo tanto, la copia del grupo de almacenamiento activo no está produciendo ningún registro.

    • El servicio de replicación de Microsoft Exchange no se está ejecutando en el nodo pasivo.

  • SoluciónDetermine cuál de las tres causas se está produciendo del modo siguiente:

    • Determine si la base de datos está desmontada mediante la Consola de administración de Exchange o ejecutando el cmdlet Get-StorageGroupStatus del Shell de administración de Exchange. Si está desmontada, deberá montarla y realizar los cambios en la base de datos (por ejemplo, la actividad dentro de la base de datos) para que cambie LastInspectedLogTime.

    • Compruebe que el Servicio de replicación de Microsoft Exchange se está ejecutando en el nodo pasivo. Si el servicio está detenido, debe iniciarlo.

    • Después de comprobar que la base de datos está montada, compruebe si está generando registros. Examine el directorio de registros de la base de datos activa e identifique el archivo de registro con el número de generación más alto. Compruebe la marca de tiempo de ese registro; deberá coincidir con el valor de LastInspectedLogTime.

La conmutación por error o Move-ClusteredMailboxServer se realiza correctamente, pero las bases de datos no se montan

  • Posibles causas   La causa típica de este problema es que la cuenta del servicio Cluster Server no tiene la autoridad necesaria para montar la base de datos. De forma alternativa, una conmutación por error ha provocado la pérdida de más registros de los permitidos por las opciones de configuración de montaje automático. La otra causa típica de un caso de conmutación por error es que las copias pasivas no eran correctas en el momento del error.

  • Solución   Los problemas de permisos de la cuenta del servicio Cluster Server se producen normalmente durante la instalación. Si las bases de datos no se montan al final de la instalación, esto generalmente indica que no se otorgaron los permisos adecuados a la cuenta del servicio de clúster. Para solucionarlo, otorgue los permisos adecuados a la cuenta del servicio de clúster y después, realice un cierre metódico y reinicie el clúster entero. Puede llevarlo a cabo (1) desconectando el servidor de buzones de correo en clúster, (2) cerrando el nodo pasivo, (3) cerrando el nodo activo, (4) iniciando el nodo activo, (5) iniciando el nodo pasivo y (6) poniendo en conexión el servidor de buzones de correo en clúster.

    • Revise el registro de eventos para determinar si la conmutación por error provocó la pérdida de más registros de los permitidos por las opciones de configuración de montaje automático. Después de determinar el estado de la base de datos de copia del grupo de almacenamiento, puede montarla explícitamente ejecutando el cmdlet Restore-StorageGroupCopy cmdlet del Shell de administración de Exchange. Finalmente, ejecute el cmdlet Get-StorageGroupCopy y examine el valor SummaryCopyStatus para identificar si existen problemas con la copia previamente activa que le impidan montarse. Si existen problemas, revise el registro de eventos para identificar la causa del problema y adoptar los pasos necesarios para solucionarlo.

La conmutación por error se realiza correctamente, pero algunas bases de datos no se montan ni automática ni manualmente. De forma alternativa, Get-ClusteredMailboxServerStatus informa de uno o más errores de bases de datos.

  • Posibles causas   Una reciente conmutación por error ha provocado la pérdida de más registros de los permitidos por las opciones de configuración de montaje automático. La otra causa típica de un caso de conmutación por error es que la copia pasiva no era correcta en el momento del error.

    Nota

    Las bases de datos pueden marcarse como erróneas o desconectadas durante un corte programado o no programado. Este estado es transitorio y se produce mientras el servicio de replicación está intentando realizar una copia final de cualquier registro disponible.

  • SoluciónRevise el registro de eventos para determinar si no se pudo montar la base de datos. Puede que la base de datos no pueda montarse debido a que los registros o archivos de base de datos están dañados. Si los eventos indican esto, restaure el acceso a la base de datos moviendo el servidor activo a otro nodo. Puede determinar si se ha producido un error en la base de datos revisando el registro de eventos. Después de determinar el estado de la base de datos de copia del grupo de almacenamiento, puede montarla explícitamente ejecutando el cmdlet Restore-StorageGroupCopy cmdlet del Shell de administración de Exchange. A continuación, ejecute el cmdlet Get-StorageGroupCopyStatus y examine el valor SummaryCopyStatus para identificar si existen problemas con la copia previamente activa que le impidan montarse. Si el estado muestra que la copia del grupo de almacenamiento es demasiado antigua para activarse, la base de datos puede restaurarse cuando el nodo donde se dio el error se pone de nuevo en funcionamiento y hay más registros disponibles. Los registros se copian automáticamente y no es necesario que realice ninguna acción.

No se puede montar una base de datos durante el inicio en un entorno de CCR.

  • Posibles causas   El error al montarse la base de datos podría provocar una acción explícita del administrador. Si una base de datos se desmonta explícitamente y después se desconecta el servidor de buzones de correo en clúster, la base de datos no se conectará en el siguiente inicio. Otra posible causa podría ser que se perdieron más registros del número aceptable durante una conmutación por error.

  • SoluciónPuede ejecutar el cmdlet Get-ClusteredMailboxServerStatus del Shell de administración de Exchange para comprobar que el almacén está operativo en el nodo. Use la Consola de administración de Exchange o el Shell de administración de Exchange para intentar una operación de montaje de la copia de la base de datos afectada. Para obtener más información acerca del montaje de la copia de una base de datos, consulte Cómo montar una base de datos en un entorno de replicación continua de clústeres. Revise el registro de eventos tras la operación de montaje para determinar si se informó de algún error.

El evento del clúster MSExchangeRepl 2073 se registra avisando de que el servicio de replicación de Microsoft Exchange no encuentra un directorio especificado.

  • Posibles causas   El evento del error indica que el servicio de replicación de Microsoft Exchange no pudo crear el directorio especificado por el evento. El servicio de replicación de Microsoft Exchange intenta crear varios directorios necesarios si es que todavía no existen. Estos incluyen rutas de acceso a directorios de archivos de registro de origen, archivos de registro de destino, archivos de sistema de destino y la ruta del inspector de archivo de registro.

    Es posible que el servicio de replicación de Microsoft Exchange no pueda crear el directorio especificado por un problema relacionado con el permiso, o por un error de hardware o de configuración.

  • Solución   Examine el código del error devuelto por el evento. Compruebe que la ubicación del directorio está disponible y que se tiene acceso a la misma Compruebe los permisos del sistema de archivos. Asegúrese de que la configuración del almacenamiento es la adecuada y de que el hardware está funcionando correctamente.

Move-ClusteredMailboxServer no inicia ningún corte programado debido a un problema de replicación

  • Posibles causas   El cmdlet Move-ClusteredMailboxServer del Shell de administración de Exchange incluye comprobaciones de validación para evitar un corte programado en un nodo pasivo si la replicación no es completamente correcta en todas las copias del grupo de almacenamiento. Este comportamiento asegura que los cortes programados no se extiendan durante un tiempo inapropiado.

  • SoluciónIdentifique los grupos de almacenamiento específicos con el problema y corrija cualquier situación errónea. El mensaje de error del cmdlet Move-ClusteredMailboxServer identifica la copia del grupo de almacenamiento con problemas. Si desea realizar el traslado e ignorar la comprobación de validación, asegúrese de que sólo se desmonta la base de datos de la copia de grupo de almacenamiento que provocó el error. Vuelva a intentar la operación de traslado y utilice el parámetro -IgnoreDismounted. El parámetro IgnoreDismounted indica que los grupos de almacenamiento desmontados se omiten cuando se realizan comprobaciones de mantenimiento de replicación.

La replicación no vuelve a sincronizarse después de una conmutación por error en uno o más grupos de almacenamiento

  • **Posibles causas  **El mensaje de error que devuelve el cmdlet Get-StorageGroupCopyStatus indica que la base de datos es divergente. Esta situación se debe a una conmutación por error cuando el servidor activo antiguo no tenía suficientes registros replicados antes de la conmutación por error.

  • Solución   Reinicialice la base de datos con el cmdlet Update-StorageGroupCopy del Shell de administración de Exchange.

Error en la inicialización

  • Posibles causas   Hay una copia de seguridad en curso en el servidor activo o un problema de comunicación.

  • Solución   Compruebe que no haya ninguna copia de seguridad en curso de la copia de grupo de almacenamiento afectada. Asegúrese de que el nodo activo esté conectado.

Para obtener más información

Para obtener más información acerca de los cmdlets del Shell de administración de Exchange mencionados en este tema, consulte los siguientes temas:

Para obtener información acerca de la solución de problemas de la replicación continua local, consulte Solucionar problemas de replicación continua local.