Share via


Supervisión de la alta disponibilidad y la resistencia de sitios

Se aplica a: Exchange Server 2010

Última modificación del tema: 2010-01-11

Asegurarse de que los servidores funcionan de forma confiable y que las copias de base de datos están en buen estado son los objetivos clave para las operaciones diarias de mensajería. Para contribuir a garantizar la disponibilidad y confiabilidad de su organización de Microsoft Exchange Server 2010, deberá supervisar activamente el hardware, el sistema operativo de Windows y los servicios de Exchange 2010. La supervisión proactiva combinada con un mantenimiento preventivo le puede ayudar a identificar errores potenciales antes de que se produzca un problema grave que interfiera con el funcionamiento de la organización de Exchange.

La supervisión de la organización de Exchange implica la comprobación regular de problemas relacionados con servicios o datos. La supervisión suele incluir un sistema de notificaciones que envía advertencias cuando se producen problemas. Windows Server 2008 y Exchange 2010 incluyen algunas herramientas y servicios que le ayudan a garantizar que la organización de Exchange funciona sin problemas. Las principales ventajas respecto a la supervisión diaria son:

  • Se cumplen los requisitos de los acuerdos de nivel de servicio (SLA).
  • Se puede garantizar que las tareas administrativas específicas se completan correctamente (por ejemplo, las operaciones diarias de copia de seguridad)
  • Se detectan y resuelven los problemas (por ejemplo, problemas que pueden afectar al servicio de mensajería o a la disponibilidad de datos)

En una organización de Exchange 2010, se deben formalizar los procedimientos, funciones y responsabilidades que conllevan las operaciones. Es importante entender la conexión que existe entre prácticas y procedimientos operativos adecuados y una infraestructura en buen estado. Los procesos y procedimientos operativos completos y bien documentados ayudan a garantizar que todos los componentes del entorno de una organización de los que depende Exchange se administren de un modo eficaz y eficiente. 

Exchange 2010 incluye varias herramientas y características integradas que se pueden usar como parte de la supervisión proactiva regular cuando se configura Exchange para alta disponibilidad y resistencia de sitios. Los cmdlets de supervisión principales para la alta disponibilidad y la resistencia de sitios son Get-MailboxDatabaseCopyStatus y Test-ReplicationHealth. Además de disponer de cmdlets que realizan funciones de supervisión e informan sobre el estado, Exchange 2010 también incorpora una nueva secuencia de registro de eventos que permite aprovechar las capacidades del canal Crimson de Windows Server, así como scripts integrados que recopilan datos de dichos canales de eventos.

Puede usar la información de este tema para supervisar el estado de mantenimiento de las copias de la base de datos de buzones para grupos de disponibilidad de base de datos (DAG). Para obtener información general sobre la supervisión de Exchange 2010, consulte Supervisión de Exchange 2010..

Contenido

Cmdlet Get-MailboxDatabaseCopyStatus

Cmdlet Test-ReplicationHealth

Registro de eventos de canal Crimson

Script CollectOverMetrics.ps1

Script de CollectReplicationMetrics.ps1

Cmdlet Get-MailboxDatabaseCopyStatus

Puede usar el cmdlet Get-MailboxDatabaseCopyStatus para ver información de estado de las copias de bases de datos de buzones. Este cmdlet permite ver información sobre todas las copias de una base de datos determinada, información sobre una copia específica de una base de datos en un servidor determinado o información sobre todas las copias de bases de datos de un servidor. La tabla siguiente describe los posibles valores del estado de una copia de base de datos de buzones de correo.

Estado de copia de base de datos

Estado de copia de base de datos Descripción

Failed

La copia de una base de datos de buzones de correo muestra el estado Failed (Error) porque no está suspendida, ni puede copiar o reproducir archivos de registro. Mientras su estado sea Failed y no esté suspendida, el sistema comprobará periódicamente si se ha resuelto el problema que hizo que el estado de la copia cambiara a Failed. Una vez que el sistema ha detectado que el problema se ha resuelto, y ha descartado otros problemas, el estado de la copia cambiará automáticamente a Healthy (Correcta).

Inicialización

La copia de base de datos se está propagando, el índice de contenido de la copia de base de datos de buzones se está propagando o ambos elementos se están propagando. Una vez completada correctamente la propagación, el estado de copia cambiará a Initializing (Inicializando).

SeedingSource

La copia de base de datos de buzón se está usando como origen de una operación de inicialización de copia de base de datos.

Suspended

La copia de base de datos de buzones de correo está en estado Suspended (Suspendida) porque un administrador ha suspendido de forma manual la copia de base de datos mediante la ejecución del cmdlet Suspend-MailboxDatabaseCopy.

Healthy

La copia de base de datos de buzones de correo está copiando y reproduciendo archivos de registro correctamente, o bien ha conseguido copiar y reproducir todos los archivos de registro disponibles.

ServiceDown

El servicio de replicación de Microsoft Exchange no está disponible o se está ejecutando en el servidor que hospeda la copia de base de datos de buzones.

Initializing

La copia de base de datos de buzones de correo estará en el estado de inicialización cuando se cree una copia de base de datos, cuando el servicio de replicación de Microsoft Exchange se esté iniciando o acabe de ser iniciado y durante las transiciones de los estados Suspended, ServiceDown, Failed, Seeding, SinglePageRestore, LostWrite o Disconnected a otro estado. Mientras permanece en este estado, el sistema verifica que la base de datos y la secuencia de registro sean coherentes. En la mayoría de los casos, el estado de la copia permanecerá en el estado Initializing durante unos 15 segundos, pero en general, no debería permanecer en dicho estado por más de 30 segundos.

Resynchronizing

La copia de base de datos de buzones y los archivos de registro correspondientes se están comparando con la copia activa de la base de datos para comprobar si existen divergencias entre las dos copias. El estado de la copia permanecerá así hasta que se detecte y resuelvan las divergencias.

Mounted

La copia activa está en línea y acepta conexiones de clientes. Solo la copia activa de la copia de base de datos de buzones puede tener el estado Mounted (montada).

Dismounted

La copia activa está sin conexión y no acepta conexiones de clientes. Solo la copia activa de la copia de base de datos de buzones puede tener el estado Dismounted (desmontada).

Mounting

La copia activa se está conectando y aún no acepta conexiones de clientes. Solo la copia activa de la copia de base de datos de buzones puede tener el estado Mounting (montando).

Dismounting

La copia activa se está desconectando y está cerrando las conexiones de clientes. Solo la copia activa de la copia de base de datos de buzones puede tener el estado Dismounting (desmontando).

DisconnectedAndHealthy

La copia de base de datos de buzones ya no está conectada a la copia de base de datos activa, y tenía el estado Healthy (correcta) cuando se perdió la conexión. Este estado define cómo está la copia de base de datos con respecto a la conectividad con su copia de origen. Puede notificarse durante los errores de red de DAG entre la copia de origen y la copia de base de datos de destino.

DisconnectedAndResynchronizing

La copia de base de datos de buzones ya no está conectada a la copia de base de datos activa, y tenía el estado Resynchronizing (volviendo a sincronizar) cuando se perdió la conexión. Este estado define cómo está la copia de base de datos con respecto a la conectividad con su copia de origen. Puede notificarse durante los errores de red de DAG entre la copia de origen y la copia de base de datos de destino.

FailedAndSuspended

El sistema establece los estados Failed (error) y Suspended (suspendida) simultáneamente porque se ha detectado un error y porque la resolución del error requiere la intervención expresa de un administrador. Un ejemplo sería cuando el sistema detecta divergencias irrecuperables entre la base de datos de buzones de correo activa y la copia de base de datos. A diferencia del estado Failed (error), el sistema no comprobará periódicamente si se ha resuelto el problema para recuperarse de forma automática. En su lugar, debe intervenir un administrador para resolver la causa subyacente del error antes de que la copia de base de datos pueda pasar al estado Healthy (correcta).

ActivationSuspended

La copia de base de datos de buzones se ha bloqueado manualmente para evitar que la active un administrador.

SinglePageRestore

Este estado indica que se está llevando a cabo una operación de restauración de página única en la copia de base de datos de buzones.

El cmdlet Get-MailboxDatabaseCopyStatus también incluye un parámetro denominado ConnectionStatus, que devuelve datos sobre las redes de replicación en uso. Si usa este parámetro, se rellenarán dos campos de salida adicionales, IncomingLogCopyingNetwork y SeedingNetwork en el resultado de la tarea.

Ejemplos de Get-MailboxDatabaseCopyStatus

Los ejemplos siguientes usan el cmdlet Get-MailboxDatabaseCopyStatus. Cada ejemplo envía los resultados al cmdlet Format-List para que los muestre en formato de lista.

En este ejemplo se devuelve información de estado para todas las copias de la base de datos DB2.

Get-MailboxDatabaseCopyStatus -Identity DB2 | Format-List

En este ejemplo se devuelve el estado de todas las copias de base de datos del servidor de buzones MBX2.

Get-MailboxDatabaseCopyStatus -Server MBX2 | Format-List

En este ejemplo se devuelve el estado de todas las copias de base de datos del servidor de buzones local.

Get-MailboxDatabaseCopyStatus -Local | Format-List

En este ejemplo se devuelve el estado, el envío de registros y la información de redes de propagación de la base de datos DB3 del servidor de buzones MBX1.

Get-MailboxDatabaseCopyStatus -Identity DB3\MBX1 -ConnectionStatus | Format-List

Para obtener más información acerca del cmdlet Get-MailboxDatabaseCopyStatus, consulte Get-MailboxDatabaseCopyStatus.

Volver al principio

Cmdlet Test-ReplicationHealth

Puede usar el cmdlet Test-ReplicationHealth para ver información de estado de la replicación continua de copias de bases de datos de buzones. Use el cmdlet para comprobar todos los aspectos del estado de replicación y reproducción con el fin de proporcionar una descripción general completa de un servidor de buzones de correo concreto de un grupo de disponibilidad de base de datos (DAG).

El cmdlet Test-ReplicationHealth está diseñado para realizar una supervisión proactiva de la replicación continua y de la canalización de replicación continua, la disponibilidad de Active Manager, el estado y el mantenimiento del servicio de clúster subyacente, así como de los componentes de quórum y de red. Se puede ejecutar de forma local o remota en cualquier servidor de buzones de un grupo de disponibilidad de base de datos. El cmdlet Test-ReplicationHealth realiza las pruebas que se enumeran en la tabla siguiente.

Pruebas del cmdlet Test-ReplicationHealth

Nombre de la prueba Descripción

ClusterService

Verifica que el servicio de clúster se está ejecutando y está accesible en el miembro DAG especificado; y, si no se ha especificado ningún miembro DAG, en el servidor local.

ReplayService

Verifica que el servicio de replicación de Microsoft Exchange se está ejecutando y está accesible en el miembro DAG especificado; y, si no se ha especificado ningún miembro DAG, en el servidor local.

ActiveManager

Verifica que la instancia de Active Manager que se está ejecutando en el miembro DAG especificado (y si no se ha especificado un miembro DAG, en el servidor local) tiene asignado un rol válido (principal, secundario o independiente).

TasksRpcListener

Verifica que el servidor de llamada a procedimiento remoto (RPC) para tareas se está ejecutando y está accesible en el miembro DAG especificado; y, si no se ha especificado ningún miembro DAG, en el servidor local.

TcpListener

Verifica que el proceso de escucha de copias de registros TCP se está ejecutando y está accesible en el miembro DAG especificado; y, si no se ha especificado ningún miembro DAG, en el servidor local.

DagMembersUp

Verifica que todos los miembros DAG están disponibles, ejecutándose y accesibles.

ClusterNetwork

Verifica que todas las redes administradas por clúster del miembro DAG especificado (y si no se ha especificado ninguno, del servidor local) están disponibles.

QuorumGroup

Verifica que el grupo de clústeres (grupo de quórum) predeterminado está en buen estado y conectado.

FileShareQuorum

Verifica que el servidor testigo, el directorio testigo y el recurso compartido configurados para el grupo de disponibilidad de base de datos (DAG) están accesibles.

DBCopySuspended

Comprueba si hay alguna copia de base de datos de buzones de correo en el estado Suspended (suspendida) en el miembro DAG especificado; y, si no se ha especificado ningún miembro DAG, en el servidor local.

DBCopyFailed

Comprueba si hay alguna copia de base de datos de buzones de correo en el estado Failed (error) en el miembro DAG especificado; y, si no se ha especificado ningún miembro DAG, en el servidor local.

DBInitializing

Comprueba si hay alguna copia de base de datos de buzones de correo en el estado Initializing (inicializando) en el miembro DAG especificado; y, si no se ha especificado ningún miembro DAG, en el servidor local.

DBDisconnected

Comprueba si hay alguna copia de base de datos de buzones de correo en el estado Disconnected (desconectada) en el miembro DAG especificado; y, si no se ha especificado ningún miembro DAG, en el servidor local.

DBLogCopyKeepingUp

Verifica que el proceso de copia de registros e inspección de las copias pasivas de base de datos en el miembro DAG especificado (y si no se ha especificado ninguno, en el servidor local) consigue mantener la actividad de generación de registros en la copia activa.

DBLogReplayKeepingUp

Verifica que la actividad de reproducción de las copias pasivas de base de datos en el miembro DAG especificado (y si no se ha especificado ninguno, en el servidor local) consigue mantener la actividad de copia de registros y de inspección.

Ejemplo de Test-ReplicationHealth

En este ejemplo se usa el cmdlet Test-ReplicationHealth para comprobar el mantenimiento de replicación del servidor de buzones de correo MBX1.

Test-ReplicationHealth -Identity MBX1

Volver al principio

Registro de eventos de canal Crimson

Windows Server 2008 incluye dos categorías de registros de eventos: Registros de Windows y registros de aplicaciones y servicios. La categoría de registros de Windows incluye los registros de eventos disponibles en versiones anteriores de Windows: Registros de eventos de aplicaciones, seguridad y sistema. También incluye dos nuevos registros: el registro del programa de instalación y el registro ForwardedEvents. Los registros de Windows tienen como objetivo almacenar eventos de aplicaciones heredadas y eventos que se aplican a todo el sistema.

Los registros de aplicaciones y servicios son una nueva categoría de registros de eventos. Estos registros almacenan eventos de una única aplicación o de un único componente, en lugar de eventos que pueden tener incidencia en todo el sistema. A esta nueva categoría de registros de eventos se alude como a un canal Crimson de aplicaciones.

La categoría de los registros de aplicaciones y servicios incluye cuatro subtipos: Registros administrativos, operativos, analíticos y de depuración. Los eventos de los registros administrativos son especialmente interesantes si el motivo por el que lleva un registro de eventos es para solucionar problemas. Los eventos en el registro administrativo deben proporcionar ayuda sobre cómo responder a los eventos. Los eventos del registro operativo también son útiles, pero quizá sea necesario un conocimiento más profundo. Los registros administrativos y de depuración no son especialmente sencillos para el usuario. Los registros analíticos (que aparecen ocultos o deshabilitados de manera predeterminada) almacenan eventos que hacen un seguimiento de un problema, y suele haber un número elevado de eventos registrado. Los registros de depuración son utilizados por los desarrolladores para depurar aplicaciones.

Exchange 2010 registra eventos en los canales Crimson del área de registros de aplicaciones y servicios. Puede ver estos canales si sigue los pasos que se detallan a continuación:

  1. Abra el Visor de eventos:
  2. En el árbol de la consola, vaya a Registros de aplicaciones y servicios > Microsoft > Exchange.
  3. En Exchange, seleccione un canal Crimson: HighAvailability o MailboxDatabaseFailureItems.

El canal HighAvailability contiene eventos relacionados con el inicio y apagado del servicio de replicación de Microsoft Exchange, y los diferentes componentes que se ejecutan en el servicio de replicación de Microsoft Exchange, como Active Manager, una API de replicación sincrónica de otros fabricantes, el servidor RPC de tareas, el proceso de escucha TCP y el escritor del servicio de instantáneas de volumen (VSS). El canal HighAvailability también es utilizado por Active Manager para registrar eventos relacionados con la supervisión de funciones de Active Manager y eventos de acción de base de datos, como la operación de montaje de base de datos y la truncación de registros, y también para registrar eventos relacionados con el clúster subyacente del grupo de disponibilidad de bases de datos.

El canal MailboxDatabaseFailureItems se usa para registrar eventos asociados con errores que afectan a una base de datos de buzones de correo replicada.

Volver al principio

Script CollectOverMetrics.ps1

Exchange 2010 incluye un script denominado CollectOverMetrics.ps1, que puede encontrar en la carpeta Scripts. Se trata de un script de flujo de trabajo que recopila información sobre diferentes tipos de estadísticas de cambio y conmutación por error. Usar el script CollectOverMetrics.ps1 es una manera pasiva de supervisar. El script recopila y analiza eventos que ya se han registrado. El script admite parámetros que permiten personalizar el comportamiento y los resultados del script. En la tabla siguiente se muestran los parámetros disponibles:

Parámetros del script CollectOverMetrics.ps1

Parámetro Descripción

DatabaseAvailabilityGroup

Especifica el nombre del grupo de disponibilidad de base de datos (DAG) de la que se va a recopilar la métrica. Si se omite este parámetro, se usará el DAG del que es miembro el servidor local.

Database

Proporciona una lista de bases de datos para las que debe generarse el informe. Se admiten caracteres comodín, por ejemplo, -Database:"DB1","DB2" o -Database:"DB*".

TemporaryDataPath

Especifica la ubicación para almacenar archivos temporales. Si se omite este parámetro, el nombre del directorio será el siguiente: %UnidadDelSistema%\Temp\CollectOverMetrics\<ScriptStartTime>

StartTime

Especifica la hora a la que se empezarán a recopilar datos de eventos. Si se omite este parámetro, la hora de inicio será el día anterior a las 00:00 (medianoche).

EndTime

Especifica la hora a la que se dejarán de recopilar datos de eventos. Si se omite este parámetro, los eventos se recopilarán hasta las 23:59 del día anterior.

ReportPath

Especifica la carpeta usada para almacenar los resultados de procesamiento de eventos. Si se omite este parámetro, se usará la carpeta Scripts.

ReportAlias

Especifica el alias de correo electrónico al que se debe enviar el informe.

IncludeAppLogs

Especifica si los eventos del registro de eventos de aplicaciones también se deben recopilar, combinar y procesar. De forma predeterminada, se incluirán los siguientes proveedores: MSExchangeIS, MSExchangeIS Mailbox Store y MSExchangeRepl.

AppLogProviders

Especifica si deben recopilarse eventos específicos del registro de eventos de aplicaciones. Si se especifica este parámetro, no se incluirán los proveedores de IncludeAppLogs, y deberán especificarse explícitamente mediante el parámetro AppLogProviders.

AnalyzeOnly

Especifica que los datos ya se han recopilado y solo se requiere su procesamiento.

MergedXmlFile

Especifica el nombre del archivo XML en el que se combinarán todos los registros de eventos recopilados.

GenerateHtmlReport

Especifica que el informe deberá publicarse en un formato de tabla HTML simple para que pueda consultarse fácilmente.

ShowHtmlReport

Especifica que el informe generado en HTML debe mostrarse en un explorador web una vez generado.

DotSourceMode

Especifica que nada debe ejecutarse de inmediato, pero este archivo está prefijado por puntos para usar los métodos de Windows PowerShell que tiene definidos.

Ejemplos de CollectOverMetrics.ps1

Los ejemplos siguientes usan el script CollectOverMetrics.ps1.

En este ejemplo se recopila la métrica de todas las bases de datos que coinciden con DB* (la búsqueda incluye un carácter comodín) en el grupo de disponibilidad de base de datos DAG1. Una vez recopilada la métrica, se genera y muestra un informe HTML.

CollectOverMetrics.ps1 -DatabaseAvailabilityGroup DAG1 -Database:"DB*" -GenerateHTMLReport -ShowHTMLReport

En este ejemplo se recopila la métrica de todas las bases de datos del grupo de disponibilidad de base de datos DAG2. Una vez recopilada la métrica, se genera y muestra un informe HTML.

CollectOverMetrics.ps1 -DatabaseAvailabilityGroup DAG2 -GenerateHTMLReport -ShowHTMLReport

Volver al principio

Script de CollectReplicationMetrics.ps1

Otro script de métrica incluido en Exchange 2010 es CollectReplicationMetrics.ps1. Este script es un método activo de supervisión, porque recopila la métrica en tiempo real, mientras se ejecuta el script. El script admite parámetros que permiten personalizar el comportamiento y los resultados del mismo. En la tabla siguiente se muestran los parámetros disponibles:

Parámetros del script CollectReplicationMetrics.ps1

Parámetro Descripción

DagName

Especifica el nombre del grupo de disponibilidad de base de datos (DAG) de la que se va a recopilar la métrica. Si se omite este parámetro, se usará el DAG del que es miembro el servidor local.

DatabaseNames

Proporciona una lista de bases de datos para las que debe generarse el informe. Se admiten caracteres comodín, por ejemplo, -DatabaseNames:"DB1","DB2" o -DatabaseNames:"DB*".

ReportAlias

Especifica un alias de correo electrónico al que se debe enviar el informe.

TemporaryDataPath

Especifica la ubicación para almacenar archivos temporales. Si se omite este parámetro, el nombre del directorio será el siguiente: %UnidadDelSistema%\Temp\CollectReplicationMetrics\<ScriptStartTime>

ReportPath

Especifica la carpeta usada para almacenar los resultados de procesamiento de eventos. Si se omite este parámetro, se usará la carpeta Scripts.

Duration

Especifica el tiempo que debe durar el proceso de recolección de datos.

Frequency

Especifica la frecuencia a la que debe recopilarse la métrica de datos.

Verbose

Muestra el resultado de las tareas en la pantalla una vez que se ha completado cada tarea.

ProcessOnly

Especifica que los datos ya se han recopilado y solo se requiere su procesamiento.

Ejemplo de CollectReplicationMetrics.ps1

En el ejemplo siguiente se usa el script CollectReplicationMetrics.ps1.

En este ejemplo se recopila la métrica de todas las bases de datos del grupo de disponibilidad de base de datos DAG1 y se muestran los datos recopilados en un informe en pantalla.

CollectReplicationMetrics.ps1 -DagName DAG1 -Verbose

Volver al principio