Alta disponibilidad y resistencia del sitio en Exchange Server

Puede proteger las bases de datos de buzones de Exchange Server y los datos que contienen mediante la configuración de los servidores y bases de datos de Exchange para lograr una alta disponibilidad y resistencia del sitio. Exchange Server minimiza el costo y la complejidad de la implementación de una solución de mensajería resistente y de alta disponibilidad, a la vez que proporciona altos niveles de servicio y disponibilidad de datos y compatibilidad con buzones de correo muy grandes.

Exchange Server permite a los clientes de todos los tamaños y de todos los segmentos implementar económicamente un servicio de continuidad de mensajería en su organización mediante la compilación de las funcionalidades de replicación nativas y la arquitectura de alta disponibilidad introducidas en Exchange 2010. Para obtener una lista de los cambios desde Exchange 2010, consulte Cambios en la alta disponibilidad y resistencia del sitio con respecto a versiones anteriores.

Terminología básica

Los siguientes términos clave son importantes a la hora de entender qué es la alta disponibilidad o la resistencia de sitios:

Active Manager

Componente interno de Exchange que se ejecuta en el servicio de replicación de Microsoft Exchange responsable de supervisar errores y de tomar acciones correctivas a través de la conmutación por error en un grupo de disponibilidad de bases de datos (DAG).

AutoDatabaseMountDial

Valor de propiedad de un servidor de buzones de correo que determina si una copia de base de datos pasiva se monta automáticamente como una nueva copia activa, en función del número de archivos de registro que le falten a la copia que se va a montar.

Replicación continua, modo de bloque

En el modo de bloque, como cada actualización se escribe en el búfer de registro activo de la copia de base de datos activa, también se incluye en un búfer de registro de cada una de las copias de buzones pasivos en el modo de bloque. Cuando se llena el búfer de registro, cada copia de base de datos genera, inspecciona y crea el siguiente archivo de registro en la secuencia de generación.

Replicación continua, modo de archivo

En el modo de archivo, los archivos de registro de transacciones cerradas se transfieren de la copia de bases de datos activa a una o más copias de bases de datos pasivas.

Grupo de disponibilidad de base de datos

Un grupo de hasta 16 servidores de Exchange que hospeda un conjunto de bases de datos replicadas.

Movilidad de la base de datos

La capacidad de una Exchange Server base de datos de buzón de correo que se va a replicar y montar en otros servidores de Exchange.

Datacenter

Normalmente, esto se refiere a un sitio de Active Directory, aunque también puede referirse a un sitio físico. En el contexto de esta documentación, el centro de datos equivale al sitio de Active Directory.

Modo de coordinación de activación de centros de datos

Propiedad de la configuración del DAG que, cuando está habilitada, fuerza al servicio de replicación de Microsoft Exchange a que adquiera permisos para montar bases de datos en el inicio.

Recuperación ante desastres

Cualquier proceso que sirve para recuperarse manualmente de un error. Puede tratarse de un error que afecta a un único elemento o a toda la ubicación física.

API de replicación de terceros de Exchange

API que Exchange suministra y que permite usar la replicación sincrónica de terceros para un DAG en lugar de la replicación continua.

Alta disponibilidad

Solución que ofrece disponibilidad de servicio, disponibilidad de datos y recuperación automática de los errores que afectan al servicio o a los datos (como un error de red, de almacenamiento o de servidor).

Implementación incremental

La capacidad de implementar la alta disponibilidad y la resistencia del sitio después de instalar Exchange Server.

Copia de base de datos de buzones de correo con retardo

Copia pasiva de una base de datos de buzones de correo que presenta un tiempo de retardo de reproducción de registro superior a cero.

Copia de base de datos de buzones de correo

Base de datos de buzones de correo (archivo .edb y registros), ya sea en estado activo o pasivo.

Resistencia de buzón

Nombre de una solución unificada de alta disponibilidad y resistencia del sitio en Exchange Server.

Disponibilidad administrada

Conjunto de procesos internos que consta de sondeos, monitores y respondedores que incorporan la supervisión y la alta disponibilidad en todos los roles de servidor y protocolos.

*sobre (pronunciada "estrella sobre")

Abreviatura para conmutaciones y conmutaciones por error. Un cambio consiste en la activación manual de una o varias copias de bases de datos. Una conmutación por error consiste en la activación automática de una o varias copias de bases de datos después de un error.

Red de seguridad

Anteriormente conocida como contenedor de transporte, se trata de una característica del servicio de transporte que almacena una copia de todos los mensajes durante X días. La configuración predeterminada es 2 días.

Redundancia de instantánea

Característica de servidor de transporte que proporciona redundancia de mensajes para todo el tiempo que estos están en tránsito.

Resistencia de sitios

Configuración que amplía la infraestructura de mensajería a varios sitios de Active Directory para proporcionar una continuidad operativa al sistema de mensajería en el caso de que un error afecte a alguno de los sitios.

Grupos de disponibilidad de base de datos

Un DAG es el componente base del marco de alta disponibilidad y resistencia del sitio integrado en Exchange Server. Un DAG es un grupo de hasta 16 servidores de Exchange que hospeda un conjunto de bases de datos y proporciona recuperación automática a nivel de base de datos de errores que afectan a bases de datos, redes o servidores individuales. Cualquier servidor en un DAG puede hospedar una copia de una base de datos de buzones de correo de cualquier otro servidor en el DAG. Cuando se agrega un servidor a un DAG, funciona con otros servidores en el DAG para proporcionar recuperación automática de errores que afectan a las bases de datos de buzones de correo, como un error de disco o de servidor. Para obtener más información sobre los DAG, vea Database availability groups.

Copias de bases de datos de buzones de correo

Las características de alta disponibilidad y resistencia del sitio usadas por primera vez en Exchange 2010 se usan en Exchange Server para crear y mantener copias de base de datos. Exchange Server también aprovecha el concepto de movilidad de base de datos, que es conmutación por error de nivel de base de datos administrada por Exchange.

La movilidad de la base de datos desconecta las bases de datos de los servidores y agrega compatibilidad para un máximo de 16 copias de una sola base de datos. También proporciona una experiencia nativa para crear copias de una base de datos.

La configuración de una copia de base de datos como base de datos de buzón activa se conoce como cambio. Cuando se produce un error que afecta a una base de datos o al acceso a una base de datos y una nueva base de datos se convierte en la copia activa, este proceso se conoce como conmutación por error. Este proceso también hace referencia a un error de servidor en el que uno o más servidores conectan las bases de datos que el servidor con el error se encargaba de conectar anteriormente. Cuando se produce una conmutación por error o una conmutación por error, otros servidores de Exchange tienen en cuenta el cambio casi inmediatamente y redirigen el tráfico de cliente y mensajería a la nueva base de datos activa.

Por ejemplo, si se produce un error en una base de datos activa en un DAG debido a un error de almacenamiento subyacente, Active Manager se recuperará automáticamente conmutando por error a una copia de base de datos en otro servidor del DAG. En Exchange Server, la disponibilidad administrada proporciona comportamientos para recuperarse de la pérdida de acceso de protocolo a una base de datos, incluido el reciclaje de grupos de trabajo de aplicaciones, el reinicio de servicios y servidores e inicio de conmutaciones por error de base de datos.

Para obtener más información acerca de las copias de bases de datos de buzones de correo, vea Copias de bases de datos de buzones de correo.

Active Manager

Exchange Server aprovecha Active Manager para administrar el estado de copia de la base de datos y la base de datos, el estado, la replicación continua y otros aspectos de alta disponibilidad. Para obtener más información acerca de Active Manager, consulte Active Manager.

Resistencia de sitios

En Exchange 2010, podría implementar un DAG en dos centros de datos y hospedar el testigo en una tercera base de datos para habilitar la conmutación por error para el rol de servidor Buzón de correo para cualquiera de los centros de datos. Pero no se ha realizado la conmutación por error de la propia solución porque el espacio de nombres todavía tenía que cambiarse manualmente para los roles de servidor que no son de buzón.

En Exchange 2016 y Exchange 2019, el espacio de nombres no necesita moverse con el DAG. Exchange aprovecha la tolerancia a errores incorporada en el espacio de nombre mediante el equilibrio de cargas de varias direcciones IP (y, de ser necesario, la capacidad de poner a los servidores fuera de servicio y en funcionamiento). Los clientes HTTP modernos funcionan con esta redundancia de manera automática. La pila HTTP puede aceptar varias direcciones IP para un nombre de dominio completo (FQDN) y, si la primera dirección IP que prueba tiene un error permanente (es decir, no se puede conectar), probará con la próxima dirección IP en la lista. En los errores temporales (la conexión se pierde después de que se establece la sesión, quizás debido a un error intermitente en el servicio en el que, por ejemplo, un dispositivo deja paquetes y debe colocarse fuera de servicio), es posible que el usuario deba actualizar el explorador.

Esto significa que el espacio de nombres ya no es un punto único de error, como sucedía en Exchange 2010. En Exchange 2010, el mayor punto único de error en el sistema de mensajería es posiblemente el FQDN que se proporciona a los usuarios porque les dice dónde ir. En el paradigma de Exchange 2010, cambiar el destino al que el FQDN se dirige no es sencillo porque se debe cambiar el DNS y, luego, controlar la latencia de DNS, lo que, en algunas partes del mundo, representa todo un desafío. También se deben administrar las cachés de nombres en los exploradores, lo que suele tardar aproximadamente 30 minutos.

En Exchange Server, los clientes tienen más de un lugar donde ir. Casi todos los protocolos de acceso de cliente de Exchange Server se basan en HTTP. Algunos ejemplos son Outlook, EAS, EWS, Outlook en la Web y EAC). Todos los clientes HTTP admitidos tienen la capacidad de usar varias direcciones IP, lo que proporciona conmutación por error en el lado cliente. Puede configurar DNS para entregar varias direcciones IP a un cliente durante la resolución de nombres. El cliente solicita mail.contoso.com y obtiene, por ejemplo, dos o cuatro direcciones IP. Sin embargo, el cliente usará muchas de las direcciones IP que obtiene de forma confiable. Esto hace que el cliente sea mucho mejor porque, si se produce un error en una de las direcciones IP, el cliente tiene una o más direcciones IP alternativas a las que intentar conectarse. Si el cliente prueba una y genera un error, espera unos 20 segundos y, a continuación, prueba la siguiente de la lista. Por lo tanto, si pierde la VIP de la matriz de servicios de acceso de cliente, la recuperación de los clientes se produce automáticamente y en unos 21 segundos.

Entre las ventajas se incluye lo siguiente:

  • En Exchange Server, si pierde el equilibrador de carga en el sitio principal, simplemente apáguelo (o tal vez desactive la VIP) y repárelo o reemplácelo. Los clientes que aún no están usando el VIP en el centro de datos secundario realizarán una conmutación por error automática al VIP secundario sin cambiar el espacio de nombre ni realizar cambios en el DNS. Esto no solo significa que ya no deberá realizar un cambio, sino también que no volverá a perder el tiempo que normalmente perdía con la recuperación del cambio de un centro de datos. En Exchange 2010, debía controlar la latencia de DNS (por lo que se recomendaba establecer el Valor del período de vida (TTL) en 5 minutos, y la introducción de la URL de conmutación por recuperación). En Exchange 2016 y Exchange 2019, no es necesario hacerlo porque obtiene una conmutación por error rápida (20 segundos) del espacio de nombres entre VIP (centros de datos).

  • Dado que puede realizar la conmutación por error del espacio de nombre entre centros de datos, lo único que se necesita para lograr una conmutación por error del centro de datos es un mecanismo para la conmutación por error del rol del servidor Buzón de correo en centros de datos. Para obtener una conmutación por error automática para el DAG, simplemente cree una solución donde el DAG se divida en partes iguales entre dos centros de datos y, luego, coloque el servidor testigo en una tercera ubicación para que los miembros del DAG puedan arbitrarla en cualquier centro de datos, independientemente del estado de la red entre los centros de datos que contienen los miembros del DAG. Si solo tiene dos centros de datos y no dispone de una tercera la ubicación física, puede colocar el servidor testigo en una máquina virtual de Microsoft Azure. Vea Usar una máquina virtual de Microsoft Azure como un servidor testigo del DAG para más información.

  • En este escenario, los esfuerzos del administrador se enfocan simplemente en solucionar el problema y no se desperdician restaurando el servicio. Simplemente, se arregla el error, mientras el servicio continúa funcionando y se mantiene la integridad de los datos. La urgencia y el nivel de estrés que se sienten cuando se arregla un dispositivo dañado no se comparan con la urgencia y el nivel de estrés que se sienten cuando se trabaja para restaurar el servicio. Es mejor para el usuario final y menos estresante para el administrador.

Puede permitir que se produzcan conmutaciones por error sin tener que realizar retrocesos (a veces denominados conmutaciones por recuperación de manera incorrecta). Si pierde servidores en el centro de datos principal, lo que da lugar a una interrupción de 20 segundos para los clientes, es posible que ni siquiera le importe la conmutación por recuperación. En este caso, su principal preocupación sería solucionar el problema principal (por ejemplo, reemplazar el equilibrador de carga erróneo). Una vez que esté de nuevo en línea y en funcionamiento, algunos clientes empezarán a usarlo y otros pueden permanecer operativos en el segundo centro de datos.

Exchange Server también proporciona funcionalidad que permite a los administradores hacer frente a errores intermitentes. Un error intermitente es aquel en el que, por ejemplo, se puede establecer la conexión TCP, pero no ocurre nada después. Los errores intermitentes requieren realizar algún tipo de acción administrativa adicional porque pueden derivarse de un dispositivo de reemplazo que se ha puesto en funcionamiento. Mientras se produce el proceso de reparación, el dispositivo puede estar encendido y aceptar algunas solicitudes, pero puede que no esté listo del todo para prestar servicio a los clientes hasta que se realicen los pasos de configuración necesarios. En esta situación, el administrador puede realizar un cambio de espacio de nombres con tan solo quitar el VIP del dispositivo que se va a reemplazar del DNS. De este modo, durante ese período de servicio, ningún cliente intentará conectarse a él. Después de completarse el proceso de reemplazo, el administrador puede volver a agregar el VIP al DNS y los clientes podrán empezar a usarlo.

Para obtener más información sobre cómo planear e implementar la resistencia del sitio, consulte Planeamiento de la alta disponibilidad y resistencia del sitio e Implementación de la alta disponibilidad y resistencia del sitio.

API de replicación de terceros

Exchange Server incluye una API de replicación de terceros que permite a las organizaciones usar soluciones de replicación sincrónica de terceros en lugar de la característica de replicación continua integrada. Microsoft admite soluciones de otros fabricantes que usen esta API, siempre y cuando la solución aporte las funciones necesarias para reemplazar todas las características de replicación continua que se deshabilitan debido al uso de la API. Las soluciones se admiten únicamente si la API se usa con un DAG para administrar y activar copias de bases de datos de buzones de correo. No se admite el uso de la API fuera de estos límites. Además, la solución debe cumplir los requisitos aplicables de compatibilidad de hardware de Windows. (No se requiere la validación de la prueba para la compatibilidad).

Al implementar una solución que usa la replicación integrada de otros fabricantes, debe comprobarse que el proveedor de dicha solución sea el responsable principal de la compatibilidad de la solución. Microsoft admite datos de Exchange para soluciones replicadas y no replicadas. Las soluciones que usan la replicación de datos deben cumplir la directiva de soporte técnico de Microsoft para la replicación de datos. Además, las soluciones que usan el modelo de recurso de clúster de conmutación por error de Windows deben cumplir los requisitos de compatibilidad de clúster de Windows especificados en el artículo de Microsoft Knowledge Base 943984, Directiva de compatibilidad de Microsoft para clústeres de conmutación por error de Windows Server 2008 o Windows Server 2008 R2 o Directiva de compatibilidad de Microsoft para clústeres de conmutación por error de Windows Server 2012.

La directiva de compatibilidad de restauración y copia de seguridad de Microsoft para implementaciones que usan soluciones basadas en API de replicaciones de terceros es la misma que la aplicada en implementaciones de replicaciones continuas nativas.

Si es un socio y busca información sobre la API de replicación de terceros, póngase en contacto con su representante de Microsoft.

Documentación de alta disponibilidad y resistencia de sitios

La tabla siguiente contiene vínculos a temas que le ayudarán a obtener información y administrar los DAG, las copias de base de datos de buzones y la copia de seguridad y restauración para Exchange Server.

Tema Descripción
Grupos de disponibilidad de base de datos Obtener más información acerca de DAG, Active Manager, el modo de coordinación de activación de centros de datos (DAC) y las copias de bases de datos de buzones de correo.
Planear la alta disponibilidad y la resistencia del sitio Obtenga más información acerca de aspectos generales, hardware, redes, software, servidores testigo y otros requisitos y procedimientos recomendados para DAG.
Implementación de alta disponibilidad y resistencia de sitios Consultar un escenario de implementación de ejemplo para implementar y configurar DAG.
Administración de alta disponibilidad y resistencia de sitios Obtener más información acerca de las tareas de administración de DAG, cambios y conmutaciones por error y el modo de mantenimiento.
Supervisión de grupos de disponibilidad de base de datos Obtener más información sobre los scripts y cmdlets integrados para supervisar DAG y copias de base de datos.
Copia de seguridad, restauración y recuperación ante desastres Obtener más información acerca de la creación de copias de seguridad y restauración de bases de datos de Exchange, bases de datos de recuperación y la recuperación del servidor.