Share via


Descripción general de las tecnologías de almacenamiento

 

Última modificación del tema: 2006-05-08

Para mejorar la disponibilidad de la organización de Exchange 2003, su solución de almacenamiento de servicios de fondo de Exchange debe estar respaldada por un subsistema de almacenamiento redundante. Cuando diseñe la solución de almacenamiento, familiarícese con las siguientes tecnologías relacionadas con el almacenamiento:

  • Niveles de RAID   Implementaciones de matrices de discos que ofrecen distintos niveles de rendimiento y tolerancia a errores.
  • Soluciones SAN   Ofrecen almacenamiento de datos centralizado mediante una red de alta velocidad.
  • Soluciones de almacenamiento conectadas en red   Almacenamiento que se conecta directamente a los servidores mediante conexiones de red existentes.
  • Tecnologías de replicación   Soluciones que utilizan tecnologías de replicación sincrónica y asincrónica de datos para replicar datos dentro de un sitio (mediante redes SAN y LAN) o en otro sitio diferente (mediante LAN virtuales).

Las soluciones de almacenamiento SAN y conectadas en red suelen incorporar tecnologías RAID. Puede configurar los discos del dispositivo de almacenamiento para que utilicen un nivel de RAID adecuado a sus necesidades de rendimiento y tolerancia a errores. Utilice la información de las secciones siguientes para comparar y contrastar estas tecnologías de almacenamiento.

Importante

En general se recomienda que utilice una solución de almacenamiento en disco de dispositivo de almacenamiento de acceso directo (DASD) o conectado a una SAN porque estas configuraciones optimizan el rendimiento y la confiabilidad de Exchange 2003. Microsoft no ofrece soporte técnico para el uso de soluciones de almacenamiento conectadas en red a menos que cumplan determinados requisitos de Windows.

Nota

Para obtener información acerca de las soluciones de almacenamiento SAN y conectadas en red, consulte en Microsoft Knowledge Base el artículo 328879, "Using Exchange Server with Storage Attached Network and network-attached storage devices" (en inglés).

Antes de implementar una solución de almacenamiento para las bases de datos de Exchange 2003, confirme con su proveedor que dicha solución está diseñada para Exchange 2003. Muchos proveedores disponen de guías de recomendaciones para Exchange.

Descripción general de RAID

Al utilizar una solución de RAID, puede ampliar la tolerancia a errores de la organización de Exchange. En una configuración de RAID, parte de la capacidad de almacenamiento físico contiene información redundante sobre los datos almacenados en los discos duros. La información redundante es información de paridad (en el caso de un volumen de RAID-5) o una copia completa y diferente de los datos (en el caso de un volumen de reflejo). Si se produce un error en uno de los discos o en la ruta de acceso, o si no se puede leer un sector del disco, la información redundante permite regenerar los datos.

Nota

Puede implementar soluciones de RAID en el sistema host (RAID de software) o en la matriz de almacenamiento externo (RAID de hardware). En general, ambas soluciones aportan ventajas similares en cuanto a confiabilidad. Sin embargo, RAID de software aumenta la carga de procesamiento de la CPU en el servidor host. En esta sección se supone que utiliza una solución de RAID de hardware, no de software. Para obtener información acerca de cómo utilizar RAID de software con Microsoft Windows Server™ 2003, consulte la Ayuda de Windows Server 2003.

Para comprobar que los servidores de Exchange seguirán funcionando correctamente en caso de que se produzca un error en un disco, puede utilizar el reflejo de disco o el seccionado de disco con paridad en los discos duros. Con el reflejo de disco y el seccionado de disco con paridad, puede crear datos redundantes de los datos de los discos duros.

Aunque el reflejo de disco crea volúmenes duplicados que pueden continuar funcionando si uno de los reflejos experimenta errores, el reflejo de disco no impide que los archivos dañados (u otros errores de los archivos) se registren en los dos reflejos. Por este motivo, no debe utilizar el reflejo de disco como alternativa al mantenimiento de las actuales copias de seguridad de los datos importantes de los servidores.

Nota

Cuando se utilizan técnicas de redundancia, como la paridad, se sacrifica en parte el rendimiento de E/S del disco duro en aras de la tolerancia a errores.

Puesto que los archivos de base de datos y los archivos de registro de transacciones son críticos para el funcionamiento de un servidor de Exchange, debe mantener los archivos de base de datos y los archivos de registro de transacciones del grupo de almacenamiento de Exchange en unidades físicas diferentes. También puede utilizar el reflejo de disco o el seccionado de disco con paridad para impedir que la pérdida de un solo disco duro físico ocasione errores en una parte del sistema de mensajería. Para obtener más información acerca del reflejo de disco y el seccionado de disco con paridad, consulte “Achieving Fault Tolerance by Using RAID” en el Kit de implementación de Windows Server 2003 (en inglés).

Para implementar una configuración de RAID, se recomienda que sólo utilice un producto RAID de hardware en lugar de características de disco dinámico tolerantes a errores de software.

En las secciones siguientes se explican las principales implementaciones de RAID: RAID-0, RAID-1, RAID-0+1 y RAID-5. Aunque existen muchas otras implementaciones de RAID, estos cuatro tipos constituyen una buena representación del alcance total de las soluciones de RAID.

RAID-0

RAID-0 es una matriz de discos seccionados. Cada disco está dividido de forma lógica de modo que una “sección” abarca todos los discos de la matriz para crear una única partición lógica. Por ejemplo, si un archivo se guarda en toda una matriz RAID-0 y la aplicación que está guardando el archivo está almacenada en la unidad D, la matriz RAID-0 distribuye el archivo por la unidad lógica D. En este ejemplo, el archivo abarca los seis discos.

2687677a-8ce3-433b-845b-16098951fdc2

Desde una perspectiva de rendimiento, RAID-0 es la tecnología de RAID más eficiente, ya que puede escribir en los seis discos simultáneamente. Cuando todos los discos contienen los datos de la aplicación, se obtiene la máxima eficacia en la utilización de los discos.

La desventaja de RAID-0 es su falta de tolerancia a errores. Si las bases de datos de los buzones de Exchange se guardan en una matriz RAID-0 y uno de los discos experimenta errores, debe restaurar las bases de datos de los buzones en una matriz de disco en funcionamiento y restaurar los archivos de registro de transacciones. Además, si almacena los archivos de registro de transacciones en esta matriz y pierde un disco, sólo puede realizar la restauración hasta un momento dado de las bases de datos de buzones a partir de la última copia de seguridad.

RAID-0 no resulta una solución recomendable en Exchange.

RAID-1

RAID-1 es una matriz de disco reflejado en la que se reflejan dos discos.

68d4f8a0-17e3-4183-9ffb-ae6eca3581c4

RAID-1 es la más confiable de las tres matrices RAID, puesto que todos los datos se reflejan cuando se escriben. Sólo puede utilizar la mitad del espacio de almacenamiento de los discos. Aunque esto puede resultar poco eficaz, RAID-1 es la opción preferida para los datos que requieren la mayor confiabilidad posible.

RAID-0+1

Si su objetivo es lograr una alta confiabilidad y el máximo rendimiento para los datos, considere la posibilidad de utilizar RAID-0+1. RAID-0+1 ofrece alto rendimiento ya que utiliza las ventajas de seccionado de RAID-0, al tiempo que garantiza la redundancia al utilizar las ventajas de reflejo de discos de RAID-1.

e519ecd7-b74b-409a-ab02-9fe283e80ed7

En una matriz de disco RAID-0+1 los datos se reflejan en los dos conjuntos de disco (RAID-1) y, a continuación, se seccionan entre las unidades (RAID-0). Todos los discos físicos están duplicados en la matriz. Si tiene una matriz RAID-0+1 de seis discos, tres de los discos estarán disponibles para el almacenamiento de datos.

RAID-5

RAID-5 es una matriz de discos seccionados similar a RAID-0 en el sentido de que los datos se distribuyen en toda la matriz. Sin embargo, RAID-5 incluye también paridad. Hay un mecanismo que mantiene la integridad de los datos almacenados en la matriz de forma que, si se producen errores en uno de los discos de la matriz, se puedan reconstruir los datos a partir de los discos restantes. Por tanto, RAID-5 es una solución de almacenamiento confiable.

978020d4-cfcb-4e13-8f30-895de517f188

Sin embargo, para mantener la paridad entre los discos, se sacrifica 1/n del espacio en disco (donde n es igual al número de unidades de la matriz). Por ejemplo, si tiene seis discos de 9GB, tiene 45 GB de espacio de almacenamiento utilizable. Para mantener la paridad, una escritura de datos se traduce en dos escrituras y dos lecturas de la matriz RAID-5. Por tanto, el rendimiento global disminuye.

La ventaja de una solución de RAID-5 es que es confiable y utiliza el espacio en disco de forma más eficaz que RAID-1 y RAID-0+1.

Consideración de las soluciones de RAID

A la hora de diseñar una solución de RAID, debe tener en cuenta el rendimiento, la confiabilidad, la capacidad de disco y el costo. Si bien el costo y la capacidad son importantes, las principales consideraciones son el rendimiento y la confiabilidad del sistema de almacenamiento.

En la tabla siguiente se compara el costo y la confiabilidad de las cuatro soluciones de RAID diferentes.

Comparación del costo y la confiabilidad de las soluciones de RAID

Solución de RAID Número de unidades Costo Confiabilidad

RAID-0

10 discos de 9 GB

Alta

Baja

RAID-1

2 discos de 45 GB

Baja

Baja

RAID-0+1

20 discos de 9 GB

Muy alta

Muy alta

RAID-5

11 discos de 9 GB

Alta

Alta

  • Costo
    Evalúe el costo calculando el número de discos que necesita para sostener la matriz. La implementación de RAID-0+1 es la más costosa, ya que debe tener el doble de espacio en disco del que realmente se necesita. Sin embargo, esta configuración también produce un rendimiento mucho mayor que la configuración de RAID-5 con la misma capacidad, como se puede observar por la velocidad máxima de lectura y escritura. RAID-1 es la solución menos costosa porque sólo necesita dos unidades de 45 GB para almacenar 90 GB de datos. Sin embargo, el uso de dos discos grandes reduce considerablemente el rendimiento.
  • Confiabilidad y rendimiento
    Calcule la confiabilidad evaluando el impacto que un error en el disco podría tener sobre la integridad de los datos. RAID-0 no implementa ningún tipo de redundancia, de manera que un error en uno de los discos de la matriz RAID-0 requiere una restauración completa de los datos. RAID-0+1 es la solución más confiable de las cuatro porque deben producirse errores en dos o más discos para que se puedan perder datos.

    Evalúe el rendimiento probando exhaustivamente los distintos niveles de RAID en un entorno de prueba. Debe seleccionar el hardware, los niveles de RAID y la configuración de almacenamiento de manera que se cumplan o se superen los niveles de rendimiento exigidos por su organización. Para probar el rendimiento del subsistema de almacenamiento de Exchange, utilice Jetstress y otras herramientas de capacidad de Exchange. Para obtener información acerca de las recomendaciones para lograr los niveles necesarios de rendimiento, confiabilidad y facilidad de recuperación, consulte Recomendaciones para configurar el almacenamiento de servicios de fondo de Exchange.

Soluciones de Red de área de almacenamiento (SAN)

Se recomienda que utilice una SAN para el almacenamiento de los archivos de Exchange. Esta configuración optimiza el rendimiento y la confiabilidad del servidor.

Importante

Se suele recomendar el uso de soluciones de almacenamiento de dispositivo de almacenamiento de acceso directo (DASD) o conectadas a SAN, ya que esta configuración optimiza el rendimiento y la confiabilidad de Exchange. Microsoft no ofrece soporte técnico para las soluciones de almacenamiento conectadas en red a menos que cumplan determinados requisitos del programa Windows Logo. Para obtener información acerca de las soluciones de almacenamiento conectadas en red compatibles, consulte “Soluciones de almacenamiento conectadas en red” más adelante en este tema.

Una SAN proporciona capacidades de almacenamiento y de administración del almacenamiento para los datos de una empresa. Para lograr una conexión rápida y confiable entre el almacenamiento y las aplicaciones, las SAN utilizan la tecnología de conmutación Fibre Channel.

Una red SAN tiene tres áreas de componentes principales:

  • Tecnología de conexión Fibre Channel
  • Matrices de almacenamiento en las que se guardan y se protegen los datos
  • Software de administración de almacenamiento y de SAN

Los proveedores de hardware venden paquetes de SAN completos que incluyen el hardware, el software y el soporte técnico necesarios. El software de SAN administra la redundancia del flujo de datos y de la red al proporcionar varias rutas de acceso a los datos almacenados. Como la tecnología SAN es relativamente nueva y continúa evolucionando rápidamente, puede diseñar e implementar una solución completa de SAN que tenga en cuenta el crecimiento futuro y la aparición de nuevas tecnologías SAN. En última instancia, la tecnología SAN facilita la conectividad entre sistemas de varios proveedores con diferentes sistemas operativos y productos de almacenamiento de distintos proveedores.

bf90c89e-33af-486f-9bbe-6fb39fa5d6cb

Actualmente, las soluciones de SAN son las más adecuadas para las empresas y para los departamentos de Tecnología de la información (IT) que necesitan almacenar grandes volúmenes de datos.

Aunque el costo de implementación puede suponer un obstáculo, una solución de SAN puede ser la mejor opción, ya que a largo plazo el costo total de propiedad (TCO) puede ser menor que el costo del mantenimiento de varias matrices de almacenamiento conectadas directamente. Tenga en cuenta las siguientes ventajas que ofrece una solución de SAN:

  • Si actualmente dispone de varias matrices administradas por varios administradores, la administración centralizada de todos los almacenamientos permite que los administradores puedan realizar otras tareas.
  • En términos de disponibilidad, ninguna otra solución tiene el potencial para ofrecer la confiabilidad flexible y exhaustiva que una solución de SAN respaldada por un proveedor. Es posible que algunas empresas prevean una gran pérdida de ingresos cuando los servicios de colaboración y mensajería no están disponibles. Si su empresa puede sufrir una pérdida de ingresos importante por la no disponibilidad del servicio de mensajería, puede resultar rentable la implementación de una solución de SAN.

Antes de invertir en una SAN, calcule el costo de la solución de almacenamiento actual en cuanto a recursos administrativos y de hardware, y evalúe la necesidad que tiene la empresa de disponer de un almacenamiento confiable.

Cómo beneficia a Exchange una Red de área de almacenamiento

A continuación se muestran las ventajas que supone la implementación de una solución de SAN en la organización de Exchange 2003:

  • Exchange 2003 necesita un elevado ancho de banda de E/S que sólo permite una matriz de almacenamiento conectada a SAN (a veces se denomina conectada al canal). Por el contrario, en las soluciones de almacenamiento de red que dependen del acceso a los archivos de la base de datos de Exchange 2003 a través de una pila de red puede aumentar el riesgo de que se produzcan daños en los datos y pérdidas de rendimiento.
  • Exchange 2003 también necesita que haya almacenes de carpetas públicas y de buzones en una unidad local del servidor de Exchange. Este requisito lo satisfacen las soluciones de SAN que se conectan a los servidores de Exchange a través de una conexión local Fibre Channel. Otras soluciones de almacenamiento que dependen de un redirector de redes para procesar los recursos del disco no satisfacen este requisito.
  • Las redes SAN son altamente escalables, lo que es una consideración importante en Exchange. A medida que los datos de correo aumentan y los límites de los buzones se ven cuestionados continuamente debe ampliar la capacidad de almacenamiento y la velocidad de entrada/salida. Cuando la organización crezca, una SAN le permitirá agregar discos fácilmente.
    Se recomienda que seleccione una solución de SAN que incorpore virtualización del almacenamiento. La virtualización del almacenamiento le permite agregar fácilmente discos y reasignar rápidamente esa capacidad adicional a los servidores de Exchange. Con la virtualización del almacenamiento, puede comprar discos de almacenamiento adicionales de acuerdo con sus requisitos de capacidad y su presupuesto.
  • La naturaleza escalable de las redes SAN también hace posible la ampliación de la organización de Exchange al agregar servidores. Con las redes SAN puede conectar varios servidores de Exchange a varias matrices de almacenamiento y, a continuación, dividir el almacenamiento entre ellas.
  • Mediante el uso de copias de seguridad instantáneas y de reflejo que utilicen el servicio de instantáneas de volumen, la realización de copias de seguridad, la recuperación y la disponibilidad mejorarán con una SAN.
    Para obtener información acerca de cómo puede mejorar la solución de almacenamiento con servicio de instantáneas de volumen, consulte Prácticas recomendadas para utilizar el servicio de instantáneas de volumen con Exchange Server 2003 (en inglés).
  • Las estrategias de replicación que incluyen la replicación de datos de una SAN de un sitio en una SAN de otro sitio diferente permiten proteger los datos de la organización en caso de que se produzca un error en un sitio. Además, si implementa clústeres dispersos geográficamente en coordinación con la estrategia de replicación de sitios, el sistema de mensajería también será operativo.
    Para obtener información acerca de cómo replicar datos en sitios alternativos, consulte “Uso de varios sitios físicos” en Medidas de tolerancia a errores del sistema.
    Para obtener información acerca de la organización en clústeres dispersos geográficamente, consulte “Organización en clústeres dispersos geográficamente” en Consideraciones de diseño de la organización en clústeres.

Soluciones de almacenamiento conectadas en red

El almacenamiento conectado en red se refiere a los productos que utilizan un enfoque de conexión a un servidor para el almacenamiento de datos. En este enfoque, el hardware de almacenamiento se conecta directamente a la red Ethernet mediante conexiones Interfaz estándar de equipos pequeños (SCSI), Fibre Channel o la compatibilidad con SCSI de Internet (iSCSI) agregada recientemente. Un producto de almacenamiento conectado en red es un servidor especializado que contiene un sistema de archivos y almacenamiento escalable. En este modelo, el almacenamiento de datos está descentralizado. El equipo de almacenamiento conectado en red se conecta localmente a los servidores departamentales y, por tanto, sólo los servidores locales pueden tener acceso a los datos.

Para obtener información acerca de iSCSI, consulte el sitio Web de Microsoft Storage Technologies - iSCSI (en inglés).

Para obtener información acerca de iSCSI en Exchange, consulte en Microsoft Knowledge Base el artículo 839686, "Support for iSCSI technology components in Exchange Server" (en inglés).

Importante

Exchange 2003 tiene requisitos de acceso a datos y ancho de banda de E/S que los productos de almacenamiento conectados en red no suelen cumplir. El uso incorrecto del software de Exchange 2003 con un producto de almacenamiento conectado en red puede tener como resultado la pérdida de datos, incluso la pérdida total de las bases de datos.

Para obtener más información acerca de las soluciones de almacenamiento conectadas en red específicas de Exchange 2003, consulte en Microsoft Knowledge Base el artículo 839687, "Microsoft support policy on the use of network-attached storage devices with Exchange Server 2003" (en inglés).

Para obtener información acerca de las soluciones de almacenamiento conectadas en red para Exchange 5.5 y otras versiones posteriores, consulte en Microsoft Knowledge Base el artículo 317173, "Exchange Server and network-attached storage" (en inglés).

Para obtener información acerca de la comparación de las soluciones de almacenamiento SAN y conectadas en red, consulte en Microsoft Knowledge Base el artículo 328879, "Using Exchange Server with Storage Attached Network and network-attached storage devices" (en inglés).

Tecnologías de replicación de datos de Exchange

Si su organización de Exchange debe funcionar continuamente, incluso aunque se produzca un desastre en un sitio, puede mejorar la confiabilidad de los datos de Exchange si implementa tecnologías de replicación de datos que repliquen datos de las aplicaciones en uno o más sitios remotos. Esas tecnologías de replicación de datos le permiten sincronizar las SAN de varios sitios mediante redes IP o de fibra de larga distancia. La replicación que se realiza en estas soluciones es sincrónica o asincrónica.

Para obtener información acerca de cómo puede utilizar varios sitios físicos para agregar redundancia con el fin de proteger los datos de las aplicaciones, consulte “Uso de varios sitios físicos” en Medidas de tolerancia a errores del sistema.

Para obtener información acerca de cómo puede utilizar la replicación de sitios remotos junto con Organización en clústeres de Windows, consulte “Organización en clústeres dispersos geográficamente” en Consideraciones de diseño de la organización en clústeres.

Replicación sincrónica

Las soluciones que incluyen tecnologías de replicación sincrónica pueden ayudarle a conseguir una confiabilidad de los datos del cien por cien. Las tecnologías de replicación sincrónica escriben en ambas plataformas de almacenamiento (el dispositivo de almacenamiento principal y el replicado) antes de informar al sistema operativo de que la escritura se realizó correctamente. Dependiendo de la distancia que haya entre las dos plataformas de almacenamiento, esta latencia puede ser importante (más de 50 milisegundos). Esta mayor latencia crea una carga en el servidor que afecta considerablemente a lo que perciben los clientes de Exchange. En concreto, la elevada latencia de escritura puede ocasionar excesivas colas de llamada a procedimiento remoto (RPC) y puede consumir los 100 subprocesos de RPC (subprocesos que esperan E/S de escritura), lo que causa graves problemas de uso.

Para reducir al mínimo el efecto negativo sobre la facilidad de uso, puede reducir el número de usuarios tanto en el servidor como en la SAN. Por ejemplo, considere una implementación de Exchange que incluya replicación sincrónica donde la carga de usuarios esté limitada a sólo 1.000 usuarios, incluso aunque tanto el servidor como la SAN puedan atender a 4.000. Aunque la replicación sincrónica tiene una alta confiabilidad de datos, no emplea una penalización del rendimiento de escritura de E/S elevada. Esta penalización de escritura de E/S es un factor importante en cuanto al número de usuarios a los que se puede atender en una plataforma dada.

Importante

Las soluciones que utilizan replicación sincrónica pueden mejorarse si se utilizan varios servidores con dos procesadores, en lugar de implementar un modelo consolidado con servidores que tengan cuatro u ocho procesadores. La consolidación de servidores se reduce con las tecnologías de replicación sincrónica.

Replicación asincrónica

La replicación asincrónica no tiene un efecto negativo sobre el rendimiento de los clientes de Exchange porque las escrituras de replicación se realizan después de completarse la escritura en el almacenamiento principal. El problema de la replicación asincrónica de datos es que puede tardar hasta un minuto (varía para cada proveedor de SAN) en completarse la escritura de replicación, lo que aumenta las posibilidades de que se pierdan datos durante un desastre. La replicación asincrónica no tiene penalización de rendimiento en la escritura, pero es menos confiable en cuanto a confiabilidad de los datos.

Importante

Si selecciona un método asincrónico, asegúrese de que los procedimientos de recuperación de desastres estén bien probados. También debe entender que existe la posibilidad de que se pierdan algunos datos durante un desastre. Por esta razón, las soluciones de replicación asincrónica no se recomiendan con clústeres dispersos geográficamente.

Prueba de la replicación de datos

Si selecciona un método sincrónico, como ocurre con la implementación de cualquier subsistema de almacenamiento, implemente la solución de replicación de datos en un entorno de prueba para validar el diseño. La documentación incluida con la herramienta Jetstress contiene información acerca de cómo probar las soluciones de replicación de datos. Para obtener información acerca de Jetstress, consulte Uso de Jetstress para probar el rendimiento de disco.

Puede descargar Jetstress en el sitio Web Herramienta Jetstress de Microsoft Exchange Server (en inglés).