Almacenamiento de datos e informes

La replicación se utiliza con frecuencia en las aplicaciones de almacenamiento de datos e informes para:

  • Consolidar los datos y poder transformarlos y moverlos al entorno de almacenamiento de datos.

  • Distribuir los datos a bases de datos de sólo lectura para los informes.

  • Distribuir datos a una base de datos de proceso analítico en línea (OLAP).

Aunque la replicación no replica objetos de Microsoft SQL Server 2008 Analysis Services (SSAS) (como dimensiones o cubos), se utiliza con frecuencia para distribuir datos de las bases de datos de proceso de transacciones en línea (OLTP) a bases de datos de ensayo y a las bases de datos que se utilizan para informes, ayuda para la toma de decisiones y análisis.

En el diagrama siguiente se muestra un caso típico, en el que los datos se replican de un servidor de proceso en línea a un servidor de informes y a un servidor de ensayo para el análisis OLAP y ROLAP.

Replicar datos en un servidor de informes

Ejemplo de Adventure Works Cycles

Adventure Works Cycles es una compañía ficticia que se utiliza para mostrar situaciones y conceptos de bases de datos. Para obtener más información, vea Bases de datos de ejemplo AdventureWorks.

Adventure Works Cycles utiliza el almacenamiento de datos y los informes en varios departamentos, como Fabricación y Recursos humanos.

El departamento de fabricación almacena datos históricos de los defectos de fabricación y otros parámetros de calidad y rendimiento. Los datos se replican de los servidores de la planta de fabricación a un servidor de ensayo en la oficina principal de la compañía. Desde ahí, los datos se transforman y se cargan en cubos OLAP para su análisis.

En la actualidad, el departamento de recursos humanos genera informes con una aplicación de otro fabricante, aunque tienen previsto sustituir esta aplicación por Reporting Services. También les gustaría ampliar sus capacidades de informes y agregar la capacidad de realizar los siguientes tipos de análisis:

  • Análisis de compensaciones y beneficios, incluido el impacto de las tasas de cambio de moneda internacionales.

  • Planes de plantilla.

  • Simulaciones y previsiones de costos de plantilla.

Pondrán en línea un nuevo servidor para controlar el aumento de la necesidad de informes en toda la compañía. Los datos se replicarán desde el departamento de recursos humanos y otros departamentos a este servidor de informes central de sólo lectura.

Requisitos comunes para este escenario

Las aplicaciones de almacenamiento de datos e informes tienen por lo general los siguientes requisitos, que debe una solución de replicación apropiada debe cubrir:

  • El sistema debe mantener una coherencia transaccional.

  • El sistema debe tener una latencia baja: las actualizaciones en el servidor de procesamiento en línea deberían llegar al servidor de ensayo y al de informes con rapidez.

  • El sistema debe tener un rendimiento alto: debe controlar la replicación de un gran número de transacciones.

  • El proceso de replicación debe producir una sobrecarga mínima en el servidor de procesamiento en línea.

  • Los cambios de datos fluyen en una dirección: del servidor de proceso en línea a los servidores de ensayo y de informes.

  • Los datos necesarios en los servidores de ensayo y de informes pueden ser un subconjunto de los datos disponibles en el servidor de proceso en línea.

Tipo de replicación que se utiliza en este escenario

SQL Server utiliza una metáfora de la industria de la publicación para describir los componentes del sistema de replicación. Los componentes incluyen el publicador, los suscriptores, las publicaciones y artículos, y las suscripciones.

En el diagrama anterior, el servidor de proceso en línea es el publicador. Algunos o todos los datos del servidor de proceso en línea están incluidos en dos publicaciones (una para ensayo y otra para informes) y cada tabla de datos es un artículo (los artículos también pueden ser otros objetos de base de datos, como procedimientos almacenados). El servidor de ensayo y el servidor de informes son suscriptores de una de las publicaciones, y cada servidor recibe esquemas y datos como una suscripción. Para obtener más información acerca de los componentes del sistema, vea Información general del modelo de publicación de replicación.

SQL Server ofrece diferentes tipos de replicación para distintos requisitos de aplicación: replicación de instantáneas, replicación transaccional y replicación de mezcla. La mejor implementación para este escenario es la replicación transaccional, que se adapta perfectamente para controlar los requisitos indicados en la sección anterior. Para obtener más información sobre la replicación transaccional, vea Información general de la replicación transaccional y Cómo funciona la replicación transaccional.

Por diseño, la replicación transaccional satisface los requisitos principales de este escenario:

  • Coherencia transaccional

  • Latencia baja

  • Rendimiento alto

  • Sobrecarga mínima

La opción principal que hay que considerar para este escenario es el filtrado. La replicación transaccional permite filtrar columnas y filas, de forma que las tablas de los servidores de ensayo y de informes contengan sólo los datos requeridos por la aplicación. Para obtener más información, vea Filtrar datos publicados.

Pasos para implementar este escenario

Para implementar este escenario, debe crear primero una publicación y suscripciones y, a continuación, inicializar cada suscripción. Haga clic en los vínculos siguientes para obtener más información acerca de cada paso:

Cuando la suscripción se haya inicializado y los datos fluyan entre el publicador y los suscriptores, es posible que necesite consultar los siguientes temas para obtener información sobre tareas habituales de administración y supervisión: