Administración de información empresarial mediante SSIS, MDS y DQS

La administración de información en una empresa suele implicar la integración de datos procedentes de la empresa y externos, la limpieza de datos, la búsqueda de coincidencias en los datos para quitar duplicados, la normalización de los datos, el enriquecimiento de los datos, hacer que los datos cumplan los requisitos legales y de cumplimiento, y su almacenamiento posterior en una ubicación centralizada con todas las configuraciones de seguridad necesarias.

SQL Server 2012 proporciona todos los componentes necesarios para lograr una solución eficiente de Administración de información empresarial (EIM) en un único producto. Los componentes clave SQL Server 2012 que ayudan a crear una solución de EIM son los siguientes:

  • SQL Server Integration Services

  • SQL Server Data Quality Services

  • SQL Server Master Data Services

SQL Server Integration Services (SSIS) proporciona una plataforma extensible y eficaz para la integración de datos procedentes de diversos orígenes en una solución completa de extracción, transformación y carga (ETL) que admite flujos de trabajo empresariales, un almacenamiento de datos o administración de datos maestros. Vea el tema Información general (Integration Services) para obtener información general rápida y conocer los usos típicos de SSIS.

SQL Server Data Quality Services (DQS) permite limpiar, buscar coincidencias, normalizar y enriquecer los datos, de forma que pueda entregar información de confianza para Business Intelligence, un almacenamiento de datos y cargas de trabajo de procesamiento de transacciones. Vea el tema Introducción a Data Quality Services para conocer las necesidades empresariales de DQS y cómo responde DQS a esas necesidades.

SQL Server Master Data Services (MDS) proporciona un concentrador central de datos que garantiza que la integridad de la información y la coherencia de los datos es constante en las diferentes aplicaciones. Vea el tema Introducción a Master Data Services para ver descripciones breves de las características principales de MDS.

Vea las notas del producto Administración de información empresarial con SQL Server 2012 y Limpiar y buscar coincidencias de datos maestros con las tecnologías EIM para obtener instrucciones completas sobre la implementación de una solución EIM usando conjuntamente estas tecnologías EIM de Microsoft y vea el vídeo Administración de información empresarial (EIM): usar conjuntamente SSIS, DQS y MDS para ver una buen demostración de un escenario EIM.

En este tutorial, aprenderá a usar conjuntamente SSIS, MDS y DQS para implementar una solución de ejemplo de Administración de información empresaria (EIM). Primero usará DQS para crear una base de conocimiento que contenga conocimiento sobre los datos de proveedor (metadatos), limpiar los datos de un archivo de Excel con la base de conocimiento, y buscar coincidencias en los datos para identificar y quitar duplicados en los datos. Después usará el complemento MDS para Excel con el fin de cargar los datos limpios y coincidentes en MDS. A continuación, automatizará todo el proceso mediante una solución de SSIS. La solución de SSIS de este tutorial lee los datos de entrada de un archivo de Excel, pero puede ampliarla para que lea de diversos orígenes como Oracle, Teradata, DB2 y Base de datos SQL de Windows Azure.

Requisitos previos

  1. Microsoft SQL Server 2012 con los siguientes componentes instalados.

    1. Integration Services (SSIS)

    2. Master Data Services (MDS)

    3. Data Quality Services (DQS)

    4. SQL Server Data Tools

      Vea Instalación de SQL Server 2012 para obtener detalles sobre la instalación del producto.

  2. Configure MDS con el Administrador de configuración de Master Data Services.

    Use el Administrador de configuración para crear y configurar una base de datos de Master Data Services. Después de crear la base de datos de MDS, cree una aplicación web para MDS en un sitio web (por ejemplo: https://localhost/MDS) y asocie la base de datos de MDS a la aplicación web de MDS. Tenga en cuenta que, para crear una aplicación web de MDS, debe tener instalado IIS en el equipo. Vea Requisitos de la aplicación web (Master Data Services) y Requisitos de base de datos (Master Data Services) para obtener más información sobre los requisitos previos para configurar la base de datos y la aplicación web de MDS.

  3. Instale y configure DQS con el instalador de Data Quality Server. Haga clic sucesivamente en Inicio, Todos los programas, Microsoft SQL Server 2012, Data Quality Services e Instalador de Data Quality Server.

  4. Microsoft Excel 2010 (preferiblemente de 32 bits).

  5. Instale Complemento Master Data Services para Excel (de 32 bits o de 64 bits según la versión de Excel que tenga en el equipo) desde aquí. Para averiguar la versión de Excel instalada en el equipo, ejecute Excel, haga clic en Archivo en la barra de menús y, a continuación, haga clic en Ayuda para ver la versión en el panel derecho. Tenga en cuenta que necesita instalar Visual Studio 2010 Tools para Office Runtime antes de instalar el complemento de Excel.

  6. (Opcional) Cree una cuenta con Windows Azure Marketplace. Una de las tareas del tutorial requiere tener una cuenta de Azure Marketplace (denominado originalmente Data Market). Puede omitir esta tarea si lo desea y continuar con la tarea siguiente.

  7. Descargue el archivo Suppliers.xls desde el Centro de descarga de Microsoft

  8. DQS no permite exportar los resultados de la limpieza o de coincidencia a un archivo de Excel si está usando la versión de 64 bits de Excel. Se trata de un problema conocido. Para solucionar temporalmente este problema, haga lo siguiente:

    1. Instale SQL Server 2012 SP1 (en equipos de 64 bits con Excel de 64 bits).

    2. Ejecute DQLInstaller.exe –upgrade. Si instaló la instancia predeterminada de SQL Server, el archivo DQSInstaller.exe está disponible en C:\Archivos de programa\Microsoft SQL Server\MSSQL11.MSSQLSERVER\MSSQL\Binn. Haga doble clic en el archivo DQSInstaller.exe.

    3. En Administrador de configuración de Master Data Services, haga clic en Seleccionar base de datos, seleccione la base de datos de MDS existente y haga clic en Actualizar.

Lecciones

Lección

Descripción breve

Tiempo estimado para completarla (en minutos).

Lección 1: crear la base de conocimiento de DQS Proveedores

En esta lección, creará una base de conocimiento de DQS denominada Proveedores.

60

Lección 2: limpiar datos de proveedor con la base de conocimiento Proveedores

En esta lección, creará y ejecutará un proyecto de DQS para limpiar los datos de proveedor de un archivo de Excel usando la base de conocimiento Proveedores que creó en la primera lección.

45

Lección 3: buscar datos coincidentes para quitar duplicados de lista de proveedores

En esta lección, creará un proyecto de DQS para realizar la actividad de coincidencia con el fin de identificar y quitar duplicados de la lista limpia de proveedores.

45

Lección 4: almacenar datos de proveedor en MDS

En esta lección, cargará los datos limpios y coincidentes de proveedor en Master Data Services (MDS) con el Complemento MDS para Excel.

45

Lección 5: automatizar la limpieza y la búsqueda de coincidencias con SSIS

En esta lección, creará una solución de SSIS que limpia los datos de entrada con DQS, busca coincidencias en los datos limpios para quitar duplicados, y almacena los datos limpios y coincidentes en MDS de forma automatizada.

75

Pasos siguientes

Para comenzar el tutorial, vaya a la primera lección: Lección 1: crear la base de conocimiento de DQS Proveedores.