Lección 5: automatizar la limpieza y la búsqueda de coincidencias con SSIS

En la lección 1, generó la base de conocimiento Proveedores, y la usó para limpiar datos en la lección 2 y para buscar datos coincidentes en la lección 3 mediante la herramienta Cliente DQS. En un escenario real, es posible que deba extraer datos de un origen que DQS no admite o que desee automatizar el proceso de limpieza y búsqueda de coincidencias sin tener que usar la herramienta Cliente DQS. SQL Server Integration Services (SSIS) cuenta con componentes que puede usar para integrar datos de diversos orígenes heterogéneos y un componente Transformación Limpieza de DQS para invocar la funcionalidad de limpieza expuesta por DQS. Actualmente, DQS no expone ninguna funcionalidad de búsqueda de coincidencias para que la use SSIS, pero puede emplear la Transformación Agrupación aproximada para identificar duplicados en los datos.

Puede cargar datos en MDS mediante la característica Almacenamiento provisional basado en entidades. Cuando crea una entidad en MDS, se crean automáticamente las tablas de ensayo y los procedimientos almacenados correspondientes. Por ejemplo, cuando creó la entidad Proveedor, se crearon automáticamente la tabla stg.supplier_Leaf y el procedimiento almacenado stg.udp_Supplier_Leaf. Use las tablas de ensayo y los procedimientos para crear, actualizar y eliminar miembros de entidad. En esta lección, creará nuevos miembros para la entidad Proveedor. Para cargar datos en el servidor de MDS, el paquete SSIS los carga primero en la tabla de ensayo stg.supplier_Leaf y después desencadena el procedimiento almacenado stg.udp_Supplier_Leaf asociado. Vea Importar datos para obtener más detalles.

En esta lección, realizará las tareas siguientes:

  1. Quitar datos de proveedor en MDS (si ha realizado las cuatro lecciones anteriores). El paquete SSIS que crea en esta lección carga los datos en MDS automáticamente. Antes, cargaba manualmente los datos de proveedor limpios y coincidentes en el servidor de MDS con el Cliente de DQS.

  2. Crear una vista de suscripciones en la entidad Proveedor para exponer los datos de la entidad en otras aplicaciones. Esta acción crea una vista de SQL que comprobará mediante SQL Server Management Studio. No usará esta vista en esta versión del tutorial.

  3. Crear y ejecutar un proyecto de SSIS con SQL Server Data Tools. El proyecto usa la transformación Limpieza de datos para enviar una solicitud de limpieza al servidor de DQS. DQS no expone todavía la funcionalidad de búsqueda de coincidencias, por lo que usará la transformación Agrupación aproximada para identificar los duplicados.

  4. Comprobar que los datos se crean en MDS mediante Master Data Manager.

  5. Revisar los resultados del proyecto de limpieza de DQS creado por el paquete SSIS y realizar opcionalmente una limpieza interactiva para mejorar la base de conocimiento.

Paso siguiente

Tarea 1 (requisito previo): quitar datos de proveedor en MDS