Lección 2: limpiar datos de proveedor con la base de conocimiento Proveedores

En esta lección, limpiará los datos de proveedor en un archivo de Excel con la base de conocimiento Proveedores que creó en la primera lección. La limpieza de datos en DQS incluye un proceso asistido por PC que analiza cómo se ajustan los datos al conocimiento de una base de conocimiento y un proceso interactivo que permite revisar y modificar los resultados del proceso asistido por PC. La característica de limpieza de datos identifica los datos incorrectos en el origen de datos y después corrige o sugiere correcciones a los datos incorrectos. También normaliza y enriquece los datos de cliente usando valores de dominio, valores iniciales de sinónimos, reglas de dominio, relaciones basadas en términos y datos de referencia. Puede aprobar o rechazar interactivamente los cambios propuestos por el proceso asistido por PC. Vea Limpieza de datos para obtener más detalles.

El proceso asistido por PC emplea los valores de umbral siguientes que puede configurar mediante la opción Configuración de la página principal del Cliente DQS.

  • Puntuación mínima para sugerencias: puntuación o nivel de confianza mínimo que DQS emplea para sugerir el reemplazo de un valor.

  • Puntuación mínima de correcciones automáticas: puntuación o nivel de confianza mínimo que DQS emplea para corregir automáticamente un valor.

Vea Configurar los valores de umbral para la limpieza y coincidencia para obtener información detallada acerca de cómo configurar estos valores.

En esta lección, realizará las tareas siguientes para limpiar los datos de entrada mediante la base de conocimiento Proveedores.

  1. Crear un proyecto de calidad de datos para la limpieza, seleccionar la base de conocimiento Proveedores como base de conocimiento que se usará para analizar y limpiar los datos de origen en un archivo de Excel, y seleccionar la actividad Limpieza.

  2. Asignar las columnas de Excel que desea limpiar a los dominios de DQS o dominios compuestos adecuados de la base de conocimiento.

  3. Ejecutar la actividad de limpieza asistida por PC. El proceso asistido por PC muestra información sobre la calidad de los datos en el Cliente de calidad de los datos que puede usar para limpiar los datos de forma interactiva.

  4. Ver y administrar los resultados de la actividad Limpieza. Puede examinar los valores que el proceso asistido por PC dice que son correctos, incorrectos pero corregidos, incorrectos con un cambio sugerido o no válidos. Puede aprobar o rechazar interactivamente los cambios, corrigiendo o invalidando la sugerencia del proceso asistido por PC mediante el campo Corregir a.

  5. Exportar los resultados del proceso de limpieza a un archivo de Excel.

  6. Importar los valores de proyecto de limpieza en dominios para mejorar el contenido de la base de conocimiento con nuevas reglas, valores, correcciones, etc.

Paso siguiente

Tarea 1: crear un proyecto de calidad de datos