Share via


Leçon 2 : Nettoyage des données des fournisseurs avec la base de connaissances Fournisseurs

Dans cette leçon, vous allez nettoyer les données des fournisseurs dans un fichier Excel à l'aide de la base de connaissances Fournisseurs que vous avez créée dans la première leçon. Le nettoyage de données dans DQS comprend un processus assisté par ordinateur qui analyse la conformité des données par rapport aux connaissances contenues dans une base de connaissances, et un processus interactif qui vous permet d'examiner et de modifier les résultats du processus assisté par ordinateur. La fonctionnalité de nettoyage des données identifie les données incorrectes dans votre source de données et les corrige, ou suggère des corrections. Elle normalise et enrichit également les données client en utilisant des valeurs de domaine, des valeurs menantes pour les synonymes, des règles de domaine, des relations à base de termes et des données de référence. Vous pouvez approuver ou refuser en mode interactif les modifications proposées par le processus assisté par ordinateur. Consultez Nettoyage de données pour plus de détails.

Le processus assisté par ordinateur utilise les valeurs de seuil suivantes, que vous pouvez configurer à l'aide de l'option Configuration dans la page principale du Client DQS.

  • Score minimal pour les suggestions : le score minimal ou niveau de confiance est utilisé par DQS pour suggérer le remplacement d'une valeur.

  • Score minimal pour les corrections automatiques : le score minimal ou niveau de confiance est utilisé par DQS pour corriger automatiquement une valeur.

Consultez Configurer les valeurs de seuil pour le nettoyage et la correspondance pour plus d'informations sur la façon de configurer ces paramètres.

Dans cette leçon, vous allez effectuer les tâches suivantes pour nettoyer les données d'entrée à l'aide de la base de connaissances Fournisseurs.

  1. Créer un projet de qualité des données pour le nettoyage, sélectionner la base de connaissances Fournisseurs comme base de connaissances à utiliser pour analyser et nettoyer les données sources dans un fichier Excel, puis sélectionner l'activité de nettoyage.

  2. Mapper les colonnes Excel que vous souhaitez nettoyer aux domaines/domaines composites DQS appropriés dans la base de connaissances.

  3. Exécuter l'activité de nettoyage assistée par ordinateur. Le processus assisté par ordinateur affiche les informations de qualité des données dans le Data Quality Client utilisé pour nettoyer les données de façon interactive.

  4. Affichez et gérez les résultats de l'activité de nettoyage. Vous pouvez examiner les valeurs qui le processus assisté par ordinateur identifie comme correctes, incorrectes mais corrigées, incorrectes avec une modification suggérée, ou non valides. Vous pouvez approuver ou refuser de façon interactive les modifications, ou corriger ou remplacer la suggestion du processus assisté par ordinateur, en utilisant le champ Corriger vers.

  5. Exporter les résultats du nettoyage dans un fichier Excel.

  6. Importer les valeurs du projet de nettoyage dans des domaines pour enrichir les connaissances de la base de connaissances avec de nouvelles règles, des valeurs, des corrections, etc.

Étape suivante

Tâche 1 : Création d'un projet de qualité des données