Share via


Leçon 3 : Faire correspondre les données pour supprimer les doublons de la liste des fournisseurs

Vous préparez la base de connaissances pour effectuer une activité de correspondance en créant une stratégie de correspondance dans la base de connaissances. Il ne peut exister qu'une seule stratégie de correspondance dans une base de connaissances. Une stratégie de correspondance comprend une ou plusieurs règles de correspondance. Une règle identifie les domaines impliqués dans le processus de correspondance, et spécifie le poids de chaque valeur de domaine dans un jugement de correspondance. Vous spécifiez dans la règle si des valeurs de domaine doivent être une correspondance exacte ou si elles peuvent être semblables, et avec quel degré de similarité. Vous pouvez également spécifier si une correspondance de domaine est requise pour le processus de correspondance. Vous pouvez tester chaque règle séparément, ainsi que l'ensemble de la stratégie, sur des exemples de données. Le processus de test affiche les enregistrements dont les scores correspondants sont supérieurs au seuil Score d'enregistrement minimal spécifié dans la configuration de DQS dans un cluster (groupe). Vous pouvez continuer à ajuster les règles de la stratégie jusqu'à ce que vous soyez satisfait.

Après avoir défini la stratégie, créez un projet de qualité des données pour effectuer l'activité de correspondance. Le projet de correspondance applique les règles de correspondance de la stratégie de correspondance à la source de données à évaluer. Ce processus évalue la probabilité que deux lignes soient des correspondances. Lorsque DQS exécute l'analyse de correspondance, il crée des clusters des enregistrements qu'il considère comme des correspondances. DQS identifie de façon aléatoire l'un des enregistrements comme un enregistrement pivot. Vous pouvez vérifier et refuser tout enregistrement qui n'est pas une correspondance appropriée pour le cluster. Consultez la rubrique Créer une stratégie de correspondance pour plus de détails.

Dans cette leçon, vous allez effectuer une activité de correspondance pour supprimer les doublons de la liste des fournisseurs. D'abord, vous allez créer une stratégie de correspondance avec une règle pour identifier les doublons dans la liste des fournisseurs, puis vous allez publier la stratégie dans la base de connaissances. Ensuite, vous allez créer et exécuter un projet de qualité des données pour la correspondance. Enfin, vous allez exporter les résultats de l'activité de correspondance dans un fichier Excel que vous utiliserez plus tard lors du téléchargement des données dans Master Data Services (MDS).

Étape suivante

Tâche 1 : Définition d'une stratégie de correspondance