Partager via


Tâche 1 : Définition d'une stratégie de correspondance

Dans cette tâche, vous allez créer une stratégie de correspondance contenant une règle. La règle aura une condition préalable : ID du fournisseur, ce qui signifie que les ID des fournisseurs doivent correspondre avant d'utiliser les autres domaines dans la règle. La règle utilise deux autres domaines : Nom du fournisseur avec une valeur Similarité égale à 70 % et Adresse de messagerie du contact avec une valeur Similarité égale à 30 %.

  1. Dans la page principale du Client DQS, cliquez sur la flèche droite en regard de la base de connaissances Fournisseurs, puis sélectionnez Stratégie de correspondance.

    Menu Stratégie de correspondance dans la Page principale

  2. Dans la page Mapper, sélectionnez Fichier Excel pour Source de données.

  3. Cliquez sur Parcourir, assurez-vous que le filtre est défini sur Classeur Excel et sélectionnez le fichier Cleansed Supplier List.xls exporté après l'activité de nettoyage des données des fournisseurs.

    [!REMARQUE]

    À la fin de cette activité, vous ne pourrez pas exporter les résultats car l'activité est principalement axées sur la définition d'une stratégie de correspondance. Vous allez créer un projet de qualité des données pour l'activité de correspondance, et l'exécuter pour supprimer les doublons de la liste des fournisseurs en utilisant cette stratégie de correspondance dans la leçon suivante.

  4. Mappez la colonne SupplierID au domaine ID du fournisseur, la colonne Nom du fournisseur au domaine Nom du fournisseur et la colonne ContactEmailAddress au domaine Adresse de messagerie du contact. Vous devez uniquement mapper les colonnes sources aux domaines que vous souhaitez utiliser pour définir la stratégie de correspondance. Dans ce cas, vous allez rendre les domaines ID du fournisseur, Nom du fournisseur et Adresse de messagerie du contact disponibles pour l'activité de stratégie de correspondance.

    Page de mappage du processus de définition de la stratégie de correspondance

  5. Cliquez sur Suivant pour afficher la page Stratégie de correspondance où vous allez définir une stratégie de correspondance contenant une règle.

  6. Cliquez sur le bouton Créer une règle de correspondance dans la barre d'outils pour créer une règle dans la stratégie.

    Bouton à la barre d'outils Créer une règle de correspondance

  7. Dans le volet Détails de la règle à droite, entrez Supprimer les fournisseurs en double pour Nom de la règle.

  8. Cliquez sur Ajouter un nouvel élément de domaine dans la barre d'outils du volet droit.

    Détails de la règle - Bouton Ajouter un nouvel élément de domaine

  9. Sélectionnez ID du fournisseur pour le domaine, puis activez la case à cocher Condition préalable. Notez que la colonne Similarité prend automatiquement la valeur Exact. En définissant ID du fournisseur comme Condition préalable, vous spécifiez que les valeurs de ce champ dans les deux enregistrements doivent retourner une correspondance de 100 %, sans quoi les enregistrements ne sont pas considérés comme une correspondance et les autres clauses de la règle sont ignorées.

    Supprimer la définition de la règle des fournisseurs dupliqués

  10. Recliquez sur l'icône Ajouter un nouvel élément de domaine dans la barre d'outils.

  11. Sélectionnez le domaine Nom du fournisseur, sélectionnez Similaire pour Similarité, puis tapez 70 pour le Poids. Ici, vous spécifiez que les noms des fournisseurs n'ont pas besoin d'être identiques, mais peuvent être similaires pour que les enregistrements soient considérés comme une correspondance. Le poids indique la contribution du score de ce champ au score de correspondance global.

  12. Répétez les étapes précédentes pour ajouter le domaine Adresse de messagerie du contact avec 30 comme Poids.

  13. Notez que le score de correspondance minimal a la valeur 80 %, qui est la valeur que vous voyez dans l'onglet Général de la page Configuration de l'Administration de DQS. Vous ne pouvez augmenter ce score qu'au-dessus de cette valeur de seuil, ici.

  14. Notez que l'option Clusters qui se chevauchent est sélectionnée. Avec cette option, un enregistrement peut apparaître dans plusieurs clusters. Si vous modifiez le paramètre en Clusters qui ne se chevauchent pas, les clusters qui ont des enregistrements communs sont combinés dans un seul cluster.

  15. Le bouton Démarrer sur cette page vous permet de tester chaque règle de la stratégie séparément, tandis que le bouton Démarrer dans la page suivante permet de tester la stratégie dans son ensemble (toutes les règles contenues dans la stratégie).

  16. Cliquez sur Suivant pour basculer vers la page Résultats de correspondance.

Étape suivante

Tâche 2 : Test et publication de la stratégie de correspondance