Mise en correspondance de la qualité des données dans le complément MDS pour Excel

S’applique à :SQL Server - Windows uniquement Azure SQL Managed Instance

Au fil du temps, vous souhaiterez ajouter des données au référentiel MDS. Avant d’ajouter des données, il peut être utile de comparer les nouvelles données aux données qui sont déjà managées dans MDS pour s’assurer de ne pas ajouter de données dupliquées ou incorrectes.

Le complément MDS pour Excel utilise la fonctionnalité Data Quality Services (DQS) de SQL Server pour faire correspondre les données similaires. Lorsque vous utilisez la fonctionnalité de correspondance du complément, les enregistrements similaires sont regroupés et un score qui représente la précision du résultat est affiché. Pour plus d’informations sur la fonctionnalité de correspondance fournie par DQS, consultez Correspondance de données.

Flux de travail pour la correspondance de la qualité des données

Lorsque vous utilisez DQS avec le complément MDS pour Excel, utilisez le flux de travail suivant :

  1. Récupérez une liste de données managées MDS et combinez-la avec une liste non gérée dans MDS. Pour plus d’informations, consultez Combiner des données (complément MDS pour Excel).

  2. Utilisez la base de connaissances DQS pour comparer les données dans la liste combinée. Pour plus d’informations, consultez Correspondance des données similaires (complément MDS pour Excel).

  3. Pour plus de détails sur les similitudes identifiées par DQS, affichez les colonnes de détail.

  4. Explorez les résultats et déterminez les données qui doivent être ajoutées au référentiel MDS et celles qui sont dupliquées.

  5. Publiez les données nouvelles et/ou mises à jour dans le référentiel MDS.

Bases de connaissances

Les résultats correspondants fournis dans le complément sont basés sur une base de connaissances DQS.

  • La base de connaissances par défaut (DQS Data) est créée lors de l'installation de DQS. Si vous choisissez d'utiliser la base de connaissances par défaut (sans ajouter de stratégie de correspondance à la base de connaissances par défaut dans le client de qualité des données), vous devez mapper les colonnes dans la feuille de calcul aux domaines de la base de connaissances, puis attribuer une valeur de pondération aux domaines que vous choisissez.

  • Vous pouvez utiliser le client de qualité des données pour créer une nouvelle base de connaissances avec une stratégie de correspondance, ou pour ajouter une stratégie de correspondance à la base de connaissances par défaut. Dans ce cas, les valeurs de pondération sont déterminées par la stratégie correspondante que vous avez déjà créée et vous devez uniquement mapper les colonnes aux domaines. Pour plus d’informations, consultez Créer une stratégie de correspondance.

Pour plus d’informations sur les bases de connaissances, consultez Bases de connaissances et domaines DQS.

Description de la tâche Rubrique
Combinez les données externes avec les données managées MDS en préparation pour les comparer. Combiner des données (complément MDS pour Excel)
Utilisez la base de connaissances DQS pour rechercher des similitudes dans vos données. Mettre en correspondance des données similaires (complément MDS pour Excel)