Share via


Leçon 5 : Automatisation du nettoyage et de la mise en correspondance avec SSIS

Dans la leçon 1, vous avez créé la base de connaissances Fournisseurs et vous l'avez utilisée pour nettoyer les données dans la leçon 2, et pour faire correspondre les données dans la leçon 3, à l'aide de l'outil Client DQS. Dans un scénario réel, vous devrez peut-être extraire des données d'une source non prise en charge par DQS, ou vous pouvez souhaiter automatiser le processus de nettoyage et de correspondance sans utiliser l'outil Client DQS. SQL Server Integration Services (SSIS) contient les composants nécessaires pour intégrer des données provenant de sources hétérogènes, et un composant Transformation de nettoyage DQS pour appeler la fonctionnalité de nettoyage exposée par DQS. Actuellement, DQS n'expose pas la fonctionnalité de correspondance dans SSIS, mais vous pouvez utiliser Transformation de regroupement probable pour identifier des doublons dans les données.

Vous pouvez télécharger des données dans MDS à l'aide de la fonctionnalité de mise en lots basée sur les entités. Lorsque vous créez une entité dans MDS, les tables intermédiaires et les procédures stockées correspondantes sont automatiquement créées. Par exemple, lors de la création de l'entité Fournisseur, la table stg.supplier_Leaf et la procédure stockée stg.udp_Supplier_Leaf sont automatiquement créées. Vous utilisez les tables intermédiaires et les procédures pour créer, mettre à jour et supprimer des membres d'entité. Dans cette leçon, vous allez créer de nouveaux membres d'entité pour l'entité Fournisseur. Pour charger des données dans le serveur MDS, le package SSIS charge d'abord les données dans la table intermédiaire stg.supplier_Leaf puis exécute la procédure stockée associée stg.udp_Supplier_Leaf. Consultez Importer des données pour plus de détails.

Dans cette leçon, vous allez effectuer les tâches suivantes :

  1. Supprimer les données des fournisseurs dans MDS (si vous avez suivi les quatre leçons précédentes). Le package SSIS que vous allez créer dans cette leçon va télécharger automatiquement les données dans MDS. Précédemment, vous avez téléchargé manuellement sur le serveur MDS les données des fournisseurs nettoyées et mises en correspondance à l'aide du client DQS.

  2. Créer une vue d'abonnement sur l'entité Fournisseur pour exposer les données de l'entité dans d'autres applications. Cette action crée une vue SQL que vous allez vérifier l'aide de SQL Server Management Studio. Vous n'utiliserez pas cette vue dans cette version du didacticiel.

  3. Créer et exécuter un projet SSIS à l'aide de SQL Server Data Tools. Le projet utilise la transformation Nettoyage de données pour envoyer une demande de nettoyage au serveur DQS. DQS n'expose pas encore la fonctionnalité de correspondance, c'est pourquoi vous allez utiliser la transformation Regroupement probable pour identifier les doublons dans les données.

  4. Vérifier que les données sont créées dans MDS à l'aide de Master Data Manager.

  5. Examiner les résultats du projet de nettoyage DQS créé par le package SSIS et, éventuellement, effectuer un nettoyage interactif pour créer la base de connaissances par la suite.

Étape suivante

Tâche 1 (condition préalable) : Supprimer des données sur les fournisseurs dans MDS