Gestion des informations d'entreprise en associant SSIS, MDS et DQS

La gestion des informations dans une entreprise implique généralement l'intégration des données au sein de l'entreprise et avec l'extérieur, le nettoyage des données, leur correspondance pour supprimer tous les doublons, leur normalisation, leur enrichissement, rendre les données conformes aux exigences juridiques et de conformité, et enfin, le stockage des données dans un emplacement centralisé avec tous les paramètres de sécurité nécessaires.

SQL Server 2012 fournit tous les composants nécessaires pour une solution de gestion des informations d'entreprise (EIM) efficace dans un seul produit. Les composants clés de SQL Server 2012 qui vous aident à générer une solution EIM sont les suivants :

  • SQL Server Integration Services

  • SQL Server Data Quality Services

  • SQL Server Master Data Services

SQL Server Integration Services (SSIS) fournit une plateforme puissante et souple pour intégrer les données provenant de différentes sources dans une solution d'extraction, de transformation et de chargement (ETL) complète qui prend en charge les flux de travail d'entreprise, un entrepôt de données, ou la gestion des données de référence. Consultez la rubrique Présentation d'Integration Services pour une présentation rapide et les utilisations classiques de SSIS.

SQL Server Data Quality Services (DQS) permet de nettoyer, faire correspondre, normaliser et enrichir les données, afin de disposer d'informations approuvées pour le décisionnel, d'un entrepôt de données et de charges de traitement pour les transactions. Consultez la rubrique Présentation de Data Quality Services pour en savoir plus sur les besoins auxquels DQS répond, et comment il satisfait ces besoins.

SQL Server Master Data Services (MDS) est un concentrateur de données central qui garantit l'intégrité des informations et la cohérence des données entre différentes applications. Consultez la rubrique Présentation de Master Data Services pour une brève description des principales fonctionnalités de MDS.

Consultez les livres blancs Gestion des informations d'entreprise avec SQL Server 2012 et Nettoyage et correspondance des données de référence avec les technologies EIM pour obtenir une aide complète sur l'implémentation d'une solution EIM à l'aide de ces technologies Microsoft. Vous pouvez également regarder la vidéo Gestion des informations d'entreprise (EIM) : associer SSIS, DQS et MDS pour un exemple clair d'un scénario EIM.

Dans ce didacticiel, vous allez apprendre à utiliser SSIS, MDS et DQS conjointement pour implémenter un exemple de solution de gestion des informations d'entreprise (EIM). Vous utiliserez d'abord DQS pour créer une base de connaissances contenant les connaissances relatives aux données (métadonnées), puis vous allez nettoyer les données dans un fichier Excel à l'aide de la base de connaissances, et enfin, vous allez faire correspondre les données pour identifier et supprimer les doublons. Ensuite, vous utiliserez le complément MDS pour Excel pour télécharger les données nettoyées et mises en correspondance dans MDS. Enfin, vous automatiserez l'ensemble du processus en utilisant une solution SSIS. La solution SSIS décrite dans ce didacticiel lit les données d'entrée à partir d'un fichier Excel, mais vous pouvez l'étendre pour lire d'autres sources telles que Oracle, Teradata, DB2, et la Base de données SQL de Windows Azure.

Configuration requise

  1. Microsoft SQL Server 2012 avec les composants suivants.

    1. Integration Services (SSIS)

    2. Master Data Services (MDS)

    3. Data Quality Services (DQS)

    4. SQL Server Data Tools

      Consultez le Guide d'installation de SQL Server 2012 pour plus d'informations sur l'installation du produit.

  2. Configurer MDS à l'aide du Gestionnaire de configuration Master Data Services

    Utilisez le Gestionnaire de configuration pour créer et configurer une base de données Master Data Services. Après avoir créé la base de données MDS, créez une application Web pour MDS dans un site Web (par exemple : https://localhost/MDS) et associez la base de données MDS à l'application Web MDS. Notez que, pour créer une application Web MDS, vous devez installer IIS sur votre ordinateur. Consultez Configuration requise pour l'application Web (Master Data Services) et Configuration requise pour la base de données (Master Data Services) pour plus d'informations sur les conditions requises pour configurer la base de données et l'application Web MDS.

  3. Installer et configurer DQS à l'aide du programme d'installation de Data Quality Server. Cliquez sur Démarrer, pointez sur Tous les programmes, cliquez sur Microsoft SQL Server 2012, cliquez sur Data Quality Services, puis sur Data Quality Server Installer.

  4. Microsoft Excel 2010 (32 bits) est préférable.

  5. Installez le Complément Master Data Services pour Excel (32 bits ou 64 bits en fonction de la version d'Excel que vous avez sur votre ordinateur) depuis ce lien. Pour connaître la version d'Excel installée sur votre ordinateur, exécutez Excel, cliquez sur Fichier dans la barre de menus et cliquez sur Aide pour consulter la version dans le volet droit. Notez que vous devez installer Visual Studio 2010 Tools pour Office Runtime avant d'installer le complément Excel.

  6. (Facultatif) Créez un compte Windows Azure Marketplace. L'une des tâches du didacticiel nécessite que vous ayez un compte Azure Marketplace (anciennement Data Market). Vous pouvez ignorer cette tâche, si vous préférez, et passer à la tâche suivante.

  7. Téléchargez le fichier Suppliers.xls à partir du Centre de téléchargement Microsoft.

  8. DQS ne vous permet pas d'exporter les résultats du nettoyage ou de la correspondance dans un fichier Excel si vous utilisez la version 64 bits d'Excel. Il s'agit d'un problème connu. Pour le contourner, procédez comme suit :

    1. Installez SQL Server 2012 SP1 (sur des ordinateurs contenant la version 64 bits d'Excel).

    2. Exécutez DQLInstaller.exe – Mise à niveau. Si vous avez installé l'instance par défaut de SQL Server, le fichier DQSInstaller.exe est copié sous C:\Program Files\Microsoft SQL Server\MSSQL11.MSSQLSERVER\MSSQL\Binn. Double-cliquez sur le fichier DQSInstaller.exe.

    3. Dans Gestionnaire de configuration Master Data Services, cliquez sur Sélectionner une base de données, sélectionnez une base de données MDS existante, puis cliquez sur Mettre à niveau.

Leçons

Leçon

Brève description

Durée estimée (en minutes).

Leçon 1 : Création d'une base de connaissances DQS nommée Fournisseurs

Dans cette leçon, vous allez créer une base de connaissances DQS nommée Fournisseurs.

60

Leçon 2 : Nettoyage des données des fournisseurs avec la base de connaissances Fournisseurs

Dans cette leçon, vous allez créer et exécuter un projet DQS pour nettoyer les données des fournisseurs dans un fichier Excel à l'aide de la base de connaissances Fournisseurs que vous avez créée dans la première leçon.

45

Leçon 3 : Faire correspondre les données pour supprimer les doublons de la liste des fournisseurs

Dans cette leçon, vous allez créer un projet DQS pour effectuer une activité de correspondance et identifier et supprimer les doublons de la liste des fournisseurs nettoyée.

45

Leçon 4 : Stockage des données sur les fournisseurs dans MDS

Dans cette leçon, vous allez télécharger dans Master Data Services (MDS) les données des fournisseurs nettoyées et mises en correspondance à l'aide du Complément MDS pour Excel.

45

Leçon 5 : Automatisation du nettoyage et de la mise en correspondance avec SSIS

Dans cette leçon, vous allez créer une solution SSIS qui nettoie les données d'entrée à l'aide de DQS, fait correspondre les données nettoyées pour supprimer les doublons, et stocke dans MDS les données nettoyées et mises en correspondance de manière automatisée.

75

Étapes suivantes

Pour démarrer le didacticiel, passez à la première leçon : Leçon 1 : Création d'une base de connaissances DQS nommée Fournisseurs.