Concepts Data Quality Services

S’applique à :SQL Server

Cette rubrique fournit un bref résumé des concepts de Data Quality Services (DQS) dans la gestion des connaissances, les projets de qualité des données et l’administration de la qualité des données.

Concepts relatifs à la gestion des connaissances

La base de connaissances DQS est un référentiel de métadonnées créé par le gestionnaire de données ou un professionnel de l'informatique pour améliorer la qualité des données via des opérations de nettoyage et de mise en correspondance. La gestion des connaissances DQS inclut les processus utilisés pour créer et gérer la base de connaissances, de manière assistée par ordinateur et de manière interactive.

Découverte des connaissances

La découverte des connaissances est un processus assisté par ordinateur qui analyse des exemples de données tirés de votre organisation pour générer des connaissances. Lorsque vous obtenez les résultats de l'analyse, vous pouvez valider et améliorer les connaissances, puis les appliquer pour nettoyer, mettre en correspondance et profiler les données. Pour plus d’informations, consultez DQS Knowledge Bases and Domains.

Gestion de l'arborescence du domaine

Le processus de gestion de domaine vous permet de modifier ou augmenter les connaissances générées par le processus de découverte des connaissances. Vous pouvez modifier, mettre à jour et examiner de manière interactive les connaissances dans une base de connaissances. Une base de connaissances comprend des champs de données qui contiennent des valeurs de domaine et leur état, leurs règles de domaine, leurs relations à base de termes et leurs données de référence. Dans la gestion d'un domaine, vous pouvez modifier les propriétés du domaine, lui joindre des données de référence, gérer ses règles, gérer ses valeurs, écrire des relations de données et créer, supprimer, importer, ou exporter des domaines. Vous pouvez également utiliser des domaines composés qui agrègent plusieurs domaines. Pour plus d’informations, consultez DQS Knowledge Bases and Domains.

Stratégie de correspondance

Une stratégie de correspondance contient les règles de correspondance utilisées pour effectuer une déduplication de données. Le processus de stratégie de correspondance vous permet de créer des règles de correspondance, de les adapter précisément en fonction des résultats de la correspondance et du profilage des données, et d'ajouter la stratégie à la base de connaissances. Pour plus d'informations, voir Data Matching.

Reference Data Services

Vous pouvez utiliser des données de référence pour valider, corriger et enrichir vos données, en exploitant les services de sociétés qui garantissent la qualité de leurs données de référence. Vous pouvez utiliser les services de la Place de marché Azure pour vous connecter à des fournisseurs de données de référence ou utiliser une connexion directe à un fournisseur. Pour plus d’informations, consultez Reference Data Services in DQS.

Pour plus d'informations sur la gestion des connaissances dans DQS, consultez DQS Knowledge Bases and Domains.

Concepts relatifs au projets de qualité des données

Le gestionnaire de données effectue des opérations de qualité des données (nettoyage et correspondance) à l’aide d’un projet de qualité des données dans l’application cliente de qualité des données.

Nettoyage des données

Le nettoyage de données dans DQS s'effectue sur la base des connaissances dans une base de connaissances DQS. Le nettoyage de données dans DQS est un processus en deux étapes :

  • Nettoyage assisté par ordinateur: DQS utilise les connaissances d'une base de connaissances sélectionnée pour le projet de nettoyage afin de proposer des corrections/suggestions aux valeurs d'une source de données.

  • Nettoyage interactif: le gestionnaire de données ou un professionnel de l'informatique peut exécuter le processus de nettoyage interactif pour modifier ou augmenter les corrections aux données proposées par le processus de nettoyage de données assisté par ordinateur. Il utilise pour cela les niveaux de confiance et les statistiques identifiés par le processus de nettoyage de données, ou écrit manuellement ses propres modifications dans le projet.

Après le nettoyage de données, le gestionnaire peut exporter les données traitées vers une base de données SQL Server, un fichier .csv ou un fichier Excel. Pour plus d'informations, voir Data Cleansing.

Correspondance de données

Le processus de correspondance permet au gestionnaire de données de comparer des données afin que celles similaires, mais légèrement différentes, puissent être alignées par un processus de déduplication. DQS effectue la déduplication en fonction des règles de correspondance contenues dans la base de connaissances ; le gestionnaire de données spécifie les paramètres du processus de correspondance dans un projet de qualité des données. Pour plus d'informations, voir Data Matching.

Profilage et notifications

Le profilage des données fournit aux gestionnaires de données des statistiques et des informations en temps réel sur les données traitées par DQS dans le cadre des activité de nettoyage ou de correspondance pendant l'exécution d'un projet de qualité de données. Le profilage des données vous aide à évaluer l'efficacité des activités de nettoyage et de correspondance dans un projet de qualité des données, et les notifications suggèrent des mesures pouvant être prises pour améliorer ces activités. Pour plus d’informations, consultez Data Profiling and Notifications in DQS.

Pour plus d’informations sur les projets de qualité des données dans DQS, consultez Data Quality Projects (DQS) (Data Quality Projects).

Concepts relatifs à l'administration de la qualité des données

Un administrateur DQS peut effectuer diverses tâches d’administration à l’aide de l’application cliente de qualité des données.

Analyse des activités

L'analyse des activités affiche l'état de chaque activité comprise dans une plage de données, fournit des données pour chaque activité et permet aux administrateurs DQS de contrôler une activité. Pour plus d’informations, consultez Monitor DQS Activities.

Configuration

L'option de configuration vous permet de :

Sécurité relative au magasin d’objets blob distants (DQS)

Vous pouvez utiliser des rôles dans le mécanisme de sécurité SQL Server pour sécuriser DQS. Il existe trois rôles DQS qui déterminent le niveau d’accès d’un utilisateur dans l’application cliente Data Quality : dqs_administrator, dqs_kb_editor et dqs_kb_operator. Vous ne pouvez pas accorder de rôles aux utilisateurs à l’aide de l’application cliente De qualité des données ; elle est effectuée à l’aide de SQL Server Management Studio. Pour plus d’informations, voir DQS Security.

Pour plus d'informations sur l'administration DQS, consultez DQS Administration.

Voir aussi

Data Quality Services