Data Quality-Projekte (DQS)

Gilt für:SQL Server

Ein Datenqualitätsprojekt in Data Quality Services (DQS) ist ein Mittel, um die Qualität Ihrer Quelldaten zu verbessern, indem Sie Datenbereinigungs- und Datenabgleichsaktivitäten durchführen und dann die resultierenden Daten in eine SQL Server-Datenbank oder eine CSV-Datei exportieren. Sie können ein Data Quality-Projekt als Bereinigungsprojekt oder Abgleichsprojekt erstellen, um jeweilige Aktivitäten auszuführen. Bereinigung und Abgleichsprojekte können mit der gleichen Wissensdatenbank ausgeführt werden, da Wissen für Datenbereinigung und das Abgleichen in die gleiche Wissensdatenbank integriert werden können.

Ein Data Quality-Projekt hat die folgenden Vorteile:

  • Data Quality-Projekte ermöglichen es Ihnen, die Quelldaten mithilfe von Wissen in einer DQS-Wissensdatenbank zu bereinigen.

  • Sie können Datenabgleiche für Ihre Quelldaten durchführen, indem Sie die Abgleichsrichtlinie in einer Wissensdatenbank verwenden.

  • Stellt einen Assistenten bereit, um Sie durch die Bereinigungs- und Abgleichsaktivitäten zu führen und exportiert die Daten gemäß Ihrer Auswahl in eine SQL Server-Datenbank oder eine CSV-Datei. Der Data Steward kann das Data Quality-Projekt verwenden, um die computergestützten/interaktiven Schritte zum Bereinigen und Abgleichen von Daten auszuführen.

Data Quality-Projekt: Bereinigungsaktivität

Data Quality-Projekte ermöglichen es Ihnen, die Quelldaten basierend auf einer Wissensdatenbank zu bereinigen. Die Datenbereinigungsaktivität in DQS ist ein zwei Schritte umfassender Prozess:

  1. In einem computergestützten Datenbereinigungsprozess werden Quelldaten im Hinblick auf das Wissen in der Wissensdatenbank analysiert und Änderungen vorgeschlagen. Die verarbeiteten Daten werden von DQS kategorisiert (vorgeschlagen, neu, ungültig und richtig) und werden dem Benutzer zur weiteren Verarbeitung angezeigt.

  2. Ein interaktiver Bereinigungsprozess, der es dem Data Steward ermöglicht, die vom computerunterstützten Datenbereinigungsprozess vorgeschlagenen Daten zu genehmigen, abzulehnen oder zu ändern.

Ausführliche Informationen zur Bereinigungsaktivität in einem Data Quality-Projekt finden Sie unter Data Cleansing.

Data Quality-Projekt: Abgleichsaktivität

Ein Data Quality-Abgleichsprojekt ermöglicht es Ihnen, Abgleichsaktivitäten auf Grundlage der Abgleichsrichtlinie in einer Wissensdatenbank auszuführen, um Datenduplizierung durch das Identifizieren exakter und ungefährer Treffer zu verhindern und dadurch das Entfernen doppelter Daten zu ermöglichen. Es wird empfohlen, dass Sie die Daten bereinigen, bevor Sie entsprechende Abgleiche ausführen. Gehen Sie folgendermaßen vor:

  1. Erstellen Sie ein Data Quality-Projekt, wählen Sie die Bereinigungsaktivität aus, schließen Sie die Datenbereinigungsaktivität für die Quelldaten ab, und exportieren Sie sie dann in eine Tabelle in einer SQL Server-Datenbank.

  2. Erstellen Sie ein weiteres Data Quality-Projekt mithilfe einer Wissensdatenbank, die eine Abgleichsrichtlinie enthält, wählen Sie die Abgleichsaktivität aus, und wählen Sie dann auf der Seite Struktur die Datenbank und die Tabelle aus, in die Sie die gereinigten Daten in Schritt 1 exportiert haben.

  3. Schließen Sie die Abgleichsaktivität für die bereinigten Daten ab.

Ausführliche Informationen zur Abgleichsaktivität in einem Data Quality-Projekt finden Sie unter Data Matching.

Datenprofilerstellung und Benachrichtigungen

Beim Ausführen der Bereinigungs- und Abgleichsaktivitäten in einem Data Quality-Projekt werden Ihnen Statistiken und Informationen über die von DQS verarbeiteten Daten in Echtzeit angezeigt. Mithilfe der Datenprofilerstellung können Sie die Effektivität der Bereinigungs- und Abgleichsprozesse bewerten und potenziell bestimmen, inwiefern die Datenbereinigung oder der -abgleich dabei behilflich waren, die Datenqualität zu verbessern. DQS-Profilerstellung stellt zwei Data Quality-Dimensionen bereit: Vollständigkeit (das Ausmaß des Vorhandenseins von Daten) und Genauigkeit (das Ausmaß, in dem Daten für den beabsichtigten Zweck verwendet werden können). Außerdem werden auf Grundlage der Datenprofilinformationen dem Benutzer Benachrichtigungen zu den Aktionen angezeigt, die ausgeführt werden können, um die Datenbereinigungs- und Datenabgleichsvorgänge zu verbessern. Weitere Informationen zur Datenprofilerstellung und zu Benachrichtigungen finden Sie unter Data Profiling and Notifications in DQS.

Taskbeschreibung Thema
Beschreibt, wie ein Data Quality-Projekt erstellt wird. Erstellen eines Data Quality-Projekts
Beschreibt, wie ein Data Quality-Projekt geöffnet, entsperrt, umbenannt oder gelöscht wird. Öffnen, Entsperren, Umbenennen und Löschen eines Data Quality-Projekts
Beschreibt, wie ein Integration Services-Projekt im Datenqualitätsclient geöffnet wird. Öffnen von Integration Services-Projekten im Data Quality-Client

Weitere Informationen

DQS-Wissensdatenbanken und -Domänen