Data Quality-Projekte (DQS)

Ein Data Quality-Projekt in Data Quality Services (DQS) ist ein Mittel, die Qualität von den Quelldaten mithilfe einer Wissensdatenbank zu verbessern durch das Ausführen von Datenbereinigung und Datenabgleichsaktivitäten und das Exportieren der resultierenden Daten dann in eine SQL Server-Datenbank oder eine CSV-Datei. Sie können ein Data Quality-Projekt als Bereinigungsprojekt oder Abgleichsprojekt erstellen, um jeweilige Aktivitäten auszuführen. Bereinigung und Abgleichsprojekte können mit der gleichen Wissensdatenbank ausgeführt werden, da Wissen für Datenbereinigung und das Abgleichen in die gleiche Wissensdatenbank integriert werden können.

Ein Data Quality-Projekt hat die folgenden Vorteile:

  • Data Quality-Projekte ermöglichen es Ihnen, die Quelldaten mithilfe von Wissen in einer DQS-Wissensdatenbank zu bereinigen.

  • Sie können Datenabgleiche für Ihre Quelldaten durchführen, indem Sie die Abgleichsrichtlinie in einer Wissensdatenbank verwenden.

  • Stellt einen Assistenten bereit, um Sie durch die Bereinigungs- und Abgleichsaktivitäten zu führen und exportiert die Daten gemäß Ihrer Auswahl in eine SQL Server-Datenbank oder eine CSV-Datei. Der Data Steward kann das Data Quality-Projekt verwenden, um die computergestützten/interaktiven Schritte zum Bereinigen und Abgleichen von Daten auszuführen.

In diesem Thema

  • Data Quality-Projekt: Bereinigungsaktivität

  • Data Quality-Projekt: Abgleichsaktivität

  • Datenprofilerstellung und Benachrichtigungen

Data Quality-Projekt: Bereinigungsaktivität

Data Quality-Projekte ermöglichen es Ihnen, die Quelldaten basierend auf einer Wissensdatenbank zu bereinigen. Die Datenbereinigungsaktivität in DQS ist ein zwei Schritte umfassender Prozess:

  1. In einem computergestützten Datenbereinigungsprozess werden Quelldaten im Hinblick auf das Wissen in der Wissensdatenbank analysiert und Änderungen vorgeschlagen. Die verarbeiteten Daten werden von DQS kategorisiert (vorgeschlagen, neu, ungültig und richtig) und werden dem Benutzer zur weiteren Verarbeitung angezeigt.

  2. Ein interaktiver Bereinigungsprozess, der es dem Data Steward ermöglicht, die vom computerunterstützten Datenbereinigungsprozess vorgeschlagenen Daten zu genehmigen, abzulehnen oder zu ändern.

Ausführliche Informationen zur Bereinigungsaktivität in einem Data Quality-Projekt finden Sie unter Datenbereinigung.

Pfeilsymbol, dass mit dem Link "Zurück zum Anfang" verwendet wird[Top]

Data Quality-Projekt: Abgleichsaktivität

Ein Data Quality-Abgleichsprojekt ermöglicht es Ihnen, Abgleichsaktivitäten auf Grundlage der Abgleichsrichtlinie in einer Wissensdatenbank auszuführen, um Datenduplizierung durch das Identifizieren exakter und ungefährer Treffer zu verhindern und dadurch das Entfernen doppelter Daten zu ermöglichen. Es wird empfohlen, dass Sie die Daten bereinigen, bevor Sie entsprechende Abgleiche ausführen. Gehen Sie folgendermaßen vor:

  1. Erstellen Sie ein Data Quality-Projekt, wählen Sie die Bereinigungsaktivität aus, schließen Sie die Datenbereinigungsaktivität für die Quelldaten ab, und exportieren Sie sie dann in eine Tabelle in einer SQL Server-Datenbank.

  2. Erstellen Sie ein weiteres Data Quality-Projekt mithilfe einer Wissensdatenbank, die eine Abgleichsrichtlinie enthält, wählen Sie die Abgleichsaktivität aus, und wählen Sie dann auf der Seite Struktur die Datenbank und die Tabelle aus, in die Sie die gereinigten Daten in Schritt 1 exportiert haben.

  3. Schließen Sie die Abgleichsaktivität für die bereinigten Daten ab.

Ausführliche Informationen zur Abgleichsaktivität in einem Data Quality-Projekt finden Sie unter Datenabgleich.

Pfeilsymbol, dass mit dem Link "Zurück zum Anfang" verwendet wird[Top]

Datenprofilerstellung und Benachrichtigungen

Beim Ausführen der Bereinigungs- und Abgleichsaktivitäten in einem Data Quality-Projekt werden Ihnen Statistiken und Informationen über die von DQS verarbeiteten Daten in Echtzeit angezeigt. Mithilfe der Datenprofilerstellung können Sie die Effektivität der Bereinigungs- und Abgleichsprozesse bewerten und potenziell bestimmen, inwiefern die Datenbereinigung oder der -abgleich dabei behilflich waren, die Datenqualität zu verbessern. DQS-Profilerstellung stellt zwei Data Quality-Dimensionen bereit: Vollständigkeit (das Ausmaß des Vorhandenseins von Daten) und Genauigkeit (das Ausmaß, in dem Daten für den beabsichtigten Zweck verwendet werden können). Außerdem werden auf Grundlage der Datenprofilinformationen dem Benutzer Benachrichtigungen zu den Aktionen angezeigt, die ausgeführt werden können, um die Datenbereinigungs- und Datenabgleichsvorgänge zu verbessern. Weitere Informationen zur Datenprofilerstellung und zu Benachrichtigungen finden Sie unter Datenprofilerstellung und Benachrichtigungen in DQS.

Pfeilsymbol, dass mit dem Link "Zurück zum Anfang" verwendet wird[Top]

Verwandte Aufgaben

Aufgabenbeschreibung

Thema

Beschreibt, wie ein Data Quality-Projekt erstellt wird.

Erstellen eines Data Quality-Projekts

Beschreibt, wie ein Data Quality-Projekt verwaltet wird (öffnen, entsperren, umbenennen und löschen).

Verwalten von Data Quality-Projekten (Öffnen, Entsperren, Umbenennen, Löschen)

Beschreibt, wie ein Integration Services-Projekt in Data Quality Client geöffnet wird.

Öffnen von Integration Services-Projekten im Data Quality-Client

Siehe auch

Konzepte

DQS-Wissensdatenbanken und -Domänen