Konzepte der Data Quality Services

Gilt für:SQL Server

Dieses Thema enthält eine kurze Zusammenfassung der Konzepte von Data Quality Services (DQS) im Wissensmanagement, in Projekten zur Datenqualität und in der Datenqualitätsverwaltung.

Konzepte der Wissensverwaltung

Die DQS-Wissensdatenbank ist ein Repository von Metadaten, die vom Data Steward oder IT-Profi zur Verwendung bei der Verbesserung der Datenqualität durch Datenbereinigung und Datenabgleich erstellt werden. Die DQS-Wissensverwaltung schließt die Prozesse ein, die verwendet wurden, um die Wissensdatenbank zu erstellen und zu verwalten, sowohl in einer computergestützten Weise als auch interaktiv.

Wissensermittlung

Die Wissensermittlung ist ein computergestützter Prozess, der Beispiele für die Daten der Organisation analysiert, um Wissen zu den Daten zu erstellen. Sobald die Ergebnisse der Analyse vorliegen, können Sie das Wissen überprüfen und verbessern und es dann auf die Durchführung von Datenbereinigungen, den Datenabgleich und die Profilerstellung anwenden. Weitere Informationen finden Sie unter DQS Knowledge Bases and Domains.

Domänenverwaltung

Der Domänenverwaltungsprozess ermöglicht es Ihnen, das Wissen zu ändern, das vom Wissensermittlungsprozess generiert wurde, oder es zu erweitern. Sie können das Wissen in einer Wissensdatenbank interaktiv bearbeiten, aktualisieren und überprüfen. Eine Wissensdatenbank besteht aus Datendomänen, die Domänenwerte und ihren Status, Domänenregeln, begriffsbasierte Beziehungen und Verweisdaten enthalten. In der Domänenverwaltung können Sie Domäneneigenschaften ändern, Verweisdaten an eine Domäne anfügen, Domänenregeln verwalten, Domänenwerte verwalten und Datenbeziehungen eingeben sowie Domänen erstellen, löschen, importieren oder exportieren. Sie können auch Verbunddomänen verwenden, die mehr als eine einzelne Domäne aggregieren. Weitere Informationen finden Sie unter DQS Knowledge Bases and Domains.

Übereinstimmende Richtlinie

Eine Abgleichsrichtlinie enthält die Abgleichsregeln, die verwendet werden, um Datendeduplizierung auszuführen. Der Abgleichsrichtlinienprozess ermöglicht es Ihnen, Abgleichsregeln zu erstellen, sie basierend auf Abgleichsergebnissen und Profilerstellungsdaten anzupassen und der Wissensdatenbank die Richtlinie hinzuzufügen. Weitere Informationen finden Sie unter Data Matching.

Reference Data Services

Sie können Verweisdaten verwenden, um die Daten zu überprüfen, zu korrigieren und anzureichern und dabei die Dienste von Unternehmen nutzen, die die Qualität ihrer Verweisdaten garantieren. Sie können die Dienste von Azure Marketplace verwenden, um eine Verbindung mit Referenzdatenanbietern herzustellen, oder Sie können eine direkte Verbindung zu einem Anbieter verwenden. Weitere Informationen finden Sie unter Reference Data Services in DQS.

Weitere Informationen zur Wissensverwaltung in DQS finden Sie unter DQS Knowledge Bases and Domains.

Konzepte des Data Quality-Projekts

Der Data Steward führt Datenqualitätsvorgänge (Reinigung und Abgleich) mithilfe eines Datenqualitätsprojekts in der Data Quality Client-Anwendung aus.

Datenbereinigung

Die Datenbereinigung in DQS wird auf Grundlage des Wissens in einer DQS-Wissensdatenbank ausgeführt. Die Datenbereinigung in DQS umfasst zwei Schritte:

  • Computergestützte Bereinigung: DQS verwendet das Wissen in der ausgewählten Wissensdatenbank für das Bereinigungsprojekt, um Korrekturen/Vorschläge für die Werte in einer Datenquelle anzubieten.

  • Interaktive Bereinigung: Der Data Steward kann den interaktiven Bereinigungsprozess ausführen, um Datenkorrekturen, die vom computergestützten Datenbereinigungsprozess vorgeschlagen wurden, zu ändern oder zu erweitern. Der Data Steward verwendet dabei Vertrauensgrade und Statistiken, die vom Datenbereinigungsprozess identifiziert werden, oder eigene Änderungen, die manuell in das Projekt eingegeben werden.

Der Data Steward kann die verarbeiteten Daten nach der Bereinigung in eine SQL Server-Datenbank, CSV- oder Excel-Datei exportieren. Weitere Informationen finden Sie unter Data Cleansing.

Datenabgleich

Der Abgleichsprozess ermöglicht es dem Data Steward, Daten abzugleichen, damit ähnliche, aber leicht abweichende Daten anhand eines Deduplizierungsprozesses ausgerichtet werden können. DQS führt die Deduplizierung auf Grundlage der in der Wissensdatenbank enthaltenen Abgleichsregeln aus; die Parameter für den Abgleichsprozess werden vom Data Steward aus dem Data Quality-Projekt heraus angegeben. Weitere Informationen finden Sie unter Data Matching.

Profilerstellung und Benachrichtigungen

Die Datenprofilerstellung stellt Data Stewards während der Ausführung eines Data Quality-Projekts Statistiken und Informationen zu den von DQS verarbeiteten Daten in Echtzeit bereit, die für Bereinigungs- und Abgleichsaktivitäten verwendet werden. Mithilfe der Datenprofilerstellung können Sie die Effektivität der Bereinigungs- und Abgleichsprozesse in einem Data Quality-Projekt bewerten. Außerdem unterstützen Benachrichtigungen den Benutzer bei Aktionen, die zur Verbesserung der Datenbereinigungs- und Datenabgleichsvorgänge ausgeführt werden können. Weitere Informationen finden Sie unter Data Profiling and Notifications in DQS.

Weitere Informationen zu Datenqualitätsprojekten in DQS finden Sie unter Data Quality Projects (DQS).

Konzepte der Data Quality-Verwaltung

Ein DQS-Administrator kann verschiedene administrative Aufgaben mithilfe der Data Quality Client-Anwendung ausführen.

Aktivitätsüberwachung

Die Aktivitätsüberwachung zeigt den Status und den Zustand jeder Aktivität an, die innerhalb eines Datenbereichs durchgeführt wird, stellt Daten für jede Aktivität bereit und ermöglicht es DQS-Administratoren, eine Aktivität zu steuern. Weitere Informationen finden Sie unter Monitor DQS Activities.

Konfiguration

Die Option "Konfiguration" bietet folgende Möglichkeiten:

DQS-Sicherheit

Sie verwenden Rollen innerhalb des SQL Server-Sicherheitsmechanismus, um DQS sicher zu machen. Es gibt drei DQS-Rollen, die die Zugriffsebene für einen Benutzer in der Datenqualitätsclientanwendung bestimmen: dqs_administrator, dqs_kb_editor und dqs_kb_operator. Sie können den Benutzern, die die Datenqualitätsclientanwendung verwenden, keine Rollen erteilen. Sie erfolgt mithilfe von SQL Server Management Studio. Weitere Informationen finden Sie unter DQS Security.

Weitere Informationen zur DQS-Verwaltung finden Sie unter DQS Administration.

Weitere Informationen

Data Quality Services