Share via


Bereinigen von Daten in einer Verbunddomäne

Dieses Thema enthält Informationen zur Bereinigung von Verbunddomänen in Data Quality Services (DQS). Eine Verbunddomäne besteht aus einer oder mehreren Einzeldomänen und ist einem Datenfeld zugeordnet, das sich aus mehreren verwandten Begriffen zusammensetzt. Die einzelnen Domänen in einer Verbunddomäne müssen einen gemeinsamen Wissensbereich haben. Ausführliche Informationen zu Verbunddomänen finden Sie unter Verwalten einer Verbunddomäne.

In diesem Thema

  • Zuordnen einer Verbunddomäne zu den Quelldaten

  • Datenkorrektur mit definitiven domänenübergreifenden Regeln

  • Datenprofilerstellung für Verbunddomänen

Zuordnen einer Verbunddomäne zu den Quelldaten

Es gibt zwei Methoden, mit denen Sie die Quelldaten einer Verbunddomäne zuordnen können:

  • Bei den Quelldaten handelt es sich um ein einzelnes Feld (beispielsweise „Vollständiger Name“), das einer Verbunddomäne zugeordnet wird.

    • Wenn die Verbunddomäne einem Verweisdatendienst zugeordnet wird, werden die Quelldaten zur Korrektur und Analyse unverändert an den Verweisdatendienst gesendet.

    • Wenn die Verbunddomäne keinem Verweisdatendienst zugeordnet wird, werden die Quelldaten basierend auf der für die Verbunddomäne definierten Methode analysiert. Weitere Informationen zum Angeben einer Analysemethode für Verbunddomänen finden Sie unter Erstellen einer Verbunddomäne

  • Die Quelldaten bestehen aus mehreren Feldern (z. B. „Vorname“, „Weitere Vornamen“ und „Nachname“), die einzelnen Domänen innerhalb einer Verbunddomäne zugeordnet werden.

Ein Beispiel zum Zuordnen von Verbunddomänen zu Quelldaten finden Sie unter Anfügen einer Domäne/Verbunddomäne an Verweisdaten.

Pfeilsymbol, dass mit dem Link "Zurück zum Anfang" verwendet wird[Top]

Datenkorrektur mit definitiven domänenübergreifenden Regeln

Domänenübergreifende Regeln in Verbunddomänen ermöglichen es Ihnen, Regeln zu erstellen, die die Beziehung zwischen einzelnen Domänen in einer Verbunddomäne angeben. Domänenübergreifende Regeln werden berücksichtigt, wenn Sie die Bereinigungsaktivität für die Quelldaten von Verbunddomänen ausführen. Abgesehen davon, dass Sie erfahren, ob eine domänenübergreifenden Regel gültig ist, korrigiert die definitive domänenübergreifende Then-Regel Wert ist gleich auch die Daten während der Datenbereinigungsaktivität.

Beachten Sie das folgende Beispiel: Es gibt eine Verbunddomäne namens „Product“ mit drei einzelnen Domänen: ProductName, CompanyName und ProductVersion. Erstellen Sie die folgende definitive domänenübergreifende Regel:

IF Domain ‘CompanyName’ Value contains Microsoft and Domain ‘ProductName’ Value is equal to Office and ‘ProductVersion’ Value is equal to 2010 THEN Domain ‘ProductName’ Value is equal to Microsoft Office 2010.

Wenn diese domänenübergreifende Regel ausgeführt wird, werden die Quelldaten (ProductName) nach der Bereinigungsaktivität wie folgt korrigiert:

Quelldaten

Ausgabedaten

ProductName

CompanyName

ProductVersion

Office

Microsoft Inc.

2010

ProductName

CompanyName

ProductVersion

Microsoft Office 2010

Microsoft Inc.

2010

Wenn Sie die definitive domänenübergreifende Then-Regel Wert ist gleich testen, enthält das Dialogfeld Verbunddomänenregel testen eine neue Spalte namens Korrigieren in, in der die korrigierten Daten angezeigt werden. In einem Data Quality-Bereinigungsprojekt ändert diese definitive domänenübergreifende Regel die Daten mit 100% Zuverlässigkeit. In der Spalte Grund wird die folgende Meldung angezeigt: Korrigiert von Regel '<Name der domänenübergreifenden Regel>'. Weitere Informationen zu domänenübergreifenden Regeln finden Sie unter Erstellen einer domänenübergreifenden Regel.

HinweisHinweis

Die definitive domänenübergreifende Regel funktioniert nicht für Verbunddomänen, die an einen Verweisdatendienst angefügt wurden.

Pfeilsymbol, dass mit dem Link "Zurück zum Anfang" verwendet wird[Top]

Datenprofilerstellung für Verbunddomänen

Die Profilerstellung in DQS bietet während der Bereinigungsaktivität zwei Data Quality-Dimensionen: Vollständigkeit (das Ausmaß des Vorhandenseins von Daten) und Genauigkeit (das Ausmaß, in dem Daten für den beabsichtigten Zweck verwendet werden können). Die Profilerstellung kann keine zuverlässigen Vollständigkeitsstatistiken für Verbunddomänen bereitstellen. Wenn Sie Vollständigkeitsstatistiken benötigen, verwenden Sie Einzeldomänen anstatt Verbunddomänen. Wenn Sie Verbunddomänen verwenden möchten, sollten Sie eine Wissensdatenbank mit Einzeldomänen für die Profilerstellung erstellen, um die Vollständigkeit zu bestimmen, und eine weitere Domäne mit einer Verbunddomäne für die Bereinigungsaktivität erstellen. Die Profilerstellung kann z. B. 95 % Vollständigkeit für Adressendatensätze anzeigen, die eine Verbunddomäne verwenden, aber es kann einen viel höheren Grad der Unvollständigkeit für eine der Spalten geben, z. B. für eine Postleitzahlspalte. In diesem Beispiel möchten Sie die Vollständigkeit der Postleitzahlspalte mit einer Einzeldomäne messen.

Die Profilerstellung stellt wahrscheinlich zuverlässige Genauigkeitsstatistiken für Verbunddomänen bereit, da Sie die Genauigkeit für mehrere Spalten gemeinsam messen können. Der Wert dieser Daten liegt in der zusammengesetzten Aggregation, daher sollten Sie die Genauigkeit mit einer Verbunddomäne messen.

Ausführliche Informationen zur Datenprofilerstellung während der Bereinigungsaktivität finden Sie unter Profiler Statistics in Bereinigen von Daten mit (internem) DQS-Wissen.

Pfeilsymbol, dass mit dem Link "Zurück zum Anfang" verwendet wird[Top]