Lektion 2: Bereinigung von Lieferantendaten mithilfe der Wissensdatenbank 'Suppliers'

In dieser Lektion bereinigen Sie unter Verwendung der in der ersten Lektion erstellten Wissensdatenbank Suppliers die Lieferantendaten in einer Excel-Datei. Die Datenbereinigung in DQS umfasst einen computergestützten Prozess, der analysiert, inwieweit Daten mit den Informationen in einer Wissensdatenbank übereinstimmen, und einen interaktiven Prozess, mit dem Sie die Ergebnisse des computergestützten Prozesses überprüfen und ändern können. Die Datenbereinigungsfunktion identifiziert falsche Daten in der Datenquelle und korrigiert diese anschließend oder schlägt Korrekturen für die falschen Daten vor. Darüber hinaus standardisiert und erweitert sie Kundendaten unter Verwendung von Domänenwerten, führenden Werten für Synonyme, Domänenregeln, begriffsbasierten Beziehungen und Verweisdaten. Sie können die vom computergestützten Prozess vorgeschlagenen Änderungen interaktiv genehmigen oder ablehnen. Unter Datenbereinigung finden Sie weitere Informationen.

Der computergestützte Prozess verwendet die folgenden Schwellenwerte, die Sie mithilfe der Konfigurationsoption auf der DQS-Client-Hauptseite konfigurieren können.

  • Mindestergebnis für Vorschläge: Das Mindestergebnis bzw. der Vertrauensgrad, der von DQS zum Vorschlagen eines Ersatzes für einen Wert verwendet wird.

  • Mindestergebnis für automatische Korrekturen: Das Mindestergebnis bzw. der Vertrauensgrad, der von DQS zum automatischen Korrigieren eines Werts verwendet wird.

Unter Konfigurieren der Schwellenwerte für Bereinigung und Abgleich finden Sie detaillierte Informationen zur Konfiguration dieser Einstellungen.

In dieser Lektion führen Sie die folgenden Aufgaben für die Wissensdatenbank "Suppliers" aus, um die Eingabedaten zu bereinigen.

  1. Erstellen Sie ein Data Quality-Projekt für die Bereinigung, wählen Sie die Wissensdatenbank "Suppliers" als Wissensdatenbank für die Analyse und Bereinigung der Quelldaten in einer Excel-Datei aus, und wählen Sie die Bereinigungsaktivität aus.

  2. Ordnen Sie die Excel-Spalten, die Sie bereinigen möchten, entsprechenden DQS-Domänen/Verbunddomänen in der Wissensdatenbank zu.

  3. Führen Sie die computergestützte Bereinigungsaktivität aus. Der computergestützte Prozess zeigt Informationen zur Datenqualität im Data Quality-Client an, mit dem Sie die Daten interaktiv bereinigen können.

  4. Zeigen Sie die Ergebnisse der Bereinigungsaktivität an, und verwalten Sie sie. Sie können die Werte überprüfen, die vom computergestützten Prozess als richtig, falsch aber korrigiert, falsch mit einem Änderungsvorschlag oder ungültig bewertet werden. Sie können die Änderungen interaktiv genehmigen oder ablehnen und dabei den Vorschlag des computergestützten Prozesses im Feld "Korrigieren in" korrigieren oder überschreiben.

  5. Exportieren Sie die Ergebnisse des Bereinigungsprozesses in eine Excel-Datei.

  6. Importieren Sie die Werte aus dem Bereinigungsprojekt in Domänen, um die Informationen in der Wissensdatenbank durch neue Regeln, Werte, Korrekturen usw. zu erweitern.

Nächster Schritt

Aufgabe 1: Erstellen eines Data Quality-Projekts