Lektion 5: Automatisierung der Bereinigung und des Abgleich mit SSIS

Mithilfe des Tools DQS-Client haben Sie in Lektion 1 die Wissensdatenbank "Suppliers" erstellt und sie verwendet, um in Lektion 2 Daten zu bereinigen und in Lektion 3 Daten abzugleichen. In einem realen Szenario müssen Sie möglicherweise Daten aus einer Quelle abrufen, die DQS nicht unterstützt, oder den Bereinigungs- und Abgleichsprozess automatisieren, ohne das Tool DQS-Client zu verwenden. SQL Server Integration Services (SSIS) weist Komponenten auf, die Sie verwenden können, um Daten aus verschiedenen heterogenen Quellen zu integrieren, und eine Komponente DQS-Bereinigungstransformation, um die DQS-Bereinigungsfunktionalität aufzurufen. Derzeit stellt DQS keine Abgleichsfunktionalität für SSIS bereit, Sie können jedoch die Transformation für Fuzzygruppierung verwenden, um Duplikate in den Daten zu identifizieren.

Sie können Daten in MDS hochladen, indem Sie die entitätsbasierte Stagingfunktion verwenden. Wenn Sie eine Entität in MDS erstellen, werden entsprechende Stagingtabellen und gespeicherte Prozeduren automatisch erstellt. Beim Erstellen der Entität "Supplier" wurden beispielsweise die Tabelle stg.supplier_Leaf und die gespeicherte Prozedur stg.udp_Supplier_Leaf automatisch erstellt. Sie verwenden die Stagingtabellen und Prozeduren, um Entitätselemente zu erstellen, zu aktualisieren und zu löschen. In dieser Lektion erstellen Sie neue Entitätselemente für die Entität "Suppliers". Um Daten auf den MDS-Server zu laden, lädt das SSIS-Paket zuerst die Daten in die Stagingtabelle stg.supplier_Leaf und löst dann die zugeordnete gespeicherte Prozedur stg.udp_Supplier_Leaf aus. Weitere Informationen erhalten Sie unter Importieren von Daten.

In dieser Lektion führen Sie die folgenden Aufgaben aus:

  1. Entfernen Sie Lieferantendaten in MDS (wenn Sie die vorherigen vier Lektionen durchgearbeitet haben). Das SSIS-Paket, das Sie in dieser Lektion erstellen, lädt die Daten in MDS automatisch hoch. Sie haben die bereinigten und abgeglichenen Lieferantendaten in einem früheren Schritt manuell mit DQS-Client auf den MDS-Server hochgeladen.

  2. Erstellen Sie eine Abonnementsicht in der Entität "Suppliers", um Daten in der Entität anderen Anwendungen bereitzustellen. Diese Aktion erstellt eine SQL-Sicht, die Sie mit SQL Server Management Studio überprüfen. Sie werden diese Sicht nicht in dieser Version des Lernprogramms nutzen.

  3. Erstellen Sie ein SSIS-Projekt, und führen Sie es aus, indem Sie SQL Server Data Tools verwenden. Das Projekt verwendet die Transformation Datenbereinigung, um eine Bereinigungsanforderung an den DQS-Server zu senden. DQS stellt keine Abgleichsfunktion bereit. Daher verwenden Sie die Transformation für Fuzzygruppierung, um Duplikate zu identifizieren.

  4. Überprüfen Sie mit Master Data Manager, ob die Daten in MDS erstellt wurden.

  5. Überprüfen Sie die Ergebnisse des DQS-Bereinigungsprojekts, das vom SSIS-Paket erstellt wurde, und führen Sie optional eine interaktive Bereinigung durch, um die Wissensdatenbank auszubauen.

Nächster Schritt

Aufgabe 1 (Voraussetzung) Entfernen von Lieferantendaten in MDS