Enterprise Information Management mit SSIS, MDS und DQS

Das Verwalten von Informationen in einem Unternehmen schließt in der Regel die Integration von Daten im gesamten Unternehmen und darüber hinaus ein, außerdem Bereinigen der Daten, Abgleichen der Daten zum Entfernen aller Duplikate, Standardisieren der Daten, Erweitern der Daten, Sicherstellen, dass die Daten gesetzliche und Kompatibilitätsanforderungen erfüllen, und Speichern der Daten an einem zentralen Ort mit allen erforderlichen Sicherheitseinstellungen.

SQL Server 2012 stellt alle für eine effektive Enterprise Information Management (EIM)-Lösung benötigten Komponenten in einem einzigen Produkt bereit. Folgende Schlüsselkomponenten von SQL Server 2012 helfen Ihnen bei der Erstellung einer EIM-Lösung:

  • SQL Server Integration Services

  • SQL Server Data Quality Services

  • SQL Server Master Data Services

SQL Server Integration Services (SSIS) stellt eine leistungsstarke, erweiterbare Plattform für das Integrieren von Daten aus verschiedenen Quellen in einer umfassenden Lösung zum Extrahieren, Transformieren und Laden von Daten (ETL-Lösung) bereit, die Geschäftsworkflows, ein Data Warehouse oder die Masterdatenverwaltung unterstützt. Unter Integration Services – Übersicht finden Sie eine kurze Übersicht und typische Verwendungen von SSIS.

SQL Server Data Quality Services (DQS) ermöglicht es Ihnen, Daten zu bereinigen, abzugleichen, zu standardisieren und zu erweitern, sodass Sie zuverlässige Informationen für Business Intelligence, ein Data Warehouse und Transaktionsverarbeitungs-Arbeitsauslastungen übermitteln können. Weitere Informationen zur Geschäftsanforderung an DQS und dazu, wie DQS die Anforderung erfüllt, finden Sie unter Einführung in Data Quality Services.

SQL Server Master Data Services (MDS) bietet einen zentralen Datenhub, der sicherstellt, dass die Integrität der Informationen und die Einheitlichkeit der Daten in verschiedenen Anwendungen konstant sind. Unter Übersicht über Master Data Services finden Sie kurze Beschreibungen wichtiger Funktionen von MDS.

In den Whitepapers Enterprise Information Management mit SQL Server 2012 und Cleanse and Match Master Data by Using EIM finden Sie umfassende Hinweise zur Implementierung einer EIM-Lösung mithilfe dieser Microsoft EIM-Technologien. Sehen Sie sich auch das Video Enterprise Information Management (EIM): Bringing together SSIS, DQS, and MDS an, um eine interessante Demo eines EIM-Szenarios zu sehen.

In diesem Lernprogramm erfahren Sie, wie Sie SSIS, MDS und DQS zusammen verwenden, um eine Enterprise Information Management (EIM)-Beispiellösung zu implementieren. Zunächst erstellen Sie mithilfe von DQS eine Wissensdatenbank, die Informationen zu den Daten (Metadaten) enthält. Dann bereinigen Sie die Daten in einer Excel-Datei anhand der Wissensdatenbank und gleichen die Daten ab, um Duplikate in den Daten zu identifizieren und zu entfernen. Als Nächstes verwenden Sie das MDS-Add-In für Excel, um die bereinigten und abgeglichenen Daten in MDS hochzuladen. Dann automatisieren Sie den gesamten Prozess, indem Sie eine SSIS-Lösung verwenden. Die SSIS-Lösung in diesem Lernprogramm liest die Eingabedaten aus einer Excel-Datei, aber Sie können sie erweitern, damit sie aus verschiedenen Quellen wie Oracle, Teradata, DB2 und Windows Azure SQL-Datenbank lesen kann.

Erforderliche Komponenten

  1. Microsoft SQL Server 2012 mit den folgenden installierten Komponenten:

    1. Integration Services (SSIS)

    2. Master Data Services (MDS)

    3. Data Quality Services (DQS)

    4. SQL Server Data Tools

      Im SQL Server 2012-Installationshandbuch finden Sie Informationen zum Installieren des Produkts.

  2. Konfigurieren Sie MDS mithilfe des Master Data Services-Konfigurations-Managers.

    Verwenden Sie den Konfigurations-Manager, um eine Master Data Services-Datenbank zu erstellen und zu konfigurieren. Nachdem Sie die MDS-Datenbank erstellt haben, erstellen Sie eine Webanwendung für MDS auf einer Website (Beispiel: https://localhost/MDS), und ordnen Sie die MDS-Datenbank der MDS-Webanwendung zu. Beachten Sie, dass zum Erstellen einer MDS-Webanwendung IIS auf Ihrem Computer installiert sein muss. Unter Anforderungen für die Webanwendung (Master Data Services) sowie Datenbankanforderungen (Master Data Services) finden Sie Informationen zu den Voraussetzungen für das Konfigurieren von MDS-Datenbank und -Webanwendung.

  3. Installieren und konfigurieren Sie DQS mithilfe des Data Quality-Server-Installationsprogramms. Klicken Sie auf Start und dann auf Alle Programme. Klicken Sie auf Microsoft SQL Server 2012 und anschließend auf Data Quality Services, und klicken Sie dann auf Data Quality Server-Installationsprogramm.

  4. Microsoft Excel 2010 (32-Bit wird bevorzugt).

  5. Installieren Sie das Master Data Services-Add-In für Microsoft Excel (32-Bit oder 64-Bit, abhängig von der Excel-Version, die auf Ihrem Computer installiert ist) von hier. Um herauszufinden, welche Version von Excel auf dem Computer installiert ist, führen Sie Excel aus, klicken Sie auf der Menüleiste auf Datei, und klicken Sie dann auf Hilfe, um die Version im rechten Bereich anzuzeigen. Beachten Sie, dass Sie vor der Installation des Excel Add-Ins Visual Studio 2010 Tools für Office-Laufzeit installieren müssen.

  6. (Optional) Erstellen Sie ein Konto bei Windows Azure Marketplace. Für eine der Aufgaben im Lernprogramm müssen Sie über ein Konto bei Azure Marketplace verfügen (ursprünglich als Data Market bezeichnet). Sie können diese Aufgabe überspringen und mit der folgenden Aufgabe fortfahren.

  7. Laden Sie die Datei Suppliers.xls aus dem Microsoft Download Center herunter.

  8. Wenn Sie die 64-Bit-Version von Excel verwenden, ermöglicht DQS es Ihnen nicht, die Bereinigung- oder Abgleichsergebnisse in eine Excel-Datei zu exportieren. Es handelt sich um ein bekanntes Problem. Führen Sie folgende Schritte aus, um dieses Problem zu umgehen:

    1. Installieren Sie SQL Server 2012 SP1 (auf 64-Bit-Computern mit 64-Bit-Excel).

    2. Führen Sie DQLInstaller.exe –upgrade aus. Wenn Sie z. B. die Standardinstanz von SQL Server installiert haben, steht die Datei DQSInstaller.exe in der Regel unter C:\Programme\Microsoft SQL Server\MSSQL11.MSSQLSERVER\MSSQL\Binn zur Verfügung. Doppelklicken Sie auf die Datei DQSInstaller.exe.

    3. Klicken Sie im Konfigurations-Manager für Master Data Services auf Datenbank auswählen, wählen Sie die vorhandene MDS-Datenbank aus, und klicken Sie dann auf Aktualisieren.

Lektionen

Lektion

Kurze Beschreibung

Für die Bearbeitung voraussichtlich benötigte Zeit (in Minuten)

Lektion 1: Erstellen der DQS-Wissensdatenbank 'Suppliers'

In dieser Lektion erstellen Sie eine DQS-Wissensdatenbank namens Suppliers.

60

Lektion 2: Bereinigung von Lieferantendaten mithilfe der Wissensdatenbank 'Suppliers'

In dieser Lektion erstellen Sie ein DQS-Projekt, das Sie dann ausführen, um die Lieferantendaten in einer Excel-Datei zu bereinigen, indem Sie die Wissensdatenbank Suppliers verwenden, die Sie in der ersten Lektion erstellt haben.

45

Lektion 3: Abgleich von Daten, um Duplikate aus der Lieferantenliste zu entfernen

In dieser Lektion erstellen Sie ein DQS-Projekt, um einen Abgleich auszuführen und so Duplikate in der bereinigten Lieferantenliste zu identifizieren und daraus zu entfernen.

45

Lektion 4: Speichern von Lieferantendaten in MDS

In dieser Lektion laden Sie die bereinigten und abgeglichenen Lieferantendaten mit dem MDS-Add-In für Excel in Master Data Services (MDS) hoch.

45

Lektion 5: Automatisierung der Bereinigung und des Abgleich mit SSIS

In dieser Lektion erstellen Sie eine SSIS-Lösung, die Eingabedaten mithilfe von DQS bereinigt, die bereinigten Daten abgleicht, um Duplikate zu entfernen, und die bereinigten und abgeglichenen Daten automatisch in MDS speichert.

75

Nächste Schritte

Um das Lernprogramm zu starten, fahren Sie mit der ersten Lektion fort: Lektion 1: Erstellen der DQS-Wissensdatenbank 'Suppliers'.