Erstellen einer Sequence Clustering-Miningmodellstruktur (Data Mining-Lernprogramm für Fortgeschrittene)

Der erste Schritt zum Erstellen eines Sequence Clustering-Miningmodells besteht im Erstellen einer neuen Miningstruktur sowie eines neuen Miningmodells mit dem Data Mining-Assistenten auf Basis des Microsoft Sequence Clustering-Algorithmus.

Dazu verwenden Sie die gleiche Datenquellensicht wie für die Market Basket-Analyse, fügen jedoch eine Spalte mit dem sequence-Bezeichner hinzu. Sequenz bezeichnet in diesem Szenario die Reihenfolge, in der Elemente vom Kunden im Einkaufskorb abgelegt werden.

Darüber hinaus fügen Sie einige Spalten hinzu, die in einem der Modelle zum Gruppieren von Kunden anhand demografischer Daten verwendet werden.

So erstellen Sie eine Sequenzclusterstruktur und ein Sequenzclustermodell

  1. Klicken Sie im Projektmappen-Explorer von Business Intelligence Development Studio mit der rechten Maustaste auf Miningstrukturen, und wählen Sie Neue Miningstruktur aus.

  2. Klicken Sie auf der Seite Willkommen auf Weiter.

  3. Überprüfen Sie auf der Seite Definitionsmethode auswählen, ob die Option Aus vorhandener relationaler Datenbank oder vorhandenem Data Warehouse ausgewählt ist, und klicken Sie dann auf Weiter.

  4. Überprüfen Sie auf der Seite Data Mining-Struktur erstellen, ob die Option Miningstruktur mit Miningmodell erstellen ausgewählt ist. Klicken Sie neben der Dropdownliste auf die Option Welche Data Mining-Technik möchten Sie verwenden?, und wählen Sie die Option Microsoft Sequence Clustering aus. Klicken Sie auf Weiter.

    Die Seite Datenquellensicht auswählen wird angezeigt. Wählen Sie unter Verfügbare Datenquellensichten die Option Orders aus.

    Orders ist die gleiche Datenquellensicht, die Sie auch für das Market Basket-Szenario verwendet haben. Wenn Sie diese Datenquellensicht noch nicht erstellt haben, finden Sie unter Hinzufügen einer Datenquellensicht mit geschachtelten Tabellen (Data Mining-Lernprogramm für Fortgeschrittene) entsprechende Informationen.

  5. Klicken Sie auf Weiter.

  6. Aktivieren Sie auf der Seite Tabellentypen angeben neben der Tabelle vAssocSeqOrders das Kontrollkästchen Fall, und aktivieren Sie neben der Tabelle vAssocSeqLineItems das Kontrollkästchen Geschachtelt. Klicken Sie auf Weiter.

    HinweisHinweis

    Wenn bei der Auswahl der Kontrollkästchen Fall oder Geschachtelt ein Fehler auftritt, kann dies daran liegen, dass die Verknüpfung in der Datenquellensicht fehlerhaft ist. Die geschachtelte Tabelle vAssocSeqLineItems muss mit der Falltabelle vAssocSeqOrders durch eine m:1-Verknüpfung verbunden werden. Sie können die Beziehung bearbeiten, indem Sie mit der rechten Maustaste auf die Verknüpfungslinie klicken und die Richtung der Verknüpfung umkehren. Weitere Informationen finden Sie unter Dialogfeld 'Beziehung erstellen/bearbeiten' (Analysis Services - Mehrdimensionale Daten).

  7. Wählen Sie auf der Seite Trainingsdaten angeben die Spalten aus, die für das Modell verwendet werden sollen, indem Sie das entsprechende Kontrollkästchen aktivieren:

    • **IncomeGroup    **Aktivieren Sie das Kontrollkästchen Eingabe.

      Diese Spalte enthält interessante Informationen über die Kunden, die Sie für das Clustering verwenden können. Eine Verwendung findet nur im ersten Modell, nicht jedoch im zweiten Modell statt.

    • **OrderNumber    **Aktivieren Sie das Kontrollkästchen Schlüssel.

      Dieses Feld wird als Bezeichner oder Key für die Falltabelle verwendet. Das Schlüsselfeld der Falltabelle sollte nicht als Eingabe verwendet werden, da der Schlüssel eindeutige Werte enthält, die nicht nützlich für das Clustering sind.

    • **Region    **Aktivieren Sie das Kontrollkästchen Eingabe.

      Diese Spalte enthält interessante Informationen über die Kunden, die Sie für das Clustering verwenden können. Eine Verwendung findet nur im ersten Modell, nicht jedoch im zweiten Modell statt.

    • **LineNumber   **Aktivieren Sie das Kontrollkästchen Schlüssel und das Kontrollkästchen Eingabe.

      Das Feld LineNumber wird als Bezeichner oder Sequence Key für die geschachtelte Tabelle verwendet. Der Schlüssel für eine geschachtelte Tabelle muss immer für die Eingabe verwendet werden.

    • **Model   **Aktivieren Sie das Kontrollkästchen Eingabe und das Kontrollkästchen Vorhersagbar.

    Überprüfen Sie die Auswahl, und klicken Sie auf Weiter.

  8. Überprüfen Sie, dass das Raster auf der Seite Inhalt und Datentyp der Spalten angeben die Spalten, Inhaltstypen und Datentypen in der folgenden Tabelle enthält, und klicken Sie auf Weiter.

    Tabellen/Spalten

    Inhaltstyp

    Datentyp

    IncomeGroup

    Diskret

    Text

    OrderNumber

    Schlüssel

    Text

    Region

    Diskret

    Text

    vAssocSeqLineItems

      

      

    Zeilennummer

    Key Sequence

    Long

    Modell

    Diskret

    Text

  9. Ändern Sie auf der Seite Testsatz erstellen den Wert von Prozentsatz der Daten für Tests in 20, und klicken Sie auf Weiter.

  10. Geben Sie auf der Seite Assistenten abschließen im Feld Miningstrukturname den Namen Sequence Clustering mit Region ein.

  11. Geben Sie in das Feld Miningmodellname den Namen Sequence Clustering mit Region ein.

  12. Aktivieren Sie die Option Drillthrough zulassen, und klicken Sie dann auf Fertig stellen.

Nächste Aufgabe in dieser Lektion

Verarbeiten des Sequenzclustermodells