Freigeben über


Erstellen einer Sequence Clustering-Miningmodellstruktur (Mittleres Data Mining Tutorial)

Der erste Schritt zum Erstellen eines Sequenzcluster-Miningmodells besteht im Erstellen einer neuen Miningstruktur sowie eines neuen Miningmodells auf der Basis des Microsoft Sequence Clustering-Algorithmus mittels des Data Mining-Assistenten.

Dazu verwenden Sie die gleiche Datenquellensicht wie für die Market Basket-Analyse, fügen jedoch eine Spalte mit dem sequence-Bezeichner hinzu. In diesem Szenario bezeichnet "Sequenz" die Reihenfolge, in der die Elemente vom Kunden im Warenkorb abgelegt werden.

Darüber hinaus fügen Sie einige Spalten hinzu, die in einem der Modelle zum Gruppieren von Kunden anhand demografischer Daten verwendet werden.

So erstellen Sie eine Sequenzclusterstruktur und ein Sequenzclustermodell

  1. Klicken Sie im Projektmappen-Explorer von Business Intelligence Development Studio mit der rechten Maustaste auf Miningstrukturen, und wählen Sie Neue Miningstruktur aus.

  2. Klicken Sie auf der Seite Willkommen auf Weiter.

  3. Überprüfen Sie auf der Seite Definitionsmethode auswählen, ob die Option Aus vorhandener relationaler Datenbank oder vorhandenem Data Warehouse ausgewählt ist, und klicken Sie dann auf Weiter.

  4. Überprüfen Sie auf der Seite Data Mining-Struktur erstellen, ob die Option Miningstruktur mit Miningmodell erstellen ausgewählt ist. Klicken Sie neben der Dropdownliste auf die Option Welche Data Mining-Technik möchten Sie verwenden?, und wählen Sie die Option Microsoft Sequence Clustering aus. Klicken Sie auf Weiter.

    Die Seite Datenquellensicht auswählen wird angezeigt. Wählen Sie unter Verfügbare Datenquellensichten die Option Bestellungen aus.

    Orders ist die gleiche Datenquellensicht, die Sie auch für das Market Basket-Szenario verwendet haben. Wenn Sie diese Datenquellensicht noch nicht erstellt haben, finden Sie unter Hinzufügen einer Datenquellensicht mit geschachtelten Tabellen (Data Mining-Lernprogramm für Fortgeschrittene) entsprechende Informationen.

  5. Klicken Sie auf Weiter.

  6. Aktivieren Sie auf der Seite Tabellentypen angeben neben der Tabelle vAssocSeqOrders das Kontrollkästchen Fall, und aktivieren Sie neben der Tabelle vAssocSeqLineItems das Kontrollkästchen Geschachtelt. Klicken Sie auf Weiter.

    HinweisHinweis

    Wenn bei der Auswahl der Kontrollkästchen Fall oder Geschachtelt ein Fehler auftritt, kann dies daran liegen, dass der Join in der Datenquellensicht fehlerhaft ist. Die geschachtelte Tabelle vAssocSeqLineItems muss mit der Falltabelle vAssocSeqOrders durch einen m:1-Join verbunden werden. Sie können die Beziehung bearbeiten, indem Sie mit der rechten Maustaste auf die Joinlinie klicken und dann die Richtung des Joins umkehren. Weitere Informationen finden Sie unter Dialogfeld 'Beziehung erstellen/bearbeiten' (Analysis Services - Mehrdimensionale Daten).

  7. Wählen Sie auf der Seite Trainingsdaten angeben die Spalten aus, die für das Modell verwendet werden sollen, indem Sie das entsprechende Kontrollkästchen aktivieren:

    • **IncomeGroup    **Aktivieren Sie das Kontrollkästchen Eingabe.

      Diese Spalte enthält interessante Informationen über die Kunden, die Sie für das Clustering verwenden können. Eine Verwendung findet nur im ersten Modell, nicht jedoch im zweiten Modell statt.

    • **OrderNumber    **Aktivieren Sie das Kontrollkästchen Schlüssel.

      Dieses Feld wird als Bezeichner oder Key für die Falltabelle verwendet. Das Schlüsselfeld der Falltabelle sollte nicht als Eingabe verwendet werden, da der Schlüssel eindeutige Werte enthält, die nicht nützlich für das Clustering sind.

    • **Region    **Aktivieren Sie das Kontrollkästchen Eingabe.

      Diese Spalte enthält interessante Informationen über die Kunden, die Sie für das Clustering verwenden können. Eine Verwendung findet nur im ersten Modell, nicht jedoch im zweiten Modell statt.

    • **LineNumber   **Aktivieren Sie die Kontrollkästchen Schlüssel und Eingabe.

      Das Feld LineNumber wird als Bezeichner oder Sequence Key für die geschachtelte Tabelle verwendet. Der Schlüssel für eine geschachtelte Tabelle muss immer für die Eingabe verwendet werden.

    • **Model   **Aktivieren Sie die Kontrollkästchen Eingabe und Vorhersagbar.

    Überprüfen Sie die Auswahl, und klicken Sie auf Weiter.

  8. Überprüfen Sie, ob das Raster auf der Seite Inhalt und Datentyp der Spalten angeben die in der folgenden Tabelle dargestellten Spalten, Inhaltstypen und Datentypen enthält, und klicken Sie auf Weiter.

    Tabellen/Spalten

    Inhaltstyp

    Datentyp

    IncomeGroup

    Diskret

    Text

    OrderNumber

    Schlüssel

    Text

    Region

    Diskret

    Text

    vAssocSeqLineItems

      

      

    "Zeilennummer: 65536"

    Key Sequence

    Long

    Modell

    Diskret

    Text

  9. Ändern Sie auf der Seite Testsatz erstellen den Wert von Prozentsatz der Daten für Tests in 20, und klicken Sie auf Weiter.

  10. Geben Sie auf der Seite Assistenten abschließen im Feld Miningstrukturname den Namen Sequenzcluster mit Region ein.

  11. Geben Sie in das Feld Miningmodellname den Namen Sequenzcluster mit Region ein.

  12. Aktivieren Sie die Option Drillthrough zulassen, und klicken Sie dann auf Fertig stellen.

Nächste Aufgabe in dieser Lektion

Verarbeiten des Sequenzclustermodells