Erstellen einer Sequence Clustering-Miningmodellstruktur (Mittleres Data Mining Tutorial)

 

Gilt für: SQL Server 2016 Preview

Der erste Schritt zum Erstellen eines Sequenzcluster-Miningmodells besteht im Erstellen einer neuen Miningstruktur sowie eines neuen Miningmodells auf der Basis des Microsoft Sequence Clustering-Algorithmus mittels des Data Mining-Assistenten.

Verwenden Sie die gleiche Datenquellensicht, die Sie für die Warenkorbanalyse verwendet, aber fügen Sie eine Spalte mit dem Sequenz Bezeichner. In diesem Szenario bezeichnet "Sequenz" die Reihenfolge, in der die Elemente vom Kunden im Warenkorb abgelegt werden.

Darüber hinaus fügen Sie einige Spalten hinzu, die in einem der Modelle zum Gruppieren von Kunden anhand demografischer Daten verwendet werden.

So erstellen Sie eine Sequenzclusterstruktur und ein Sequenzclustermodell

  1. Im Projektmappen-Explorer SQL Server Data Tools (SSDT), mit der rechten Maustaste Miningstrukturen und wählen Sie Neue Miningstruktur.

  2. Klicken Sie auf der Seite Willkommen auf Weiter.

  3. Auf der Definitionsmethode auswählen Überprüfen Sie, ob Seite aus vorhandener relationaler Datenbank oder vorhandenem Data Warehouse ausgewählt ist, und klicken Sie dann auf Weiter.

  4. Auf der Data Mining-Struktur erstellen Seite, überprüfen Sie, ob die Option Miningstruktur mit Miningmodell erstellen ausgewählt ist. Klicken Sie anschließend auf die Dropdownliste für die Option welche Datamining-Technik möchten Sie verwenden?, und wählen Sie Microsoft Sequence Clustering. Klicken Sie auf Weiter.

    Die Datenquellensicht auswählen Seite wird angezeigt. Unter Verfügbare Datenquellensichten, Option Aufträge.

    Orders ist die gleiche Datenquellensicht, die Sie auch für das Market Basket-Szenario verwendet haben. Wenn Sie diese Datenquellensicht erstellt haben, finden Sie unter Hinzufügen einer Datenquellensicht mit geschachtelten Tabellen ( Intermediate Data Mining-Lernprogramm ).

  5. Klicken Sie auf Weiter.

  6. Auf der Tabellentypen angeben Seite der Fall das Kontrollkästchen neben der vAssocSeqOrders Tabelle, und wählen Sie die geschachtelte das Kontrollkästchen neben der vAssocSeqLineItems Tabelle. Klicken Sie auf Weiter.

    Hinweis


    Tritt ein Fehler bei der Auswahl der Fall oder geschachtelte Kontrollkästchen, kann es sein, dass der Join in der Datenquellensicht nicht korrekt ist. Die geschachtelte Tabelle vAssocSeqLineItems, muss eine Verbindung mit der Falltabelle vAssocSeqOrders durch eine viele-zu-eins-Verknüpfung. Sie können die Beziehung bearbeiten, indem Sie mit der rechten Maustaste auf die Joinlinie klicken und dann die Richtung des Joins umkehren. Weitere Informationen finden Sie unter Erstellen oder das Dialogfeld bearbeiten Beziehung ( Analysis Services – mehrdimensionale Daten ).

  7. Auf der Trainingsdaten angeben Seite, wählen Sie die Spalten für die Verwendung im Modell durch Aktivieren eines Kontrollkästchens wie folgt:

    • IncomeGroupWählen Sie die Eingabe das Kontrollkästchen.

      Diese Spalte enthält interessante Informationen über die Kunden, die Sie für das Clustering verwenden können. Eine Verwendung findet nur im ersten Modell, nicht jedoch im zweiten Modell statt.

    • OrderNumberWählen Sie die Schlüssel das Kontrollkästchen.

      Dieses Feld wird als Bezeichner verwendet werden, für die Falltabelle oder Schlüssel. Das Schlüsselfeld der Falltabelle sollte nicht als Eingabe verwendet werden, da der Schlüssel eindeutige Werte enthält, die nicht nützlich für das Clustering sind.

    • RegionWählen Sie die Eingabe das Kontrollkästchen.

      Diese Spalte enthält interessante Informationen über die Kunden, die Sie für das Clustering verwenden können. Eine Verwendung findet nur im ersten Modell, nicht jedoch im zweiten Modell statt.

    • LineNumberWählen Sie die Schlüssel und Eingabe Kontrollkästchen.

      Die LineNumber Feld wird als Bezeichner verwendet werden, für die geschachtelte Tabelle oder Sequence Key. Der Schlüssel für eine geschachtelte Tabelle muss immer für die Eingabe verwendet werden.

    • ModellWählen Sie die Eingabe und vorhersagbar Kontrollkästchen.

    Stellen Sie sicher, dass die Auswahl, und klicken Sie dann auf Weiter.

  8. Auf der Inhalt und Datentyp der Spalten angeben Seite überprüfen, ob das Raster die Spalten, Inhaltstypen und Datentypen, die in der folgenden Tabelle gezeigt enthält, und klicken Sie dann auf Weiter.

    Tabellen/Spalten Inhaltstyp Datentyp
    IncomeGroup Discrete Text
    OrderNumber Key Text
    Region Discrete Text
    vAssocSeqLineItems
    Zeilennummer Key Sequence Long
    Model Discrete Text
  9. Auf der Testsatz erstellen Seite, ändern Sie die Prozentsatz der zu testenden Daten in 20, und klicken Sie dann auf Weiter.

  10. Auf der der Assistent Seite für die Miningstrukturname, Typ Sequence Clustering with Region.

  11. Für die Miningmodellname, Typ Sequence Clustering with Region.

  12. Überprüfen Sie die Drillthrough zulassen ein, und klicken Sie dann auf Fertig stellen.

Nächste Aufgabe in der Lektion

Verarbeiten des Sequenzclustermodells

Siehe auch

Data Mining-Designer
Microsoft Sequence Clustering-Algorithmus