Erstellen von Vorhersagen für ein Sequenzclustermodell (Data Mining-Lernprogramm für Fortgeschrittene)

Nachdem Sie sich im Viewer mit dem Sequenzclustermodell vertraut gemacht haben, können Sie mit dem Generator für Vorhersageabfragen auf der Registerkarte Miningmodellvorhersage im Data Mining-Designer Vorhersageabfragen erstellen. Um eine Vorhersage zu erstellen, wählen Sie zuerst das Sequenzclustermodell und dann die Eingabedaten aus. Sie können eine externe Datenquelle als Eingabe verwenden, oder Sie können eine SINGLETON-Abfrage erstellen und Werte in einem Dialogfeld angeben.

In dieser Lektion wird davon ausgegangen, dass Sie bereits mit der Verwendung des Generators für Vorhersageabfragen vertraut sind und lernen möchten, wie spezifische Abfragen für ein Sequenzclustermodell erstellt werden. Grundlegende Informationen zur Verwendung eines Sequenzclustermodells finden Sie unter Erstellen von DMX-Vorhersageabfragen oder im Abschnitt Erstellen von Vorhersagen (Lernprogramm zu Data Mining-Grundlagen) des Lernprogramms zu Data Mining-Grundlagen.

Erstellen von Vorhersagen für das regionale Modell

In diesem Szenario erstellen Sie zunächst einige SINGLETON-Vorhersageabfragen, um eine Vorstellung von den regionalen Unterschieden bei Vorhersageabfragen zu erhalten.

So erstellen Sie eine SINGLETON-Abfrage für ein Sequenzclustermodell

  1. Klicken Sie im Data Mining-Designer auf die Registerkarte Miningmodellvorhersage.

  2. Wählen Sie im Spaltenmenü Miningmodell die Option SINGLETON-Abfrage aus.

    Der Bereich Miningmodell und der Bereich SINGLETON-Abfrageeingabe werden angezeigt.

  3. Klicken Sie im Bereich Miningmodell auf Modell auswählen. (Sie können diesen Schritt überspringen, wenn der Sequenzclustermodus bereits ausgewählt wurde.)

    Das Dialogfeld Miningmodell auswählen wird geöffnet.

  4. Erweitern Sie den Knoten, der die Miningstruktur Sequenzcluster mit Region darstellt, und wählen Sie das Modell Sequence Clustering with Region aus. Klicken Sie auf OK. Der Eingabebereich spielt im Moment noch keine Rolle; die Eingaben werden nach Einrichten der Vorhersagefunktionen vorgenommen.

  5. Klicken Sie im Raster unter Quelle auf die leere Zelle, und wählen Sie Vorhersagefunktion aus. Wählen Sie in der Zelle unter Feld den Eintrag PredictSequence aus.

    HinweisHinweis

    Sie können auch die Predict-Funktion verwenden. Achten Sie in diesem Fall darauf, die Version der Predict-Funktion auszuwählen, die eine Tabellenspalte als Argument akzeptiert.

  6. Wählen Sie im Bereich Miningmodell die geschachtelte Tabelle v Assoc Seq Line Items aus und ziehen Sie diese in das Raster zum Feld Kriterium/Argument für die PredictSequence-Funktion.

    Das Ziehen und Ablegen von Tabellen- und Spaltennamen ermöglicht es Ihnen, komplexe Anweisungen ohne Syntaxfehler zu erstellen. Dadurch wird jedoch der aktuelle Zelleninhalt einschließlich anderer optionaler Argumente für die PredictSequence-Funktion ersetzt. Wenn Sie die anderen Argumente anzeigen möchten, können Sie dem Raster vorübergehend eine zweite Instanz der Funktion als Referenz hinzufügen.

  7. Klicken Sie auf die Schaltfläche Ergebnis oben rechts im Generator für Vorhersageabfragen.

Die erwarteten Ergebnisse enthalten eine einzelne Spalte mit der Überschrift Ausdruck. Die Spalte Ausdruck enthält eine geschachtelte Tabelle mit drei Spalten:

$SEQUENCE

"Zeilennummer: 65536"

Modell

1

  

Mountain-200

Was bedeuten diese Ergebnisse? Denken Sie daran, dass Sie keine Eingaben angegeben haben. Die Vorhersage erfolgt daher auf Basis aller Fälle, und die wahrscheinlichste Gesamtvorhersage wird von Analysis Services zurückgegeben.

Hinzufügen von Eingaben zu einer SINGLETON-Vorhersageabfrage

Bislang haben Sie noch keine Eingaben angegeben. In der nächsten Aufgabe geben Sie unter Verwendung des Bereichs SINGLETON-Abfrageeingabe einige Eingaben für die Abfrage an. Zunächst verwenden Sie [Region] als Eingabe für das Clustermodell für regionale Sequenzen, um zu überprüfen, ob die vorhergesagten Sequenzen für alle Regionen gleich sind. Anschließend erfahren Sie, wie Sie die Abfrage bearbeiten und die Wahrscheinlichkeit für die einzelnen Vorhersagen hinzufügen können; außerdem vereinfachen Sie die Ergebnisse, um diese übersichtlicher zu gestalten.

So generieren Sie Vorhersagen für eine bestimmte Kundengruppe

  1. Klicken Sie oben links im Generator für Vorhersageabfragen auf die Schaltfläche Entwurf, um zum Raster für das Erstellen von Abfragen zurückzukehren.

  2. Klicken Sie im Dialogfeld SINGLETON-Abfrageeingabe für Region auf das Feld Wert, und wählen Sie Europe aus.

  3. Klicken Sie auf die Schaltfläche Ergebnis, um Vorhersagen für Kunden in Europa anzuzeigen.

  4. Klicken Sie oben links im Generator für Vorhersageabfragen auf die Schaltfläche Entwurf, um zum Raster für das Erstellen von Abfragen zurückzukehren.

  5. Klicken Sie im Dialogfeld SINGLETON-Abfrageeingabe für Region auf das Feld Wert, und wählen Sie North America aus.

  6. Klicken Sie auf die Schaltfläche Ergebnis, um Vorhersagen für Kunden in Nordamerika anzuzeigen.

Hinzufügen von Wahrscheinlichkeiten mit einem benutzerdefinierten Ausdruck

Das Ausgeben der Wahrscheinlichkeit für die einzelnen Vorhersagen gestaltet sich etwas schwieriger, da die Wahrscheinlichkeit ein Attribut der Vorhersage darstellt und als geschachtelte Tabelle ausgegeben wird. Wenn Sie bereits mit Data Mining-Erweiterungen (DMX) vertraut sind, können Sie einfach die Abfrage ändern und der geschachtelten Tabelle eine untergeordnete SELECT-Anweisung hinzufügen. Sie können jedoch auch eine untergeordnete SELECT-Anweisung im Generator für Vorhersageabfragen erstellen, indem Sie einen benutzerdefinierten Ausdruck hinzufügen.

So geben Sie Wahrscheinlichkeiten für eine vorhergesagte Sequenz mit einem benutzerdefinierten Ausdruck aus

  1. Klicken Sie oben links im Generator für Vorhersageabfragen auf die Schaltfläche Entwurf, um zum Raster für das Erstellen von Abfragen zurückzukehren.

  2. Klicken Sie im Raster unter Quelle auf eine neue Zeile, und wählen Sie Benutzerdefinierter Ausdruck aus.

  3. Lassen Sie das Feld unter Feld leer.

  4. Geben Sie für Alias den Buchstaben t ein.

  5. Geben Sie im Feld Kriterium/Argument die vollständige untergeordnete SELECT-Anweisung ein, wie im folgenden Codebeispiel dargestellt. Achten Sie darauf, auch die öffnende und die schließende Klammer einzugeben.

    (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))
    
  6. Klicken Sie auf die Schaltfläche Ergebnis, um Vorhersagen für Kunden in Europa anzuzeigen.

Das Ergebnis enthält zwei geschachtelte Tabellen: eine Tabelle mit der Vorhersage und eine Tabelle mit der Wahrscheinlichkeit für die Vorhersage. Wenn Sie die Abfrage nicht ausführen können, können Sie zur Abfrageentwurfsansicht wechseln und die vollständige Abfrageanweisung überprüfen. Diese sollte wie folgt lauten:

SELECT
  PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]),
  ( (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))) as [t]
FROM
  [Sequence Clustering with Region]
NATURAL PREDICTION JOIN
(SELECT 'Europe' AS [Region]) AS t

Arbeiten mit Ergebnissen

Wenn Ihre Ergebnisse eine große Zahl von geschachtelten Tabellen enthalten, können Sie diese vereinfachen, um die Anzeige übersichtlicher zu gestalten. Dazu können Sie die Abfrage manuell ändern und das FLATTENED-Schlüsselwort hinzufügen.

So vereinfachen Sie geschachtelte Rowsets in einer Vorhersageabfrage

  1. Klicken Sie auf die Schaltfläche Abfrage in der Ecke des Generators für Vorhersageabfragen.

    Das Raster ändert sich in einen offenen Bereich, in dem Sie die DMX-Anweisung anzeigen und ändern können, die Sie mit dem Generator für Vorhersageabfragen erstellt haben.

  2. Geben Sie nach dem SELECT-Schlüsselwort FLATTENED ein.

    Der vollständige Abfragetext sollte wie folgt aussehen:

    SELECT FLATTENED
      PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]),
      ( (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))) as [t]
    FROM
      [Sequence Clustering with Region]
    NATURAL PREDICTION JOIN
    (SELECT 'Europe' AS [Region]) AS t
    
  3. Klicken Sie auf die Schaltfläche Ergebnisse oben rechts im Generator für Vorhersageabfragen.

Nach dem manuellen Bearbeiten einer Abfrage können Sie nicht mehr zur Entwurfsansicht zurückkehren, ohne dass Ihre Änderungen verloren gehen. Sie können jedoch die DMX-Anweisung, die Sie manuell erstellt haben, als Textdatei speichern und anschließend zur Entwurfsansicht zurückkehren. In diesem Fall wird die Abfrage auf die letzte gültige Version in der Entwurfsansicht zurückgesetzt.

Erstellen von Vorhersagen für das verwandte Modell

In den vorangegangenen Beispielen wurde die Tabellenspalte für den Fall Region als Eingabe für eine SINGLETON-Vorhersageabfrage verwendet, um zu überprüfen, ob im Modell regionale Unterschiede festzustellen sind. Nach der Untersuchung des Modells sind Sie jedoch zu dem Schluss gekommen, dass die Unterschiede nicht groß genug sind, um eine Anpassung von Produktempfehlungen nach Region zu rechtfertigen. Vielmehr interessieren Sie sich für Vorhersagen über die Elemente, die ein Kunde voraussichtlich wählen wird. In den folgenden Abfragen verwenden Sie daher das Sequenzclustermodell ohne Region, um Empfehlungen für alle Kunden zu generieren.

Verwenden von geschachtelten Tabellenspalten als Eingabe

Zunächst erstellen Sie eine SINGLETON-Vorhersageabfrage, die ein Element als Eingabe akzeptiert und das Element mit der nächsthöheren Wahrscheinlichkeit zurückgibt. Voraussetzung für eine solche Vorhersage ist die Verwendung einer geschachtelten Tabellenspalte als Eingabewert. Dies liegt daran, dass das Attribut für die Vorhersage (Modell) Teil einer geschachtelten Tabelle ist. Analysis Services stellt das Dialogfeld Eingabe für geschachtelte Tabelle bereit, um das Erstellen von Vorhersageabfragen für geschachtelte Tabellenattribute mit dem Generator für Vorhersageabfragen zu vereinfachen.

So verwenden Sie eine geschachtelte Tabelle als Eingabe für eine Vorhersage

  1. Klicken Sie oben links im Generator für Vorhersageabfragen auf die Schaltfläche Entwurf, um zum Raster für das Erstellen von Abfragen zurückzukehren.

  2. Klicken Sie im Dialogfeld SINGLETON-Abfrageeingabe für Region auf das Feld Wert, und wählen Sie die leere Zeile aus, um die Eingabe für das Feld zu löschen.

  3. Klicken Sie im Dialogfeld SINGLETON-Abfrageeingabe für vAssocSeqLineItems auf das Feld Wert und anschließend auf die Schaltfläche mit den drei Punkten (...).

  4. Klicken Sie im Dialogfeld Eingabe für geschachtelte Tabelle auf Hinzufügen.

  5. Klicken Sie in der neuen Zeile auf das Feld unter Modell, und wählen Sie Touring Tire aus der Liste aus. Klicken Sie auf OK.

  6. Klicken Sie auf die Schaltfläche Ergebnis, um die Vorhersagen anzuzeigen.

Im Modell werden die angegebenen Folgeelemente für alle Kunden empfohlen, die Touring Tire als erstes Element ausgewählt haben. Aus Ihrer Untersuchung des Modells wissen Sie, dass die Produkte Touring Tire und Touring Tire Tube von Kunden häufig zusammen gekauft werden. Die Empfehlungen entsprechen daher den Erwartungen.

$SEQUENCE

"Zeilennummer: 65536"

Modell

1

  

Touring Tire Tube

2

  

Sport-100

3

  

Long-Sleeve Logo Jersey

Erstellen einer Abfrage für Massenvorhersagen mit Eingaben für geschachtelte Tabellen

Sie können nun mit dem Modell wie gewünscht Vorhersagen erstellen, die als Grundlage für Empfehlungen dienen können. Als Nächstes erstellen Sie eine Vorhersageabfrage, die einer externen Datenquelle zugeordnet ist. Diese Datenquelle stellt Werte bereit, die aktuelle Produkte darstellen. Da Sie eine Vorhersageabfrage erstellen möchten, die die Customer ID sowie eine Liste der Produkte als Eingabe bereitstellt, fügen Sie die Kundentabelle als Falltabelle hinzu und die Tabelle mit den von Kunden getätigten Käufen als geschachtelte Tabelle. Anschließend fügen Sie wie zuvor Vorhersagefunktionen hinzu, um Empfehlungen zu erstellen.

Dieses Verfahren wird auch in Lektion 3 zum Erstellen von Vorhersagen für das Market Basket-Szenario verwendet; bei Vorhersagen in einem Sequenzclustermodell ist allerdings auch die Reihenfolge als Eingabe erforderlich.

So erstellen Sie eine Vorhersageabfrage mit Eingaben für geschachtelte Tabellen

  1. Wählen Sie im Bereich Miningmodell ggf. das Sequenzclustermodell aus.

  2. Klicken Sie im Dialogfeld Eingabetabelle(n) auswählen auf Falltabelle auswählen.

  3. Wählen Sie im Dialogfeld Tabelle auswählen den Eintrag Orders als Datenquelle aus. Wählen Sie in der Liste Tabellen-/Sichtname den Eintrag vAssocSeqOrders aus, und klicken Sie dann auf OK.

  4. Klicken Sie im Dialogfeld Eingabetabelle(n) auswählen auf Geschachtelte Tabelle auswählen.

  5. Wählen Sie im Dialogfeld Tabelle auswählen den Eintrag Orders als Datenquelle aus. Wählen Sie in der Liste Tabellen-/Sichtname den Eintrag vAssocSeqLineItems aus, und klicken Sie dann auf OK.

    Analysis Services versucht, Beziehungen zu erkennen und automatisch zu erstellen, wenn die Datentypen übereinstimmen und ähnliche Spaltennamen vorliegen. Wenn fehlerhafte Beziehungen erstellt werden, können Sie mit der rechten Maustaste auf die Verknüpfungslinie klicken und Verbindungen ändern auswählen, um die Spaltenzuordnung zu bearbeiten. Sie können auch mit der rechten Maustaste auf die Verknüpfungslinie klicken und Löschen auswählen, um die Beziehung vollständig zu entfernen. In diesem Fall werden die Beziehungen automatisch dem Entwurfsbereich hinzugefügt, da die Tabellen in der Datenquellensicht bereits verbunden waren.

  6. Fügen Sie dem Raster eine neue Zeile hinzu. Wählen Sie vAssocSeqOrders als Quelle und CustomerKey als Feld aus.

  7. Fügen Sie dem Raster eine neue Zeile hinzu. Wählen Sie Vorhersagefunktion als Quelle und PredictSequenceals Feld aus.

  8. Ziehen Sie vAssocSeqLineItems in das Feld Kriterium/Argument. Klicken Sie auf das Ende des Felds Kriterium/Argument, und geben Sie die folgenden Argumente ein: 2.

    Der vollständige Text im Feld Kriterium/Argument sollte wie folgt lauten: [Sequence Clustering].[v Assoc Seq Line Items],2

  9. Klicken Sie auf die Schaltfläche Ergebnis, um die Vorhersagen für die einzelnen Kunden anzuzeigen.

Sie haben das Lernprogramm für Sequenzclustermodelle abgeschlossen.

Nächste Schritte

Wenn Sie alle Abschnitte in Data Mining-Lernprogramm für Fortgeschrittene (Analysis Services - Data Mining) abgeschlossen haben, können Sie als Nächstes lernen, wie Sie mit Data Mining-Erweiterungen (DMX) Modelle und Vorhersagen erstellen. Weitere Informationen finden Sie unter Lernprogramme: Verwenden von DMX.

Wenn Sie mit Programmierkonzepten vertraut sind, können Sie Data Mining-Objekte mithilfe von Analysis Management Objects (AMO) auch programmgesteuert bearbeiten. Weitere Informationen finden Sie unter AMO-Klassen für Data Mining.