Erstellen von Vorhersagen für ein Sequenzclustermodell (Data Mining-Lernprogramm für Fortgeschrittene)

Artikel
03/03/2017

Gilt für: SQL Server 2016 Preview

Nachdem Sie das Sequenzclustermodell durch Navigieren sie in der Ereignisanzeige verstanden haben, erstellen Sie Vorhersageabfragen mit dem Generator für Vorhersageabfragen auf die Miningmodellvorhersage Registerkarte im Data Mining-Designer. Um eine Vorhersage zu erstellen, wählen Sie zuerst das Sequenzclustermodell und dann die Eingabedaten aus. Sie können eine externe Datenquelle als Eingabe verwenden, oder Sie können eine SINGLETON-Abfrage erstellen und Werte in einem Dialogfeld angeben.

In dieser Lektion wird davon ausgegangen, dass Sie bereits mit der Verwendung des Generators für Vorhersageabfragen vertraut sind und lernen möchten, wie spezifische Abfragen für ein Sequenzclustermodell erstellt werden. Allgemeine Informationen zur Verwendung von Generator für Vorhersageabfragen finden Sie unter Tools für Data Mining-Abfragen oder im Abschnitt des Lernprogramms grundlegende Data Mining Vorhersagen erstellen ( Grundlegende Datamining-Lernprogramm ).

Erstellen von Vorhersagen für das regionale Modell

In diesem Szenario erstellen Sie zunächst einige SINGLETON-Vorhersageabfragen, um eine Vorstellung von den regionalen Unterschieden bei Vorhersageabfragen zu erhalten.

So erstellen Sie eine SINGLETON-Abfrage für ein Sequenzclustermodell

Klicken Sie auf die Miningmodellvorhersage Registerkarte des Data Mining-Designer.
In der Miningmodell Klicken Sie im spaltenmenü Singleton-Abfrage.

Die Miningmodell Bereich und Singleton-Abfrageeingabe Bereich angezeigt.
In der Miningmodell Bereich, klicken Sie auf Modell auswählen. (Sie können diesen Schritt überspringen, wenn der Sequenzclustermodus bereits ausgewählt wurde.)

Die Miningmodell auswählen das Dialogfeld wird geöffnet.
Erweitern Sie den Knoten, die Miningstruktur darstellt Sequence Clustering with Region, und wählen Sie das Modell Sequence Clustering with Region. Klicken Sie auf OK. Der Eingabebereich spielt im Moment noch keine Rolle; die Eingaben werden nach Einrichten der Vorhersagefunktionen vorgenommen.
Klicken Sie im Raster auf die leere Zelle unter Quelle und wählen Sie Vorhersagefunktion. In der Zelle unter Feld, Option PredictSequence.

Hinweis

Sie können auch die Predict Funktion. Wählen Sie die Version der achten Sie hierzu die Predict -Funktion, die eine Tabellenspalte als Argument akzeptiert...
In der Miningmodell Bereich die geschachtelte Tabelle auswählen v Assoc Seq Line Items, und ziehen Sie es in das Raster zu den Kriterium/Argument Feld für die PredictSequence Funktion.

Ziehen und Ablegen von Tabellen- und Spaltennamen ermöglicht es Ihnen, komplexe Anweisungen ohne Syntaxfehler zu erstellen. Es ersetzt jedoch den aktuellen Inhalt der Zelle, einschließlich anderer optionaler Argumente für die PredictSequence Funktion. Wenn Sie die anderen Argumente anzeigen möchten, können Sie dem Raster vorübergehend eine zweite Instanz der Funktion als Referenz hinzufügen.
Klicken Sie auf die Ergebnis Schaltfläche in der oberen Ecke des Generators für Vorhersageabfragen.

Die erwarteten Ergebnisse enthalten eine einzelne Spalte mit der Überschrift Ausdruck. Die Ausdruck Spalte enthält eine geschachtelte Tabelle mit drei Spalten wie folgt:

$SEQUENCE	Zeilennummer	Model
1		Mountain-200

Was bedeuten diese Ergebnisse? Denken Sie daran, dass Sie keine Eingaben angegeben haben. Die Vorhersage erfolgt daher auf Basis aller Fälle, und die wahrscheinlichste Gesamtvorhersage wird von Analysis Services zurückgegeben.

Hinzufügen von Eingaben zu einer Singleton-Vorhersageabfrage

Bislang haben Sie noch keine Eingaben angegeben. In der nächsten Aufgabe verwenden Sie die Singleton-Abfrageeingabe Bereich einige Eingaben für die Abfrage an. Zunächst verwenden Sie [Region] als Eingabe für das Clustermodell für regionale Sequenzen, um zu überprüfen, ob die vorhergesagten Sequenzen für alle Regionen gleich sind. Anschließend erfahren Sie, wie Sie die Abfrage bearbeiten und die Wahrscheinlichkeit für die einzelnen Vorhersagen hinzufügen können; außerdem vereinfachen Sie die Ergebnisse, um diese übersichtlicher zu gestalten.

So generieren Sie Vorhersagen für eine bestimmte Kundengruppe

Klicken Sie auf die Entwurf Schaltfläche in der linken oberen Ecke der Generator für Vorhersageabfragen wieder an die Abfrage Raster erstellen.
In der Singleton-Abfrageeingabe im Dialogfeld klicken Sie auf der Wert Feld für Region, und wählen Sie Europa.
Klicken Sie auf die Ergebnis Schaltfläche, um Vorhersagen für Kunden in Europa anzuzeigen.
Klicken Sie auf die Entwurf Schaltfläche in der linken oberen Ecke der Generator für Vorhersageabfragen wieder an die Abfrage Raster erstellen.
In der Singleton-Abfrageeingabe im Dialogfeld klicken Sie auf der Wert Feld für Region, und wählen Sie North America.
Klicken Sie auf die Ergebnis Schaltfläche, um Vorhersagen für Kunden in Nordamerika anzuzeigen.

Hinzufügen von Wahrscheinlichkeiten mit einem benutzerdefinierten Ausdruck

Das Ausgeben der Wahrscheinlichkeit für die einzelnen Vorhersagen gestaltet sich etwas schwieriger, da die Wahrscheinlichkeit ein Attribut der Vorhersage darstellt und als geschachtelte Tabelle ausgegeben wird. Wenn Sie bereits mit Data Mining-Erweiterungen (DMX) vertraut sind, können Sie einfach die Abfrage ändern und der geschachtelten Tabelle eine untergeordnete SELECT-Anweisung hinzufügen. Sie können jedoch auch eine untergeordnete SELECT-Anweisung im Generator für Vorhersageabfragen erstellen, indem Sie einen benutzerdefinierten Ausdruck hinzufügen.

So geben Sie Wahrscheinlichkeiten für eine vorhergesagte Sequenz mit einem benutzerdefinierten Ausdruck aus

Klicken Sie auf die Entwurf Schaltfläche in der linken oberen Ecke der Generator für Vorhersageabfragen wieder an die Abfrage Raster erstellen.
Im Raster unter Quelle, auf eine neue Zeile, und wählen Sie benutzerdefinierter Ausdruck.
Lassen Sie das Kontrollkästchen unter Feld leer.
Für Alias, Typ t.
In der Kriterium/Argument Geben die vollständige untergeordnete select-Anweisung wie im folgenden Codebeispiel gezeigt. Achten Sie darauf, auch die öffnende und die schließende Klammer einzugeben.
```
(SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))  
```
Klicken Sie auf die Ergebnis Schaltfläche, um Vorhersagen für Kunden in Europa anzuzeigen.

Das Ergebnis enthält zwei geschachtelte Tabellen: eine Tabelle mit der Vorhersage und eine Tabelle mit der Wahrscheinlichkeit für die Vorhersage. Wenn Sie die Abfrage nicht ausführen können, können Sie zur Abfrageentwurfsansicht wechseln und die vollständige Abfrageanweisung überprüfen. Diese sollte wie folgt lauten:

SELECT  
  PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]),  
  ( (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))) as [t]  
FROM  
  [Sequence Clustering with Region]  
NATURAL PREDICTION JOIN  
(SELECT 'Europe' AS [Region]) AS t

Arbeiten mit Ergebnissen

Wenn Ihre Ergebnisse eine große Zahl von geschachtelten Tabellen enthalten, können Sie diese vereinfachen, um die Anzeige übersichtlicher zu gestalten. Zu diesem Zweck manuell ändern und Hinzufügen der REDUZIERTES Schlüsselwort.

So vereinfachen Sie geschachtelte Rowsets in einer Vorhersageabfrage

Klicken Sie auf die Abfrage Schaltfläche in der Ecke des Generators für Vorhersageabfragen.

Das Raster ändert sich in einen offenen Bereich, in dem Sie die DMX-Anweisung anzeigen und ändern können, die Sie mit dem Generator für Vorhersageabfragen erstellt haben.

Nach der Wählen Sie -Schlüsselwort, Typ REDUZIERTES.

Der vollständige Abfragetext sollte wie folgt aussehen:

SELECT FLATTENED  
  PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]),  
  ( (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))) as [t]  
FROM  
  [Sequence Clustering with Region]  
NATURAL PREDICTION JOIN  
(SELECT 'Europe' AS [Region]) AS t

Klicken Sie auf die Ergebnisse Schaltfläche in der oberen Ecke des Generators für Vorhersageabfragen.

Nachdem Sie eine Abfrage manuell bearbeitet haben, werden Sie nicht zurück zur Entwurfsansicht zu wechseln, ohne dass Änderungen verloren gehen können. Sie können jedoch die DMX-Anweisung, die Sie manuell erstellt haben, als Textdatei speichern und anschließend zur Entwurfsansicht zurückkehren. In diesem Fall wird die Abfrage auf die letzte gültige Version in der Entwurfsansicht zurückgesetzt.

Erstellen von Vorhersagen für das verwandte Modell

In den vorangegangenen Beispielen wurde die Tabellenspalte für den Fall Region als Eingabe für eine SINGLETON-Vorhersageabfrage verwendet, um zu überprüfen, ob im Modell regionale Unterschiede festzustellen sind. Nach der Untersuchung des Modells sind Sie jedoch zu dem Schluss gekommen, dass die Unterschiede nicht groß genug sind, um eine Anpassung von Produktempfehlungen nach Region zu rechtfertigen. Vielmehr interessieren Sie sich für Vorhersagen über die Elemente, die ein Kunde voraussichtlich wählen wird. In den folgenden Abfragen verwenden Sie daher das Sequenzclustermodell ohne Region, um Empfehlungen für alle Kunden zu generieren.

Verwenden von geschachtelten Tabellenspalten als Eingabe

Zunächst erstellen Sie eine SINGLETON-Vorhersageabfrage, die ein Element als Eingabe akzeptiert und das Element mit der nächsthöheren Wahrscheinlichkeit zurückgibt. Voraussetzung für eine solche Vorhersage ist die Verwendung einer geschachtelten Tabellenspalte als Eingabewert. Dies liegt daran, dass das Attribut für die Vorhersage (Modell) Teil einer geschachtelten Tabelle ist. Analysis Services stellt die Eingabe für geschachtelte Tabelle Dialogfeld können Sie das einfache Erstellen von Vorhersageabfragen für geschachtelte Tabellenattribute mit dem Generator für Vorhersageabfragen.

So verwenden Sie eine geschachtelte Tabelle als Eingabe für eine Vorhersage

Klicken Sie auf die Entwurf Schaltfläche in der linken oberen Ecke der Generator für Vorhersageabfragen wieder an die Abfrage Raster erstellen.
In der Singleton-Abfrageeingabe im Dialogfeld klicken Sie auf der Wert Feld für Region, und wählen Sie die leere Zeile, um die Eingabe für dieses Feld zu löschen.
In der Singleton-Abfrageeingabe im Dialogfeld klicken Sie auf der Wert im Feld vAssocSeqLineItems, und klicken Sie dann auf die Schaltfläche (...).
In der Eingabe für geschachtelte Tabelle Dialogfeld klicken Sie auf Hinzufügen.
Klicken Sie in der neuen Zeile auf das Feld unter Modell, und wählen Sie die Option Touring Tire aus. Klicken Sie auf OK.
Klicken Sie auf die Ergebnis Schaltfläche, um die Vorhersagen anzuzeigen.

Im Modell werden die angegebenen Folgeelemente für alle Kunden empfohlen, die Touring Tire als erstes Element ausgewählt haben. Aus Ihrer Untersuchung des Modells wissen Sie, dass die Produkte Touring Tire und Touring Tire Tube von Kunden häufig zusammen gekauft werden. Die Empfehlungen entsprechen daher den Erwartungen.

$SEQUENCE	Zeilennummer	Model
1		Touring Tire Tube
2		Sport-100
3		Long-Sleeve Logo Jersey

Erstellen einer Abfrage für Massenvorhersagen mit Eingaben für geschachtelte Tabellen

Sie können nun mit dem Modell wie gewünscht Vorhersagen erstellen, die als Grundlage für Empfehlungen dienen können. Als Nächstes erstellen Sie eine Vorhersageabfrage, die einer externen Datenquelle zugeordnet ist. Diese Datenquelle stellt Werte bereit, die aktuelle Produkte darstellen. Da Sie eine Vorhersageabfrage erstellen möchten, die die Customer ID sowie eine Liste der Produkte als Eingabe bereitstellt, fügen Sie die Kundentabelle als Falltabelle hinzu und die Tabelle mit den von Kunden getätigten Käufen als geschachtelte Tabelle. Anschließend fügen Sie wie zuvor Vorhersagefunktionen hinzu, um Empfehlungen zu erstellen.

Dieses Verfahren wird auch in Lektion 3 zum Erstellen von Vorhersagen für das Market Basket-Szenario verwendet; bei Vorhersagen in einem Sequenzclustermodell ist allerdings auch die Reihenfolge als Eingabe erforderlich.

So erstellen Sie eine Vorhersageabfrage mit Eingaben für geschachtelte Tabellen

In der Miningmodell Klicken Sie im Bereich der Sequence Clustering-Modell, wenn sie nicht bereits ausgewählt ist.
In der Eingabetabelle(n) im Dialogfeld klicken Sie auf Falltabelle auswählen.
In der Tabelle auswählen für die Datenquelle, wählen Sie im Dialogfeld Aufträge. In der Tabellen-/Sichtname Liste, wählen Sie vAssocSeqOrders, und klicken Sie dann auf OK.
In der Eingabetabelle(n) im Dialogfeld klicken Sie auf geschachtelte Tabelle auswählen.
In der Tabelle auswählen im Dialogfeld für Datenquelle, wählen Sie Aufträge aus. In der Tabellen-/Sichtname Liste, wählen Sie vAssocSeqLineItems und klicken Sie dann auf OK.

Analysis Services versucht, Beziehungen zu erkennen und automatisch zu erstellen, wenn die Datentypen übereinstimmen und ähnliche Spaltennamen vorliegen. Wenn die Beziehungen erstellt falsch sind, können Sie mit der rechten Maustaste der Verknüpfungslinie aus und wählen Sie Verbindungen ändern zum Bearbeiten der Spalte Zuordnung oder Sie können mit der rechten Maustaste der Joinlinie, und wählen Löschen die Beziehung vollständig zu entfernen. In diesem Fall werden die Beziehungen automatisch dem Entwurfsbereich hinzugefügt, da die Tabellen in der Datenquellensicht bereits verbunden waren.
Fügen Sie dem Raster eine neue Zeile hinzu. Für Quelle, wählen Sie vAssocSeqOrders und Feld, wählen Sie CustomerKey.
Fügen Sie dem Raster eine neue Zeile hinzu. Für Quelle, Option Vorhersagefunktion, und für Feld, Option PredictSequence.
Ziehen Sie vAssocSeqLineItems in das Kriterium/Argument Feld. Klicken Sie auf am Ende der Kriterium/Argument ein, und geben Sie die folgenden Argumente: 2.

Der vollständige Text im der Kriterium/Argument sollte: [Sequence Clustering].[v Assoc Seq Line Items],2
Klicken Sie auf die Ergebnis Schaltfläche, um die Vorhersagen für jeden Kunden anzuzeigen.

Sie haben das Lernprogramm für Sequenzclustermodelle abgeschlossen.

Nächste Schritte

Wenn Sie alle Abschnitte in abgeschlossen haben die Intermediate Data Mining-Lernprogramm ( Analysis Services – Datamining ), der nächste Schritt ist möglicherweise zu erfahren, wie mit Data Mining Extensions (DMX)-Anweisung kann Modelle und Vorhersagen erstellen. Weitere Informationen finden Sie unter Erstellen und Abfragen von Data Mining-Modellen mit DMX: Lernprogramme und #40; Analysis Services – Datamining ).

Wenn Sie mit Programmierkonzepten vertraut sind, können Sie Data Mining-Objekte mithilfe von Analysis Management Objects (AMO) auch programmgesteuert bearbeiten. Weitere Informationen finden Sie unter AMO-Klassen für Data Mining.

Siehe auch

Sequenzclusteringmodellabfragebeispiele
Miningmodellinhalt von Sequence Clustering-Modellen (Analysis Services – Data Mining)

Share via