Das wichtigste Ziel vieler Data Mining-Projekte besteht darin, mithilfe von Miningmodellen Vorhersagen zu treffen. Angenommen, Sie möchten vorhersagen, wie viele Produkte Ihr Unternehmen im Dezember nächsten Jahres absetzen wird oder ob sich ein potenzieller Kunde von einer Werbekampagne zum Kauf eines Produkts anregen lässt.
Wenn Sie eine Vorhersage erstellen, geben Sie in der Regel neue Daten an und lassen das Modell auf Basis dieser neuen Daten eine Vorhersage erstellen. Vorhersagen können Sie als Batch treffen oder durch Zuordnen des Modells zu einer externen Datenquelle in einer Vorhersageverknüpfung. Alternativ können Sie Werte nacheinander bereitstellen. Erstellen Sie dazu eine SINGLETON-Abfrage.
Sowohl die SINGLETON- als auch die Batchvorhersageabfrage verwenden die PREDICTION JOIN-Syntax, um die neuen Daten zu definieren. Der Unterschied besteht darin, wie die Eingabeseite der Vorhersageverknüpfung angegeben wird. In einer SINGLETON-Abfrage werden die Daten inline als Teil der Abfrage angegeben. In einer Batchabfrage stammen die Daten aus einer externen Datenquelle, die mit der OPENQUERY-Syntax angegeben wird. Weitere Informationen finden Sie unter OPENQUERY (DMX).
Darüber hinaus ermöglichen Zeitreihenmodelle, Vorhersagen nur auf Basis des Modells zu treffen. Sie müssen keine neuen Daten eingeben, sondern nur Vorhersagen auf der Grundlage der vorhandenen Reihen anfordern.
Der folgende Abschnitt enthält Informationen über das Erstellen der einzelnen Abfragetypen:
|
Abfragetyp
|
Abfrageoptionen
|
|---|
|
SINGLETON-Vorhersageabfrage
|
Treffen Sie eine Vorhersage über einen neuen einzelnen Fall oder mehrere neue Fälle, die Sie in die Abfrage eingeben.
|
|
Batchvorhersagen
|
Ordnen Sie dem Modell neue Fälle in einer externen Datenquelle zu, und treffen Sie Vorhersagen.
|
|
Zeitreihenvorhersagen
|
Sagen Sie auf Grundlage eines vorhandenen Modells eine bestimmte Anzahl zukünftiger Schritte vorher.
Erweitern Sie ein vorhandenes Modell, indem Sie neue Daten hinzufügen, und treffen Sie Vorhersagen auf Grundlage der zusammengesetzten Reihe.
Übernehmen Sie das vorhandene Modell mit der REPLACE_MODEL_CASES-Option für die neuen Datenreihen.
|
Sie können nicht nur einen bestimmten Wert, wie den Umsatz des nächsten Monats, oder ein Produkt zur Empfehlung an den Kunden vorhersagen, sondern eine Vorhersageabfrage anpassen, um verschiedene Arten von Informationen, die mit der Vorhersage verknüpft sind, zurückzugeben. Es wäre beispielsweise hilfreich zu wissen, wie wahrscheinlich es ist, dass die Vorhersage richtig ist. So können Sie entscheiden, ob Sie die Empfehlung an den Benutzer weitergeben oder nicht.
Um die von einer Vorhersageabfrage zurückgegebenen Informationen anzupassen, fügen Sie der Abfrage Vorhersagefunktionen hinzu. Jedes Modell oder jeder Abfragetyp unterstützt bestimmte Funktionen. Clustermodelle unterstützen beispielsweise spezielle Vorhersagefunktionen, die zusätzliche Details über die vom Modell vorgenommenen Gruppierungen bereitstellen. Zeitreihenmodelle unterstützen Vorhersagefunktionen, die Unterschiede im Verlauf der Zeit berechnen. Es gibt auch allgemeine Vorhersagefunktionen, die mit fast allen Modelltypen funktionieren. Eine Liste der Vorhersagefunktionen, die in verschiedenen Abfragen unterstützt werden, finden Sie unter Zuordnen von Funktionen zu Abfragetypen (DMX). Eine vollständige Liste der Vorhersagefunktionen finden Sie unter Data Mining-Erweiterungen (DMX) - Funktionsreferenz.
Zurück zum Anfang
SINGLETON-Abfragen
Eine SINGLETON-Abfrage ist nützlich, wenn Sie einfache Vorhersagen in Echtzeit erstellen möchten. Sie erhalten beispielsweise Informationen von einem Kunden über eine Website und verwenden diese Daten anschließend, um Vorhersagen zurückzugeben, die als für diesen Kunden spezifische Empfehlungen dargestellt werden. Oder Sie analysieren den Inhalt einer E-Mail, ordnen der E-Mail anschließend anhand eines vorhandenen Klassifikationsmodells eine Kategorie zu und leiten die Nachricht entsprechend weiter.
SINGLETON-Abfragen erfordern keine separate Tabelle mit Eingaben. Stattdessen übergeben Sie eine einzelne Datenreihe an das Modell. Daraufhin wird eine einzelne Vorhersage in Echtzeit zurückgegeben. Sie können die SINGLETON-Abfrage auch erweitern, um mehrere Vorhersagen zu erstellen. Geben Sie dazu eine SELECT-Anweisung mit einem einzelnen Fall ein, fügen Sie den UNION-Operator hinzu, und geben Sie anschließend eine andere SELECT-Anweisung zur Angabe eines anderen Falls an.
Sie können SINGLETON-Abfragen für ein vorhandenes Modell wie folgt erstellen:
-
Mit dem Data Mining-Designer
-
Mit einer SINGLETON-Abfragevorlage
-
Durch programmgesteuertes Erstellen einer DMX-Anweisung oder in einem anderen Analysis Services-Client.
Beim Erstellen einer SINGLETON-Abfrage müssen Sie die neuen Daten in Form einer PREDICTION JOIN-Anweisung für das Modell bereitstellen. Dies bedeutet, dass Sie zwar keine Zuordnung zu einer tatsächlichen Tabelle vornehmen, jedoch dennoch sicherstellen müssen, dass die neuen Daten mit den vorhandenen Spalten des Miningmodells übereinstimmen. Wenn die neuen Datenspalten und die neuen Daten genau übereinstimmen, übernimmt Analysis Services die Zuordnung der Spalten. Dies wird als NATURAL PREDICTION JOIN bezeichnet. Wenn die Spalten jedoch nicht übereinstimmen oder die neuen Daten nicht dieselbe Art und Menge von Daten enthalten wie das Modell, müssen Sie angeben, welche Spalten im Modell den neuen Daten zuzuordnen sind, oder Sie legen die fehlenden Werte fest.
Informationen zum Erstellen einer SINGLETON-Abfrage in Data Mining-Designer finden Sie unter Vorgehensweise: Erstellen einer SINGLETON-Abfrage im Data Mining-Designer und Verwenden vom Generator für Vorhersageabfragen zum Erstellen von DMX-Vorhersageabfragen.
Informationen zur Verwendung von DMX zum Erstellen einer SINGLETON-Abfrage finden Sie unter Vorhersageabfragen (DMX).
Ein Beispiel zur Verwendung der DMX-Abfragevorlagen in SQL Server Management Studio finden Sie unter Vorgehensweise: Erstellen einer SINGLETON-Vorhersageabfrage von einer Vorlage.
Zurück zum Anfang
Batchvorhersageabfragen
Wenn Sie eine Vorhersageverknüpfung durchführen, ordnen Sie das Modell einer neuen Datenquelle zu. Analysis Services trifft dann Vorhersagen für jede Zeile der neuen Daten basierend auf Muster im Modell. Eine Vorhersageverknüpfung ist nützlich bei großen Informationsmengen in einer Tabelle oder einer anderen externen Datenquelle, wenn Sie Vorhersagen mit dem trainierten Modell treffen möchten.
Sie können Batchvorhersageabfragen für ein vorhandenes Modell wie folgt erstellen:
-
Mit dem Data Mining-Designer
-
Mit einer Vorlage
-
Durch programmgesteuertes Erstellen einer DMX-Anweisung oder in einem anderen Analysis Services-Client.
-
Wenn Sie eine Batchvorhersageabfrage mit dem Data Mining-Designer erstellen, muss die externe Datenquelle zunächst als Datenquellensicht definiert werden.
Wenn Sie eine Vorhersageverknüpfung mit DMX erstellen, können Sie die externe Datenquelle anhand der Befehle OPENQUERY, OPENROWSET oder SHAPE angeben. Die Standard-Datenzugriffsmethode in den DMX-Vorlagen ist OPENQUERY. Informationen zu diesen Methoden finden Sie unter <source data query>.
Unabhängig davon, wie Sie die externen Daten definieren, muss die angegebene Datenquelle Spalten mit Daten enthalten, die den Daten im Modell entsprechen. Die neuen Informationen können jedoch unvollständig sein. Die Kundenliste kann beispielsweise eine Spalte Age, jedoch keine Informationen über das Einkommen enthalten. Auch wenn Einkommensdaten beim Trainieren des Modells verwendet wurden, können Sie dem Modell die neuen Daten zuordnen und eine Vorhersage erstellen. In einigen Fällen wird die Qualität der Vorhersagen durch die fehlenden Informationen beeinträchtigt.
Die besten Ergebnisse erzielen Sie, wenn Sie möglichst viele der zwischen den neuen Daten und dem Modell übereinstimmenden Spalten verknüpfen. Die Abfrage wird jedoch auch dann erfolgreich durchgeführt, wenn keine Übereinstimmungen vorhanden sind. Wenn keine Spalten verknüpft werden, gibt die Abfrage die marginale Vorhersage zurück. Diese entspricht der Anweisung SELECT <predictable-column> FROM <model> ohne PREDICTION JOIN-Klausel.
Arbeiten mit den Ergebnissen einer Vorhersageabfrage
Eine Vorhersageabfrage entspricht nicht einer Abfrage einer relationalen Datenbank. Jede Vorhersagefunktion, die Sie einer Abfrage hinzufügen, gibt ein eigenes Rowset zurück. Wenn Sie eine Vorhersage für einen Einzelfall treffen, kann das Ergebnis aus einem vorhergesagten Wert und mehreren Spalten geschachtelter Tabellen mit zusätzlichen Details bestehen.
Jedes Mal, wenn Sie mehrere Funktionen in einer Abfrage kombinieren, werden die Rückgabeergebnisse als hierarchisches Rowset kombiniert. Wenn Ihr Anbieter keine hierarchischen Rowsets verarbeiten kann, können Sie die Ergebnisse mit dem FLATTEN-Schlüsselwort in der Vorhersageabfrage vereinfachen.
Weitere Informationen, einschließlich Beispiele vereinfachter Rowsets, finden Sie unter SELECT (DMX).
Vorhersagen für Zeitreihenminingmodelle
Zeitreihenmodelle bieten eine größere Flexibilität bei der Verwendung neuer Daten und beim Erstellen von Vorhersagen. Sie können entweder das Modell wie vorhanden verwenden, um Vorhersagen zu erstellen, oder Sie können neue Daten für das Modell angeben, um Vorhersagen auf der Basis jüngster Trends zu aktualisieren. Wenn Sie neue Daten hinzufügen, können Sie angeben, wie die neuen Daten verwendet werden sollen, um entweder die Modellfälle zu erweitern oder um die Modellfälle zu ersetzen.
Wenn Sie die Modellfälle erweitern, fügen Sie dem Zeitreihenmodell die neuen Faktendaten hinzu. Weitere Vorhersagen werden auf Basis der neuen, kombinierten Reihen getroffen. Wenn Sie die Modellfälle ersetzen, behalten Sie das trainierte Modell bei, ersetzen jedoch die zugrunde liegenden Fälle durch einen Satz neuer Falldaten.
Unabhängig vom verwendeten Ansatz ist der Ausgangspunkt für Vorhersagen stets das Ende der ursprünglichen Reihe.
Angenommen, es ist ein Zeitreihenmodell vorhanden, das mit Umsatzdaten vom vergangenen Jahr trainiert wurde. Nachdem Sie einige Monate neue Umsatzdaten gesammelt haben, möchten Sie Ihre Verkaufsprognosen für das laufende Jahr aktualisieren. Sie können eine Vorhersageverknüpfung erstellen, die das Modell durch Hinzufügen neuer Daten aktualisiert und es um neue Vorhersagen erweitert.
Alternativ können Sie Ihr Modell auf vorhandene Daten aufbauen und anschließend eine Vorhersageverknüpfung erstellen, die die Falldaten durch neue Daten ersetzt. Dies ist nützlich, wenn beispielsweise für ein Geschäft zahlreiche Daten fehlen und Sie zum Treffen von Vorhersagen ein Modell verwenden möchten, das auf den Daten eines anderen Geschäfts aufgebaut wurde. Weitere Informationen über das Erstellen von Vorhersageverknüpfungen für Zeitreihenmodelle finden Sie im Thema über Abfragen von Zeitreihenmodellen oder unter PredictTimeSeries (DMX).
Zurück zum Anfang