Freigeben über


Testen der Genauigkeit des Miningmodells (Data Mining-Lernprogramm)

Wenn Sie die Miningmodelle für das Targeted Mailing-Szenario erstellt, verarbeitet und untersucht haben, können Sie die Modelle testen, um festzustellen, wie gut die Vorhersagen sind. Außerdem können Sie prüfen, ob eines der Modelle eine bessere Leistung bringt als die anderen.

Auf der Registerkarte Mininggenauigkeitsdiagramm des Data Mining-Designers können Sie berechnen, wie gut die Vorhersage eines Modells ist. Außerdem können Sie die Ergebnisse eines Modells direkt mit den Ergebnissen der anderen Modelle vergleichen. Diese Vergleichsmethode wird als Liftdiagramm bezeichnet. Auf der Registerkarte Mininggenauigkeitsdiagramm werden Eingabedaten (Daten, die nicht mit dem ursprünglichen Dataset zusammenhängen) verwendet, um Vorhersagen und bekannte Ergebnisse zu vergleichen. Die Ergebnisse des Vergleichs werden dann sortiert und in einem Diagramm grafisch dargestellt. Ebenfalls grafisch dargestellt wird ein ideales Modell, also ein theoretisches Modell, das die Ergebnisse stets zu 100 Prozent richtig vorhersagt. Sie können die Ergebnisse des tatsächlichen Modells mit denen des idealen Modells vergleichen, um festzustellen, wie gut die Vorhersagen des Modells sind. Weitere Informationen zur Funktionsweise von Liftdiagrammen finden Sie unter Liftdiagramm.

Das Liftdiagramm ist wichtig, da es hilft, fast identische Modelle in einer Struktur zu unterscheiden, sodass Sie feststellen können, welches Modell die besten Vorhersagen bereitstellt. Auf ähnliche Weise zeigt das Liftdiagramm, welcher Algorithmustyp die besten Vorhersagen für eine bestimmte Situation bereitstellt. Weitere Informationen zum Verwenden der Registerkarte Mininggenauigkeitsdiagramm finden Sie unter Überprüfen von Data Mining-Modellen.

Im Rahmen dieses Themas führen Sie die folgenden Aufgaben aus:

  • Zuordnen der Eingabespalten
  • Filtern von Eingabezeilen
  • Auswählen der Modelle, vorhersagbaren Spalten und Werte
  • Anzeigen des Liftdiagramms

Zuordnen der Eingabespalten

Der erste Schritt beim Testen der Genauigkeit von Miningmodellen ist die Zuordnung der Spalten der Miningstruktur zu den Spalten der Eingabedaten. Wenn sich die Spaltennamen entsprechen, dann erstellt der Data Mining-Designer die Beziehungen automatisch.

So ordnen Sie Eingabespalten der Miningstruktur zu

  1. Klicken Sie im Data Mining-Designer auf der Registerkarte Spaltenzuordnung der Registerkarte Mininggenauigkeitsdiagramm im Feld Eingabetabelle(n) auswählen auf Falltabelle auswählen.

    Das Dialogfeld Tabelle auswählen wird geöffnet. In diesem Dialogfeld wählen Sie die Tabelle mit den Eingabedaten aus. Das sind diejenigen Daten, die für Vorhersageabfragen verwendet werden sollen, mit denen die Genauigkeit der Modelle festgestellt werden soll. Im Rahmen dieses Lernprogramms verwenden Sie für die Eingabespalten die gleichen Daten, die Sie zum Verarbeiten des Modells verwendet haben. Im Idealfall sind die Eingabespalten separate Datenzeilen, die Sie ausgenommen haben und nicht zum Verarbeiten der Modelle verwenden haben. Im Dialogfeld Tabelle auswählen würden Sie diese Daten als Eingabespalten auswählen.

  2. Überprüfen Sie in der Liste Datenquelle, ob Adventure Works DW ausgewählt ist.

  3. Wählen Sie in der Liste Tabellen-/Sichtname den Eintrag vTargetMail aus, und klicken Sie dann auf OK.

    Die Spalten der Miningstruktur werden automatisch den gleichnamigen Spalten der Eingabetabelle zugeordnet.

Auf der Grundlage der Spaltenzuordnungen wird für jedes Modell in der Struktur eine Vorhersageabfrage generiert. Um eine Zuordnung zwischen zwei Spalten zu löschen, markieren Sie die Linie, die die Spalte der Tabelle Miningstruktur mit der Spalte der Tabelle Eingabetabelle(n) auswählen verbindet, und drücken Sie dann ENTF. Sie können Zuordnungen auch manuell erstellen, indem Sie in Eingabetabelle(n) auswählen auf eine Spalte klicken und diese dann in Miningstruktur auf die entsprechende Spalte ziehen.

Filtern von Eingabezeilen

Sie können das Raster unter Filtern Sie die zum Generieren des Liftdiagramms verwendeten Eingabedaten verwenden, um die Eingabedaten zu filtern. Sie können Spalten aus Eingabetabelle(n) auswählen auf das Raster ziehen, oder Sie können Werte auswählen, indem Sie zum Anzeigen einer entsprechenden Werteliste auf eine Spalte des Rasters klicken. Wenn Sie beispielsweise die Eingabezeilen auf diejenigen einschränken möchten, bei denen die Spalte Income größer als x ist, wählen Sie in der Spalte Quelle den Wert vTargetMail und in der Spalte Feld den Wert Income aus. Geben Sie dann >x in der Spalte Kriterium/Argument ein.

Beachten Sie, dass die Daten in diesem Lernprogramm nicht gefiltert werden.

Auswählen der Modelle, vorhersagbaren Spalten und Werte

Im nächsten Schritt wählen Sie die Modelle aus, die Sie in das Liftdiagramm aufnehmen möchten. Außerdem wählen Sie die vorhersagbare Spalte aus, mit der die Modelle verglichen werden sollen. Standardmäßig werden alle Modelle in der Miningstruktur ausgewählt. Sie können hier angeben, dass ein Modell nicht mit aufgenommen werden soll. Behalten Sie jedoch für dieses Lernprogramm die Auswahl aller Modelle bei.

Sie können zwei Arten von Genauigkeitsdiagrammen anlegen. Wenn Sie einen vorhersagbaren Wert auswählen, wird ein Diagramm angezeigt, das zeigt, wie hoch der Wert für den Lift des Modells ist. Wenn Sie keinen vorhersagbaren Wert aufnehmen, zeigt das Diagramm an, wie genau das Modell ist.

So zeigen Sie den Lift für die Modelle an

  1. Stellen Sie sicher, dass unter Wählen Sie die vorhersagbaren Miningmodellspalten aus, die im Liftdiagramm angezeigt werden sollen für jedes Modell in der Liste Name der vorhersagbaren Spalte der Eintrag Bike Buyer ausgewählt ist.

  2. Wählen Sie in der Spalte Wert vorhersagen den Wert 1 für jedes Modell aus.

So zeigen Sie die Genauigkeit der Modelle an

  • Stellen Sie sicher, dass unter Wählen Sie die vorhersagbaren Miningmodellspalten aus, die im Liftdiagramm angezeigt werden sollen für jedes Modell in der Liste Name der vorhersagbaren Spalte der Eintrag Bike Buyer ausgewählt ist.

    Lassen Sie die Spalte Wert vorhersagen leer.

Wenn das Kontrollkästchen Vorhersagespalten und -werte synchronisieren aktiviert ist, wird die vorhersagbare Spalte für jedes Miningmodell in der Miningstruktur synchronisiert.

ms170238.note(de-de,SQL.90).gifHinweis:
In der Liste Name der vorhersagbaren Spalte werden nur die Miningmodellspalten aufgelistet, für die als Verwendungstyp Predict oder Predict Only festgelegt wurde. Die Spalten müssen darüber hinaus auf Miningstrukturspalten basieren, deren Inhaltstyp Discrete oder Discretized ist.

In einigen erweiterten Szenarios erstellen Sie u. U. ein Liftdiagramm, das eine vorhersagbare Spalte in zwei Miningmodellen umfasst, die nicht auf derselben Miningstrukturspalte basieren, aber die gleichen Daten enthalten. Wenn Sie das Kontrollkästchen Vorhersagespalten und -werte synchronisieren deaktivieren, können Sie eine beliebige vorhersagbare Spalte und einen beliebigen vorhersagbaren Wert auswählen. Die Ergebnisse werden zusammen dargestellt, unabhängig davon, ob das sinnvoll ist.

Anzeigen des Liftdiagramms

Zum Anzeigen des Liftdiagramms wechseln Sie auf dem Mininggenauigkeitsdiagramm auf die Registerkarte Liftdiagramm. Wenn Sie auf die Registerkarte klicken, wird eine Vorhersageabfrage für Server und Datenbank für die Miningstruktur und Eingabetabelle ausgeführt. Die vorhergesagten Werte werden mit den bekannten Istwerten verglichen und im Diagramm dargestellt. Weitere Informationen zum Verwenden des Diagramms finden Sie unter Liftdiagramm.

Nächste Aufgabe in dieser Lektion

Erstellen von Vorhersagen (Data Mining-Lernprogramm)