SystemGetAccuracyResults (Analysis Services - Data Mining)

Gibt Genauigkeitsmetriken einer Kreuzvalidierung für eine Miningstruktur und alle verwandten Modelle zurück, wobei Clustering-Modelle ausgeschlossen sind.

Diese gespeicherte Prozedur gibt Metriken für das ganze Dataset als einzelne Partition zurück. Um das Dataset in Querschnitte zu partitionieren und Metriken für jede Partition zurückzugeben, verwenden Sie SystemGetCrossValidationResults (Analysis Services - Data Mining).

HinweisHinweis

Diese gespeicherte Prozedur wird nicht bei Modellen unterstützt, die mithilfe des Microsoft Time Series-Algorithmus oder des Microsoft Sequence Clustering-Algorithmus erstellt werden. Verwenden Sie auch für Clustering-Modelle die separate gespeicherte Prozedur SystemGetClusterAccuracyResults (Analysis Services - Data Mining).

Syntax

SystemGetAccuracyResults(<mining structure>, 
[,<mining model list>]
,<data set>
,<target attribute>
[,<target state>]
[,<target threshold>]
[,<test list>])

Argumente

  • mining structure
    Name einer Miningstruktur in der aktuellen Datenbank.

    (Erforderlich)

  • model list
    Durch Trennzeichen getrennte Liste von Modellen, die überprüft werden sollen.

    Der Standardwert lautet null. Dies heißt, dass alle anwendbaren Modelle verwendet werden. Bei Verwendung des Standardwerts werden Clustering-Modelle automatisch aus der Liste der Kandidaten für die Verarbeitung ausgeschlossen.

    (Optional)

  • data set
    Ein ganzzahliger Wert, der angibt, welche Partition in der Miningstruktur zum Testen verwendet wird. Der Wert wird von einer Bitmaske abgeleitet, die die Summe der folgenden Werte darstellt, wobei jeder einzelne Wert optional ist:

    Trainingsfälle

    0x0001

    Testfälle

    0x0002

    Modellfilter

    0x0004

    Eine vollständige Liste der möglichen Werte finden Sie in diesem Thema im Abschnitt mit den Hinweisen.

    (erforderlich)

  • target attribute
    Zeichenfolge, die den Namen eines vorhersagbaren Objekts enthält. Ein vorhersagbares Objekt kann eine Spalte, eine verschachtelte Tabellenspalte oder eine Schlüsselspalte für eine geschachtelte Tabelle eines Miningmodells sein.

    (erforderlich)

  • target state
    Zeichenfolge, die einen bestimmten vorherzusagenden Wert enthält.

    Wenn ein Wert angegeben ist, werden die Metriken für diesen bestimmten Status aufgelistet.

    Wenn kein Wert oder Null angegeben ist, werden die Metriken für den wahrscheinlichsten Status der einzelnen Vorhersagen berechnet.

    Der Standardwert lautet null.

    (optional)

  • target threshold
    Zahl zwischen 0,0 und 1, die die Mindestwahrscheinlichkeit angibt, mit der Vorhersagewert als richtig gewertet wird.

    Der Standardwert ist null. Das heißt, dass alle Vorhersagen als richtig gewertet werden.

    (optional)

  • test list
    Eine Zeichenfolge, die Testoptionen angibt. Dieser Parameter ist für die zukünftige Verwendung reserviert.

    (optional)

Rückgabetyp

Das Rowset, das zurückgegeben wird, enthält Bewertungen für jede Partition und Aggregate für alle Modelle.

In der folgenden Tabelle sind die Spalten aufgeführt, die von GetValidationResults zurückgegeben werden.

Spaltenname

Beschreibung

Modell

Name des Modells, das getestet wurde. Alles gibt an, dass das Ergebnis ein Aggregat für alle Modelle ist.

AttributeName

Der Name der vorhersagbaren Spalte.

AttributeState

Ein Zielwert in der vorhersagbaren Spalte.

Wenn diese Spalte einen Wert enthält, werden Metriken nur für den angegebenen Status aufgelistet.

Wenn kein Wert oder Null angegeben ist, werden die Metriken für den wahrscheinlichsten Status der einzelnen Vorhersagen berechnet.

PartitionIndex

Bezeichnet die Partition, für die das Ergebnis gilt.

Bei dieser Prozedur ist das immer 0.

PartitionCases

Ein ganzzahliger Wert, der auf Grundlage des <data set>-Parameters die Anzahl der Zeilen in der Fallmenge angibt.

Test

Der Typ von Test, der ausgeführt wurde.

Measure

Der Name des Measures, der vom Test zurückgegeben wurde. Measures für die einzelnen Modelle richten sich nach dem Modelltyp und dem Typ des vorhersagbaren Werts.

Eine Liste der für die einzelnen vorhersagbaren Typen zurückgegebenen Measures finden Sie unter Bericht für die Kreuzvalidierung (Analysis Services – Data Mining).

Eine Definition der einzelnen Measures finden Sie unter Übergreifende Überprüfung (Analysis Services - Data Mining).

Wert

Der Wert für das angegebene Measure.

Hinweise

Die folgende Tabelle enthält Beispiele für die Werte, mit denen Sie die Daten in der für die Kreuzvalidierung verwendeten Miningstruktur angeben können. Wenn Sie Testfälle für die Kreuzvalidierung verwenden möchten, muss die Miningstruktur bereits ein Testdataset enthalten. Informationen zum Definieren eines Testdatasets bei der Erstellung einer Miningstruktur finden Sie unter Partitionieren von Daten in Trainings- und Testsätze (Analysis Services - Data Mining).

Ganzzahliger Wert

Beschreibung

1

Nur Trainingsfälle werden verwendet.

2

Nur Testfälle werden verwendet.

3

Sowohl die Trainingsfälle als auch Testfälle werden verwendet.

4

Ungültige Kombination.

5

Nur Trainingsfälle werden verwendet, und der Modellfilter wird angewendet.

6

Nur Testfälle werden verwendet, und der Modellfilter wird angewendet.

7

Sowohl die Trainingsfälle als auch Testfälle werden verwendet, und der Modellfilter wird angewendet.

Weitere Informationen über die Szenarien, in denen Sie Kreuzvalidierung verwenden würden, finden Sie unter Überprüfen von Data Mining-Modellen (Analysis Services - Data Mining).

Beispiele

In diesem Beispiel werden Genauigkeitsmeasures für ein einzelnes Entscheidungsstrukturmodell, v Target Mail DT, zurückgegeben, das mit der vTargetMail-Miningstruktur verknüpft ist. Der Code in Zeile 4 gibt an, dass die Ergebnisse auf den Testfällen basieren sollen und für jedes Modell nach dem für das Modell spezifischen Filter gefiltert werden. [Bike Buyer] gibt die Spalte an, die vorhergesagt werden soll, und die 1 in der folgenden Zeile gibt an, dass das Modell nur für den spezifischen Wert 1 bewertet wird, der besagt: "Ja, will kaufen".

Die letzte Zeile des Codes gibt an, dass der Statusschwellenwert 0,5 beträgt. Das heißt, dass Vorhersagen mit einer Wahrscheinlichkeit über 50 Prozent bei der Genauigkeitsberechnung als "gute" Vorhersagen bewertet werden sollen.

CALL SystemGetAccuracyResults (
[vTargetMail],
[vTargetMail DT],
6,
'Bike Buyer',
1,
0.5
)

Beispielergebnisse:

ModelName

AttributeName

AttributeState

PartitionIndex

PartitionSize

Test

Measure

Wert

v Target Mail DT

Bike Buyer

1

0

1638

Klassifizierung

Wahr positiv

605

v Target Mail DT

Bike Buyer

1

0

1638

Klassifizierung

Falsch positiv

177

v Target Mail DT

Bike Buyer

1

0

1638

Klassifizierung

Wahr negativ

501

v Target Mail DT

Bike Buyer

1

0

1638

Klassifizierung

Falsch negativ

355

v Target Mail DT

Bike Buyer

1

0

1638

Wahrscheinlichkeit

Protokollergebnis

-0.598454638753028

v Target Mail DT

Bike Buyer

1

0

1638

Wahrscheinlichkeit

Prognose

0.0936717116894395

v Target Mail DT

Bike Buyer

1

0

1638

Wahrscheinlichkeit

Wurzel des mittleren Fehlers zum Quadrat

0.361630800104946

Anforderungen

Die Kreuzvalidierung in SQL Server Enterprise ist erst ab SQL Server 2008 verfügbar.