Erstellen von Berichten für Kreuzvalidierung

In diesem Thema wird die Erstellung eines Kreuzvalidierungsberichts auf der Registerkarte "Genauigkeitsdiagramm" im Data Mining-Designer erläutert. Allgemeine Informationen zum Aussehen eines Kreuzvalidierungsberichts und zu den statistischen Measures, die er enthält, finden Sie unter Kreuzvalidierung (Analysis Services - Data Mining).

Ein Kreuzvalidierungsbericht unterscheidet sich grundlegend von einem Genauigkeitsdiagramm, z. B. ein Prognosegütediagramm oder eine Klassifikationsmatrix.

  • Bei der Kreuzvalidierung wird die Gesamtverteilung von Daten bewertet, die in einem Modell oder einer Struktur verwendet werden. Daher wird auch kein Testdataset angegeben. Bei der Kreuzvalidierung werden immer nur die ursprünglichen Daten verwendet, mit denen das Modell oder die Miningstruktur trainiert wurde.

  • Kreuzvalidierung kann nur hinsichtlich eines einzelnen vorhersagbaren Ergebnisses ausgeführt werden. Wenn die Struktur Modelle unterstützt, die über andere vorhersagbare Attribute verfügen, müssen Sie separate Berichte für jede vorhersagbare Ausgabe erstellen.

  • Nur Modelle, die mit der gerade ausgewählten Struktur verknüpft werden, sind für die Kreuzvalidierung verfügbar.

  • Wenn die Struktur, die derzeit ausgewählt ist, eine Kombination aus Clustering- und Nicht-Clusteringmodellen unterstützt, wenn Sie auf Ergebnisse abrufen klicken, werden in der gespeicherten Prozedur der Kreuzvalidierung automatisch Modelle geladen, die über die gleiche vorhergesagte Spalte verfügen, und Clusteringmodelle, in denen nicht das gleiche vorhersagbare Attribut verwendet wird, werden ignoriert.

  • Sie können einen Kreuzvalidierungsbericht für ein Clusteringmodell erstellen, das nur dann nicht über ein vorhersagbares Attribut verfügt, wenn die Miningstruktur keine anderen vorhersagbaren Attribute unterstützt.

Auswählen einer Miningstruktur

  1. Öffnen Sie den Data Mining-Designer in SQL Server-Datentools (SSDT).

  2. Öffnen Sie in Projektmappen-Explorer die Datenbank, die die Struktur oder das Modell enthält, für das Sie einen Bericht erstellen möchten.

  3. Doppelklicken Sie im Data Mining-Designer auf die Miningstruktur, um die Struktur und die zugehörigen Modelle zu öffnen.

  4. Klicken Sie auf die Registerkarte Mininggenauigkeitsdiagramm.

  5. Klicken Sie auf die Registerkarte Kreuzvalidierung.

Festlegen von Kreuzvalidierungsoptionen

  1. Klicken Sie auf der Registerkarte Kreuzvalidierung für Foldanzahl auf den Pfeil nach unten, um eine Zahl zwischen 1 und 10 auszuwählen. Der Standardwert lautet 10.

    Die Foldanzahl stellt die Anzahl von Partitionen dar, die innerhalb des ursprünglichen Datasets erstellt werden. Wenn Sie die Foldanzahl auf 1 festgelegt haben, wird der Trainingssatz ohne Partitionierung verwendet.

  2. Klicken Sie für Zielattribut auf den Pfeil nach unten, und wählen Sie eine Spalte aus der Liste aus. Wenn das Modell ein Clustermodell ist, wählen Sie #Cluster, um anzugeben, dass das Modell über kein vorhersagbares Attribut verfügt. Der Wert, #Cluster ist nur verfügbar, wenn die Miningstruktur keine anderen vorhersagbaren Attributstypen unterstützt.

    Sie können nur ein vorhersagbares Attribut pro Bericht auswählen. Standardmäßig sind alle zugehörigen Modelle, die über das gleiche vorhersagbare Attribut verfügen, im Bericht enthalten.

  3. Geben Sie für Maximale Anzahl von Fällen eine Zahl ein, die groß genug ist, um eine repräsentative Stichprobe von Daten bereitzustellen, wenn die Daten auf die angegebene Anzahl von Aufteilungen aufgeteilt wird. Wenn Sie eine Zahl angeben, die größer ist als die Anzahl der tatsächlichen Fälle im Trainingssatz des Modells, werden alle Fälle verwendet.

    Wenn der Trainingsdatensatz sehr groß ist, können Sie über den unter Maximale Anzahl von Fällen eingegebenen Wert die Gesamtzahl der verarbeiteten Fälle einschränken. Der Bericht kann so schneller beendet werden. Sie sollten jedoch keinen zu kleinen Wert für Maximale Anzahl von Fällen eingeben, da ansonsten möglicherweise nicht genügend Daten zur Kreuzvalidierung zur Verfügung stehen.

  4. Geben Sie optional für Zielstatus den Wert des vorhersagbaren Attributs ein, das Sie modellieren möchten. Wenn zum Beispiel die Spalte [Fahrradkäufer] zwei mögliche Werte enthält, nämlich 1 (Ja) und 2 (Nein), können Sie den Wert 1 eingeben, um die Genauigkeit des Modells nur für das gewünschte Ergebnis zu bewerten.

    HinweisHinweis

    Wenn Sie keinen Wert eingeben, ist die Option Zielschwellenwert nicht verfügbar, und auf das Modell wird für alle möglichen Werte des vorhersagbaren Attributs zugegriffen.

  5. Geben Sie optional für Zielschwellenwert eine Dezimalzahl zwischen 0 und 1 ein, um anzugeben, welche Mindestwahrscheinlichkeit eine Vorhersage erreichen muss, damit sie als genau gelten kann.

    Zusätzliche Tipps zur Festlegung von Wahrscheinlichkeitsschwellenwerten finden Sie unter Measures im Kreuzvalidierungsbericht.

  6. Klicken Sie auf Ergebnisse abrufen.

Drucken des Kreuzvalidierungsberichts

  1. Klicken Sie auf der Registerkarte Kreuzvalidierung mit der rechten Maustaste auf den abgeschlossenen Bericht.

  2. Wählen Sie aus dem Kontextmenü die Option Drucken oder Seitenansicht, um zunächst den Bericht zu überprüfen.

Erstellen einer Kopie des Berichts in Microsoft Excel

  1. Klicken Sie auf der Registerkarte Kreuzvalidierung mit der rechten Maustaste auf den abgeschlossenen Bericht.

  2. Wählen Sie im Kontextmenü die Option Alles auswählen.

  3. Klicken Sie mit der rechten Maustaste auf den ausgewählten Text, und wählen Sie Kopieren.

  4. Fügen Sie die Auswahl in eine geöffnete Excel-Arbeitsmappe ein. Wenn Sie die Option Einfügen verwenden, wird der Bericht als HTML in Excel eingefügt. Auf diese Weise werden Zeilen- und Spaltenformatierung beibehalten. Wenn Sie den Bericht mit den Optionen für Inhalte einfügen für Text oder Unicode-Text einfügen, wird der Bericht im nach Zeilen getrennten Format eingefügt.

Siehe auch

Konzepte

Measures im Kreuzvalidierungsbericht