Anpassen eines Data Mining-Modells (Analysis Services - Data Mining)

Nachdem Sie einen Algorithmus ausgewählt haben, der Ihren Geschäftsanforderungen entspricht, können Sie das Miningmodell mit den folgenden Verfahren anpassen, um die Ergebnisse potenziell zu verbessern.

  • Verwenden Sie verschiedene Spalten mit Daten im Modell, oder ändern Sie die Nutzung oder die Inhaltstypen der Spalten.

  • Erstellen Sie Filter für das Miningmodell, um die Daten einzuschränken, die beim Trainieren des Modells verwendet werden.

  • Legen Sie Algorithmusparameter fest, um Schwellenwerte, Strukturteilungen und andere Bedingungen zu steuern.

  • Ändern Sie den Standardalgorithmus, der zur Analyse von Daten oder zum Vorhersagen verwendet wird.

Ändern der vom Modell verwendeten Daten

Die Auswahl der im Modell zu verwendenden Datenspalten sowie die Art und Weise, wie diese Daten verwendet und verarbeitet werden, beeinflussen die Ergebnisse der Analyse. Die folgenden Themen enthalten Informationen zu diesen Optionen.

  • Miningmodelle (Analysis Services - Data Mining)

    Bietet eine Übersicht über die Architektur eines Miningmodells einschließlich der zugrunde liegenden Miningstruktur und der Auswahl der Miningspalten.

  • Erstellen von Filtern für Miningmodelle (Analysis Services - Data Mining)

    Erklärt, wie Sie Filter erstellen können, die für ein Miningmodell gelten, um Modelle basierend auf einer Teilmenge der Miningstrukturdaten zu erstellen.

  • Featureauswahl beim Data Mining.

    Erläutert, wie Analysis Services die Featureauswahl verwendet, um nur die nützlichsten Attribute zum Hinzufügen in ein Modell auszuwählen. Wenn Sie die Anzahl von Spalten und Attributen reduzieren, kann die Leistung und die Qualität des Modells verbessert werden. Die verfügbaren Featureauswahlmethoden unterscheiden sich je nach ausgewähltem Algorithmus.

Wenn Sie den Data Mining-Assistenten verwenden, kann Analysis Services auch automatisch die Daten auswählen, die am besten zum Erstellen eines bestimmten Modells geeignet sind.

Anpassen von Algorithmuseinstellungen

Die Algorithmusauswahl bestimmt, welche Ergebnisse Sie erhalten. Allgemeine Informationen darüber, wie ein bestimmter Algorithmus funktioniert, oder die Geschäftsszenarien, in denen Sie von einem bestimmten Algorithmus profitieren, finden Sie unter Data Mining-Algorithmen (Analysis Services - Data Mining).

Die in Analysis Services bereitgestellten Data Mining-Algorithmen können ebenfalls umfassend angepasst werden. Sie können das Verhalten des Algorithmus und die Verarbeitungsweise der Daten steuern, indem Sie die Algorithmusparameter festlegen. Die folgenden Themen enthalten ausführliche Informationen über die Parameter, die jeder Algorithmus unterstützt.

Technische Referenz für den Microsoft Decision Trees-Algorithmus

Technische Referenz für den Microsoft Clustering-Algorithmus

Technische Referenz für den Microsoft Naive Bayes-Algorithmus

Technische Referenz für den Microsoft Association-Algorithmus

Technische Referenz für den Microsoft Sequence Clustering-Algorithmus

Technische Referenz für den Microsoft Neural Network-Algorithmus

Technische Referenz für den Microsoft Logistic Regression-Algorithmus

Technische Referenz für den Microsoft Linear Regression-Algorithmus

Technische Referenz für den Microsoft Time Series-Algorithmus

Das Thema für jeden Algorithmustyp umfasst auch die Vorhersagefunktionen, die mit Modellen, die auf diesem Algorithmus basieren, verwendet werden können.

Liste der Algorithmusparameter

Jeder Algorithmus unterstützt Parameter, die Sie zum Anpassen des Algorithmusverhaltens und zum Optimieren der Ergebnisse des Modells verwenden können. Eine Beschreibung, wie die einzelnen Parameter verwendet werden, finden Sie in den folgenden Themen:

Eigenschaftsname

Gilt für

AUTO_DETECT_PERIODICITY

Technische Referenz für den Microsoft Time Series-Algorithmus

CLUSTER_COUNT

Technische Referenz für den Microsoft Clustering-Algorithmus

Technische Referenz für den Microsoft Sequence Clustering-Algorithmus

CLUSTER_SEED

Technische Referenz für den Microsoft Clustering-Algorithmus

CLUSTERING_METHOD

Technische Referenz für den Microsoft Clustering-Algorithmus

COMPLEXITY_PENALTY

Technische Referenz für den Microsoft Decision Trees-Algorithmus

Technische Referenz für den Microsoft Time Series-Algorithmus

FORCED_REGRESSOR

Technische Referenz für den Microsoft Decision Trees-Algorithmus

Technische Referenz für den Microsoft Linear Regression-Algorithmus

FORECAST_METHOD

Technische Referenz für den Microsoft Time Series-Algorithmus

HIDDEN_NODE_RATIO

Technische Referenz für den Microsoft Neural Network-Algorithmus

HISTORIC_MODEL_COUNT

Technische Referenz für den Microsoft Time Series-Algorithmus

HISTORICAL_MODEL_GAP

Technische Referenz für den Microsoft Time Series-Algorithmus

HOLDOUT_PERCENTAGE

Technische Referenz für den Microsoft Logistic Regression-Algorithmus

Technische Referenz für den Microsoft Neural Network-Algorithmus

HinweisHinweis
Dieser Parameter unterscheidet sich vom Prozentwert für zurückgehaltene Daten, der für eine Miningstruktur gilt.

HOLDOUT_SEED

Technische Referenz für den Microsoft Logistic Regression-Algorithmus

Technische Referenz für den Microsoft Neural Network-Algorithmus

HinweisHinweis
Dieser Parameter unterscheidet sich vom Ausgangswert für zurückgehaltene Daten, der für eine Miningstruktur gilt.

INSTABILITY_SENSITIVITY

Technische Referenz für den Microsoft Time Series-Algorithmus

MAXIMUM_INPUT_ATTRIBUTES

Technische Referenz für den Microsoft Clustering-Algorithmus

Technische Referenz für den Microsoft Decision Trees-Algorithmus

Technische Referenz für den Microsoft Linear Regression-Algorithmus

Technische Referenz für den Microsoft Naive Bayes-Algorithmus

Technische Referenz für den Microsoft Neural Network-Algorithmus

Technische Referenz für den Microsoft Logistic Regression-Algorithmus

MAXIMUM_ITEMSET_COUNT

Technische Referenz für den Microsoft Association-Algorithmus

MAXIMUM_ITEMSET_SIZE

Technische Referenz für den Microsoft Association-Algorithmus

MAXIMUM_OUTPUT_ATTRIBUTES

Technische Referenz für den Microsoft Decision Trees-Algorithmus

Technische Referenz für den Microsoft Linear Regression-Algorithmus

Technische Referenz für den Microsoft Logistic Regression-Algorithmus

Technische Referenz für den Microsoft Naive Bayes-Algorithmus

Technische Referenz für den Microsoft Neural Network-Algorithmus

MAXIMUM_SEQUENCE_STATES

Technische Referenz für den Microsoft Sequence Clustering-Algorithmus

MAXIMUM_SERIES_VALUE

Technische Referenz für den Microsoft Time Series-Algorithmus

MAXIMUM_STATES

Technische Referenz für den Microsoft Clustering-Algorithmus

Technische Referenz für den Microsoft Neural Network-Algorithmus

Technische Referenz für den Microsoft Sequence Clustering-Algorithmus

MAXIMUM_SUPPORT

Technische Referenz für den Microsoft Association-Algorithmus

MINIMUM_IMPORTANCE

Technische Referenz für den Microsoft Association-Algorithmus

MINIMUM_ITEMSET_SIZE

Technische Referenz für den Microsoft Association-Algorithmus

MINIMUM_DEPENDENCY_PROBABILITY

Technische Referenz für den Microsoft Naive Bayes-Algorithmus

MINIMUM_PROBABILITY

Technische Referenz für den Microsoft Association-Algorithmus

MINIMUM_SERIES_VALUE

Technische Referenz für den Microsoft Time Series-Algorithmus

MINIMUM_SUPPORT

Technische Referenz für den Microsoft Association-Algorithmus

Technische Referenz für den Microsoft Clustering-Algorithmus

Technische Referenz für den Microsoft Decision Trees-Algorithmus

Technische Referenz für den Microsoft Sequence Clustering-Algorithmus

Technische Referenz für den Microsoft Time Series-Algorithmus

MISSING_VALUE_SUBSTITUTION

Technische Referenz für den Microsoft Time Series-Algorithmus

MODELLING_CARDINALITY

Technische Referenz für den Microsoft Clustering-Algorithmus

PERIODICITY_HINT

Technische Referenz für den Microsoft Time Series-Algorithmus

PREDICTION_SMOOTHING

Technische Referenz für den Microsoft Time Series-Algorithmus

SAMPLE_SIZE

Technische Referenz für den Microsoft Clustering-Algorithmus

Technische Referenz für den Microsoft Logistic Regression-Algorithmus

Technische Referenz für den Microsoft Neural Network-Algorithmus

SCORE_METHOD

Technische Referenz für den Microsoft Decision Trees-Algorithmus

SPLIT_METHOD

Technische Referenz für den Microsoft Decision Trees-Algorithmus

STOPPING_TOLERANCE

Technische Referenz für den Microsoft Clustering-Algorithmus

Zusätzliche Anforderungen

Das Auswählen und Vorbereiten von Daten ist ein wichtiger Teil des Data Mining-Prozesses. Bei den von Microsoft bereitgestellten Algorithmen sind beispielsweise keine doppelten Schlüssel zulässig. Der Datentyp, der für jedes Modell erforderlich ist, ist je nach Algorithmus unterschiedlich. Weitere Informationen finden Sie im Abschnitt mit den Anforderungen in den folgenden Themen:

Anpassen von Ergebnissen mit Abfrage- und Vorhersagefunktionen

Nachdem das Modell erstellt und verarbeitet wurde, können Sie die Informationen anzeigen, indem Sie einen der für jeden Modelltyp spezifischen Viewer verwenden. Sie können auch eigene Abfragen mithilfe von Data Mining Extensions (DMX) erstellen, um erweiterte oder detailliertere Informationen zu Mustern in den Daten zu erhalten.

Informationen zum Erstellen von Abfragen, die den Modellinhalt zurückgeben, finden Sie unter Abfragen von Data Mining-Modellen (Analysis Services - Data Mining).

Mit Funktionen können Sie die Ergebnisse erweitern, die von einem Miningmodell zurückgegeben werden. Einige Funktionen geben auch Statistiken zurück, die die Wahrscheinlichkeit eines Ergebnisses oder andere Bewertungen darstellen. Darüber hinaus unterstützen einzelne Algorithmen auch zusätzliche Funktionen. Wenn beispielsweise ein Miningmodell Cluster verwendet, können Sie Spezialfunktionen verwenden, um Informationen zu den Clustern zu suchen. Wenn jedoch Ihr Modell auf dem Time Series-Algorithmus basiert, stehen unterschiedliche Funktionen für Vorhersagen und Abfragen des Modellinhalts zur Verfügung. Weitere Informationen finden Sie in der technischen Referenz für jeden Algorithmus.

Beispiele zum Abfragen eines Miningmodells und zum Arbeiten mit Vorhersagefunktionen für spezifische Modelltypen finden Sie unter Abfragen von Data Mining-Modellen (Analysis Services - Data Mining).

Eine Liste der Vorhersagefunktionen, die für alle Algorithmustypen unterstützt werden, finden Sie unter Zuordnen von Funktionen zu Abfragetypen (DMX).

Bewerten von Änderungen in einem Modell

Wenn Sie das Geschäftsproblem mit unterschiedlichen Modellen oder durch Variationen eines Modells lösen möchten, müssen Sie die Genauigkeit der einzelnen Modelle messen und untersuchen, wie gut sich das jeweilige Modell zur Lösung Ihres Geschäftsproblems eignet. Allgemeine Informationen über das Auswerten von Data Mining-Modellen finden Sie unter Überprüfen von Data Mining-Modellen (Analysis Services - Data Mining). Weitere Informationen über das Auswerten der Genauigkeit verschiedener Miningmodelle finden Sie unterTools zum Auswerten der Modellgenauigkeit (Analysis Services - Data Mining).