Artikel
09/24/2010

Anpassen eines Data Mining-Modells (Analysis Services - Data Mining)

Nachdem Sie einen Algorithmus ausgewählt haben, der Ihren Geschäftsanforderungen entspricht, können Sie das Miningmodell mit den folgenden Verfahren anpassen, um die Ergebnisse potenziell zu verbessern.

Verwenden Sie verschiedene Spalten mit Daten im Modell, oder ändern Sie die Nutzung oder die Inhaltstypen der Spalten.
Erstellen Sie Filter für das Miningmodell, um die Daten einzuschränken, die beim Trainieren des Modells verwendet werden.
Legen Sie Algorithmusparameter fest, um Schwellenwerte, Strukturteilungen und andere Bedingungen zu steuern.
Ändern Sie den Standardalgorithmus, der zur Analyse von Daten oder zum Vorhersagen verwendet wird.

Ändern der vom Modell verwendeten Daten

Die Auswahl der im Modell zu verwendenden Datenspalten sowie die Art und Weise, wie diese Daten verwendet und verarbeitet werden, beeinflussen die Ergebnisse der Analyse. Die folgenden Themen enthalten Informationen zu diesen Optionen.

Miningmodelle (Analysis Services - Data Mining)

Bietet eine Übersicht über die Architektur eines Miningmodells einschließlich der zugrunde liegenden Miningstruktur und der Auswahl der Miningspalten.
Erstellen von Filtern für Miningmodelle (Analysis Services - Data Mining)

Erklärt, wie Sie Filter erstellen können, die für ein Miningmodell gelten, um Modelle basierend auf einer Teilmenge der Miningstrukturdaten zu erstellen.
Featureauswahl beim Data Mining.

Erläutert, wie Analysis Services die Featureauswahl verwendet, um nur die nützlichsten Attribute zum Hinzufügen in ein Modell auszuwählen. Wenn Sie die Anzahl von Spalten und Attributen reduzieren, kann die Leistung und die Qualität des Modells verbessert werden. Die verfügbaren Featureauswahlmethoden unterscheiden sich je nach ausgewähltem Algorithmus.

Wenn Sie den Data Mining-Assistenten verwenden, kann Analysis Services auch automatisch die Daten auswählen, die am besten zum Erstellen eines bestimmten Modells geeignet sind.

Anpassen von Algorithmuseinstellungen

Die Algorithmusauswahl bestimmt, welche Ergebnisse Sie erhalten. Allgemeine Informationen darüber, wie ein bestimmter Algorithmus funktioniert, oder die Geschäftsszenarien, in denen Sie von einem bestimmten Algorithmus profitieren, finden Sie unter Data Mining-Algorithmen (Analysis Services - Data Mining).

Die in Analysis Services bereitgestellten Data Mining-Algorithmen können ebenfalls umfassend angepasst werden. Sie können das Verhalten des Algorithmus und die Verarbeitungsweise der Daten steuern, indem Sie die Algorithmusparameter festlegen. Die folgenden Themen enthalten ausführliche Informationen über die Parameter, die jeder Algorithmus unterstützt.

Technische Referenz für den Microsoft Decision Trees-Algorithmus

Technische Referenz für den Microsoft Clustering-Algorithmus

Technische Referenz für den Microsoft Naive Bayes-Algorithmus

Technische Referenz für den Microsoft Association-Algorithmus

Technische Referenz für den Microsoft Sequence Clustering-Algorithmus

Technische Referenz für den Microsoft Neural Network-Algorithmus

Technische Referenz für den Microsoft Logistic Regression-Algorithmus

Technische Referenz für den Microsoft Linear Regression-Algorithmus

Technische Referenz für den Microsoft Time Series-Algorithmus

Das Thema für jeden Algorithmustyp umfasst auch die Vorhersagefunktionen, die mit Modellen, die auf diesem Algorithmus basieren, verwendet werden können.

Liste der Algorithmusparameter

Jeder Algorithmus unterstützt Parameter, die Sie zum Anpassen des Algorithmusverhaltens und zum Optimieren der Ergebnisse des Modells verwenden können. Eine Beschreibung, wie die einzelnen Parameter verwendet werden, finden Sie in den folgenden Themen:

Eigenschaftsname	Gilt für
AUTO_DETECT_PERIODICITY	Technische Referenz für den Microsoft Time Series-Algorithmus
CLUSTER_COUNT	Technische Referenz für den Microsoft Clustering-Algorithmus Technische Referenz für den Microsoft Sequence Clustering-Algorithmus
CLUSTER_SEED	Technische Referenz für den Microsoft Clustering-Algorithmus
CLUSTERING_METHOD	Technische Referenz für den Microsoft Clustering-Algorithmus
COMPLEXITY_PENALTY	Technische Referenz für den Microsoft Decision Trees-Algorithmus Technische Referenz für den Microsoft Time Series-Algorithmus
FORCED_REGRESSOR	Technische Referenz für den Microsoft Decision Trees-Algorithmus Technische Referenz für den Microsoft Linear Regression-Algorithmus
FORECAST_METHOD	Technische Referenz für den Microsoft Time Series-Algorithmus
HIDDEN_NODE_RATIO	Technische Referenz für den Microsoft Neural Network-Algorithmus
HISTORIC_MODEL_COUNT	Technische Referenz für den Microsoft Time Series-Algorithmus
HISTORICAL_MODEL_GAP	Technische Referenz für den Microsoft Time Series-Algorithmus
HOLDOUT_PERCENTAGE	Technische Referenz für den Microsoft Logistic Regression-Algorithmus Technische Referenz für den Microsoft Neural Network-Algorithmus Hinweis Dieser Parameter unterscheidet sich vom Prozentwert für zurückgehaltene Daten, der für eine Miningstruktur gilt.
HOLDOUT_SEED	Technische Referenz für den Microsoft Logistic Regression-Algorithmus Technische Referenz für den Microsoft Neural Network-Algorithmus Hinweis Dieser Parameter unterscheidet sich vom Ausgangswert für zurückgehaltene Daten, der für eine Miningstruktur gilt.
INSTABILITY_SENSITIVITY	Technische Referenz für den Microsoft Time Series-Algorithmus
MAXIMUM_INPUT_ATTRIBUTES	Technische Referenz für den Microsoft Clustering-Algorithmus Technische Referenz für den Microsoft Decision Trees-Algorithmus Technische Referenz für den Microsoft Linear Regression-Algorithmus Technische Referenz für den Microsoft Naive Bayes-Algorithmus Technische Referenz für den Microsoft Neural Network-Algorithmus Technische Referenz für den Microsoft Logistic Regression-Algorithmus
MAXIMUM_ITEMSET_COUNT	Technische Referenz für den Microsoft Association-Algorithmus
MAXIMUM_ITEMSET_SIZE	Technische Referenz für den Microsoft Association-Algorithmus
MAXIMUM_OUTPUT_ATTRIBUTES	Technische Referenz für den Microsoft Decision Trees-Algorithmus Technische Referenz für den Microsoft Linear Regression-Algorithmus Technische Referenz für den Microsoft Logistic Regression-Algorithmus Technische Referenz für den Microsoft Naive Bayes-Algorithmus Technische Referenz für den Microsoft Neural Network-Algorithmus
MAXIMUM_SEQUENCE_STATES	Technische Referenz für den Microsoft Sequence Clustering-Algorithmus
MAXIMUM_SERIES_VALUE	Technische Referenz für den Microsoft Time Series-Algorithmus
MAXIMUM_STATES	Technische Referenz für den Microsoft Clustering-Algorithmus Technische Referenz für den Microsoft Neural Network-Algorithmus Technische Referenz für den Microsoft Sequence Clustering-Algorithmus
MAXIMUM_SUPPORT	Technische Referenz für den Microsoft Association-Algorithmus
MINIMUM_IMPORTANCE	Technische Referenz für den Microsoft Association-Algorithmus
MINIMUM_ITEMSET_SIZE	Technische Referenz für den Microsoft Association-Algorithmus
MINIMUM_DEPENDENCY_PROBABILITY	Technische Referenz für den Microsoft Naive Bayes-Algorithmus
MINIMUM_PROBABILITY	Technische Referenz für den Microsoft Association-Algorithmus
MINIMUM_SERIES_VALUE	Technische Referenz für den Microsoft Time Series-Algorithmus
MINIMUM_SUPPORT	Technische Referenz für den Microsoft Association-Algorithmus Technische Referenz für den Microsoft Clustering-Algorithmus Technische Referenz für den Microsoft Decision Trees-Algorithmus Technische Referenz für den Microsoft Sequence Clustering-Algorithmus Technische Referenz für den Microsoft Time Series-Algorithmus
MISSING_VALUE_SUBSTITUTION	Technische Referenz für den Microsoft Time Series-Algorithmus
MODELLING_CARDINALITY	Technische Referenz für den Microsoft Clustering-Algorithmus
PERIODICITY_HINT	Technische Referenz für den Microsoft Time Series-Algorithmus
PREDICTION_SMOOTHING	Technische Referenz für den Microsoft Time Series-Algorithmus
SAMPLE_SIZE	Technische Referenz für den Microsoft Clustering-Algorithmus Technische Referenz für den Microsoft Logistic Regression-Algorithmus Technische Referenz für den Microsoft Neural Network-Algorithmus
SCORE_METHOD	Technische Referenz für den Microsoft Decision Trees-Algorithmus
SPLIT_METHOD	Technische Referenz für den Microsoft Decision Trees-Algorithmus
STOPPING_TOLERANCE	Technische Referenz für den Microsoft Clustering-Algorithmus

Zusätzliche Anforderungen

Das Auswählen und Vorbereiten von Daten ist ein wichtiger Teil des Data Mining-Prozesses. Bei den von Microsoft bereitgestellten Algorithmen sind beispielsweise keine doppelten Schlüssel zulässig. Der Datentyp, der für jedes Modell erforderlich ist, ist je nach Algorithmus unterschiedlich. Weitere Informationen finden Sie im Abschnitt mit den Anforderungen in den folgenden Themen:

Microsoft Decision Trees-Algorithmus	Microsoft Time Series-Algorithmus
Microsoft Clustering-Algorithmus	Microsoft Neural Network-Algorithmus
Microsoft Naive Bayes-Algorithmus	Microsoft Logistic Regression-Algorithmus
Microsoft Association-Algorithmus	Microsoft Linear Regression-Algorithmus
Microsoft Sequence Clustering-Algorithmus

Anpassen von Ergebnissen mit Abfrage- und Vorhersagefunktionen

Nachdem das Modell erstellt und verarbeitet wurde, können Sie die Informationen anzeigen, indem Sie einen der für jeden Modelltyp spezifischen Viewer verwenden. Sie können auch eigene Abfragen mithilfe von Data Mining Extensions (DMX) erstellen, um erweiterte oder detailliertere Informationen zu Mustern in den Daten zu erhalten.

Informationen zum Erstellen von Abfragen, die den Modellinhalt zurückgeben, finden Sie unter Abfragen von Data Mining-Modellen (Analysis Services - Data Mining).

Mit Funktionen können Sie die Ergebnisse erweitern, die von einem Miningmodell zurückgegeben werden. Einige Funktionen geben auch Statistiken zurück, die die Wahrscheinlichkeit eines Ergebnisses oder andere Bewertungen darstellen. Darüber hinaus unterstützen einzelne Algorithmen auch zusätzliche Funktionen. Wenn beispielsweise ein Miningmodell Cluster verwendet, können Sie Spezialfunktionen verwenden, um Informationen zu den Clustern zu suchen. Wenn jedoch Ihr Modell auf dem Time Series-Algorithmus basiert, stehen unterschiedliche Funktionen für Vorhersagen und Abfragen des Modellinhalts zur Verfügung. Weitere Informationen finden Sie in der technischen Referenz für jeden Algorithmus.

Beispiele zum Abfragen eines Miningmodells und zum Arbeiten mit Vorhersagefunktionen für spezifische Modelltypen finden Sie unter Abfragen von Data Mining-Modellen (Analysis Services - Data Mining).

Eine Liste der Vorhersagefunktionen, die für alle Algorithmustypen unterstützt werden, finden Sie unter Zuordnen von Funktionen zu Abfragetypen (DMX).

Bewerten von Änderungen in einem Modell

Wenn Sie das Geschäftsproblem mit unterschiedlichen Modellen oder durch Variationen eines Modells lösen möchten, müssen Sie die Genauigkeit der einzelnen Modelle messen und untersuchen, wie gut sich das jeweilige Modell zur Lösung Ihres Geschäftsproblems eignet. Allgemeine Informationen über das Auswerten von Data Mining-Modellen finden Sie unter Überprüfen von Data Mining-Modellen (Analysis Services - Data Mining). Weitere Informationen über das Auswerten der Genauigkeit verschiedener Miningmodelle finden Sie unterTools zum Auswerten der Modellgenauigkeit (Analysis Services - Data Mining).

Siehe auch

Konzepte

Data Mining-Algorithmen (Analysis Services - Data Mining)

Physische Architektur (Analysis Services - Data Mining)