Spaltenverteilungen (Data Mining)

In MicrosoftSQL ServerAnalysis Services können Sie Spaltenverteilungen in einer Miningstruktur definieren, um zu beeinflussen, wie Algorithmen die Daten in diesen Spalten verarbeiten, wenn Sie Miningmodelle erstellen. Für einige Algorithmen ist es hilfreich, vor dem Verarbeiten des Modells für jede kontinuierliche Spalte die Verteilung zu definieren, wenn für die Spalten bekannt ist, dass sie normal verteilte Werte enthalten. Wenn Sie die Verteilungen nicht definieren, liefern die sich ergebenden Miningmodelle möglicherweise ungenauere Vorhersagen, da die Algorithmen weniger Informationen zum Interpretieren der Daten haben.

Die in Analysis Services verfügbaren Algorithmen unterstützen folgende Verteilungstypen:

  • Normal
    Die Werte für die kontinuierliche Spalte bilden ein Histogramm, das einer Normalverteilung folgt.

    Histogramm mit Normalverteilung

  • Log Normal
    Die Werte für die kontinuierliche Spalte bilden ein Histogramm, in dem die Kurve am oberen Ende einen gedehnten Verlauf und am unteren Ende einen Schrägverlauf aufweist.

    Histogramm mit Protokollnormalverteilung

  • Uniform
    Die Werte für die kontinuierliche Spalte bilden eine flache Kurve, in der alle Werte gleich wahrscheinlich sind.

    Histogramm mit Gleichverteilung

Weitere Informationen zu den Algorithmen, die in Analysis Services zur Verfügung stehen, finden Sie unter Data Mining-Algorithmen (Analysis Services - Data Mining).