Bestimmen einer in einem Modell als Regressor zu verwendenden Spalte

Ein lineares Regressionsmodell stellt den Wert des vorhersagbaren Attributs als Ergebnis einer Formel dar, die die Eingaben so kombiniert, dass die Daten so nah wie möglich an einer geschätzten Regressionsgeraden liegen. Der Algorithmus akzeptiert nur numerische Werte als Eingaben und erkennt automatisch die am besten passenden Eingaben.

Sie können jedoch angeben, dass eine Spalte als Regressor einbezogen werden soll, indem Sie dem Modell den FORCE_REGRESSOR-Parameter hinzufügen und die zu verwendenden Regressoren angeben. Sie sollten dies in Fällen tun, in denen das Attribut eine Bedeutung hat, auch wenn die Wirkung zu klein ist, um vom Modell erkannt zu werden. Oder wenn Sie sicherstellen möchten, dass das Attribut in die Formel einbezogen wird.

In der folgenden Prozedur wird beschrieben, wie ein einfaches lineares Regressionsmodell erstellt wird, und zwar mit den gleichen Beispieldaten, die im Lernprogramm zu neuronalen Netzwerken verwendet werden. Das Modell ist nicht unbedingt robust, zeigt jedoch, wie Sie ein lineares Regressionsmodell mit dem Data Mining-Designer anpassen können.

Erstellen eines einfachen linearen Regressionsmodells

  1. Erweitern Sie in SQL Server-Datentools (SSDT) im Projektmappen-Explorer den Knoten Miningstrukturen.

  2. Doppelklicken Sie auf die Datei Call Center.dmm, um sie im Designer zu öffnen.

  3. Wählen Sie im Menü Miningmodell die Option Neues Miningmodell.

  4. Wählen Sie als Algorithmus die Option Microsoft Linear Regression. Geben Sie als Namen Callcenterregression ein.

  5. Ändern Sie die Spaltenverwendung auf der Registerkarte Miningmodelle wie folgt. Soweit dies nicht bereits der Fall ist, sollten alle Spalten, die nicht in der folgenden Liste enthalten sind, auf Ignorieren festgelegt werden.

    FactCallCenterID Schlüssel

    ServiceGrade PredictOnly

    Total Operators Eingabe

    AverageTimePerIssue Eingabe

  6. Wählen Sie im Menü Miningmodell die Option zum Festlegen der Modellparameter aus.

  7. Geben Sie für den FORCE_REGRESSOR-Parameter in der Spalte Wert die Spaltennamen in Klammern und durch Kommas getrennt wie folgt ein:

    [Average Time Per Issue],[Total Operators]
    
    HinweisHinweis

    Der Algorithmus erkennt automatisch, welche Spalten die besten Regressoren sind. Sie müssen Regressoren nur erzwingen, wenn Sie sicherstellen möchten, dass eine Spalte in der endgültigen Formel enthalten ist.

  8. Wählen Sie im Menü Miningmodell die Option Modell verarbeiten.

    Im Viewer wird das Modell als einzelner Knoten dargestellt, der die Regressionsformel enthält. Sie können die Formel in der Mininglegende anzeigen oder die Koeffizienten für die Formel mithilfe von Abfragen extrahieren.

Siehe auch

Verweis

Technische Referenz für den Microsoft Linear Regression-Algorithmus

Miningmodellinhalt von linearen Regressionsmodellen (Analysis Services – Data Mining)

Konzepte

Microsoft Linear Regression-Algorithmus

Data Mining-Abfrage