Artikel
03/30/2012

Erstellen von Vorhersagen für Callcentermodelle (Data Mining-Lernprogramm für Fortgeschrittene)

Nachdem Sie Informationen zu Interaktionen zwischen Arbeitsschichten, der Anzahl der Telefonisten und Anrufe sowie der Dienstqualität gesammelt haben, können Sie einige Vorhersageabfragen für Geschäftsanalysen und Planungen erstellen. Sie erstellen zunächst einige Vorhersagen über das explorative Modell, um bestimmte Annahmen zu testen. Danach erstellen Sie Massenvorhersagen mithilfe des logistischen Regressionsmodells.

Für diese Lektion wird davon ausgegangen, dass Sie bereits mit der Verwendung des Generators für Vorhersageabfragen vertraut sind. Allgemeine Informationen zum Verwenden des Generators für Vorhersageabfragen finden Sie unter Erstellen von DMX-Vorhersageabfragen.

Erstellen von Vorhersagen mit dem neuronalen Netzwerkmodell

Im folgenden Beispiel wird veranschaulicht, wie eine SINGLETON-Vorhersage mithilfe des neuronalen Netzwerkmodells getroffen wird, das für Untersuchungen erstellt wurde. Mit SINGLETON-Vorhersagen können verschiedene Werte und deren Auswirkungen auf das Modell auf einfache Weise getestet werden. In diesem Szenario werden Sie die Dienstqualität für die Nachtschicht (kein Wochentag angegeben) vorhersagen, wenn sechs erfahrene Telefonisten Dienst haben.

So erstellen Sie eine SINGLETON-Abfrage mithilfe des neuronalen Netzwerkmodells

Öffnen Sie in Business Intelligence Development Studio die Projektmappe mit dem Modell, das Sie verwenden möchten.
Klicken Sie im Data Mining-Designer auf die Registerkarte Miningmodellvorhersage.
Klicken Sie im Bereich Miningmodell auf Modell auswählen.
Im Dialogfeld Miningmodell auswählen wird eine Liste mit Miningstrukturen angezeigt. Erweitern Sie die Miningstruktur, um eine Liste der dieser Struktur zugeordneten Miningmodelle anzuzeigen.
Erweitern Sie die Miningstruktur "Call Center Default", und wählen Sie das neuronale Netzwerkmodell "Call Center - LR" aus.
Klicken Sie im Menü Miningmodell auf SINGLETON-Abfrage.

Das Dialogfeld SINGLETON-Abfrageeingabe wird angezeigt, in dem die Spalten den Spalten im Miningmodell zugeordnet sind.
Klicken Sie im Dialogfeld SINGLETON-Abfrageeingabe auf die Zeile für Shift und wählen Sie midnight aus.
Klicken Sie auf die Zeile für Lvl 2 Operators und geben Sie 6 ein.
Klicken Sie in der unteren Hälfte der Registerkarte Miningmodellvorhersage auf die erste Zeile im Raster.
Klicken Sie in der Spalte Quelle auf den Pfeil nach unten, und wählen Sie Vorhersagefunktion aus. Wählen Sie in der Spalte Feld den Eintrag PredictHistogram aus.

Eine Liste mit Argumenten, die Sie mit dieser Vorhersagefunktion verwenden können, wird automatisch im Feld Kriterium/Argument angezeigt.
Ziehen Sie die Spalte ServiceGrade aus der Liste der Spalten im Bereich Miningmodell in das Feld Kriterium/Argument.

Der Name der Spalte wird automatisch als Argument eingefügt. Sie können jede vorhersagbare Attributspalte in dieses Textfeld ziehen.
Klicken Sie oben im Generator für Vorhersageabfragen auf die Schaltfläche Zur Abfrageergebnissicht wechseln.

Die erwarteten Ergebnisse enthalten die möglichen vorhergesagten Werte für jede Dienstqualität bei Berücksichtigung der angegebenen Eingaben zusammen mit Unterstützungs- und Wahrscheinlichkeitswerten für jede Vorhersage. Sie können jederzeit zur Entwurfsansicht zurückkehren und die Eingaben ändern oder weitere Eingaben hinzufügen.

Erstellen von Vorhersagen mithilfe eines logistischen Regressionsmodells

Sie können mit einem neuronalen Netzwerkmodell Vorhersagen erstellen, normalerweise wird das neuronale Netzwerkmodell jedoch für die Untersuchung komplexer Beziehungen verwendet. Wenn Sie die Attribute bereits kennen, die für das Geschäftsproblem relevant sind, können Sie ein logistisches Regressionsmodell verwenden, um die Auswirkungen bei Änderungen an bestimmten unabhängigen Variablen vorherzusagen. Die logistische Regression ist eine statistische Methode, die häufig verwendet wird, um Vorhersagen auf der Grundlage von Änderungen in unabhängigen Variablen zu treffen: Sie wird z. B. für finanzielle Bewertungen verwendet, um das Kundenverhalten auf der Grundlage der Kundendemografie vorherzusagen.

In dieser Aufgabe erfahren Sie, wie Sie eine Datenquelle für Vorhersagen erstellen und anschließend Vorhersagen zur Beantwortung verschiedener Geschäftsfragen treffen.

Generieren von Daten für Massenvorhersagen

In dieser Lektion erstellen Sie zuerst eine aggregierte Ansicht der Quelldaten, die zum Treffen von Massenvorhersagen verwendet werden kann, und verknüpfen diese Daten anschließend in einer Vorhersageabfrage mit einem Miningmodell. Es gibt viele Möglichkeiten, Eingabedaten bereitzustellen. Sie können beispielsweise die Personalausstattung aus einer Tabelle importieren oder die Werte programmgesteuert angeben. In diesem Fall erstellen Sie mithilfe des Datenquellensicht-Designers eine benannte Abfrage. Diese benannte Abfrage ist eine benutzerdefinierte T-SQL-Anweisung, die Aggregate für jede Schicht erstellt, wie z. B. die maximale Anzahl an Telefonisten, die Mindestanzahl empfangener Anrufe oder die durchschnittliche Anzahl generierter Probleme.

So generieren Sie Eingabedaten für eine Massenvorhersageabfrage

Klicken Sie im Projektmappen-Explorer mit der rechten Maustaste auf Datenquellensichten und wählen Sie dann Neue Datenquellensicht aus.
Wählen Sie im Datenquellensicht-Assistenten Adventure Works DW2008R2 als Datenquelle aus und klicken Sie dann auf Weiter.
Klicken Sie auf der Seite Tabellen und Sichten auswählen auf Weiter, ohne eine Tabelle auszuwählen.
Geben Sie auf der Seite Assistenten abschließen den Namen Shifts ein.

Dieser Name wird im Projektmappen-Explorer als Name der Datenquellensicht angezeigt.
Klicken Sie mit der rechten Maustaste auf den leeren Entwurfsbereich, und wählen Sie Neue benannte Abfrage aus.
Geben Sie im Dialogfeld Benannte Abfrage erstellen den Namen Shifts for Call Center ein.

Dieser Name wird im Datenquellensicht-Designer nur als der Name der benannten Abfrage angezeigt.

Fügen Sie in der unteren Hälfte des Dialogfelds die folgende Abfrageanweisung in den SQL-Textbereich ein.

SELECT DISTINCT WageType, Shift, 
AVG(Orders) as AvgOrders, MIN(Orders) as MinOrders, MAX(Orders) as MaxOrders,
AVG(Calls) as AvgCalls, MIN(Calls) as MinCalls, MAX(Calls) as MaxCalls,
AVG(LevelTwoOperators) as AvgOperators, MIN(LevelTwoOperators) as MinOperators, MAX(LevelTwoOperators) as MaxOperators,
AVG(Issues) as AvgIssues, MIN(Issues) as MinIssues, MAX(Issues) as MaxIssues
FROM dbo.FactCallCenter
GROUP BY Shift, WageType

Klicken Sie auf OK..
Klicken Sie im Entwurfsbereich mit der rechten Maustaste auf die Tabelle Shifts for Call Center und wählen Sie Daten durchsuchen aus, um eine Vorschau der von der T-SQL-Abfrage zurückgegeben Daten anzuzeigen.
Klicken Sie mit der rechten Maustaste auf die Registerkarte Shifts.dsv (Design) und klicken Sie dann auf Speichern, um die neue Datenquellensichtdefinition zu speichern.

Vorhersagen der Dienstmetrik für jede Schicht

Nachdem Sie einige Werte für jede Schicht generiert haben, verwenden Sie nun diese Werte als Eingabe für das logistische Regressionsmodell, das Sie erstellt haben, um mehrere Vorhersagen zu generieren.

So verwenden Sie die neue DSV als Eingabe für eine Vorhersageabfrage

Klicken Sie im Data Mining-Designer auf die Registerkarte Miningmodellvorhersage.
Klicken Sie im Bereich Miningmodell auf Modell auswählen und wählen Sie aus der Liste der verfügbaren Modelle Call Center - LR aus.
Deaktivieren Sie im Menü Miningmodell die Option SINGLETON-Abfrage. Eine Warnung weist Sie darauf hin, dass die Eingaben für die SINGLETON-Abfrage verloren gehen. Klicken Sie auf OK.

Das Dialogfeld SINGLETON-Abfrageeingabe wird durch das Dialogfeld Eingabetabelle(n) auswählen ersetzt.
Klicken Sie auf Falltabelle auswählen.
Wählen Sie im Dialogfeld Tabelle auswählen aus der Liste der Datenquellen "Shifts" aus. Wählen Sie "Shifts for Call Center" in der Liste Tabellen-/Sichtname aus (wird ggf. automatisch ausgewählt), und klicken Sie dann auf OK.

Die Entwurfsoberfläche Miningmodellvorhersage wird aktualisiert und zeigt die Zuordnungen an, die von Analysis Services auf Grundlage der Namen und der Datentypen der Spalten in den Eingabedaten und in dem Modell erstellt wurden.
Klicken Sie mit der rechten Maustaste auf eine der Verknüpfungslinien und wählen Sie dann Verbindungen ändern aus.

In diesem Dialogfeld können Sie genau sehen, welche Spalten zugeordnet werden und welche nicht. Das Miningmodell enthält Spalten für Calls, Orders, Issues und LvlTwoOperators, die Sie beliebigen Aggregaten zuordnen können, die Sie basierend auf diesen Spalten in den Quelldaten erstellt haben. In diesem Szenario nehmen Sie eine Zuordnung zu den Mittelwerten vor.
Klicken Sie auf die leere Zelle neben LevelTwoOperators und wählen Sie Shifts for Call Center.AvgOperators aus.
Klicken Sie auf die leere Zelle neben Calls, wählen Sie Shifts for Call Center.AvgCalls aus und klicken Sie dann auf OK.

So erstellen Sie die Vorhersagen für jede Schicht

Klicken Sie im Raster in der unteren Hälfte des Generators für Vorhersageabfragen auf die leere Zelle unter Quelle und wählen Sie dann Shifts for Call Center aus.
Wählen Sie in der leeren Zelle unter Feld den Eintrag Shift aus.
Klicken Sie auf die nächste leere Zeile im Raster und wiederholen Sie die oben beschriebene Prozedur, um eine weitere Zeile für WageType hinzuzufügen.
Klicken Sie auf die nächste leere Zeile im Raster. Wählen Sie in der Spalte Quelle den Eintrag Vorhersagefunktion aus. Wählen Sie in der Spalte Feld den Eintrag Vorhersagen aus.
Ziehen Sie die Spalte ServiceGrade aus dem Bereich Miningmodell in das Raster und legen Sie die Spalte in der Zelle Kriterium/Argument ab. Geben Sie im Feld Alias die Zeichenfolge Predicted Service Grade ein.
Klicken Sie auf die nächste leere Zeile im Raster. Wählen Sie in der Spalte Quelle den Eintrag Vorhersagefunktion aus. Wählen Sie in der Spalte Feld den Eintrag PredictProbability aus.
Ziehen Sie die Spalte ServiceGrade aus dem Bereich Miningmodell in das Raster und legen Sie die Spalte in der Zelle Kriterium/Argument ab. Geben Sie im Feld Alias die Zeichenfolge Probability ein.
Klicken Sie auf Zur Abfrageergebnissicht wechseln, um die Vorhersagen anzuzeigen.

In der folgenden Tabelle werden Beispielergebnisse für jede Schicht angezeigt.

Shift	WageType	Predicted Service Grade	Wahrscheinlichkeit
AM	holiday	0.165	0.377520666
midnight	holiday	0.105	0.364105573
PM1	holiday	0.165	0.40056055
PM2	holiday	0.165	0.338532973
AM	weekday	0.165	0.370847617
midnight	weekday	0.08	0.352999173
PM1	weekday	0.165	0.317419177
PM2	weekday	0.105	0.311672027

Vorhersagen zu den Auswirkungen der Gesprächsdauer auf die Dienstqualität

Sie haben mehrere Werte für jede Schicht generiert und diese Werte als Eingaben für das logistische Regressionsmodell verwendet. Da als Geschäftsziel jedoch eine Abbruchrate zwischen 0,00 und 0,05 vorgegeben ist, sind die Ergebnisse nicht sehr ermutigend.

Vom Betriebsteam wird daher beschlossen, einige Vorhersagen auf der Grundlage des ursprünglichen Modells auszuführen, das gezeigt hat, dass sich die Antwortzeit stark auf die Dienstqualität auswirkt. Mit diesen Vorhersagen soll untersucht werden, ob durch eine Verkürzung der durchschnittlichen Antwortzeit für Anrufe die Dienstqualität verbessert werden kann. Verbessert sich das Ergebnis, wenn die Antwortzeit auf 90 Prozent oder sogar 80 Prozent der aktuellen Antwortzeit verkürzt wird?

Es ist leicht, eine Datenquellensicht (Data Source View, DSV) zu erstellen, die die durchschnittlichen Antwortzeiten für jede Schicht berechnet. Sie können auch Spalten mit Zeiten hinzufügen, die die Zielwerte darstellen. Sie können dann die DSV als Eingabe für das Modell verwenden.

In der folgenden Tabelle werden die Ergebnisse einer Vorhersageabfrage aufgeführt, die drei verschiedene Antwortzeiten als Eingaben verwendet. Die Abfrage gibt auch die Wahrscheinlichkeit des vorhergesagten Werts zurück, damit Sie einschätzen können, wie wahrscheinlich es ist, dass die Verkürzung der Antwortzeit Auswirkungen auf die Dienstqualität hat.

In der folgenden Tabelle stellt der erste Zahlensatz die vorhergesagte Dienstqualität dar, und der zweite Satz (in Klammern) gibt die Wahrscheinlichkeit dieses vorhergesagten Werts an. Aus diesen Ergebnissen lässt sich schließen, dass eine Verkürzung der Antwortzeit auf 90 Prozent umgesetzt werden sollte.

Shift	WageType	Durchschnittliche Antwortzeit für die Schicht	Verkürzung der Antwortzeit auf 90 Prozent	Verkürzung der Antwortzeit auf 80 Prozent
AM	holiday	0.165 (0.366079388)	0.05 (0.457470875)	0.05 (0.610514425)
AM	weekday	0.05 (0.341218694)	0.05 (0.475767776)	0.05 (0.60083244)
midnight	holiday	0.165 (0.337801273)	0.05 (0.413774655)	0.05 (0.545764101)
midnight	weekday	0.05 (0.378241537)	0.05 (0.471615415)	0.05 (0.545614362)
PM1	holiday	0.165 (0.457871243)	0.165 (0.376892925)	0.05 (0.359440286)
PM1	weekday	0.08 (0.299182047)	0.08 (0.363761441)	0.08 (0.40686473)
PM2	holiday	0.105 (0.325921785)	0.05 (0.392121793)	0.05 (0.521558758)
PM2	weekday	0.105 (0.436051591)	0.105 (0.342589832)	0.05 (Y)

Alternativ zur Bereitstellung der Eingabewerte in einer Datenquellensicht (wie in diesem Beispiel) können Sie die Eingaben auch programmgesteuert berechnen und für das Modell bereitstellen. Indem Sie alle möglichen Werte durchlaufen, können Sie so die kleinste Verkürzung der Antwortzeit ermitteln, bei der die vorgegebenen Zielwerte für die Dienstqualität in jeder Schicht erreicht werden.

Es gibt eine Vielzahl anderer Vorhersageabfragen, die Sie für dieses Modell erstellen können. Sie können zum Beispiel vorhersagen, wie viele Telefonisten erforderlich sind, um eine bestimmte Dienstqualität zu erreichen oder um eine bestimmte Anzahl von eingehenden Aufrufen entgegenzunehmen. Da Sie in einem logistischen Regressionsmodell mehrere Ausgaben einschließen können, ist es leicht, mit verschiedenen unabhängigen Variablen und Ergebnissen zu experimentieren, ohne mehrere separate Modelle erstellen zu müssen.

Hinweise

Die Data Mining-Add-Ins für Excel 2007 stellen einen Logistic Regression-Assistenten bereit, mit dem komplexe Fragen einfach beantwortet werden können, beispielsweise wie viele Operatoren der Ebene 2 benötigt werden, um die Dienstqualität für eine bestimmte Schicht auf ein Zielniveau anzuheben. Die Data Mining-Add-Ins können kostenlos heruntergeladen werden und enthalten Assistenten, die auf dem neuronalen Netzwerk und/oder den Logistic Regression-Algorithmen basieren. Weitere Informationen finden Sie unter den folgenden Links:

SQL Server 2005 Data Mining Add-Ins für Office 2007: Goal Seek and What If Scenario Analysis
SQL Server 2008 Data Mining Add-Ins for Office 2007: Goal Seek Scenario Analysis, What If Scenario Analysis, and Prediction Calculator

Schlussfolgerung

Sie haben gelernt, Miningmodelle zu erstellen, anzupassen und zu interpretieren, die auf dem Microsoft Neural Network-Algorithmus und dem Microsoft Logistic Regression-Algorithmus basieren. Diese Modelltypen bieten sehr umfassende Möglichkeiten und erlauben nahezu unendlich viele Variationen bei der Analyse. Ihre Verwendung kann daher komplex und schwierig sein. Tools, z. B. die Excel-basierten Diagramme und PivotTables, die im Datenquellensicht-Designer bereitgestellt werden, unterstützen Sie beim Erkennen und Interpretieren der wichtigsten von den Algorithmen festgestellten Trends. Um die Ergebnisse des Modells in ihrem ganzen Umfang zu nutzen, können Sie die vom Modell bereitgestellte Analyse genau untersuchen und die Daten eingehend prüfen, indem Sie zwischen dem benutzerdefinierten Miningmodell-Viewers und anderer Tools wechseln. Auf diese Weise gewinnen Sie umfassende Einblicke in die Datentrends.