Hinzufügen einer Datenquellensicht für Callcenterdaten (Data Mining-Lernprogramm für Fortgeschrittene)

In dieser Aufgabe fügen Sie eine Datenquellensicht hinzu, mit der auf Callcenterdaten zugegriffen wird. Die gleichen Daten werden verwendet, um sowohl das ursprüngliche neuronale Netzwerkmodell zum Durchsuchen als auch das logistische Regressionsmodell zum Schreiben von Empfehlungen zu erstellen.

Sie verwenden den Datenquellensicht-Designer auch dazu, eine Spalte für den Wochentag hinzuzufügen. Dies ist hilfreich, da Sie aus Erfahrung wissen, dass sich Muster im Hinblick auf Anfrufaufkommen wie auch Dienstqualität wiederholen, die den Rhythmus von Werktagen und Wochenende wiederspiegeln, auch wenn die Quelldaten alle Callcenterdaten nach Datum verfolgen.

Vorgehensweisen

So fügen Sie eine Datenquellensicht hinzu

  1. Klicken Sie im Projektmappen-Explorer mit der rechten Maustaste auf Datenquellensichten und wählen Sie Neue Datenquellensicht aus.

    Der Datenquellensicht-Assistent wird geöffnet.

  2. Klicken Sie auf der Seite Willkommen auf Weiter.

  3. Wählen Sie auf der Seite Datenquelle auswählen unter Relationale Datenquellen die Adventure Works DW Multidimensional 2012 -Datenquelle aus. Wenn diese Datenquelle noch nicht vorhanden ist, finden Sie unter Lernprogramm zu Data Mining-Grundlagen entsprechende Informationen. Klicken Sie auf Weiter.

  4. Wählen Sie auf der Seite Tabellen und Sichten auswählen die folgende Tabelle aus, und klicken Sie anschließend auf den Pfeil nach rechts, um sie der Datenquellensicht hinzuzufügen:

    • FactCallCenter (dbo)

    • DimDate

  5. Klicken Sie auf Weiter.

  6. Auf der Seite Assistenten abschließen wird die Datenquellensicht standardmäßig Adventure Works DW Multidimensional 2012 benannt. Ändern Sie den Namen in CallCenter und klicken Sie anschließend auf Fertig stellen.

    Der Datenquellensicht-Designer wird geöffnet und zeigt die Datenquellensicht "CallCenter" an.

  7. Klicken Sie mit der rechten Maustaste im Bereich Datenquellensicht, und wählen Sie Tabellen hinzufügen/entfernen aus. Wählen Sie die Tabelle DimDate aus und klicken Sie auf OK.

    Eine Beziehung zwischen den DateKey-Spalten in jeder Tabelle sollte automatisch hinzugefügt werden. Mithilfe dieser Beziehung rufen Sie aus der Tabelle DimDate die Spalte EnglishDayNameOfWeek ab und verwenden sie im Modell.

  8. Klicken Sie im Datenquellensicht-Designer mit der rechten Maustaste auf die Tabelle FactCallCenter und wählen Sie dann Neue benannte Berechnung aus.

    Geben Sie im Dialogfeld Benannte Berechnung erstellen die folgenden Werte ein:

    Spaltenname

    DayOfWeek (TagderWoche)

    Beschreibung

    Abrufen des Wochentags aus der DimDate-Tabelle

    Ausdruck

    (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)

    Sie können überprüfen, ob der Ausdruck die gewünschten Daten erstellt, indem Sie mit der rechten Maustaste auf die Tabelle FactCallCenter klicken und dann Daten durchsuchen auswählen.

  9. Nehmen Sie sich kurz Zeit, die verfügbaren Daten durchzusehen, um ihre Verwendung im Data Mining besser verstehen zu können:

Spaltenname

Enthält

FactCallCenterID

Ein beim Importieren der Daten in das Data Warehouse erstellter willkürlicher Schlüssel.

Diese Spalte identifiziert eindeutige Datensätze und sollte als Fallschlüssel für das Data Mining-Modell verwendet werden.

DateKey

Das Datum des Callcentervorgangs, ausgedrückt als ganze Zahl. Ganzzahlige Datumsschlüssel werden oft in Data Warehouses verwendet. Möglicherweise möchten Sie diese Daten für die Gruppierung nach Datumswerten aber im Format Datum/Uhrzeit abrufen.

Beachten Sie, dass Datumsangaben nicht eindeutig sind, da der Hersteller einen separaten Bericht für jede einzelne Schicht eines Arbeitstages ausgibt.

WageType

Gibt an, ob der Tag ein Arbeitstag, ein Wochenendtag oder ein Feiertag war.

Es ist möglich, dass es in der Qualität des Kundendiensts ein Unterschied zwischen Wochenenden und Werktagen besteht. Daher verwenden Sie diese Spalte als Eingabe.

Shift

Gibt die Schicht an, für die Anrufe aufgezeichnet werden. Dieses Callcenter teilt den Arbeitstag in vier Schichten ein: Vormittag, Nachmittag 1, Nachmittag 2, und Nacht.

Es ist möglich, dass die Schicht die Qualität des Kundendiensts beeinflusst. Daher verwenden Sie diese Spalte als Eingabe.

LevelOneOperators

Gibt die Anzahl der arbeitenden Operatoren auf Ebene 1 an.

Callcenter-Mitarbeiter beginnen auf Ebene 1; diese Mitarbeiter sind also nicht sehr erfahren.

LevelTwoOperators

Gibt die Anzahl der arbeitenden Operatoren auf Ebene 2 an.

Ein Mitarbeiter muss eine bestimmte Anzahl von Arbeitsstunden protokollieren, um sich als Operator auf Ebene 2 zu qualifizieren.

TotalOperators

Die Gesamtzahl der arbeitenden Telefonisten während der Schicht.

Calls

Anzahl der Anrufe, die während der Schicht empfangen werden.

AutomaticResponses

Die Anzahl der Anrufe, die vollständig über die automatisierte Anrufabwicklung (Interactive Voice Response, IVR) bearbeitet wurden.

Orders

Die Anzahl der Aufträge, die durch die Anrufe abgeschlossen wurden.

IssuesRaised

Die Anzahl der Probleme, die aus Anrufen hervorgingen und einer Nachbearbeitung bedürfen.

AverageTimePerIssue

Die durchschnittliche Zeit, die erforderlich ist, um einen eingehenden Anruf zu bearbeiten.

ServiceGrade

Eine Metrik, die die allgemeine Dienstqualität an der Abbruchrate der gesamten Schicht misst. Je höher die Abbruchrate, desto wahrscheinlicher ist es, dass Kunden unzufrieden sind und potenzielle Aufträge verloren gehen.

Beachten Sie, dass die Daten vier verschiedene Spalten enthalten, die auf einer einzelnen Datumsspalte basieren: WageType, DayOfWeek, Shift und DateKey. Gewöhnlich ist es beim Data Mining nicht empfehlenswert, mehrere von den gleichen Daten abgeleitete Spalten zu verwenden, da die Werte zu stark miteinander korrelieren und so andere Muster verdecken können.

Wir verwenden jedoch DateKey nicht im Modell, da diese Spalte zu viele eindeutige Werte enthält. Es gibt keine direkte Beziehung zwischen Shift und DayOfWeek, und WageType und DayOfWeek stehen nur teilweise in Beziehung. Wenn Ihnen die Kollinearität Sorgen bereitet, könnten Sie die Struktur mit allen verfügbaren Spalten erstellen und dann in jedem Modell andere Spalten ignorieren und die Auswirkungen überprüfen.

Nächste Aufgabe in dieser Lektion

Erstellen einer neuronalen Netzwerkstruktur und eines neuronalen Netzwerkmodells (Data Mining-Lernprogramm für Fortgeschrittene)

Siehe auch

Konzepte

Datenquellsichten in mehrdimensionalen Modellen