Hinzufügen einer Datenquellensicht für Callcenterdaten (Data Mining-Lernprogramm für Fortgeschrittene)

 

Gilt für: SQL Server 2016 Preview

In dieser Aufgabe fügen Sie eine Datenquellensicht hinzu, mit der auf Callcenterdaten zugegriffen wird. Die gleichen Daten werden verwendet, um sowohl das ursprüngliche neuronale Netzwerkmodell zum Durchsuchen als auch das logistische Regressionsmodell zum Schreiben von Empfehlungen zu erstellen.

Sie verwenden den Datenquellensicht-Designer auch dazu, eine Spalte für den Wochentag hinzuzufügen. Dies ist hilfreich, da Sie aus Erfahrung wissen, dass sich Muster im Hinblick auf Anfrufaufkommen wie auch Dienstqualität wiederholen, die den Rhythmus von Werktagen und Wochenende wiederspiegeln, auch wenn die Quelldaten alle Callcenterdaten nach Datum verfolgen.

Vorgehensweisen

So fügen Sie eine Datenquellensicht hinzu

  1. In Projektmappen-Explorer, mit der rechten Maustaste Datenquellensichten, und wählen Sie Neue Datenquellensicht.

    Der Datenquellensicht-Assistent wird geöffnet.

  2. Klicken Sie auf der Seite Willkommen beim Datenquellensicht-Assistenten auf Weiter.

  3. Auf der Wählen Sie eine Datenquelle Seite relationale Datenquellen, wählen die Adventure Works DW Multidimensional 2012 -Datenquelle. Wenn Sie nicht über diese Datenquelle verfügen, finden Sie unter grundlegende Data Mining-Lernprogramm. Klicken Sie auf Weiter.

  4. Auf der Tabellen und Sichten auswählen Seite, wählen Sie in der folgenden Tabelle aus, und klicken Sie dann auf den Pfeil nach rechts, um sie der Datenquellensicht hinzuzufügen:

    • FactCallCenter (dbo)

    • DimDate

  5. Klicken Sie auf Weiter.

  6. Auf der der Assistent Seite standardmäßig den Namen die Datenquellensicht Adventure Works DW Multidimensional 2012. Ändern Sie den Namen in CallCenter, und klicken Sie dann auf Fertig stellen.

    Datenquellensicht-Designer wird geöffnet und zeigt die CallCenter -Datenquellensicht.

  7. Mit der rechten Maustaste in der Datenquellensicht-Bereich, und wählen Sie Tabellen hinzufügen/entfernen. Wählen Sie die Tabelle DimDate und klicken Sie auf OK.

    Eine Beziehung sollte automatisch hinzugefügt werden, zwischen dem DateKey Spalten in jeder Tabelle. Verwenden Sie diese Beziehung zum Abrufen der Spalte EnglishDayNameOfWeek, aus der DimDate Tabelle, und verwenden Sie es in Ihrem Modell.

  8. Die Datenquellensicht-Designer mit der Maustaste der Tabelle FactCallCenter, und wählen Sie neue benannte Berechnung.

    In der benannte Berechnung erstellen Dialogfeld Geben Sie die folgenden Werte:

    Spaltenname DayOfWeek (TagderWoche)
    Description Abrufen des Wochentags aus der DimDate-Tabelle
    expression (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)

    Um sicherzustellen, dass der Ausdruck die Daten erstellt benötigen, klicken Sie auf die Tabelle FactCallCenter, und wählen Sie dann Daten durchsuchen.

  9. Nehmen Sie sich kurz Zeit, die verfügbaren Daten durchzusehen, um ihre Verwendung im Data Mining besser verstehen zu können:

Spaltenname Enthält
FactCallCenterID Ein beim Importieren der Daten in das Data Warehouse erstellter willkürlicher Schlüssel.

Diese Spalte identifiziert eindeutige Datensätze und sollte als Fallschlüssel für das Data Mining-Modell verwendet werden.
DateKey Das Datum des Callcentervorgangs, ausgedrückt als ganze Zahl. Ganzzahlige Datumsschlüssel werden oft in Data Warehouses verwendet. Möglicherweise möchten Sie diese Daten für die Gruppierung nach Datumswerten aber im Format Datum/Uhrzeit abrufen.

Beachten Sie, dass Datumsangaben nicht eindeutig sind, da der Hersteller einen separaten Bericht für jede einzelne Schicht eines Arbeitstages ausgibt.
WageType Gibt an, ob der Tag ein Arbeitstag, ein Wochenendtag oder ein Feiertag war.

Es ist möglich, dass es ein Unterschied in der Qualität des Kundendiensts an Wochenenden und Wochentage verwenden Sie diese Spalte als Eingabe.
Shift Gibt die Schicht an, für die Anrufe aufgezeichnet werden. Dieses Callcenter teilt den Arbeitstag in vier Schichten ein: Vormittag, Nachmittag 1, Nachmittag 2, und Nacht.

Es ist möglich, dass die Schicht die Qualität des Kundendiensts beeinflusst. Daher verwenden Sie diese Spalte als Eingabe.
LevelOneOperators Gibt die Anzahl der Ebene 1 arbeitenden Operatoren auf.

Callcenter-Mitarbeiter beginnen auf Ebene 1; diese Mitarbeiter sind also nicht sehr erfahren.
LevelTwoOperators Gibt die Anzahl der arbeitenden Operatoren auf Ebene 2 an.

Ein Mitarbeiter muss eine bestimmte Anzahl von Arbeitsstunden protokollieren, um sich als Operator auf Ebene 2 zu qualifizieren.
TotalOperators Die Gesamtzahl der arbeitenden Telefonisten während der Schicht.
Aufrufe Anzahl der Anrufe, die während der Schicht empfangen werden.
AutomaticResponses Die Anzahl der Anrufe, die vollständig über die automatisierte Anrufabwicklung (Interactive Voice Response, IVR) bearbeitet wurden.
Orders Die Anzahl der Aufträge, die durch die Anrufe abgeschlossen wurden.
IssuesRaised Die Anzahl der Probleme, die aus Anrufen hervorgingen und einer Nachbearbeitung bedürfen.
AverageTimePerIssue Die durchschnittliche Zeit, die erforderlich ist, um einen eingehenden Anruf zu bearbeiten.
ServiceGrade Eine Metrik, die die allgemeine Qualität der Dienst gibt an, gemessen als die Abbruchrate für die gesamte Verschiebung. Je höher die Abbruchrate, desto wahrscheinlicher ist es, dass Kunden unzufrieden sind und potenzielle Aufträge verloren gehen.

Beachten Sie, dass die Daten vier verschiedene Spalten enthalten, die auf einer einzelnen Datumsspalte basieren: WageType, DayOfWeek, UMSCHALT, und DateKey. Gewöhnlich ist es beim Data Mining nicht empfehlenswert, mehrere von den gleichen Daten abgeleitete Spalten zu verwenden, da die Werte zu stark miteinander korrelieren und so andere Muster verdecken können.

Allerdings werden nicht verwendet, DateKey im Modell, da es zu viele eindeutige Werte enthält. Es besteht keine direkte Beziehung zwischen UMSCHALT und DayOfWeek, und WageType und DayOfWeek beziehen sich nur teilweise. Wenn Ihnen die Kollinearität Sorgen bereitet, könnten Sie die Struktur mit allen verfügbaren Spalten erstellen und dann in jedem Modell andere Spalten ignorieren und die Auswirkungen überprüfen.

Nächste Aufgabe in der Lektion

Erstellen die Struktur eines neuronalen Netzwerks und Modell ( Datamining-Lernprogramm für fortgeschrittene )

Siehe auch

Datenquellsichten in mehrdimensionalen Modellen