Partager via


Ajout d'une vue de source de données pour les données de centre d'appels (Didacticiel sur l'exploration de données intermédiaire)

Au cours de cette tâche, vous allez ajouter une vue de source de données qui sera utilisée pour accéder aux données d'un centre d'appels. Les mêmes données seront utilisées pour générer aussi bien le modèle de réseau neuronal initial destiné à l'exploration que le modèle de régression logistique que vous utiliserez pour faire des recommandations.

Vous utiliserez également le concepteur de vue de source de données pour ajouter une colonne pour le jour de la semaine. En effet, bien que les données sources suivent les données de centre d'appels par date, votre expérience indique qu'il existe des modèles récurrents à la fois en termes de volume d'appel et de qualité de service, selon que le jour est un week-end ou un jour de semaine.

Procédures

Pour ajouter une vue de source de données

  1. Dans l'Explorateur de solutions, cliquez avec le bouton droit sur Vues des sources de données et sélectionnez Nouvelle vue de source de données.

    L'Assistant Vue de source de données s'ouvre.

  2. Dans la page Assistant Vue de source de données, cliquez sur Suivant.

  3. Dans la page Sélectionner une source de données, sous Sources de données relationnelles, sélectionnez la source de données  Adventure Works DW Multidimensional 2012 . Si vous ne disposez pas de cette source de données, consultez Didacticiel sur l'exploration de données de base. Cliquez sur Suivant.

  4. Dans la page Sélectionner des tables et des vues, sélectionnez la table suivante, puis cliquez sur la flèche vers la droite pour l'ajouter à la vue de source de données :

    • FactCallCenter (dbo)

    • DimDate

  5. Cliquez sur Suivant.

  6. Dans la page Fin de l'Assistant, la vue de source de données par défaut est nommée Adventure Works DW Multidimensional 2012 . Remplacez ce nom par CallCenter, puis cliquez sur Terminer.

    Le Concepteur de vue de source de données s'ouvre pour afficher la vue de source de données CallCenter.

  7. Cliquez avec le bouton droit dans le volet Vue de source de données et sélectionnez Ajouter/supprimer des tables. Sélectionnez la table, DimDate et cliquez sur OK.

    Une relation doit être ajoutée automatiquement entre les colonnes DateKey de chaque table. Vous allez utiliser cette relation pour obtenir la colonne EnglishDayNameOfWeek à partir de la table DimDate et l'utiliser dans votre modèle.

  8. Dans le Concepteur de vue de source de données, cliquez avec le bouton droit sur la table FactCallCenter, puis sélectionnez Nouveau calcul nommé.

    Dans la boîte de dialogue Créer un calcul nommé, tapez les valeurs suivantes :

    Nom de colonne

    DayOfWeek

    Description

    Obtenir le jour de la semaine depuis la table DimDate

    Expression

    (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)

    Pour vérifier que l'expression crée les données dont vous avez besoin, cliquez avec le bouton droit sur la table FactCallCenter, puis sélectionnez Explorer les données.

  9. Prenez une minute pour examiner les données disponibles afin de pouvoir comprendre comment elles sont utilisées dans l'exploration de données :

Nom de colonne

Contient

FactCallCenterID

Clé arbitraire créée lorsque les données ont été importées vers l'entrepôt de données.

Cette colonne identifie les enregistrements uniques et doit être utilisée comme clé de cas du modèle d'exploration de données.

DateKey

Date de fonctionnement du centre d'appels, sous la forme d'un entier. Les clés de date entières sont souvent utilisées dans les entrepôts de données, mais vous souhaitez peut-être obtenir la date au format date/heure si vous vouliez fonctionner par groupements de valeurs de date.

Notez que les dates ne sont pas uniques car le fournisseur fournit un rapport distinct pour chaque équipe et pour chaque jour de fonctionnement.

WageType

Indique si le jour était un jour de semaine, de week-end ou un jour férié.

Il est possible qu'il existe une différence de qualité de service client le week-end par rapport aux jours de semaine. Vous utiliserez donc cette colonne comme entrée.

Shift

Indique l'équipe pour laquelle les appels sont enregistrés. Ce centre d'appels divise la journée de travail en quatre équipes : AM, PM1, PM2 et Midnight.

Il est possible que les horaires des équipes influencent la qualité du service client. Vous utiliserez donc cela comme entrée.

LevelOneOperators

Indique le nombre d'opérateurs de niveau 1 qui sont en service.

Les employés de centre d'appels débutent au niveau 1. Ces employés ont donc moins d'expérience.

LevelTwoOperators

Indique le nombre d'opérateurs de niveau 2 qui sont en service.

Un employé doit enregistrer un certain nombre d'heures de service pour obtenir la qualification d'opérateur de niveau 2.

TotalOperators

Nombre total d'opérateurs présents pendant le temps de travail de l'équipe.

Calls

Nombre d'appels reçus pendant la période de travail de l'équipe.

AutomaticResponses

Nombre d'appels qui ont été totalement gérés par traitement automatisé des appels (réponse vocale interactive).

Orders

Nombre de commandes qui ont fait suite à des appels.

IssuesRaised

Nombre de problèmes, générés par des appels, qui requièrent un suivi.

AverageTimePerIssue

Durée moyenne requise pour répondre à un appel entrant.

ServiceGrade

Mesure qui indique la qualité générale du service, mesuré sous la forme de taux d'abandon de l'équipe entière. Plus le taux d'abandon est élevé, plus la probabilité que les clients soient mécontents et que des commandes potentielles soient perdues est forte.

Notez que les données comprennent quatre colonnes différentes basées sur une seule colonne de date : WageType, DayOfWeek, Shift et DateKey. D'ordinaire, dans l'exploration de données il n'est pas judicieux d'utiliser plusieurs colonnes dérivées des mêmes données, car les valeurs se mettent trop lourdement en corrélation entre elles et peuvent masquer d'autres modèles.

Toutefois, nous n'utiliserons pas DateKey dans le modèle car il contient trop de valeurs uniques. Il n'existe aucune relation directe entre Shift et DayOfWeek, et WageType et DayOfWeek sont uniquement liées en partie. Si vous vous inquiétiez de la collinéarité, vous pouvez créer la structure à l'aide de toutes les colonnes disponibles, puis ignorer d'autres colonnes dans chaque modèle et tester l'effet.

Tâche suivante de la leçon

Création d'une structure et d'un modèle de réseau neuronal (Didacticiel sur l'exploration de données intermédiaire)

Voir aussi

Concepts

Vues de sources de données dans les modèles multidimensionnels