Share via


Agregar una vista del origen de datos para datos del centro de llamadas (Tutorial intermedio de minería de datos)

En esta tarea, agregará una vista del origen de datos que se usará para tener acceso a los datos del centro de llamadas. Se usarán los mismos datos para crear tanto el modelo de red neuronal inicial para la exploración como el modelo de regresión logístico que se empleará para hacer las recomendaciones.

También usará el Diseñador de vistas del origen de datos para agregar una columna para el día de la semana. Esto se debe a que, aunque los datos de origen hacen el seguimiento de los datos del centro de llamadas de por fechas, su experiencia indica que hay patrones que se repiten en términos de volumen de llamadas y calidad del servicio, dependiendo de si el día es un fin de semana o un día de la semana.

Procedimientos

Para agregar una vista del origen de datos

  1. En el Explorador de soluciones, haga clic con el botón secundario en Vistas del origen de datos y seleccione Nueva vista del origen de datos.

    Se abrirá el Asistente para vistas del origen de datos.

  2. En la página Asistente para vistas del origen de datos, haga clic en Siguiente.

  3. Use la página Seleccionar un origen de datos en Orígenes de datos relacionales, seleccione el origen de datos Adventure Works DW Multidimensional 2012 . Si no tiene este origen de datos, vea Tutorial básico de minería de datos. Haga clic en Siguiente.

  4. En la página Seleccionar tablas y vistas, seleccione la tabla siguiente y haga clic en la flecha derecha para agregarla a la vista del origen de datos:

    • FactCallCenter (dbo)

    • DimDate

  5. Haga clic en Siguiente.

  6. En la página Finalización del asistente, la vista del origen de datos tendrá el nombre Adventure Works DW Multidimensional 2012 de forma predeterminada. Cámbielo a CallCenter y, a continuación, haga clic en Finalizar.

    Se abrirá el Diseñador de vistas del origen de datos para mostrar la vista del origen de datos CallCenter.

  7. Haga clic con el botón secundario en el panel Vista del origen de datos y seleccione Agregar o quitar tablas. Seleccione la tabla DimDate y haga clic en Aceptar.

    Se debe agregar automáticamente una relación entre las columnas DateKey de cada tabla. Usará esta relación para obtener la columna EnglishDayNameOfWeek a partir de la tabla de DimDate y utilizarla en el modelo.

  8. En el diseñador de vista del origen de datos, haga clic con el botón secundario en la tabla FactCallCenter y, a continuación, seleccione Nuevo cálculo con nombre.

    En el cuadro de diálogo Crear cálculo con nombre, escriba los valores siguientes:

    Nombre de columna

    DayOfWeek

    Descripción

    Obtiene el día de la semana en la tabla DimDate

    Expression

    (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)

    Para comprobar que la expresión cree los datos que necesita, haga clic con el botón secundario en la tabla FactCallCenter y, a continuación, seleccione Explorar datos.

  9. Dedique un minuto a revisar los datos disponibles, para entender cómo se usan en la minería de datos:

Nombre de columna

Contiene

FactCallCenterID

Una clave arbitraria que se creó cuando se importaron los datos al almacenamiento de datos.

Esta columna identifica los registros únicos y debe usarse como clave de caso para el modelo de minería de datos.

DateKey

La fecha de la operación en el centro de llamadas, expresada como un entero. Las claves de fecha se usan a menudo en los almacenamientos de datos, pero puede que desee obtener la fecha con formato de fecha y hora si va a agrupar los valores por fecha.

Observe que las fechas no son únicas, ya que el proveedor facilita un informe independiente para cada turno de cada día de trabajo.

WageType

Indica si fue un día entre semana, un día del fin de semana o un día festivo.

Es posible que haya una diferencia en la calidad del servicio al cliente durante los fines de semana en comparación con los días de la semana; por eso, usará esta columna como entrada.

Shift

Indica el turno para el que se registran las llamadas. Este centro de llamadas divide su jornada laboral en cuatro turnos: uno por la mañana (AM), dos por la tarde (PM1 y PM2) y uno por la noche (Midnight).

Es posible que el turno afecte a la calidad del servicio al cliente; por eso usará esto como entrada.

LevelOneOperators

Indica el número de operadores de nivel 1 en servicio.

Los empleados de centro de llamadas comienzan en el nivel 1, de modo que estos empleados tienen menos experiencia.

LevelTwoOperators

Indica el número de operadores de nivel 2 en servicio.

Un empleado debe llevar un número determinado de horas de servicio para optar a ser operador de nivel 2.

TotalOperators

Número total de operadores presentes durante el turno.

Calls

Número de llamadas recibidas durante el turno.

AutomaticResponses

Número de llamadas procesadas por completo de forma automática (sistema de respuesta de voz interactiva o IVR).

Orders

Número de pedidos resultantes de las llamadas.

IssuesRaised

Número de incidencias que requieren seguimiento y que se generaron a través de llamadas.

AverageTimePerIssue

Promedio de tiempo que se tarda en atender una llamada entrante.

ServiceGrade

Una métrica que indica la calidad de servicio general, medida como tasa de abandono del turno completo. Cuanto más alta es la tasa de abandono, más probabilidades hay de que los clientes no estén satisfechos y de que se pierdan posibles pedidos.

Tenga en cuenta que los datos contienen cuatro columnas diferentes basadas en una sola columna de fecha: WageType, DayOfWeek, Shift y DateKey. Normalmente en la minería de datos no es aconsejable usar varias columnas derivadas de los mismos datos, ya que los valores están demasiado correlacionados entre sí y pueden ocultar otros patrones.

Sin embargo, no usaremos DateKey en el modelo porque contiene demasiados valores únicos. No hay ninguna relación directa entre Shift y DayOfWeek, y WageType y DayOfWeek solo están parcialmente relacionados. Si le preocupa que los datos sean colineales, podría crear la estructura con todas las columnas disponibles y, a continuación, omitir varias columnas en cada modelo y probar el efecto.

Siguiente tarea de la lección

Crear una estructura y un modelo de red neuronal (Tutorial intermedio de minería de datos)

Vea también

Conceptos

Vistas del origen de datos en modelos multidimensionales