Descripción de las tendencias del modelo de serie temporal (Tutorial intermedio de minería de datos)

Cuando consulta diferentes modelos creados a partir de datos agregados, puede observar que las líneas de tendencia y predicción tienen un aspecto muy diferente en función de si se sumaron el importe y la cantidad en diferentes modelos o regiones o si se calculó el promedio de las cifras.

Antes de decidir qué modelo va a aplicar como modelo general a la hora de realizar proyecciones mundiales, tendrá que revisar los datos subyacentes junto con el gráfico de predicción para entender mejor las predicciones.

Habrá observado que las líneas de tendencia se solapan hasta junio de 2006, donde las líneas de cantidad e importe comienzan a divergir. Posteriormente, en julio de 2008, las líneas vuelven a separarse.

En esta tarea, creará un cálculo con nombre a partir de la vista del origen de datos original, que la ayudará a realizar el seguimiento de la relación entre cantidad y precio. A continuación, creará un gráfico dinámico en el que incluirá esta relación y que le ayudará a comprender las divisiones de las líneas de tendencia.

Revisar los datos subyacentes

Para crear un cálculo con nombre

  1. En el Explorador de soluciones, expanda Vistas del origen de datos y haga doble clic en SalesByRegion.dsv.

  2. Haga clic con el botón secundario del mouse en la tabla vTimeSeries y seleccione Nuevo cálculo con nombre.

  3. En el cuadro Crear cálculo con nombre, en Nombre, escriba UnitAmt.

  4. En el cuadro de texto Expresión, escriba Amount/Quantity. Haga clic en Aceptar.

    La tabla vTimeSeries contiene ahora una columna calculada adicional, UnitAmt. Esta columna calculada se almacena únicamente en la definición de la vista del origen de datos del proyecto de minería de datos y no afecta a la vista de base de datos relacional subyacente.

Para crear un gráfico dinámico mediante el cálculo con nombre

  1. Haga clic con el botón secundario del mouse en la tabla vTimeSeries y seleccione Explorar datos.

  2. En la ficha Explorar la tabla vTimeSeries, haga clic en la ficha Tabla dinámica.

  3. Arrastre el campo TimeIndex del cuadro Lista de campos de tabla dinámica y colóquelo en la superficie de diseño de la tabla dinámica, donde dice Coloque aquí los campos de columna.

  4. Arrastre el campo ModelRegion del cuadro Lista de campos de tabla dinámica y colóquelo en la superficie de diseño de la tabla dinámica, donde dice Coloque aquí los campos de fila.

  5. Arrastre el campo UnitAmt del cuadro Lista de campos de tabla dinámica y colóquelo en la superficie de diseño de la tabla dinámica, donde dice Coloque aquí los campos de totales y detalle.

Revisar los modelos agregados

En la tabla dinámica, puede indicar que en varios momentos puntuales se produjeron cambios sustanciales en el importe de ventas de cada unidad, debido posiblemente a una variación del precio del producto. En julio de 2007, se produce otro cambio significativo cuando una nueva versión, T1000, se agrega en todas las regiones. Todos estos cambios afectan a las tendencias que se calculan en el modelo. Un modelo generalizado es útil porque minimiza el impacto de cualquier cambio. Sin embargo, es posible que en ciertos casos prefiera crear modelos diferentes para los nuevos almacenes, de modo que los datos de estos almacenes no afecten a las tendencias.

En este tutorial, escogerá uno de los modelos agregados para aplicarlo a las proyecciones de ventas. Recuerde que creó cuatro modelos de minería de datos diferentes, cada en función de una medida agregada diferente. Utilizará las herramientas proporcionadas en el visor de series temporales junto con la tabla dinámica que creó anteriormente para asesorarse en esta decisión. En el diagrama siguiente se muestra el gráfico de serie temporales creado para los modelos agregados. Las dos líneas de serie de color gris representan los promedios, mientras que las dos líneas de serie de color verde representan las sumas.

Cuatro modelos para las medidas agregadas

Antes de decidir qué modelo de minería va a utilizar en las proyecciones de ventas, conviene analizar los siguientes aspectos:

  • Los modelos de minería de datos basados en el importe registran una tendencia alcista, mientras que los modelos que se basan en la cantidad registran un descenso cíclico.

  • Las proyecciones que se basan en la cantidad media (AvgAmt) y las proyecciones que se basan en la suma de cantidades (SumQty) están muy alejadas.

  • Aunque las líneas de tendencia de tres de los modelos se nivelan después de 5 predicciones, la línea de tendencia del modelo que se basa en la suma de cantidades mantiene una acentuada tendencia alcista.

Hay tres cosas que puede comprobar para obtener más información. En primer lugar, active la casilla Mostrar desviaciones para ver las desviaciones estándar de cada predicción. Una barra de error más larga indica que la varianza es mayor en el valor predicho.

En segundo lugar, fíjese que la unidad del eje Y es porcentual; observe también que la escala del gráfico cambia en función de los datos del gráfico. De forma predeterminada, el Visor de series temporales de Microsoft ajusta automáticamente las unidades del eje de porcentajes para hacer el gráfico más fácil de consultar. Por tanto, si desea utilizar una escala concreta o fija, deberá utilizar una consulta de predicción para crear y exportar los valores; deberá crear también un gráfico en otra aplicación, como Microsoft Excel.

Por último, puede utilizar la vista de árbol de decisión del modelo de serie temporal para entender las divisiones del modelo. En un modelo de serie temporal, una división o una rama del árbol de decisión puede significar que la pendiente de la línea de tendencia ha cambiado significativamente en algún punto, o puede significar que el árbol se bifurcó en función de algunas otras condiciones. La vista que muestra estas divisiones como nodos en una vista de árbol le permite explorar en profundidad los detalles de las causas de la división.

Para ver el árbol de decisión de cada serie

  1. En el Explorador de soluciones, expanda Vistas del origen de datos y haga clic con el botón secundario del mouse en AllRegions.dsv.

  2. Haga clic con el botón secundario del mouse en la tabla vTimeSeries y seleccione Explorar datos.

  3. En la ficha Explorar la tabla vTimeSeries, haga clic en la ficha Tabla dinámica.

  4. Arrastre el campo ReportingDate del cuadro Lista de campos de tabla dinámica y colóquelo en la superficie de diseño de la tabla dinámica, donde dice Coloque aquí los campos de columna.

  5. Arrastre el campo Region del cuadro Lista de campos de tabla dinámica y colóquelo en la superficie de diseño de la tabla dinámica, donde dice Coloque aquí los campos de fila.

  6. Arrastre el campo UnitAmt del cuadro Lista de campos de tabla dinámica y colóquelo en la superficie de diseño de la tabla dinámica, donde dice Coloque aquí los campos de totales y detalle.

También es importante entender que, dado que un modelo de serie temporal se calcula utilizando las medias móviles, los valores de los datos finales de la serie de datos pueden tener un impacto más fuerte sobre la predicción que los valores de datos iniciales de la serie. Es más, la sugerencia de periodicidad que proporcionó al generar el modelo también tiene un efecto sobre el modo en que los promedios se utilizan en el tiempo.

Conclusión

Conforme a este análisis, ha debido aprender algunas cosas:

  • La cantidad es intrínsecamente volátil porque los valores absolutos podrían ser muy bajos en algunos almacenes; es más, la vista del gráfico tiende a exagerar las diferencias al presentar las cifras como porcentajes.

  • El importe parece incluso más volátil, pues el importe depende de la cantidad, pero también se ve afectado por los cambios de precios.

  • La fuerte tendencia alcista de las predicciones de la serie M200 North America está causada por el hecho de que el volumen de ventas fue especialmente alto en esta combinación de producto y región hacia el final de los datos históricos.

Después de explorar los datos y los diferentes modelos en profundidad, puede estar satisfecho, pues ha encontrado un modelo confiable. Si los usuarios de la compañía necesitan una justificación del análisis, puede obtener fórmulas y datos complementarios utilizando las estadísticas disponibles en InfoTips o examinando o consultando el contenido del modelo.

En la lección siguiente, utilizará el modelo que se basa en la cantidad media para realizar predicciones de la cantidad en todas las regiones.