Agregar un modelo de predicción agregado (Tutorial intermedio de minería de datos)

Al explorar el modelo de predicción, observó que, aunque las ventas de la mayoría de las regiones sigan un patrón, algunas regiones y algunos modelos, como el modelo M200 en la región del Pacífico, muestran tendencias muy diferentes. Las diferencias entre las regiones son comunes y pueden ser debidas a numerosos factores, por ejemplo a promociones de marketing, informes inexactos o eventos geopolíticos.

Para reducir el efecto de estos factores en las proyecciones, decide generar un modelo de minería de datos generalizado que se base en medidas agregadas de ventas mundiales. A continuación puede realizar predicciones con este modelo y aplicarlas a regiones individuales. Finalmente, comparará las predicciones creadas para diversos productos.

Crear datos para el modelo general

El primer paso para crear el modelo generalizado es agregar los datos de ventas mundiales. Para ello, se crea una vista del origen de datos especial que utiliza un origen de datos existente pero realiza cálculos como sumas o promedios.

Para crear una vista del origen de datos mediante una consulta o cálculo personalizado

  1. En el Explorador de soluciones, haga clic con el botón secundario en Vistas del origen de datos y, después, seleccione Nueva vista del origen de datos.

  2. En la página de bienvenida del asistente, haga clic en Siguiente.

  3. En la página Seleccionar origen de datos, seleccione Adventure Works DW2008R2 y, después, haga clic en Siguiente.

  4. En la página Seleccionar tablas y vistas haga clic en Siguiente.

  5. En la página, Finalización del asistente, escriba el nombre AllRegions y, a continuación, haga clic en Finalizar.

  6. Después, haga clic con el botón secundario en la superficie de diseño de la vista del origen de datos en blanco y seleccione Nueva consulta con nombre.

  7. En el cuadro de diálogo Crear consulta con nombre, en Nombre, escriba AllRegions y en Descripción, escriba Suma y promedio de ventas para todos los modelos y regiones.

  8. En el panel de texto SQL, escriba la siguiente instrucción:

    SELECT ReportingDate, 
    SUM([Quantity]) as SumQty, AVG([Quantity]) as AvgQty,
    SUM([Amount]) AS SumAmt, AVG([Amount]) AS AvgAmt,
    'All Regions' as [Region]
    FROM dbo.vTimeSeries 
    GROUP BY ReportingDate
    
  9. Haga clic en Aceptar..

  10. Haga clic con el botón secundario en la tabla AllRegions y seleccione Explorar datos.

    La nueva vista del origen de datos contiene una suma y un promedio de las ventas de todos los productos, en todo el mundo. También podría agrupar y agregar las ventas por modelo, pero teniendo en cuenta el propósito de este tutorial, creará un único modelo de serie temporal que pueda utilizar para la predicción con cualquier combinación de región o producto.

Después de crear la vista de los datos, debe generar una nueva estructura de minería de datos y, a continuación, generar un modelo de minería de datos basado en esa estructura. Ya debería estar familiarizado con el modo de generar una estructura de minería de datos. Por consiguiente, las instrucciones siguientes se simplifican.

Para generar una estructura de minería de datos y un modelo de minería de datos utilizando los datos agregados

  1. En el Explorador de soluciones, haga clic con el botón secundario en Estructuras de minería de datos y seleccione Nueva estructura de minería de datos para iniciar el Asistente para minería de datos.

  2. En el Asistente para minería de datos, realice las selecciones siguientes:

    • Algoritmo: serie temporal de Microsoft

    • Vista del origen de datos: AllRegions

    • Clave: ReportingDate (Key Time) y Region (Key)

    • Input y Predict: AvgAmt, AvgQty, SumAmt, SumQty,

    • Nombre de la estructura de minería de datos: Todas las regiones

    • Nombre del modelo de minería de datos: Todas las Regiones

  3. Procese la estructura y el modelo.

Ver los resultados

Antes de decidir qué modelo aplicar como general para realizar proyecciones en todo el mundo, debería entender mejor las predicciones. Al examinar los modelos de minería de datos y las predicciones de las diversas series agregadas en el Visor de series temporales de Microsoft, vienen a la mente varias preguntas:

  • Hasta junio de 2006, cada una de las líneas de tendencia sigue casi el mismo modelo. En ese punto, las líneas correspondientes a la cantidad e importe divergen. ¿Qué produjo el cambio?

  • En julio de 2008, las líneas divergen de nuevo. ¿Qué ocurrió?

  • Recuerde que las predicciones para la serie M200 de Norteamérica fueron mucho más elevadas que para otros productos y regiones. Le preocupa que estas proyecciones sean incorrectas y que al incorporar esta serie se afecte al modelo general creado.

En la tarea siguiente, comparará las líneas de tendencia y las predicciones para modelos de serie individuales con respecto al modelo basado en datos agregados, para ver cómo le afectan los datos subyacentes.

Si cree que el modelo es correcto y no necesita comprender mejor los resultados, puede pasar a la tarea Predecir utilizando el modelo de cálculo del promedio de la predicción (Tutorial intermedio de minería de datos).