Explorar el modelo de previsión (tutorial intermedio de minería de datos)

Artículo
05/08/2013

Después de crear el modelo de minería de datos de pronóstico, puede explorar los resultados utilizando la pestaña Visor de modelos de minería de datos del Diseñador de minería de datos. El Visor de series temporales de Microsoft contiene dos pestañas: Gráficos y Modelo.

Además, puede usar el visor de árboles genérico de Microsoft con todos los modelos. Cada vista presenta una imagen ligeramente diferente de la información del modelo de series temporales.

Pestaña Gráficos
Pestaña Modelo
Visor de árbol de contenido genérico de Microsoft

Pestaña Gráficos

En la pestaña Gráficos del Visor de series temporales de Microsoft, se representa de forma gráfica cada una de las series, incluidos los datos históricos y las predicciones. Cada línea del gráfico de serie temporal representa una combinación única de producto, región y atributo de predicción.

La leyenda del lado derecho del visor muestra las series temporales disponibles, basándose en las selecciones en la lista desplegable. Puede activar y desactivar las casillas de la leyenda para controlar las series temporales que se muestran en el gráfico.

También puede cambiar las opciones de presentación, como los colores que se utilizan en cada serie temporal, o si los valores se muestran en puntos del gráfico.

Para seleccionar una serie temporal

Haga clic en la pestaña Gráficos de la pestaña Visor de modelos de minería de datos si no está visible.
Haga clic en la lista desplegable situada a la derecha de la vista del gráfico y seleccione todas las casillas. Haga clic en Aceptar.

El gráfico debe contener ahora 24 líneas de series diferentes.
En las casillas situadas a la derecha del gráfico, desactive las casillas para ocultar temporalmente las líneas de todas las series relacionadas con Amount.

A continuación, desactive las casillas relacionadas con las bicicletas R250 y R750.

Ahora el gráfico contiene únicamente las seis líneas de serie siguientes, lo que le permite comparar con mayor facilidad las bicicletas T1000 y M200.
- M200 Europe: Quantity
- M200 North America: Quantity
- M200 Pacific: Quantity
- T1000 Europe: Quantity
- T1000 North America: Quantity
- T1000 Pacific: Quantity

Serie que predice la cantidad de M200 y T1000

El gráfico que se muestra en el visor incluye datos históricos y previstos. Los datos previstos aparecen sombreados para diferenciarlos de los históricos. Para que resulte más sencillo comparar series diferentes, también puede cambiar los colores asociados a cada línea del gráfico. Para obtener más información, vea Cambiar los colores usados en los visores de minería de datos.

A partir de las líneas de tendencia, puede ver que las ventas totales de todas las regiones están aumentando en general, y que alcanzan su valor más alto cada 12 meses, en diciembre. A partir del gráfico, también puede constatar que los datos de la bicicleta T1000 comienzan mucho más tarde que los datos de otras series de productos. Esto se debe a que es un producto más reciente, pero dado que esta serie se basa en menos datos, las predicciones podrían no ser tan precisas.

De forma predeterminada, en cada serie temporal se muestran cinco pasos de predicción, que aparecen como líneas de puntos. Este valor se puede modificar para ver más o menos predicciones. También se puede ver de forma gráfica la desviación estándar de las predicciones mediante la incorporación de barras de error al gráfico.

Para cambiar las opciones de predicción y presentación de la vista Gráfico

Intente cambiar gradualmente el valor de Pasos de predicción aumentándolo de 5 a 10; a continuación, cámbielo de nuevo a 6.

Cuando los datos históricos tienen una gran fluctuación, las fluctuaciones tienden a repetirse o incluso a amplificarse a medida que aumenta el número de predicciones. Probablemente necesitará investigar este aspecto para entender la causa del mayor aumento de datos históricos y decidir si desea aceptar estos resultados, buscar algún tipo de corrección de los datos de origen o aplicar algún tipo de suavizado en el modelo.
Active la casilla Mostrar desviaciones.

Esta opción muestra el error estimado para cada valor previsto.
Tenga en cuenta la escala del eje X. Los cambios en los datos históricos y previstos se expresan siempre como porcentaje, pero los valores reales se ajustan automáticamente para dar cabida a todos los valores del gráfico. Por consiguiente, al comparar modelos debe tener cuidado de no confiar solamente en las representaciones visuales. Para obtener el valor exacto o el aumento y el valor de porcentaje para las predicciones, sitúe el mouse sobre la línea de puntos o las líneas llenas, o haga clic en las líneas para ver los valores en Leyenda de minería de datos.

Sugerencia: si Leyenda de minería de datos no está visible, cambie a la vista Modelo, haga clic con el botón secundario en cualquier nodo y seleccione Mostrar leyenda.

Al observar estas tendencias, le preocupa la ausencia de datos para una parte de la serie y se pregunta si puede obtener predicciones más confiables calculando el promedio de ventas por modelo o quizás el promedio de ventas por región. Explorará este método en una lección posterior de este tutorial.

Volver al principio

Pestaña Modelo

La pestaña Modelo del Visor de series temporales de Microsoft del Diseñador de minería de datos permite ver el modelo de previsión en forma de gráfico de árbol.

Primero, observe que, debido a que los datos describen dos medidas distintas (importe y cantidad) para las ventas de varias líneas de productos (T1000, etc.) de tres regiones diferentes (Europa, Norteamérica y el Pacífico), el modelo que creó contiene realmente 24 árboles distintos. Cada árbol representa un modelo de patrones de venta para una combinación diferente de región, producto y atributo de predicción.

Puede elegir qué combinación de métrica de línea de productos, región y ventas desea ver si selecciona una serie en la lista desplegable Árbol de la pestaña Modelo.

¿Qué puede saber al ver el modelo como un árbol? Por ejemplo, comparemos dos modelos, uno con varios niveles del árbol y otro que tiene un único nodo.

Cuando un gráfico de árbol contiene un solo nodo, significa que la tendencia encontrada en el modelo es básicamente homogénea en el tiempo. Puede usar este nodo único, etiquetado Todo, para ver la fórmula que describe la relación entre las variables de entrada y el resultado.
Cuando un gráfico de árbol para una serie temporal tiene varias bifurcaciones, significa que la serie temporal que se detectó es demasiado compleja para representarse como una sola ecuación. En su lugar, el gráfico de árbol puede contener varias bifurcaciones, cada bifurcación etiquetada con las condiciones que causaron que el árbol se dividiera. Cuando se divide el árbol, cada bifurcación representa un segmento de tiempo diferente, en el que la tendencia puede describirse como una sola ecuación.

Por ejemplo, si observa el gráfico y ve un salto súbito en el volumen de ventas que empieza algún día de septiembre y que continúa hasta las vacaciones de Navidad, puede cambiar a la vista Modelo para ver la fecha exacta en la que cambió la tendencia. Las bifurcaciones del árbol que representan 'antes de septiembre' y 'después de septiembre' contendrían fórmulas diferentes: una fórmula que describe matemáticamente las tendencias de ventas hasta la división y otra fórmula que describe las tendencias de ventas de septiembre hasta las vacaciones de Navidad.

Para explorar el árbol de decisión de un modelo de series temporales

En la lista Árbol de la pestaña Modelo del visor, seleccione la serie T1000 Europe: Amount.

Haga clic en el nodo etiquetado Todo.

En un nodo Todo, la información sobre herramientas que aparece incluye información sobre el número de casos de las series completas y las ecuaciones de series temporales derivadas del análisis de los datos.
Si la Leyenda de minería de datos no está visible, haga clic con el botón secundario en el nodo y seleccione Mostrar leyenda.

Leyenda de minería de datos proporciona en gran medida la misma información que está en la información sobre herramientas. Si ninguna de las variables independientes son discretas, también aparecerá un histograma que muestra la distribución de variables en el nodo.
Ahora seleccione una serie temporal diferente para verla. Mediante la lista Árbol de la pestaña Modelo del visor, seleccione la serie M200 North America: Amount.

El gráfico de árbol contiene ahora un nodo Todo y dos nodos secundarios. Si examina las etiquetas de los nodos secundarios, puede saber en qué momento cambió la línea de tendencia.

Para cada nodo secundario, la descripción de Leyenda de minería de datos también incluye el recuento de casos de cada rama del árbol.

En la siguiente lista se describen algunas características adicionales del visor de árbol:

Puede cambiar la variable que se representa en el gráfico mediante el control Fondo. De forma predeterminada, los nodos que son más oscuros contienen más casos, dado que el valor de Fondo se establece en Población. Para ver solo cuántos casos hay en un nodo, sitúe el puntero del mouse sobre un nodo y vea la información sobre herramientas que aparece, o haga clic en el nodo y vea los números de la ventana de Leyenda del nodo.
La fórmula de regresión para el nodo se puede ver también en la información sobre herramientas o haciendo clic en el nodo. Si ha creado un modelo mixto, puede ver dos fórmulas, una para ARTXP (en los nodos hoja) y otra para el modelo ARIMA (en el nodo raíz del árbol).
Los pequeños rombos se usan en los nodos que representan números continuos. El rango de atributos se muestra en la barra en la que se basa el rombo. El rombo está centrado en medio del nodo y su ancho representa la varianza del atributo en ese nodo.

Volver al principio

(Opcional) Visor de árbol de contenido genérico

Además del visor personalizado para la serie temporal, Analysis Services proporciona Visor de árbol de contenido genérico de Microsoft para usarlo con todos los modelos de minería de datos. Este visor proporciona algunas ventajas:

Visor de series temporales de Microsoft: esta vista combina los resultados de los dos algoritmos. Aunque puede ver cada serie por separado, no puede determinar cómo se combinan los resultados de cada algoritmo. Asimismo, en esta vista, la información sobre herramientas y la leyenda de minería de datos muestran solo las estadísticas más importantes.
Visor de árbol de contenido genérico: permite examinar y ver todas las series de datos que se usaron en el modelo al mismo tiempo, y si ha creado un modelo mixto, se muestran los árboles de ARIMA y ARTXP en el mismo gráfico.

Puede usar este visor para obtener todas las estadísticas de ambos algoritmos, así como las asignaciones de los valores.

Recomendado para usuarios avanzados de minería de datos que desean conocer más información sobre los análisis de ARIMA y ARTXP.

Para ver los detalles de una determinada serie de datos en el visor de contenido genérico

En la pestaña Visor de modelos de minería de datos, seleccione Visor de árbol de contenido genérico de Microsoft en la lista desplegable Visor.
En el panel Título de nodo, haga clic en el primer nodo (Todos).
En el panel Detalles de nodo, observe el valor de ATTRIBUTE_NAME.

Este valor indica qué serie, o qué combinación de producto y región, está incluida en este nodo. En el ejemplo de AdventureWorks, el primer nodo es el de la serie M200 Europe.
En el panel Título de nodo, busque el primer nodo que tenga nodos secundarios.

Si un nodo de serie tiene nodos secundarios, la vista de árbol que se muestra en la pestaña Modelo del Visor de series temporales de Microsoft también tendrá una estructura de bifurcación.
Expanda el nodo y haga clic en uno de los nodos secundarios.

La columna NODE_DESCRIPTION del esquema contiene la condición que hizo que el árbol se dividiera.
En el panel Título de nodo, haga clic en el primer nodo de ARIMA y expanda el nodo hasta que todos los nodos secundarios estén visibles.
En el panel Detalles de nodo, observe el valor de ATTRIBUTE_NAME.

Este valor indica qué serie temporal está incluida en este nodo. El primer nodo de la sección ARIMA debería coincidir con el primer nodo de la sección (Todos). En el ejemplo de AdventureWorks, este nodo contiene el análisis ARIMA de la serie M200 Europa.