Explorar el modelo de previsión (tutorial intermedio de minería de datos)

Después de crear el modelo de minería de datos de pronóstico, puede explorar los resultados utilizando la ficha Visor de modelos de minería de datos del Diseñador de minería de datos. El Visor de series temporales de Microsoft contiene dos fichas: Gráficos y Modelo.

En el modelo de minería de datos de pronóstico que creó, se detallan las ventas de productos de tres regiones diferentes, Europa, América y el Pacífico, durante los años 2005-2010. Por tanto, el algoritmo de Serie temporal de Microsoft crea un modelo de series temporales que contiene varios árboles; a su vez, cada árbol contiene una combinación diferente de región, producto y atributo de predicción.

Cada una de las fichas del visor muestra una vista diferente de la información del modelo de series temporales completo.

  • Ficha Gráficos

  • Ficha Modelo

  • Visor de árbol de contenido genérico

Ficha Gráficos

En la ficha Gráficos del Visor de series temporales de Microsoft, se representa de forma gráfica cada uno de los árboles que crea el algoritmo. Un árbol de serie temporal contiene una combinación única de producto, región y atributo de predicción.

En la leyenda situada a la derecha del visor se muestran las series temporales seleccionadas en la lista desplegable y se incluye una casilla para cada serie temporal. Puede activar y desactivar las casillas de la leyenda para controlar las series temporales que se muestran en el visor.

También puede cambiar las opciones de presentación, como los colores que se utilizan en cada serie temporal, o si los valores se muestran en puntos del gráfico.

Para seleccionar una serie temporal

  1. Haga clic en la ficha Gráficos de la ficha Visor de modelos de minería de datos si no está visible.

  2. Haga clic en la lista desplegable situada a la derecha de la vista del gráfico y seleccione todas las casillas. El gráfico debe contener 24 líneas de series diferentes.

  3. Haga clic en Aceptar.

  4. En las casillas situadas a la derecha del gráfico, desactive las casillas para ocultar temporalmente las líneas de todas las series relacionadas con Amount.

  5. A continuación, desactive las casillas relacionadas con las bicicletas R250 y R750.

    Ahora el gráfico contiene únicamente las seis líneas de serie siguientes, lo que le permite comparar con mayor facilidad las bicicletas T1000 y M200.

    • M200 Europe: Quantity t

    • M200 North America: Quantity

    • M200 Pacific: Quantity

    • T1000 Europe: Quantity t

    • T1000 North America: Quantity

    • T1000 Pacific: Quantity

Serie que predice la cantidad de M200 y T1000Serie que predice la cantidad de M200 y T1000

En el gráfico se muestran los datos históricos y los datos previstos. Los datos previstos aparecen sombreados para diferenciarlos de los históricos. Para que resulte más sencillo comparar series diferentes, también puede cambiar los colores asociados a cada línea del gráfico. Para obtener más información, vea Cómo cambiar los colores utilizados en el Visor de minería de datos.

Las líneas de tendencia indican que las ventas totales de todas las regiones están incrementando en general, y alcanzan su valor más alto cada 12 meses, en diciembre. Las predicciones mantienen a grandes rasgos esta tendencia. En el gráfico también se muestra que los datos sobre la bicicleta T1000 se inician mucho más tarde que los de cualquier otra serie de productos.

De forma predeterminada, Analysis Services muestra cinco pasos de predicción para cada serie temporal. Este valor se puede modificar para ver más o menos pasos de predicción. También puede verse de forma gráfica la desviación estándar de la predicción mediante la incorporación de barras de error al gráfico.

Para cambiar las opciones de predicción y presentación de la vista Gráfico

  1. Cambie gradualmente el valor de Pasos de predicción de 5 a 10; a continuación, cámbielo de nuevo a 6.

    Nota

    En las líneas de tendencia con una gran fluctuación de los datos históricos, las fluctuaciones se amplifican durante la predicción.

  2. Active la casilla Mostrar desviaciones.

  3. Sitúe el mouse sobre las barras de error de la serie M200.

  4. Sitúe el mouse sobre las barras de error de la serie T1000 Pacific.

Estos resultados se utilizarán posteriormente en un análisis más exhaustivo. Más adelante desarrollará un modelo que calculará el promedio entre todas las regiones y, por tanto, no registrará una fluctuación tan acusada.

Volver al principio

Ficha Modelo

La ficha Modelo del Visor de series temporales de Microsoft del Diseñador de minería de datos permite ver las series temporales como un gráfico de árboles de decisión. Para cada una de las series incluidas en el modelo, se calcula un árbol independiente. En un modelo de series temporales, el gráfico de árboles de decisión podría tener un único nodo si la serie temporal fuera lineal o podría tener varios nodos y condiciones asociados a cada rama, como un árbol de decisión normal.

Los nodos del gráfico de árboles de decisión de una serie temporal contienen parte de la siguiente información:

  • La concentración de casos para el estado del atributo de predicción que se ha especificado en el control Fondo. Tanto la ventana Leyenda de minería de datos como la información sobre herramientas que aparece cuando sitúa el mouse sobre un objeto del árbol proporcionan el número exacto de casos.

  • La fórmula de regresión para el nodo. La fórmula de regresión de ARTXP solo está disponible en los nodos hoja. La ecuación ARIMA está disponible en el nodo raíz del árbol.

  • Un gráfico de rombo que representa el intervalo del atributo. El rombo está ubicado en la media del nodo y el ancho del rombo representa la varianza del atributo en el nodo.

Para ver el árbol de decisión de un modelo de series temporales

  1. En la lista Árbol de la ficha Modelo del visor, seleccione la serie M200 North America: Amount.

    En el gráfico aparece un solo nodo.

  2. Sitúe el cursor del mouse sobre el nodo.

    En un nodo Todos, la información sobre herramientas que aparece incluye información sobre el número de casos de las series completas y las ecuaciones de series temporales derivadas del análisis de los datos.

  3. Haga clic en el nodo y vea la Leyenda de minería de datos.

    La Leyenda de minería de datos contiene información similar a la de la información sobre herramientas, pero proporciona más detalles entre los que se incluye un histograma de valores.

  4. En la lista Árbol de la ficha Modelo del visor, seleccione la serie M200 Pacific: Amount.

    El gráfico de árbol contiene ahora un nodo Todos y dos nodos secundarios. El texto de los nodos secundarios describe las condiciones conforme a las que se dividió el árbol.

  5. Sitúe el cursor del mouse sobre uno de los nodos secundarios y revise el contenido de la información sobre herramientas. También puede hacer clic sobre el nodo y ver la Leyenda de minería de datos.

    En los nodos secundarios, la descripción incluye el recuento de casos de cada rama del árbol y cualquier condición adicional que hiciera que el árbol se dividiera.

Volver al principio

Visor de árbol de contenido genérico

Además del visor personalizado de series temporales, Analysis Services proporciona el Visor de árbol de contenido genérico de Microsoft. Este visor se puede utilizar para todos los modelos de minería de datos, independientemente del algoritmo que se utilice. El Visor de árbol de contenido genérico está disponible en la lista desplegable Visor.

En este visor, cada modelo de minería de datos, independientemente de los datos o el algoritmo que se utilicen para el análisis, se representa como un árbol que contiene una serie de nodos. Cada nodo representa información sobre un subconjunto de datos. El contenido exacto del nodo varía en función del algoritmo y del tipo de atributo de predicción, pero el esquema general del contenido es el mismo.

Dado que el modelo de minería de datos que creó es un modelo mixto, si se combinan los algoritmos ARTXP y ARIMA, Analysis Services utiliza a su vez cada algoritmo para crear modelos de ARTXP y ARIMA independientes para cada serie temporal. Al utilizar el Visor de series temporales Microsoft para examinar el modelo de minería de datos de pronóstico, Analysis Services combina los resultados de los dos algoritmos y muestra el modelo de minería como un árbol único, donde cada nodo del árbol incluye contenido de los dos algoritmos.

Sin embargo, cuando se utiliza el Visor de árbol de contenido genérico de Microsoft, el contenido generado por cada algoritmo se expone como dos tipos diferentes de nodos en el modelo de minería de datos de pronóstico. Puede explorar en profundidad la versión ARTXP o la versión ARIMA del modelo para ver niveles cada vez más detallados.

Para ver los detalles de una determinada serie de datos en el visor de contenido genérico

  1. En la ficha Visor de modelos de minería de datos, seleccione Visor de árbol de contenido genérico de Microsoft en la lista desplegable Visor.

  2. En el panel Título de nodo, haga clic en el primer nodo (Todos).

  3. En el panel Detalles de nodo, observe el valor de ATTRIBUTE_NAME.

    Este valor indica qué serie, o qué combinación de producto y región, está incluida en este nodo. En el ejemplo de AdventureWorks, el primer nodo es el de la serie M200 Europe.

  4. En el panel Título de nodo, busque el primer nodo que tenga nodos secundarios.

    Si un nodo de serie tiene nodos secundarios, la vista de árbol que se muestra en la ficha Modelo del Visor de series temporales de Microsoft también tendrá una estructura de bifurcación.

  5. Expanda el nodo y haga clic en uno de los nodos secundarios.

    La columna NODE_DESCRIPTION del esquema contiene la condición que hizo que el árbol se dividiera.

  6. En el panel Título de nodo, haga clic en el primer nodo de ARIMA y expanda el nodo hasta que todos los nodos secundarios estén visibles.

  7. En el panel Detalles de nodo, observe el valor de ATTRIBUTE_NAME.

    Este valor indica qué serie temporal está incluida en este nodo. El primer nodo de la sección ARIMA debería coincidir con el primer nodo de la sección (Todos). En el ejemplo de AdventureWorks, este nodo contiene el análisis ARIMA de la serie M200 Europa.

Para obtener más información, vea Contenido del modelo de minería de datos para los modelos de serie temporal (Analysis Services - Minería de datos).

Volver al principio