Personalizar y procesar el modelo de pronóstico (tutorial intermedio de minería de datos)

El algoritmo de serie temporal de Microsoft proporciona varios parámetros que afectan al modo de creación de un modelo y al modo en que se crean los datos temporales. Puede cambiar estas propiedades para controlar la manera en que el modelo de minería de datos realiza las predicciones.

Para esta tarea en el tutorial, realizará el cambio siguiente en los parámetros:

  • Ajustará el valor del parámetro PERIODICITY_HINT para el modelo Forecasting. Este parámetro proporciona al algoritmo información sobre la frecuencia de repetición del patrón en los datos. El patrón de datos de Adventure Works DW2008R2 se extrae mensualmente; la periodicidad es anual. Por tanto, establecerá el parámetro PERIODICITY_HINT al valor 12 para indicar que un patrón se repite cada 12 valores.

También revisará los valores de dos parámetros importantes que se incluyeron en SQL Server 2008 como parte de las mejoras del algoritmo de serie temporal de Microsoft.

  • El parámetro FORECAST_METHOD controla si el algoritmo de serie temporal se optimiza para las predicciones a corto o a largo plazo. De forma predeterminada, el parámetro FORECAST_METHOD está establecido en MIXED, lo que significa que dos algoritmos de predicción diferentes se mezclan y equilibran para realizar predicciones a corto y a largo plazo.

  • El parámetro PREDICTION_SMOOTHING controla la mezcla de predicciones a largo y a corto plazo. De forma predeterminada, este parámetro está establecido en 0,5, lo que generalmente proporciona el mayor equilibrio para conseguir la máxima precisión.

Una vez realizados los cambios, procesará el modelo.

Para cambiar los parámetros del algoritmo

  1. En la ficha Modelos de minería de datos, haga clic con el botón secundario en Forecasting y seleccione Establecer parámetros de algoritmo.

  2. En la fila PERIODICITY_HINT del cuadro de diálogo Parámetros de algoritmo, haga clic en la columna Valor y, a continuación, escriba {12}, incluidas las llaves.

  3. En la fila FORECAST_METHOD, compruebe que el cuadro de texto Valor está en blanco o contiene el valor MIXED. Si se ha especificado un valor diferente, escriba MIXED para volver a establecer el parámetro en el valor predeterminado.

  4. En la fila PREDICTION_SMOOTHING, compruebe que el cuadro de texto Valor esté en blanco o establecido en 0.5. Si se ha especificado un valor diferente, haga clic en Valor y escriba 0.5 para volver a establecer el parámetro en el valor predeterminado.

    Nota

    El parámetro PREDICTION_SMOOTHING solo está disponible en SQL Server Enterprise. Por consiguiente, en SQL Server Standard no puede ver ni cambiar el valor del parámetro PREDICTION_SMOOTHING. Sin embargo, el comportamiento predeterminado es el mismo.

  5. Haga clic en Aceptar.

Para procesar el modelo de pronóstico

  1. En el menú Modelo de minería de datos de BI Development Studio, seleccione Procesar estructura de minería de datos y todos los modelos.

  2. En la advertencia en la que se pregunta si desea generar e implementar el proyecto, haga clic en .

  3. En el cuadro de diálogo Procesar estructura de minería de datos - Pronóstico, haga clic en Ejecutar.

    Se abre el cuadro de diálogo Progreso del proceso para mostrar información acerca del procesamiento del modelo. El procesamiento del modelo puede tardar algún tiempo.

  4. Cuando se complete el proceso, haga clic en Cerrar para salir del cuadro de diálogo Progreso del proceso.

  5. Haga clic de nuevo en Cerrar para salir del cuadro de diálogo Procesar estructura de minería de datos - Pronóstico.

Controlar la ausencia de datos (opcional)

En muchos casos, los datos de ventas podrían tener huecos que están llenos de caracteres nulos, o es posible que un almacén no haya podido cumplir la fecha tope de notificación, con lo que se ha dejado una celda vacía al final de la serie. En estos escenarios, Analysis Services genera el error siguiente y no procesará el modelo.

"Error (minería de datos): marcas de tiempo no sincronizadas que empiezan con la serie <nombre de serie> del modelo de minería de datos <nombre del modelo>. Todas las series temporales deben terminar en la misma marca de tiempo y no pueden tener puntos de datos ausentes arbitrarios. Cuando el valor del parámetro MISSING_VALUE_SUBSTITUTION es Previous o una constante numérica, se revisarán automáticamente los puntos de datos ausentes siempre que sea posible."

Para evitar este error, puede especificar que Analysis Services proporcione automáticamente los valores nuevos para rellenar los huecos utilizando los métodos siguientes:

  • Utilizar un valor promedio. La media se calcula utilizando todos los valores válidos en la misma serie de datos.

  • Utilizar el valor anterior. Puede sustituir los valores anteriores para varias celdas que falten, pero no puede rellenar los valores de iniciales.

  • Utilizar un valor constante que proporcione el usuario.

Para especificar que los huecos se rellenen calculando el promedio de los valores

  1. En la ficha Modelos de minería de datos, haga clic con el botón secundario en la columna Forecasting y seleccione Establecer parámetros de algoritmo.

  2. En el cuadro de diálogo Parámetros de algoritmo, en la fila MISSING_VALUE_SUBSTITUTION, haga clic en la columna Valor y escriba Promedio.