Lección 1: Crear un modelo de minería de datos de serie temporal y una estructura de minería de datos

En esta lección, creará un modelo de minería de datos que le permita predecir valores a lo largo del tiempo, según datos históricos. Al crear el modelo, la estructura subyacente se generará automáticamente y se utilizará como base para otros modelos de minería de datos.

En esta lección se supone que conoce los modelos de predicción y los requisitos del algoritmo de serie temporal de Microsoft. Para obtener más información, vea Algoritmo de serie temporal de Microsoft.

Instrucción CREATE MINING MODEL

Para crear un modelo de minería de datos directamente y generar de forma automática la estructura de minería de datos subyacente, utiliza la instrucción CREATE MINING MODEL (DMX). El código de la instrucción se puede dividir en las partes siguientes:

  • Asignación de un nombre al modelo

  • Definición de la marca de tiempo

  • Definición de la columna de clave de la serie opcional

  • Definición del atributo o atributos de predicción

A continuación, se incluye un ejemplo genérico de la instrucción CREATE MINING MODEL:

CREATE MINING MODEL [<Mining Structure Name>]
(
   <key columns>,
   <predictable attribute columns>
)
USING <algorithm name>([parameter list])
WITH DRILLTHROUGH

En la primera línea del código se define el nombre del modelo de minería de datos:

CREATE MINING MODEL [Mining Model Name]

Analysis Services genera un nombre para la estructura subyacente anexando "_structure" al nombre del modelo, con lo que se asegura de que el nombre de la estructura sea distinto del nombre del modelo. Para obtener información acerca de cómo asignar un nombre a un objeto en DMX, vea Identificadores (DMX).

La línea siguiente de código define la columna de clave para el modelo de minería de datos, que en el caso de un modelo de serie temporal identifica singularmente un incremento de tiempo en los datos del origen. El incremento de tiempo se identifica con las palabras clave KEY TIME después de los tipos de datos y nombre de columna. Si el modelo de serie temporal tiene una clave de serie independiente, se identifica con la palabra clave KEY.

<key columns>

La línea siguiente del código se utiliza para definir las columnas del modelo que se predecirá. Puede tener varios atributos de predicción en un único modelo de minería de datos. Cuando hay varios atributos de predicción, el algoritmo de serie temporal de Microsoft genera un análisis independiente para cada serie:

<predictable attribute columns>

Tareas de la lección

En esta lección realizará las tareas siguientes:

  • Crear una consulta en blanco

  • Modificar la consulta para crear la el modelo de minería de datos

  • Ejecutar la consulta

Crear la consulta

El primer paso es conectarse a una instancia de Analysis Services y crear una consulta DMX en SQL Server Management Studio.

Para crear una consulta DMX mediante SQL Server Management Studio

  1. Abra SQL Server Management Studio.

  2. En el cuadro de diálogo Conectar al servidor, para Tipo de servidor, seleccione Analysis Services. En Nombre del servidor, escriba LocalHost o el nombre de la instancia de Analysis Services a la que desee conectarse para esta lección. Haga clic en Conectar.

  3. En el Explorador de objetos, haga clic con el botón secundario en la instancia de Analysis Services, seleccione Nueva consulta y haga clic en DMX.

    Se abre el Editor de consultas, que contiene una consulta nueva en blanco.

Modificar la consulta

El paso siguiente es modificar la instrucción CREATE MINING MODEL para crear el modelo de minería de datos que se usa para la predicción, junto con su estructura de minería de datos subyacente.

Para personalizar la instrucción CREATE MINING MODEL

  1. En el Editor de consultas, copie el ejemplo genérico de la instrucción CREATE MINING MODEL en la consulta en blanco.

  2. Reemplace lo siguiente:

    [mining model name] 
    

    por:

    [Forecasting_MIXED]
    
  3. Reemplace lo siguiente:

    <key columns>
    

    por:

    [Reporting Date] DATE KEY TIME,
    [Model Region] TEXT KEY
    

    La palabra clave TIME KEY indica que la columna ReportingDate contiene los valores de incremento de tiempo utilizados para ordenar los valores. Los incrementos de tiempo pueden ser fechas y horas, números enteros o cualquier tipo de datos ordenado, siempre que los valores sean únicos y los datos estén ordenados.

    Las palabras clave KEY y TEXT indican que la columna ModelRegion contiene una clave de serie adicional. Puede tener únicamente una clave de serie y los valores de la columna deben ser distintos.

  4. Reemplace lo siguiente:

    < predictable attribute columns> )
    

    por:

        [Quantity] LONG CONTINUOUS PREDICT,
        [Amount] DOUBLE CONTINUOUS PREDICT
        )
    
  5. Reemplace lo siguiente:

    USING <algorithm name>([parameter list])
    WITH DRILLTHROUGH
    

    por:

    USING Microsoft_Time_Series(AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')
    WITH DRILLTHROUGH
    

    El parámetro de algoritmo, AUTO_DETECT_PERIODICITY = 0.8, indica que desea que el algoritmo detecte los ciclos en los datos. Si se establece este valor más próximo a 1, se favorece la detección de muchos patrones pero puede desacelerar el procesamiento.

    El parámetro de algoritmo, FORECAST_METHOD, indica si desea analizar los datos utilizando ARTXP, ARIMA o una combinación de ambos.

    La palabra clave, WITH DRILLTHROUGH, especifica que desea poder ver estadísticas detalladas de los datos de origen cuando el modelo se complete. Debe agregar esta cláusula si desea examinar el modelo utilizando el Visor de series temporales de Microsoft. No se requiere para la predicción.

    Ahora, la instrucción completa debería ser como sigue:

    CREATE MINING MODEL [Forecasting_MIXED]
         (
        [Reporting Date] DATE KEY TIME,
        [Model Region] TEXT KEY,
        [Quantity] LONG CONTINUOUS PREDICT,
        [Amount] DOUBLE CONTINUOUS PREDICT
        )
    USING Microsoft_Time_Series (AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')
    WITH DRILLTHROUGH
    
  6. En el menú Archivo, haga clic en Guardar DMXQuery1.dmx como.

  7. En el cuadro de diálogo Guardar como, busque la carpeta correspondiente y asigne el nombre Forecasting_MIXED.dmx al archivo.

Ejecutar la consulta

El último paso es ejecutar la consulta. Después de crear y guardar una consulta, debe ejecutarse para crear el modelo y su estructura de minería de datos en el servidor. Para obtener más información acerca de la ejecución de consultas en el Editor de consultas, vea Ventana del Editor de consultas del motor de base de datos de SQL Server Management Studio.

Para ejecutar la consulta

  • En la barra de herramientas del Editor de consultas, haga clic en Ejecutar.

    El estado de la consulta aparece en la ficha Mensajes, en la parte inferior del Editor de consultas, después de finalizar la ejecución de la instrucción. En Mensajes, debe aparecer lo siguiente:

    Executing the query 
    Execution complete
    

    Una estructura nueva denominada Forecasting_MIXED_Structure existe ahora en el servidor, junto con el modelo de minería de datos Forecasting_MIXED relacionado.

En la lección siguiente agregará un modelo de minería de datos a la estructura de minería de datos Forecasting_MIXED recién creada.