Lección 1: Crear un modelo de minería de datos de serie temporal y una estructura de minería de datos

 

Se aplica a: SQL Server 2016 Preview

En esta lección, creará un modelo de minería de datos que le permita predecir valores a lo largo del tiempo, según datos históricos. Al crear el modelo, la estructura subyacente se generará automáticamente y se utilizará como base para otros modelos de minería de datos.

En esta lección se supone que conoce los modelos de predicción y los requisitos del algoritmo de serie temporal de Microsoft. Para más información, consulte Microsoft Time Series Algorithm.

Instrucción CREATE MINING MODEL

Para crear un modelo de minería de datos directamente y generar automáticamente la estructura de minería de datos subyacente, se utiliza el CREATE MINING MODEL ( DMX ) instrucción. El código de la instrucción se puede dividir en las partes siguientes:

  • Asignación de un nombre al modelo

  • Definición de la marca de tiempo

  • Definición de la columna de clave de la serie opcional

  • Definición del atributo o atributos de predicción

A continuación, se incluye un ejemplo genérico de la instrucción CREATE MINING MODEL:

CREATE MINING MODEL [<Mining Structure Name>]  
(  
   <key columns>,  
   <predictable attribute columns>  
)  
USING <algorithm name>([parameter list])  
WITH DRILLTHROUGH  

En la primera línea del código se define el nombre del modelo de minería de datos:

CREATE MINING MODEL [Mining Model Name]  

Analysis Services genera un nombre para la estructura subyacente anexando "_structure" al nombre del modelo, con lo que se asegura de que el nombre de la estructura sea distinto del nombre del modelo. Para obtener información sobre la nomenclatura de un objeto en DMX, vea identificadores ( DMX ).

La línea siguiente de código define la columna de clave para el modelo de minería de datos, que en el caso de un modelo de serie temporal identifica singularmente un incremento de tiempo en los datos del origen. El paso del tiempo se identifica con la KEY TIME palabras clave después de los tipos de datos y el nombre de columna. Si el modelo de serie temporal tiene una clave de serie independiente, se identifica mediante el uso de la clave (palabra clave).

<key columns>  

La línea siguiente del código se utiliza para definir las columnas del modelo que se predecirá. Puede tener varios atributos de predicción en un único modelo de minería de datos. Cuando hay varios atributos de predicción, el algoritmo de serie temporal de Microsoft genera un análisis independiente para cada serie:

<predictable attribute columns>  

Tareas de la lección

En esta lección realizará las tareas siguientes:

  • Crear una consulta en blanco

  • Modificar la consulta para crear la el modelo de minería de datos

  • Ejecutar la consulta

Crear la consulta

El primer paso es conectarse a una instancia de Analysis Services y crear una consulta DMX en SQL Server Management Studio.

Para crear una consulta DMX mediante SQL Server Management Studio

  1. Abra SQL Server Management Studio.

  2. En el Conectar con el servidor cuadro de diálogo para tipo de servidor, seleccione Analysis Services. En nombre del servidor, tipo LocalHost, o el nombre de la instancia de Analysis Services que desea conectarse para esta lección. Haga clic en Conectar.

  3. En Explorador de objetos, haga clic en la instancia de Analysis Services, elija nueva consulta, y, a continuación, haga clic en DMX.

    Se abre el Editor de consultas, que contiene una consulta nueva en blanco.

Modificar la consulta

El paso siguiente es modificar la instrucción CREATE MINING MODEL para crear el modelo de minería de datos que se usa para la predicción, junto con su estructura de minería de datos subyacente.

Para personalizar la instrucción CREATE MINING MODEL

  1. En el Editor de consultas, copie el ejemplo genérico de la instrucción CREATE MINING MODEL en la consulta en blanco.

  2. Reemplace lo siguiente:

    [mining model name]   
    

    por:

    [Forecasting_MIXED]  
    
  3. Reemplace lo siguiente:

    <key columns>  
    

    por:

    [Reporting Date] DATE KEY TIME,  
    [Model Region] TEXT KEY  
    

    El clave temporal palabra clave indica que la columna ReportingDate contiene los valores de tiempo paso utilizados para ordenar los valores. Los incrementos de tiempo pueden ser fechas y horas, números enteros o cualquier tipo de datos ordenado, siempre que los valores sean únicos y los datos estén ordenados.

    El texto y clave palabras clave indican que la columna ModelRegion contiene una clave de serie adicional. Puede tener únicamente una clave de serie y los valores de la columna deben ser distintos.

  4. Reemplace lo siguiente:

    < predictable attribute columns> )  
    

    por:

    [Quantity] LONG CONTINUOUS PREDICT,  
    [Amount] DOUBLE CONTINUOUS PREDICT  
    )  
    
  5. Reemplace lo siguiente:

    USING <algorithm name>([parameter list])  
    WITH DRILLTHROUGH  
    

    por:

    USING Microsoft_Time_Series
    (AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')  
    WITH DRILLTHROUGH  
    

    El parámetro de algoritmo AUTO_DETECT_PERIODICITY = 0.8, indica que desea que el algoritmo detecte los ciclos de los datos. Si se establece este valor más próximo a 1, se favorece la detección de muchos patrones pero puede desacelerar el procesamiento.

    El parámetro de algoritmo FORECAST_METHOD, indica si desea que los datos para analizarlos utilizando ARTXP, ARIMA o una combinación de ambos.

    La palabra clave, con la obtención de detalles, especifique que desea poder ver estadísticas detalladas de los datos de origen una vez completado el modelo. Debe agregar esta cláusula si desea examinar el modelo utilizando el Visor de series temporales de Microsoft. No se requiere para la predicción.

    Ahora la apariencia de la instrucción completa debe ser como la siguiente:

    CREATE MINING MODEL [Forecasting_MIXED]  
         (  
        [Reporting Date] DATE KEY TIME,  
        [Model Region] TEXT KEY,  
        [Quantity] LONG CONTINUOUS PREDICT,  
        [Amount] DOUBLE CONTINUOUS PREDICT  
        )  
    USING Microsoft_Time_Series (AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')  
    WITH DRILLTHROUGH  
    
  6. En el archivo menú, haga clic en Guardar DMXQuery1.dmx como.

  7. En el Guardar como cuadro de diálogo, busque la carpeta correspondiente y nombre de archivo Forecasting_MIXED.dmx.

Ejecutar la consulta

El último paso es ejecutar la consulta. Después de crear y guardar una consulta, debe ejecutarse para crear el modelo y su estructura de minería de datos en el servidor. Para obtener más información acerca de cómo ejecutar consultas en el Editor de consultas, vea Editor de consultas del motor de base de datos ( SQL Server Management Studio ).

Para ejecutar la consulta

  • En el Editor de consultas, en la barra de herramientas, haga clic en Execute.

    El estado de la consulta se muestra en el mensajes en la parte inferior del Editor de consultas de después de la instrucción termina de ejecutarse. En Mensajes, debe aparecer lo siguiente:

    Executing the query   
    Execution complete  
    

    Una nueva estructura denominada Forecasting_MIXED_Structure ahora existe en el servidor, junto con el modelo de minería de datos relacionadas Forecasting_MIXED.

En la lección siguiente, agregará un modelo de minería de datos a la Forecasting_MIXED estructura de minería de datos que acaba de crear.

Lección siguiente

Lección 2: Agregar modelos de minería de datos a la estructura de minería de datos de serie temporal

Vea también

Contenido del modelo de minería de datos para los modelos de serie temporal (Analysis Services - Minería de datos)
Referencia técnica del algoritmo de serie temporal de Microsoft