Lección 2: Agregar modelos de minería de datos a la estructura de minería de datos de Bike Buyer

 

Se aplica a: SQL Server 2016 Preview

En esta lección, agregará dos modelos de minería de datos a la estructura de minería de datos de bicicleta que creó lección 1: crear la estructura de minería de datos de Bike Buyer. Estos modelos de minería de datos le permitirán explorar los datos usando un modelo y crear predicciones usando otro modelo.

Para explorar cómo los clientes potenciales se pueden clasificar según sus características, creará un modelo de minería de datos basado en el el algoritmo de clústeres de Microsoft. En una lección posterior, explorará cómo este algoritmo encuentra clústeres de clientes que comparten características parecidas. Por ejemplo, podría averiguar que ciertos clientes tienden a vivir cerca unos de otros, van al trabajo en bicicleta y tienen una formación parecida. Puede utilizar estos clústeres para comprender mejor cómo están relacionados distintos clientes y para utilizar la información para crear una estrategia de marketing dirigida a clientes concretos.

Para predecir si un cliente potencial es probable que compre una bicicleta, creará un modelo de minería de datos basado en la algoritmo de árboles de decisión de Microsoft. Este algoritmo examina la información asociada a cada cliente potencial y encuentra características útiles para predecir si adquirirá una bicicleta. A continuación, compara los valores de las características de compradores de bicicletas anteriores con los nuevos clientes potenciales para determinar si es probable que éstos adquieran una bicicleta.

Instrucción ALTER MINING STRUCTURE

Para agregar un modelo de minería de datos a la estructura de minería de datos, se utiliza el modificar la estructura de minería de datos ( DMX ) instrucción. El código de la instrucción se puede dividir en las partes siguientes:

  • Identificación de la estructura de minería de datos

  • Asignación de un nombre al modelo de minería de datos

  • Definición de la columna de clave

  • Definición de las columnas de entrada y de predicción

  • Identificación de los cambios de parámetros y el algoritmo

A continuación, se incluye un ejemplo genérico de la instrucción ALTER MINING MODEL:

ALTER MINING STRUCTURE [<mining structure name>]  
ADD MINING MODEL [<mining model name>]  
(  
    [<key column>],  
    <mining model columns>,  
) USING <algorithm name>( <algorithm parameters> )  
WITH FILTER (<expression>)  

La primera línea de código identifica la estructura de minería de datos existente a la que se agregarán los modelos de minería de datos:

ALTER MINING STRUCTURE [<mining structure name>]  

La siguiente línea de código asigna un nombre al modelo de minería de datos que se agregará a la estructura de minería de datos:

ADD MINING MODEL [<mining model name>]  

Para obtener información sobre la nomenclatura de un objeto en DMX, vea identificadores ( DMX ).

Las líneas siguientes del código definen columnas de la estructura de minería de datos que utilizará el modelo de minería de datos:

[<key column>],  
<mining model columns>  

Solo puede utilizar columnas que ya existan en la estructura de minería de datos, y la primera columna de la lista debe ser la columna de clave de la estructura.

La siguiente línea de código define el algoritmo de minería de datos que genera el modelo de minería de datos y los parámetros de algoritmo que pueden establecerse:

) USING <algorithm name>( <algorithm parameters> )  

Para obtener más información acerca de los parámetros de algoritmo que puede ajustar, vea algoritmo de árboles de decisión de Microsoft y el algoritmo de clústeres de Microsoft.

Puede especificar que una columna del modelo de minería de datos se utilice para la predicción mediante la sintaxis siguiente:

<mining model column> PREDICT  

La última línea de código, que es opcional, define un filtro que se aplica durante el aprendizaje y prueba del modelo. Para obtener más información acerca de cómo aplicar filtros a los modelos de minería de datos, consulte filtros para modelos de minería de datos ( Analysis Services: minería de datos y nº 41;.

Tareas de la lección

En esta lección realizará las tareas siguientes:

  • Agregar un modelo de minería de datos del árbol de decisión a la estructura Bike Buyer mediante el algoritmo Árboles de decisión de Microsoft.

  • Agregar un modelo de minería de datos de agrupación en clústeres a la estructura Bike Buyer mediante el algoritmo de clústeres de Microsoft.

  • Dado que desean verse los resultados para todos los casos, todavía no se agrega un filtro a ningún modelo.

Agregar un modelo de minería de datos del árbol de decisión a la estructura

El primer paso es agregar un modelo de minería de datos basado en el algoritmo Árboles de decisión de Microsoft.

Para agregar un modelo de minería de datos del árbol de decisión

  1. En Explorador de objetos, haga clic en la instancia de Analysis Services, elija nueva consulta, y, a continuación, haga clic en DMX para abrir el Editor de consultas y una nueva consulta en blanco.

  2. Copie el ejemplo genérico de la instrucción ALTER MINING STRUCTURE en la consulta en blanco.

  3. Reemplace lo siguiente:

    <mining structure name>   
    

    por:

    [Bike Buyer]  
    
  4. Reemplace lo siguiente:

    <mining model name>   
    

    por:

    Decision Tree  
    
  5. Reemplace lo siguiente:

    <mining model columns>,  
    

    por:

    (  
       CustomerKey,  
       [Age],  
       [Bike Buyer] PREDICT,  
       [Commute Distance],  
       [Education],  
       [Gender],  
       [House Owner Flag],  
       [Marital Status],  
       [Number Cars Owned],  
       [Number Children At Home],  
       [Occupation],  
       [Region],  
       [Total Children],  
       [Yearly Income]  
    

    En este caso, la columna [Bike Buyer] se ha designado como columna PREDICT.

  6. Reemplace lo siguiente:

    USING <algorithm name>( <algorithm parameters> )   
    

    por:

    Using Microsoft_Decision_Trees  
    WITH DRILLTHROUGH  
    

    La instrucción WITH DRILLTHROUGH permite explorar los casos utilizados para generar el modelo de minería de datos.

    Ahora, la instrucción resultante debería ser como sigue:

    ALTER MINING STRUCTURE [Bike Buyer]  
    ADD MINING MODEL [Decision Tree]  
    (  
       CustomerKey,  
       [Age],  
       [Bike Buyer] PREDICT,  
       [Commute Distance],  
       [Education],  
       [Gender],  
       [House Owner Flag],  
       [Marital Status],  
       [Number Cars Owned],  
       [Number Children At Home],  
       [Occupation],  
       [Region],  
       [Total Children],  
       [Yearly Income]  
    ) USING Microsoft_Decision_Trees  
    WITH DRILLTHROUGH  
    
  7. En el archivo menú, haga clic en Guardar DMXQuery1.dmx como.

  8. En el Guardar como cuadro de diálogo, busque la carpeta correspondiente y nombre de archivo DT_Model.dmx.

  9. En la barra de herramientas, haga clic en el Execute botón.

Agregar un modelo de minería de datos de agrupación en clústeres a la estructura

A continuación, podrá agregar un modelo de minería de datos a la estructura de minería de datos Bike Buyer basado en el algoritmo de clústeres de Microsoft. Puesto que el modelo de minería de datos de agrupación en clústeres utilizará todas las columnas definidas en la estructura de minería de datos, puede utilizar un acceso directo para agregar el modelo a la estructura sin incluir la definición de las columnas de minería de datos.

Para agregar un modelo de minería de datos de agrupación en clústeres

  1. En Explorador de objetos, haga clic en la instancia de Analysis Services, elija nueva consulta, y, a continuación, haga clic en DMXpara abrir el Editor de consultas y una nueva consulta en blanco.

  2. Copie el ejemplo genérico de la instrucción ALTER MINING STRUCTURE en la consulta en blanco.

  3. Reemplace lo siguiente:

    <mining structure name>   
    

    por:

    [Bike Buyer]  
    
  4. Reemplace lo siguiente:

    <mining model>   
    

    por:

    Clustering Model  
    
  5. Elimine lo siguiente:

    (  
        [<key column>],  
        <mining model columns>,  
    )  
    
  6. Reemplace lo siguiente:

    USING <algorithm name>( <algorithm parameters> )  
    

    por:

    USING Microsoft_Clustering  
    

    Ahora la apariencia de la instrucción completa debe ser como la siguiente:

    ALTER MINING STRUCTURE [Bike Buyer]  
    ADD MINING MODEL [Clustering]  
    USING Microsoft_Clustering   
    
  7. En el archivo menú, haga clic en Guardar DMXQuery1.dmx como.

  8. En el Guardar como cuadro de diálogo, busque la carpeta correspondiente y nombre de archivo Clustering_Model.dmx.

  9. En la barra de herramientas, haga clic en el Execute botón.

En la siguiente lección procesará los modelos y la estructura de minería de datos.

Lección siguiente

Lección 3: Procesar la estructura de minería de datos de Bike Buyer