Lección 2: Agregar modelos de minería a la estructura de minería cesta de la compra

 

Se aplica a: SQL Server 2016 Preview

En esta lección, agregará dos modelos de minería de datos a la estructura de minería de datos Market Basket que creó en lección 1: crear la estructura de minería de datos de la cesta. Estos modelos de minería de datos le permitirán crear predicciones.

Para predecir los tipos de productos que los clientes tienden a comprar al mismo tiempo, creará dos modelos de minería de datos mediante el algoritmo de asociación de Microsoft y dos valores diferentes para la MINIMUM_PROBABILTY parámetro.

MINIMUM_PROBABILTY es un Microsoft parámetro de algoritmo de asociación que ayuda a determinar el número de reglas que contiene un modelo de minería de datos especificando la probabilidad mínima que debe tener una regla. Por ejemplo, al establecer este valor en 0,4 se especifica que se puede generar una regla solo si la combinación de productos que la regla describe tiene al menos una probabilidad del 40 por ciento de que esto ocurra.

Verá el efecto de cambiar la MINIMUM_PROBABILTY parámetro en una lección posterior.

Instrucción ALTER MINING STRUCTURE

Para agregar un modelo de minería de datos que contiene una tabla anidada en una estructura de minería de datos, utilice la modificar la estructura de minería de datos ( DMX ) instrucción. El código de la instrucción se puede dividir en las partes siguientes:

  • Identificación de la estructura de minería de datos

  • Asignación de un nombre al modelo de minería de datos

  • Definición de la columna de clave

  • Definición de las columnas de entrada y de predicción

  • Definición de las columnas de la tabla anidada

  • Identificación de los cambios de parámetros y el algoritmo

El siguiente es un ejemplo genérico de la modificar la estructura de minería de datos instrucción que agrega un modelo de minería de datos a una estructura que incluye columnas de tabla anidada:

ALTER MINING STRUCTURE [<Mining Structure Name>]  
ADD MINING MODEL [<Mining Model Name>]  
(  
    [<key column>],  
    <mining model column> <usage>,  
    <table columns>  
    (  [<nested key column>],  
       <nested mining model columns> )  
) USING <algorithm>( <algorithm parameters> )  

La primera línea del código identifica la estructura de minería de datos existente a la que se agregará el modelo de minería de datos:

ALTER MINING STRUCTURE [<mining structure name>]  

La siguiente línea de código asigna un nombre al modelo de minería de datos que se agregará a la estructura de minería de datos:

ADD MINING MODEL [<mining model name>]  

Para obtener información sobre la nomenclatura de un objeto de extensiones de minería de datos (DMX), consulte identificadores ( DMX ).

Las líneas siguientes del código definen las columnas de la estructura de minería de datos que usará el modelo de minería de datos:

[<key column>],  
<mining model columns> <usage>,  

Solo puede usar columnas que ya existen en la estructura de minería de datos.

La primera columna de la lista de columnas del modelo de minería de datos debe ser la columna de clave en la estructura de minería de datos. Sin embargo, no es necesario escribir clave después de la columna de clave para especificar el uso. Eso se debe a que ya ha definido la columna como una clave cuando creó la estructura de minería de datos.

Las líneas restantes especifican el uso de las columnas en el nuevo modelo de minería de datos. Puede especificar que una columna en el modelo de minería de datos se utilizará para la predicción mediante la sintaxis siguiente:

<column name> PREDICT,  

Si no especifica el uso, no tiene que incluir una columna de la estructura de minería de datos en la lista. Todas las columnas que se usan por la estructura de minería de datos a la que se hace referencia están disponibles automáticamente para su uso por parte de los modelos de minería de datos que se basan en dicha estructura. Sin embargo, el modelo no usará las columnas para entrenamiento a menos que especifique el uso.

En la última línea del código se define el algoritmo y los parámetros del algoritmo que se utilizarán para generar el modelo de minería de datos.

) USING <algorithm>( <algorithm parameters> )  

Tareas de la lección

En esta lección realizará las tareas siguientes:

  • Agregar un modelo de minería de datos de asociación a la estructura con la probabilidad predeterminada

  • Agregar un modelo de minería de datos de asociación a la estructura con una probabilidad modificada

Agregar un modelo de minería de datos de asociación a la estructura con el valor predeterminado de MINIMUM_PROBABILITY

La primera tarea es agregar un nuevo modelo de minería de datos a la estructura de minería de datos de la cesta basado en la Microsoft con el valor predeterminado para el algoritmo de asociación MINIMUM_PROBABILITY.

Agregar un modelo de minería de datos de asociación

  1. En Explorador de objetos, haga clic en la instancia de Analysis Services, elija nueva consulta, y, a continuación, haga clic en DMX.

    Se abre el Editor de consultas, que contiene una consulta nueva en blanco.

    Nota


    Para crear una consulta de DMX frente a una base de datos de Analysis Services concreta, haga clic con el botón secundario en la base de datos en lugar de la instancia.

  2. Copie el ejemplo genérico de la ALTER MINING STRUCTURE instrucción en la consulta en blanco.

  3. Reemplace lo siguiente:

    <mining structure name>   
    

    por:

    [Market Basket]  
    
  4. Reemplace lo siguiente:

    <mining model name>   
    

    por:

    [Default Association]  
    
  5. Reemplace lo siguiente:

    [<key column>],  
    <mining model columns>,  
    <table columns>  
    (  [<nested key column>],  
       <nested mining model columns> )  
    

    por:

    OrderNumber,  
        [Products] PREDICT (  
            [Model]  
        )  
    

    En este caso, el [Products] tabla se ha designado como columna de predicción**.** Además, la [Model] columna está incluida en la lista de columnas de tabla anidada porque es la columna de clave de la tabla anidada.

    Nota


    Recuerde que una clave anidada es diferente de una clave de caso. Una clave de caso es un identificador único del caso, mientras que la clave anidada es un atributo que desea usar como modelo.

  6. Reemplace lo siguiente:

    USING <algorithm>( <algorithm parameters> )  
    

    por:

    Using Microsoft_Association_Rules  
    

    Ahora, la instrucción resultante debería ser como sigue:

    ALTER MINING STRUCTURE [Market Basket]  
    ADD MINING MODEL [Default Association]  
    (  
        OrderNumber,  
        [Products] PREDICT (  
            [Model]  
        )  
    )  
    Using Microsoft_Association_Rules  
    
  7. En el archivo menú, haga clic en Guardar DMXQuery1.dmx como.

  8. En el Guardar como cuadro de diálogo, busque la carpeta correspondiente y nombre de archivo Default_Association_Model.dmx.

  9. En la barra de herramientas, haga clic en el Execute botón.

Agregar un modelo de minería de datos de asociación a la estructura cambiando el valor predeterminado de MINIMUM_PROBABILITY

La siguiente tarea es agregar un nuevo modelo de minería de datos a la estructura de minería de datos Market Basket basado en el algoritmo de asociación de Microsoft y, después, cambiar el valor predeterminado de MINIMUM_PROBABILITY a 0,01. Al cambiar el parámetro, el algoritmo de asociación de Microsoft creará más reglas.

Agregar un modelo de minería de datos de asociación

  1. En Explorador de objetos, haga clic en la instancia de Analysis Services, elija nueva consulta, y, a continuación, haga clic en DMX.

    Se abre el Editor de consultas, que contiene una consulta nueva en blanco.

  2. Copie el ejemplo genérico de la ALTER MINING STRUCTURE instrucción en la consulta en blanco.

  3. Reemplace lo siguiente:

    <mining structure name>   
    

    por:

    Market Basket  
    
  4. Reemplace lo siguiente:

    <mining model name>   
    

    por:

    [Modified Association]  
    
  5. Reemplace lo siguiente:

    <mining model columns>,  
    <table columns>  
    (  [<nested key column>],  
       <nested mining model columns> )  
    

    por:

    OrderNumber,  
    [Products] PREDICT (  
            [Model]  
        )  
    

    En este caso, la tabla [Products] se ha designado como la columna de predicción. Además, la columna [MODEL] está incluida en la lista porque es la columna de clave de la tabla anidada.

  6. Reemplace lo siguiente:

    USING <algorithm>( <algorithm parameters> )  
    

    por:

    USING Microsoft_Association_Rules (Minimum_Probability = 0.1)  
    

    Ahora, la instrucción resultante debería ser como sigue:

    ALTER MINING STRUCTURE [Market Basket]  
    ADD MINING MODEL [Modified Assocation]  
    (  
        OrderNumber,  
        [Products] PREDICT (  
            [Model]  
        )  
    )  
    USING Microsoft_Association_Rules (Minimum_Probability = 0.1)  
    
  7. En el archivo menú, haga clic en Guardar DMXQuery1.dmx como.

  8. En el Guardar como cuadro de diálogo, busque la carpeta correspondiente y nombre de archivo Modified Association_Model.dmx.

  9. En la barra de herramientas, haga clic en el Execute botón.

En esta siguiente lección procesará la estructura de minería de datos Market Basket junto con sus modelos de minería de datos asociados.

Lección siguiente

Lección 3: Procesar la estructura de minería de datos de la cesta de la compra