Lección 2: Agregar modelos de minería a la estructura de minería cesta de la compra

En esta lección agregará dos modelos de minería de datos a la estructura Market Basket que creó en Lección 1: Crear la estructura de minería de la cesta de la compra. Estos modelos de minería de datos le permitirán crear predicciones.

Para predecir los tipos de artículos que los clientes suelen adquirir simultáneamente, creará dos modelos de minería de datos usando el Algoritmo de asociación de Microsoft y dos valores distintos para el parámetro MINIMUM_PROBABILTY.

MINIMUM_PROBABILTY es un parámetro del algoritmo de asociación de Microsoft importante que ayuda a determinar el número de reglas que contendrá un modelo de minería de datos, al especificar la probabilidad mínima que debe tener una regla. Por ejemplo, al establecer este valor en 0,4 se especifica que se puede generar una regla sólo si la combinación de productos que la regla describe tiene al menos una probabilidad del 40 por ciento de que esto ocurra.

Verá el efecto de cambiar el parámetro MINIMUM_PROBABILTY en una lección posterior.

Instrucción ALTER MINING STRUCTURE

Para agregar un modelo de minería de datos que incluya una tabla anidada a una estructura de minería de datos, se usa la instrucción ALTER MINING STRUCTURE (DMX). El código de la instrucción se puede dividir en las partes siguientes:

  • Identificación de la estructura de minería de datos

  • Asignación de un nombre al modelo de minería de datos

  • Definición de la columna de clave

  • Definición de las columnas de entrada y de predicción

  • Definición de las columnas de la tabla anidada

  • Identificación de los cambios de parámetros y el algoritmo

El siguiente es un ejemplo genérico de la instrucción ALTER MINING STRUCTURE que agrega un modelo de minería de datos a una estructura que incluye columnas de tabla anidada:

ALTER MINING STRUCTURE [<Mining Structure Name>]
ADD MINING MODEL [<Mining Model Name>]
(
    [<key column>],
    <mining model column> <usage>,
    <table columns>
    (  [<nested key column>],
       <nested mining model columns> )
) USING <algorithm>( <algorithm parameters> )

La primera línea del código identifica la estructura de minería de datos existente a la que se agregará el modelo de minería de datos:

ALTER MINING STRUCTURE [<mining structure name>]

La siguiente línea de código asigna un nombre al modelo de minería de datos que se agregará a la estructura de minería de datos:

ADD MINING MODEL [<mining model name>]

Para obtener información sobre cómo denominar un objeto en Extensiones de minería de datos (DMX), vea Identificadores (DMX).

Las líneas siguientes del código definen las columnas de la estructura de minería de datos que usará el modelo de minería de datos:

[<key column>],
<mining model columns> <usage>,

Sólo puede usar columnas que ya existen en la estructura de minería de datos.

La primera columna de la lista de columnas del modelo de minería de datos debe ser la columna de clave en la estructura de minería de datos. Sin embargo, no tiene que escribir KEY después de la columna de clave para especificar el uso. Eso se debe a que ya ha definido la columna como una clave cuando creó la estructura de minería de datos.

Las líneas restantes especifican el uso de las columnas en el nuevo modelo de minería de datos. Puede especificar que una columna del modelo de minería de datos se utilice para la predicción mediante la sintaxis siguiente:

<column name> PREDICT,

Si no especifica el uso, no tiene que incluir una columna de la estructura de minería de datos en la lista. Todas las columnas que se usan por la estructura de minería de datos a la que se hace referencia están disponibles automáticamente para su uso por parte de los modelos de minería de datos que se basan en dicha estructura. Sin embargo, el modelo no usará las columnas para entrenamiento a menos que especifique el uso.

En la última línea del código se define el algoritmo y los parámetros del algoritmo que se utilizarán para generar el modelo de minería de datos.

) USING <algorithm>( <algorithm parameters> )

Tareas de la lección

En esta lección realizará las tareas siguientes:

  • Agregar un modelo de minería de datos de asociación a la estructura con la probabilidad predeterminada

  • Agregar un modelo de minería de datos de asociación a la estructura con una probabilidad modificada

Agregar un modelo de minería de datos de asociación a la estructura con el valor predeterminado de MINIMUM_PROBABILITY

La primera tarea es agregar un nuevo modelo de minería de datos a la estructura de minería de datos Market Basket basado en el algoritmo de asociación de Microsoft usando el valor predeterminado de MINIMUM_PROBABILITY.

Agregar un modelo de minería de datos de asociación

  1. En el Explorador de objetos, haga clic con el botón secundario en la instancia de Analysis Services, seleccione Nueva consulta y haga clic en DMX.

    Se abre el Editor de consultas, que contiene una consulta nueva en blanco.

    Nota

    Para crear una consulta de DMX frente a una base de datos de Analysis Services concreta, haga clic con el botón secundario en la base de datos en lugar de la instancia.

  2. Copie el ejemplo genérico de la instrucción ALTER MINING STRUCTURE en la consulta en blanco.

  3. Reemplace lo siguiente:

    <mining structure name> 
    

    por:

    [Market Basket]
    
  4. Reemplace lo siguiente:

    <mining model name> 
    

    por:

    [Default Association]
    
  5. Reemplace lo siguiente:

    [<key column>],
    <mining model columns>,
    <table columns>
    (  [<nested key column>],
       <nested mining model columns> )
    

    por:

    OrderNumber,
        [Products] PREDICT (
            [Model]
        )
    

    En este caso, la tabla [Products] se ha designado como la columna de predicción. Además, la columna [Model] está incluida en la lista de columnas de tabla anidada porque es la columna de clave de la tabla anidada.

    Nota

    Recuerde que una clave anidada es diferente de una clave de caso. Una clave de caso es un identificador único del caso, mientras que la clave anidada es un atributo que desea usar como modelo.

  6. Reemplace lo siguiente:

    USING <algorithm>( <algorithm parameters> )
    

    por:

    Using Microsoft_Association_Rules
    

    Ahora, la instrucción resultante debería ser como sigue:

    ALTER MINING STRUCTURE [Market Basket]
    ADD MINING MODEL [Default Association]
    (
        OrderNumber,
        [Products] PREDICT (
            [Model]
        )
    )
    Using Microsoft_Association_Rules
    
  7. En el menú Archivo, haga clic en Guardar DMXQuery1.dmx como.

  8. En el cuadro de diálogo Guardar como, busque la carpeta correspondiente y asigne el nombre Default_Association_Model.dmx al archivo.

  9. En la barra de herramientas, haga clic en el botón Ejecutar.

Agregar un modelo de minería de datos de asociación a la estructura cambiando el valor predeterminado de MINIMUM_PROBABILITY

La siguiente tarea es agregar un nuevo modelo de minería de datos a la estructura de minería de datos Market Basket basado en el algoritmo de asociación de Microsoft y, después, cambiar el valor predeterminado de MINIMUM_PROBABILITY a 0,01. Al cambiar el parámetro, el algoritmo de asociación de Microsoft creará más reglas.

Agregar un modelo de minería de datos de asociación

  1. En el Explorador de objetos, haga clic con el botón secundario en la instancia de Analysis Services, seleccione Nueva consulta y haga clic en DMX.

    Se abre el Editor de consultas, que contiene una consulta nueva en blanco.

  2. Copie el ejemplo genérico de la instrucción ALTER MINING STRUCTURE en la consulta en blanco.

  3. Reemplace lo siguiente:

    <mining structure name> 
    

    por:

    Market Basket
    
  4. Reemplace lo siguiente:

    <mining model name> 
    

    por:

    [Modified Association]
    
  5. Reemplace lo siguiente:

    <mining model columns>,
    <table columns>
    (  [<nested key column>],
       <nested mining model columns> )
    

    por:

    OrderNumber,
    [Products] PREDICT (
            [Model]
        )
    

    En este caso, la tabla [Products] se ha designado como la columna de predicción. Además, la columna [MODEL] está incluida en la lista porque es la columna de clave de la tabla anidada.

  6. Reemplace lo siguiente:

    USING <algorithm>( <algorithm parameters> )
    

    por:

    USING Microsoft_Association_Rules (Minimum_Probability = 0.1)
    

    Ahora, la instrucción resultante debería ser como sigue:

    ALTER MINING STRUCTURE [Market Basket]
    ADD MINING MODEL [Modified Assocation]
    (
        OrderNumber,
        [Products] PREDICT (
            [Model]
        )
    )
    USING Microsoft_Association_Rules (Minimum_Probability = 0.1)
    
  7. En el menú Archivo, haga clic en Guardar DMXQuery1.dmx como.

  8. En el cuadro de diálogo Guardar como, desplácese a la carpeta correspondiente y asigne el nombre Modified Association_Model.dmx al archivo.

  9. En la barra de herramientas, haga clic en el botón Ejecutar.

En esta siguiente lección procesará la estructura de minería de datos Market Basket junto con sus modelos de minería de datos asociados.