Lección 2: Agregar modelos de minería a la estructura de minería de datos de Market Basket

Nuevo: 5 de diciembre de 2005

En esta lección agregará dos modelos de minería de datos a la estructura Market Basket que creó en Lección 1. Crear la estructura de minería de datos Market Basket. Estos modelos de minería de datos le permitirán crear predicciones.

Para predecir los tipos de artículos que los clientes tienden a adquirir simultáneamente, creará dos modelos de minería de datos usando el Algoritmo de asociación de Microsoft con dos valores distintos para el parámetro MINIMUM_PROBABILITY.

MINIMUM_PROBABILITY es un parámetro del algoritmo de asociación de Microsoft importante a la hora de determinar el número de reglas que contendrá un modelo de minería de datos, al especificar la probabilidad mínima que debe tener una regla. Por ejemplo, si se establece este valor en 0,4, se determina que no se genera ninguna regla con menos del cuarenta por ciento de probabilidad de ocurrencia.

Explorará cuáles son las consecuencias de cambiar el parámetro MINIMUM_PROBABILITY en una lección posterior.

Instrucción ALTER MINING STRUCTURE

Para agregar un modelo de minería de datos que incluya una tabla anidada a la estructura de minería de datos, se utiliza la instrucción ALTER MINING STRUCTURE (DMX). El código de la instrucción se puede dividir en las partes siguientes:

  • Identificación de la estructura de minería de datos
  • Asignación de un nombre al modelo de minería de datos
  • Definición de la columna de clave
  • Definición de las columnas de entrada y de predicción
  • Definición de las columnas de la tabla anidada
  • Identificación de los cambios de parámetros y el algoritmo

A continuación, se incluye un ejemplo genérico de la instrucción CREATE MINING MODEL:

ALTER MINING STRUCTURE [<Mining Structure Name>]
ADD MINING MODEL [<Mining Model Name>]
(
    [<key column>],
    <mining model columns>,
    <table columns>
    (  [<nested key column>],
       <nested mining model columns> )
) USING <algorithm>( <algorithm parameters> )

La primera línea del código identifica la estructura de minería de datos existente a la que se agregará el modelo de minería de datos:

ALTER MINING STRUCTURE [<mining structure name>]

La siguiente línea del código asigna un nombre al modelo de minería de datos que se agrega a la estructura de minería de datos:

ADD MINING MODEL [<mining model name>]

Para obtener información acerca de cómo asignar un nombre a un objeto en DMX, vea Identificadores (DMX).

Las líneas siguientes del código definen columnas de la estructura de minería de datos que utilizará el modelo de minería de datos:

[<key column>],
<mining model columns>,

Sólo puede utilizar columnas que ya existan en la estructura de minería de datos, y la primera columna de la lista debe ser la columna de clave de la estructura de minería de datos.

En las líneas restantes del código se define la tabla anidada. En la primera línea de la parte de la tabla anidada del código se define el nombre de la tabla anidada:

<table columns>

En la segunda línea de la parte de la tabla anidada del código se define la columna de clave que enlaza la tabla anidada con la tabla primaria:

(  [<nested key column>],

La siguiente línea de la parte de la tabla anidada del código representa las columnas restantes en las tablas anidadas que utilizará el modelo de minería de datos:

   <nested mining model columns> )

En la última línea del código se define el algoritmo y los parámetros del algoritmo que se utilizarán para generar el modelo de minería de datos.

) USING <algorithm>( <algorithm parameters> )

Puede especificar que una columna del modelo de minería de datos se utilice para la predicción mediante la sintaxis siguiente:

<column name> PREDICT,

Agregar un modelo de minería de datos de asociación a la estructura con el valor predeterminado de MINIMUM_PROBABILITY

El primer paso es agregar un nuevo modelo de minería de datos a la estructura de minería de datos Market Basket basado en el algoritmo de asociación de Microsoft utilizando el valor predeterminado de MINIMUM_PROBABILITY.

Para agregar un modelo de minería de datos de asociación

  1. En el Explorador de objetos, haga clic con el botón secundario en la instancia de Analysis Services, seleccione Nueva consulta y haga clic en DMX.

    Se abre el Editor de consultas, que contiene una consulta nueva en blanco.

  2. Copie el ejemplo genérico de la instrucción ALTER MINING STRUCTURE en la consulta en blanco.

  3. Reemplace lo siguiente:

    <mining structure name> 
    

    por:

    Market Basket
    
  4. Reemplace lo siguiente:

    <mining model name> 
    

    por:

    [Default Association]
    
  5. Reemplace lo siguiente:

    <mining model columns>,
    <table columns>
    (  [<nested key column>],
       <nested mining model columns> )
    

    por:

    OrderNumber TEXT KEY,
        [Products] TABLE PREDICT (
            [Model] TEXT KEY
        )
    

    En este caso, la tabla [Products] se ha designado como PREDICT.

  6. Reemplace lo siguiente:

    USING <algorithm>( <algorithm parameters> )
    

    por:

    Using Microsoft_Association_Rules
    

    Ahora, la instrucción resultante debería ser como sigue:

    ALTER MINING STRUCTURE [Market Basket]
    ADD MINING MODEL [Association]
    (
        OrderNumber TEXT KEY,
        [Products] TABLE PREDICT (
            [Model] TEXT KEY
        )
    )
    Using Microsoft_Association_Rules
    
  7. En el menú Archivo, haga clic en Guardar DMXQuery1.dmx como.

  8. En el cuadro de diálogo Guardar como, desplácese a la carpeta correspondiente y asigne el nombre Default_Association_Model.dmx al archivo.

  9. En la barra de herramientas, haga clic en el botón Ejecutar.

Agregar un modelo de minería de datos de asociación a la estructura cambiando el valor predeterminado de MINIMUM_PROBABILITY

El siguiente paso es agregar un nuevo modelo de minería de datos a la estructura de minería de datos Market Basket basado en el algoritmo de asociación de Microsoft y, después, cambiar el valor predeterminado de MINIMUM_PROBABILITY a 0,01. Al cambiar el parámetro, el algoritmo de asociación de Microsoft creará más reglas.

Para agregar un modelo de minería de datos de asociación

  1. En el Explorador de objetos, haga clic con el botón secundario en la instancia de Analysis Services, seleccione Nueva consulta y haga clic en DMX.

    Se abre el Editor de consultas, que contiene una consulta nueva en blanco.

  2. Copie el ejemplo genérico de la instrucción ALTER MINING STRUCTURE en la consulta en blanco.

  3. Reemplace lo siguiente:

    <mining structure name> 
    

    por:

    Market Basket
    
  4. Reemplace lo siguiente:

    <mining model name> 
    

    por:

    [Modified Association]
    
  5. Reemplace lo siguiente:

    <mining model columns>,
    <table columns>
    (  [<nested key column>],
       <nested mining model columns> )
    

    por:

    OrderNumber TEXT KEY,
    [Products] TABLE PREDICT (
            [Model] TEXT KEY
        )
    

    En este caso, la tabla [Products] se ha designado como PREDICT.

  6. Reemplace lo siguiente:

    USING <algorithm>( <algorithm parameters> )
    

    por:

    USING Microsoft_Association_Rules (Minimum_Probability = 0.1)
    

    Ahora, la instrucción resultante debería ser como sigue:

    ALTER MINING STRUCTURE [Market Basket]
    ADD MINING MODEL [Modified Assocation]
    (
        OrderNumber TEXT KEY,
        [Products] TABLE PREDICT (
            [Model] TEXT KEY
        )
    )
    USING Microsoft_Association_Rules (Minimum_Probability = 0.1)
    
  7. En el menú Archivo, haga clic en Guardar DMXQuery1.dmx como.

  8. En el cuadro de diálogo Guardar como, desplácese a la carpeta correspondiente y asigne el nombre Modified Association_Model.dmx al archivo.

  9. En la barra de herramientas, haga clic en el botón Ejecutar.

En la siguiente lección procesará la estructura de minería de datos Market Basket y los modelos de minería de datos asociados.

Siguiente

Lección 3. Procesar la estructura de minería de datos Market Basket