Lección 3: Procesar la estructura de minería de datos de Bike Buyer

En esta lección usará la instrucción INSERT INTO y la vista vTargetMail de la base de datos de muestra AdventureWorksDW2008R2 para procesar las estructuras y los modelos de minería de datos creados en Lección 1: Crear la estructura de minería de datos de Bike Buyer y Lección 2: Agregar modelos de minería de datos a la estructura de minería de datos de Bike Buyer.

Al procesar una estructura de minería de datos, Analysis Services lee los datos de origen y genera las estructuras que admiten los modelos de minería de datos. Al procesar un modelo de minería de datos, los datos definidos por la estructura de minería de datos se pasan por el algoritmo de minería de datos que elija. El algoritmo busca tendencias y patrones y, a continuación, almacena esta información en el modelo de minería de datos. Por consiguiente, el modelo de minería de datos no contiene los datos de origen reales, sino la información descubierta por el algoritmo. Para obtener más información sobre cómo procesar modelos de minería de datos, vea Procesar objetos de minería de datos.

Solamente necesita volver a procesar una estructura de minería de datos si cambia una columna de la estructura o los datos de origen. Si agrega un modelo de minería de datos a una estructura de minería de datos que ya se ha procesado, puede usar la instrucción INSERT INTO MINING MODEL para entrenar el nuevo modelo de minería de datos.

Entrenar la plantilla de la estructura

Para entrenar la estructura de minería de datos y los modelos de minería de datos asociados, use la instrucción INSERT INTO (DMX). El código de la instrucción se puede dividir en las partes siguientes:

  • Identificación de la estructura de minería de datos

  • Visualización en una lista de las columnas de la estructura de minería de datos

  • Definición de los datos de entrenamiento

A continuación, se incluye un ejemplo genérico de la instrucción INSERT INTO:

INSERT INTO MINING STRUCTURE [<mining structure name>]
(
   <mining structure columns>
)
OPENQUERY([<datasource>],'<SELECT statement>')

La primera línea del código identifica la estructura de minería de datos que se entrenará:

INSERT INTO MINING STRUCTURE [<mining structure name>]

La línea siguiente del código especifica las columnas definidas por la estructura de minería de datos. Debe incluir en la lista cada una de las columnas de la estructura de minería de datos, y cada columna debe estar asignada a una columna incluida en los datos de la consulta de origen:

(
   <mining structure columns>
)

La última línea del código define los datos que se usarán para entrenar la estructura de minería de datos:

OPENQUERY([<datasource>],'<SELECT statement>')

En esta lección usará OPENQUERY para definir los datos de origen. Para obtener información acerca de otros métodos para definir la consulta de origen, vea <source data query>.

Tareas de la lección

En esta lección realizará la tarea siguiente:

  • Procesar la estructura de minería de datos de Bike Buyer

Procesar la estructura de minería de datos de predicción

Para procesar la estructura de minería de datos con INSERT INTO

  1. En el Explorador de objetos, haga clic con el botón secundario en la instancia de Analysis Services, seleccione Nueva consulta y haga clic en DMX.

    Se abre el Editor de consultas, que contiene una consulta nueva en blanco.

  2. Copie el ejemplo genérico de la instrucción INSERT INTO en la consulta en blanco.

  3. Reemplace lo siguiente:

    [<mining structure name>] 
    

    por:

    Bike Buyer
    
  4. Reemplace lo siguiente:

    <mining structure columns>
    

    por:

    [Customer Key],
    [Age],
    [Bike Buyer],
    [Commute Distance],
    [Education],
    [Gender],
    [House Owner Flag],
    [Marital Status],
    [Number Cars Owned],
    [Number Children At Home],
    [Occupation],
    [Region],
    [Total Children],
    [Yearly Income]
    
  5. Reemplace lo siguiente:

    OPENQUERY([<datasource>],'<SELECT statement>')
    

    por:

    OPENQUERY([Adventure Works DW2008R2],
       'SELECT CustomerKey, Age, BikeBuyer,
             CommuteDistance,EnglishEducation,
             Gender,HouseOwnerFlag,MaritalStatus,
             NumberCarsOwned,NumberChildrenAtHome, 
             EnglishOccupation,Region,TotalChildren,
             YearlyIncome 
        FROM dbo.vTargetMail')
    

    La instrucción OPENQUERY hace referencia al origen de datos de Adventure Works DW2008R2 para obtener acceso a la vista vTargetMail. La vista contiene los datos de origen que se usarán para entrenar los modelos de minería de datos.

    Ahora la apariencia de la instrucción completa debe ser como la siguiente:

    INSERT INTO MINING STRUCTURE [Bike Buyer]
    (
       [Customer Key],
       [Age],
       [Bike Buyer],
       [Commute Distance],
       [Education],
       [Gender],
       [House Owner Flag],
       [Marital Status],
       [Number Cars Owned],
       [Number Children At Home],
       [Occupation],
       [Region],
       [Total Children],
       [Yearly Income]   
    )
    OPENQUERY([Adventure Works DW2008R2],
       'SELECT CustomerKey, Age, BikeBuyer,
             CommuteDistance,EnglishEducation,
             Gender,HouseOwnerFlag,MaritalStatus,
             NumberCarsOwned,NumberChildrenAtHome, 
             EnglishOccupation,Region,TotalChildren,
             YearlyIncome 
        FROM dbo.vTargetMail')
    
  6. En el menú Archivo, haga clic en Guardar DMXQuery1.dmx como.

  7. En el cuadro de diálogo Guardar como, desplácese a la carpeta correspondiente y asigne el nombre Process Bike Buyer Structure.dmx al archivo.

  8. En la barra de herramientas, haga clic en el botón Ejecutar.

En la siguiente lección explorará el contenido de los modelos de minería de datos que ha agregado a la estructura de minería de datos en esta lección.