Lección 3: Procesar la estructura de minería de datos de la cesta de la compra

 

Se aplica a: SQL Server 2016 Preview

En esta lección, usará el INSERT INTO ( DMX ) instrucción y vAssocSeqLineItems y vAssocSeqOrders de la AdventureWorksDW2012 base de datos de ejemplo para procesar las estructuras de minería de datos y modelos de minería de datos que creó en lección 1: crear la estructura de minería de datos de la cesta y lección 2: agregar modelos de minería de datos a la estructura de minería de datos de la cesta.

Al procesar una estructura de minería de datos, Analysis Services lee los datos de origen y genera las estructuras que admiten los modelos de minería de datos. Al procesar un modelo de minería de datos, los datos definidos por la estructura de minería de datos se pasan por el algoritmo de minería de datos que haya elegido. El algoritmo busca tendencias y patrones y, a continuación, almacena esta información en el modelo de minería de datos. Por consiguiente, el modelo de minería de datos no contiene los datos de origen reales, sino la información descubierta por el algoritmo. Para obtener más información acerca del procesamiento de modelos de minería de datos, consulte #40 & consideraciones y requisitos de procesamiento; minería de datos ).

Solo debe volver a procesar una estructura de minería de datos si cambia una columna de la estructura o los datos de origen. Si agrega un modelo de minería de datos a una estructura de minería de datos que ya se ha procesado, puede usar el INSERT INTO MINING MODEL instrucción para entrenar el modelo de minería de datos nueva en los datos existentes.

Dado que la estructura de minería de datos de la cesta contiene una tabla anidada, se debe definir las columnas de minería de datos que deben entrenarse usando la estructura de tabla anidada y usar el forma comando para definir las consultas que extraen los datos de entrenamiento de las tablas de origen.

Instrucción INSERT INTO

Para entrenar la estructura de minería de datos de la cesta y sus modelos de minería de datos asociados, use la INSERT INTO ( DMX ) instrucción. El código de la instrucción se puede dividir en las partes siguientes.

  • Identificación de la estructura de minería de datos

  • Visualización en una lista de las columnas de la estructura de minería de datos

  • Definir los datos de entrenamiento con forma

El siguiente es un ejemplo genérico de la INSERT INTO instrucción:

INSERT INTO MINING STRUCTURE [<mining structure name>]  
(  
   <mining structure columns>  
   [<nested table>]  
   ( SKIP, <skipped column> )  
)  
SHAPE {  
  OPENQUERY([<datasource>],'<SELECT statement>') }  
APPEND  
(   
  {OPENQUERY([<datasource>],'<nested SELECT statement>')  
}  
RELATE [<case key>] TO [<foreign key>]  
) AS [<nested table>]  

La primera línea del código identifica la estructura de minería de datos que se entrenará:

INSERT INTO MINING STRUCTURE [<mining structure name>]  

Las líneas siguientes del código especifican las columnas definidas por la estructura de minería de datos. Debe incluir en la lista cada una de las columnas de la estructura de minería de datos, y cada columna debe estar asignada a una columna incluida en los datos de la consulta de origen: Puede usar omitir para omitir las columnas que existen en el origen de datos, pero no existen en la estructura de minería de datos. Para obtener más información acerca de cómo usar omitir, consulte INSERT INTO ( DMX ).

(  
   <mining structure columns>  
   [<nested table>]  
   ( SKIP, <skipped column> )  
)  

Las últimas líneas del código definen los datos que se utilizarán para entrenar la estructura de minería de datos. Como los datos de origen se encuentran en dos tablas, se utilizará forma para relacionar las tablas.

SHAPE {  
  OPENQUERY([<datasource>],'<SELECT statement>') }  
APPEND  
(   
  {OPENQUERY([<datasource>],''<nested SELECT statement>'')  
}  
RELATE [<case key>] TO [<foreign key>]  
) AS [<nested table>]  

En esta lección, usará OPENQUERY para definir el origen de datos. Para obtener información acerca de otros métodos de definir una consulta en el origen de datos, consulte &60; la consulta de origen de datos >.

Tareas de la lección

En esta lección realizará la tarea siguiente:

  • Procesar la estructura de minería de datos de la cesta

Procesar la estructura de minería de datos Market Basket

Para procesar la estructura de minería de datos con INSERT INTO

  1. En Explorador de objetos, haga clic en la instancia de Analysis Services, elija nueva consulta, y, a continuación, haga clic en DMX.

    Se abre el Editor de consultas, que contiene una consulta nueva en blanco.

  2. Copie el ejemplo genérico de la instrucción INSERT INTO en la consulta en blanco.

  3. Reemplace lo siguiente:

    [<mining structure>]  
    

    por:

    Market Basket  
    
  4. Reemplace lo siguiente:

    <mining structure columns>  
    [<nested table>]  
    ( SKIP, <skipped column> )  
    

    por:

    [OrderNumber],  
    [Products]   
    (SKIP, [Model])  
    

    En la instrucción productos hace referencia a la tabla Products definida por la instrucción SHAPE. OMITIR se usa para omitir la columna del modelo, que existe en el origen de datos como una clave, pero no se usa en la estructura de minería de datos.

  5. Reemplace lo siguiente:

    SHAPE {  
      OPENQUERY([<datasource>],'<SELECT statement>') }  
    APPEND  
    (   
      {OPENQUERY([<datasource>],'<nested SELECT statement>')  
    }  
    RELATE [<case key>] TO [<foreign key>]  
    ) AS [<nested table>]  
    

    por:

    SHAPE {  
      OPENQUERY([Adventure Works DW],'SELECT OrderNumber  
                FROM vAssocSeqOrders ORDER BY OrderNumber')}  
    APPEND  
    (   
      {OPENQUERY([Adventure Works DW],'SELECT OrderNumber, Model FROM   
        dbo.vAssocSeqLineItems ORDER BY OrderNumber, Model')  
    }  
    RELATE OrderNumber to OrderNumber   
    ) AS [Products]  
    

    Las referencias de la consulta de origen el AdventureWorksDW2012 origen de datos definido en el AdventureWorksDW2012 proyecto de ejemplo. Utiliza este origen de datos para obtener acceso a las vistas vAssocSeqLineItems y vAssocSeqOrders. Estas vistas contienen los datos de origen que se utilizarán para entrenar el modelo de minería de datos. Si no ha creado este proyecto o estas vistas, consulte Tutorial básico de minería de datos.

    Dentro de la forma comando utilizará OPENQUERY para definir dos consultas. La primera consulta define la tabla primaria y la segunda, la tabla anidada. Las dos tablas se relacionan mediante la columna OrderNumber, que existe en ambas tablas.

    Ahora la apariencia de la instrucción completa debe ser como la siguiente:

    INSERT INTO MINING STRUCTURE [Market Basket]  
    (  
       [OrderNumber],[Products] (SKIP, [Model])  
    )  
    SHAPE {  
      OPENQUERY([Adventure Works DW],'SELECT OrderNumber  
                FROM vAssocSeqOrders ORDER BY OrderNumber')}  
    APPEND  
    (   
      {OPENQUERY([Adventure Works DW],'SELECT OrderNumber, Model FROM   
        dbo.vAssocSeqLineItems ORDER BY OrderNumber, Model')  
    }  
    RELATE OrderNumber to OrderNumber   
    ) AS [Products]  
    
  6. En el archivo menú, haga clic en Guardar DMXQuery1.dmx como.

  7. En el Guardar como cuadro de diálogo, busque la carpeta correspondiente y nombre de archivo Process Market Basket.dmx.

  8. En la barra de herramientas, haga clic en el Execute botón.

Después de que la consulta haya terminado de ejecutarse, puede ver los modelos y los conjuntos de elementos encontrados, ver asociaciones o filtrar por conjunto de elementos, probabilidad o importancia. Para ver esta información en SQL Server Management Studio, haga clic en el nombre del modelo de datos y, a continuación, haga clic en Examinar.

En la siguiente lección creará varias predicciones basadas en los modelos de minería de datos que ha agregado a la estructura Market Basket.

Lección siguiente

Lección 4: Ejecutar predicciones de cesta de la compra