Lección 1: Crear la estructura de minería de datos de Bike Buyer

 

Se aplica a: SQL Server 2016 Preview

En esta lección creará una estructura de minería de datos que permita predecir si un cliente potencial de Adventure Works Cycles adquirirá una bicicleta. Si no está familiarizado con las estructuras de minería de datos y su función en la minería de datos, consulte estructuras de minería de datos ( Analysis Services: minería de datos y nº 41;.

La estructura de minería de datos Bike Buyer que creará en esta lección admite la adición de modelos de minería de datos basado en el el algoritmo de clústeres de Microsoftalgoritmo de árboles de decisión de Microsoft. En lecciones posteriores, utilizará los modelos de minería de datos de agrupación en clústeres para explorar las distintas formas en las que los clientes pueden agruparse, y utilizará los modelos de minería de datos del árbol de decisión para predecir si un cliente potencial adquirirá una bicicleta.

Instrucción CREATE MINING STRUCTURE

Para crear una estructura de minería de datos, utilice la crear estructura de minería de datos ( DMX ) instrucción. El código de la instrucción se puede dividir en las partes siguientes:

  • Asignación de un nombre a la estructura.

  • Definición de la columna de clave.

  • Definición de las columnas de minería de datos.

  • Definición de un conjunto de datos de pruebas opcional.

A continuación, se incluye un ejemplo genérico de la instrucción CREATE MINING STRUCTURE:

CREATE MINING STRUCTURE [<mining structure name>]  
(  
    <key column>,  
    <mining structure columns>  
)   
WITH HOLDOUT (<holdout specifier>)  

En la primera línea del código se define el nombre de la estructura:

CREATE MINING STRUCTURE [<mining structure name>]  

Para obtener información sobre la nomenclatura de un objeto de extensiones de minería de datos (DMX), consulte identificadores ( DMX ).

En la siguiente línea del código se define la columna de clave para la estructura de minería de datos, que identifica de forma única una entidad de los datos de origen:

<key column>,  

En la estructura de minería de datos que va a crear, el identificador de cliente, CustomerKey, define una entidad en los datos de origen.

La siguiente línea del código se utiliza para definir las columnas de minería de datos que usarán los modelos de minería de datos asociados a la estructura de minería de datos:

<mining structure columns>  

Puede utilizar la función DISCRETIZE en discretizar columnas continuas utilizando la sintaxis siguiente:

DISCRETIZE(<method>,<number of buckets>)

Para obtener más información acerca de la discretización de columnas, consulte métodos de discretización ( minería de datos ). Para obtener más información acerca de los tipos de columnas que se pueden definir de la estructura de minería de datos, consulte columnas de estructura de minería de datos.

La línea final del código define una partición opcional en la estructura de minería de datos:

WITH HOLDOUT (<holdout specifier>)  

Se especifica una parte de los datos que se van a utilizar para probar los modelos de minería relacionados con la estructura y los datos restantes se utilizan para el aprendizaje de los modelos. De forma predeterminada, Analysis Services crea un conjunto de datos de pruebas que contiene el 30 por ciento de todos los datos del caso. Debe agregar la especificación donde se indique que el conjunto de datos de pruebas debería contener el 30 por ciento de los casos hasta un máximo de 1000. Si el 30 por ciento de los casos es menor que 1000, el conjunto de datos de pruebas contendrá la cantidad menor.

Tareas de la lección

En esta lección realizará las tareas siguientes:

  • Crear una consulta en blanco.

  • Modificar la consulta para crear la estructura de minería de datos.

  • Ejecutar la consulta.

Crear la consulta

El primer paso es conectarse a una instancia de Analysis Services y crear una consulta DMX en SQL Server Management Studio.

Para crear una consulta DMX mediante SQL Server Management Studio

  1. Abra SQL Server Management Studio.

  2. En el Conectar con el servidor cuadro de diálogo para tipo de servidor, seleccione Analysis Services. En nombre del servidor, tipo LocalHost, o escriba el nombre de la instancia de Analysis Services que desea conectarse para esta lección. Haga clic en Conectar.

  3. En Explorador de objetos, haga clic en la instancia de Analysis Services, elija nueva consulta, y, a continuación, haga clic en DMX para abrir el Editor de consultas y una nueva consulta en blanco.

Modificar la consulta

El paso siguiente es modificar la instrucción CREATE MINING STRUCTURE descrita anteriormente para crear la estructura de minería de datos de Bike Buyer.

Para personalizar la instrucción CREATE MINING STRUCTURE

  1. En el Editor de consultas, copie el ejemplo genérico de la instrucción CREATE MINING STRUCTURE en la consulta en blanco.

  2. Reemplace lo siguiente:

    [<mining structure>]   
    

    por:

    [Bike Buyer]  
    
  3. Reemplace lo siguiente:

    <key column>   
    

    por:

    CustomerKey LONG KEY  
    
  4. Reemplace lo siguiente:

    <mining structure columns>   
    

    por:

    [Age] LONG DISCRETIZED(Automatic,10),  
    [Bike Buyer] LONG DISCRETE,  
    [Commute Distance] TEXT DISCRETE,  
    [Education] TEXT DISCRETE,  
    [Gender] TEXT DISCRETE,  
    [House Owner Flag] TEXT DISCRETE,  
    [Marital Status] TEXT DISCRETE,  
    [Number Cars Owned] LONG DISCRETE,  
    [Number Children At Home] LONG DISCRETE,  
    [Occupation] TEXT DISCRETE,  
    [Region] TEXT DISCRETE,  
    [Total Children]LONG DISCRETE,  
    [Yearly Income] DOUBLE CONTINUOUS  
    
  5. Reemplace lo siguiente:

    WITH HOLDOUT (holdout specifier>)  
    

    por:

    WITH HOLDOUT (30 PERCENT or 1000 CASES)  
    

    Ahora, la instrucción completa de la estructura de minería de datos debería ser como sigue:

    CREATE MINING STRUCTURE [Bike Buyer]  
    (  
       [Customer Key] LONG KEY,  
       [Age]LONG DISCRETIZED(Automatic,10),  
       [Bike Buyer] LONG DISCRETE,  
       [Commute Distance] TEXT DISCRETE,  
       [Education] TEXT DISCRETE,  
       [Gender] TEXT DISCRETE,  
       [House Owner Flag] TEXT DISCRETE,  
       [Marital Status] TEXT DISCRETE,  
       [Number Cars Owned]LONG DISCRETE,  
       [Number Children At Home]LONG DISCRETE,  
       [Occupation] TEXT DISCRETE,  
       [Region] TEXT DISCRETE,  
       [Total Children]LONG DISCRETE,  
       [Yearly Income] DOUBLE CONTINUOUS  
    )  
    WITH HOLDOUT (30 PERCENT or 1000 CASES)  
    
  6. En el archivo menú, haga clic en Guardar DMXQuery1.dmx como.

  7. En el Guardar como cuadro de diálogo, busque la carpeta correspondiente y nombre de archivo Bike Buyer Structure.dmx.

Ejecutar la consulta

El último paso es ejecutar la consulta. Una vez creada y guardada una consulta, tiene que ejecutarse. Es decir, la instrucción tiene que ejecutarse para crear la estructura de minería de datos en el servidor. Para obtener más información acerca de cómo ejecutar consultas en el Editor de consultas, vea Editor de consultas del motor de base de datos ( SQL Server Management Studio ).

Para ejecutar la consulta

  1. En el Editor de consultas, en la barra de herramientas, haga clic en Execute.

    El estado de la consulta se muestra en el mensajes en la parte inferior del Editor de consultas de después de la instrucción termina de ejecutarse. En Mensajes, debe aparecer lo siguiente:

    Executing the query   
    Execution complete  
    

    Una nueva estructura denominada bicicleta ahora existe en el servidor.

En la siguiente lección agregará modelos de minería de datos a la estructura que acaba de crear.

Lección siguiente

Lección 2: Agregar modelos de minería de datos a la estructura de minería de datos de Bike Buyer