Lección 4: Examinar los modelos de minería de datos de Bike Buyer

En esta lección utilizará la instrucción SELECT (DMX) para explorar el contenido de los modelos de minería de datos del árbol de decisión y de la agrupación en clústeres creada en Lección 2: Agregar modelos de minería de datos a la estructura de minería de datos Bike Buyer.

Las columnas incluidas en un modelo de minería de datos no son las columnas definidas por la estructura de minería de datos, sino un conjunto específico de columnas que describen las tendencias y los patrones encontrados por el algoritmo. Estas columnas del modelo de minería de datos se describen en el conjunto de filas del esquema DMSCHEMA_MINING_MODEL_CONTENT. Por ejemplo, la columna MODEL_NAME del conjunto de filas del esquema de contenido incluye el nombre del modelo de minería de datos. Para un modelo de minería de datos de agrupación en clústeres, la columna NODE_CAPTION contiene el nombre de cada clúster y la columna NODE_DESCRIPTION, una descripción de las características de cada clúster. Puede examinar estas columnas si utiliza la instrucción SELECT FROM <model>.CONTENT en DMX. También puede utilizar esta instrucción para explorar los datos utilizados para crear el modelo de minería de datos. La obtención de detalles debe estar habilitada en la estructura de minería de datos para poder usar esta instrucción. Para obtener más información acerca de la instrucción, vea SELECT FROM <model>.CASES (DMX).

También se pueden devolver todos los estados de una columna discreta mediante la instrucción SELECT DISTINCT. Por ejemplo, si realiza esta operación en una columna que contiene géneros, la consulta devolverá male y female.

Tareas de la lección

En esta lección realizará las tareas siguientes:

  • Explorar el contenido incluido en los modelos de minería de datos

  • Devolver los casos de los datos de origen utilizados para entrenar los modelos de minería de datos

  • Explorar los distintos estados disponibles para una columna discreta específica

Devolver el contenido de un modelo de minería de datos

En esta lección utilizará la instrucción SELECT FROM <model>.CONTENT (DMX) para devolver el contenido del modelo de agrupación en clústeres.

A continuación, se incluye un ejemplo genérico de la instrucción SELECT FROM <model>.CONTENT:

SELECT <select list> FROM [<mining model>].CONTENT
WHERE <where clause>

En la primera línea del código se definen las columnas que deben devolverse a partir del contenido del modelo de minería de datos y el modelo de minería de datos al que están asociadas:

SELECT <select list> FROM [<mining model].CONTENT

La cláusula .CONTENT junto al nombre del modelo de minería de datos especifica que se devuelve el contenido del modelo de minería de datos. Para obtener más información acerca de las columnas incluidas en el modelo de minería de datos, vea Conjunto de filas DMSCHEMA_MINING_MODEL_CONTENT.

Opcionalmente, puede utilizar la última línea del código para filtrar los resultados devueltos por la instrucción:

WHERE <where clause>

Por ejemplo, si desea restringir los resultados de la consulta a sólo los clústeres que contengan un gran número de casos, puede agregar la siguiente cláusula WHERE a la instrucción SELECT:

WHERE NODE_SUPPORT > 100

Para obtener más información acerca de cómo utilizar la instrucción WHERE, vea SELECT (DMX).

Para devolver el contenido del modelo de minería de datos de agrupación en clústeres

  1. En el Explorador de objetos, haga clic con el botón secundario en la instancia de Analysis Services, seleccione Nueva consulta y haga clic en DMX.

    Se abre el Editor de consultas, que contiene una consulta nueva en blanco.

  2. Copie el ejemplo genérico de la instrucción SELECT FROM <model>.CONTENT en la consulta en blanco.

  3. Reemplace lo siguiente:

    <select list> 
    

    por:

    También puede reemplazar * por una lista de cualquiera de las columnas incluidas en el conjunto de filas DMSCHEMA_MINING_MODEL_CONTENT.

  4. Reemplace lo siguiente:

    [<mining model>] 
    

    por:

    [Clustering]
    

    Ahora, la instrucción completa debería ser como sigue:

    SELECT * FROM [Clustering].CONTENT
    
  5. En el menú Archivo, haga clic en Guardar DMXQuery1.dmx como.

  6. En el cuadro de diálogo Guardar como, desplácese a la carpeta correspondiente y asigne el nombre SELECT_CONTENT.dmx al archivo.

  7. En la barra de herramientas, haga clic en el botón Ejecutar.

    La consulta devuelve el contenido del modelo de minería de datos.

Usar la obtención de detalles

El paso siguiente es usar la instrucción de obtención de detalles para devolver una muestra de los casos utilizados para entrenar el modelo de minería de datos del árbol de decisión. En esta lección utilizará la instrucción SELECT FROM <model>.CASES (DMX) para devolver el contenido del modelo del árbol de decisión.

A continuación, se incluye un ejemplo genérico de la instrucción SELECT FROM <model>.CASES:

SELECT <select list> 
FROM [<mining model>].CASES
WHERE IsInNode('<node id>')

En la primera línea del código se definen las columnas que deben devolverse a partir de los datos de origen y el modelo de minería de datos en el que se incluyen:

SELECT <select list> FROM [<mining model>].CASES

La cláusula .CASES especifica que se está realizando una consulta de obtención de detalles. Para poder utilizar la obtención de detalles, debe habilitarla al crear el modelo de minería de datos.

La última línea del código es opcional y especifica el nodo del modelo de minería de datos del que se solicitan casos:

WHERE IsInNode('<node id>')

Para obtener más información acerca de cómo utilizar la instrucción WHERE con IsInNode, vea SELECT FROM <model>.CASES (DMX).

Para devolver los casos utilizados para entrenar el modelo de minería de datos

  1. En el Explorador de objetos, haga clic con el botón secundario en la instancia de Analysis Services, seleccione Nueva consulta y haga clic en DMX.

    Se abre el Editor de consultas, que contiene una consulta nueva en blanco.

  2. Copie el ejemplo genérico de la instrucción SELECT FROM <model>.CASES en la consulta en blanco.

  3. Reemplace lo siguiente:

    <select list> 
    

    por:

    También puede reemplazar * por una lista de las columnas incluidas dentro de los datos de origen (como [Bike Buyer]).

  4. Reemplace lo siguiente:

    [<mining model>] 
    

    por:

    [Decision Tree]
    

    Ahora, la instrucción completa debería ser como sigue:

    SELECT * 
    FROM [Decision Tree].CASES
    
  5. En el menú Archivo, haga clic en Guardar DMXQuery1.dmx como.

  6. En el cuadro de diálogo Guardar como, desplácese a la carpeta correspondiente y asigne el nombre SELECT_DRILLTHROUGH.dmx al archivo.

  7. En la barra de herramientas, haga clic en el botón Ejecutar.

    La consulta devuelve los datos de origen utilizados para entrenar el modelo de minería de datos del árbol de decisión.

Devolver los estados de una columna discreta del modelo de minería de datos

El paso siguiente es utilizar la instrucción SELECT DISTINCT para devolver los distintos estados posibles en la columna del modelo de minería de datos que se ha especificado.

A continuación, se incluye un ejemplo genérico de la instrucción SELECT DISTINCT:

SELECT DISTINCT [<column>] 
FROM [<mining model>]

En la primera línea del código se definen las columnas del modelo de minería de datos para las que se devolverán estados:

SELECT DISTINCT [<column>] 

Debe incluir DISTINCT para devolver todos los estados de la columna. Si no incluye DISTINCT, la instrucción completa se convierte en un acceso directo para una predicción y devuelve el estado más probable de la columna especificada. Para obtener más información, vea SELECT (DMX).

Para devolver los estados de una columna discreta

  1. En el Explorador de objetos, haga clic con el botón secundario en la instancia de Analysis Services, seleccione Nueva consulta y haga clic en DMX.

    Se abre el Editor de consultas, que contiene una consulta nueva en blanco.

  2. Copie el ejemplo genérico de la instrucción SELECT DISTINCT en la consulta en blanco.

  3. Reemplace lo siguiente:

    [<column,name> 
    

    por:

    [Bike Buyer]
    
  4. Reemplace lo siguiente:

    [<mining model>] 
    

    por:

    [Decision Tree]
    

    Ahora, la instrucción completa debería ser como sigue:

    SELECT DISTINCT [Bike Buyer] 
    FROM [Decision Tree]
    
  5. En el menú Archivo, haga clic en Guardar DMXQuery1.dmx como.

  6. En el cuadro de diálogo Guardar como, desplácese a la carpeta correspondiente y asigne el nombre SELECT_DISCRETE.dmx al archivo.

  7. En la barra de herramientas, haga clic en el botón Ejecutar.

    La consulta devuelve los estados posibles de la columna Bike Buyer.

En la siguiente lección predecirá si los clientes potenciales serán compradores de bicicletas, utilizando el modelo de minería de datos del árbol de decisión.