Share via


Crear una estructura del modelo de minería de datos de agrupación en clústeres de secuencia (Tutorial intermedio de minería de datos)

El primer paso para crear un modelo de minería de datos de agrupación en clústeres de secuencia es utilizar el Asistente para minería de datos con el objeto de crear una nueva estructura de minería de datos y un modelo de minería basados en el algoritmo de clústeres de secuencia de Microsoft.

Utilizará la misma vista del origen de datos que utilizó para el análisis de la cesta de la compra, pero agregará una columna que contenga el identificador sequence. En este escenario, la secuencia significa el orden en el que el cliente agregó los elementos a la cesta de la compra.

También agregará algunas columnas que se utilizan en uno de los modelos para agrupar los clientes por datos demográficos.

Para crear un modelo y una estructura de agrupación en clústeres de secuencia

  1. En el Explorador de soluciones de Business Intelligence Development Studio, haga clic con el botón secundario en Estructuras de minería de datos y seleccione Nueva estructura de minería de datos.

  2. En la página de inicio del Asistente para minería de datos, haga clic en Siguiente.

  3. En la página Seleccionar el método de definición, compruebe que la opción A partir de una base de datos relacional o del almacenamiento de datos se ha seleccionado y, a continuación, haga clic en Siguiente.

  4. En la página Crear la estructura de minería de datos, compruebe que la opción Crear la estructura de minería de datos con un modelo de minería de datos está seleccionada. Después, haga clic en la lista desplegable para la opción ¿Qué técnica de minería de datos desea utilizar? y seleccione Agrupación en clústeres de secuencia de Microsoft. Haga clic en Siguiente.

    Aparecerá la página Seleccionar vista del origen de datos. En Vistas del origen de datos disponibles, seleccione Orders.

    Orders es la misma vista del origen de datos que utilizó para el escenario de la cesta de la compra. Si no ha creado esta vista del origen de datos, vea Agregar una vista del origen de datos con tablas anidadas (Tutorial intermedio de minería de datos).

  5. Haga clic en Siguiente.

  6. En la página Especificar tipos de tablas, active la casilla Caso, situada junto a la tabla vAssocSeqOrders, y la casilla Anidado, situada junto a la tabla vAssocSeqLineItems. Haga clic en Siguiente.

    Nota

    Si se produce un error al activar las casillas Caso o Anidado, puede ser que se deba a que la combinación en la vista del origen de datos no es correcta. La tabla anidada, vAssocSeqLineItems, debe estar conectada a la tabla de casos, vAssocSeqOrders, mediante una combinación de varios a uno. Puede modificar la relación haciendo clic con el botón secundario en la línea de combinación e invirtiendo entonces la dirección de la unión. Para obtener más información, vea Cuadro de diálogo Crear/Editar relación (Analysis Services - Datos multidimensionales).

  7. En la página Especificar los datos de aprendizaje, elija las columnas para usarlas en el modelo activando una casilla, de la forma siguiente:

    • IncomeGroup: active la casilla Entrada.

      Esta columna contiene información interesante sobre los clientes que puede utilizar para la agrupación en clústeres. La utilizará en el primer modelo y, a continuación, la omitirá en el segundo.

    • OrderNumber: active la casilla Clave.

      Este campo se utilizará como identificador para la tabla de casos o Key. En general, nunca debería utilizar el campo clave de la tabla de casos como una entrada, porque la clave contiene valores únicos que no son útiles para la agrupación en clústeres.

    • Region: active la casilla Entrada.

      Esta columna contiene información interesante sobre los clientes que puede utilizar para la agrupación en clústeres. La utilizará en el primer modelo y, a continuación, la omitirá en el segundo.

    • LineNumber: active las casillas Clave y Entrada.

      El campo LineNumber se utilizará como identificador para la tabla anidada o Sequence Key. La clave para una tabla anidada siempre se debe utilizar para la entrada.

    • Model: active las casillas Entrada y De predicción.

    Compruebe que las selecciones son correctas y, a continuación, haga clic en Siguiente.

  8. En la página Especificar el contenido y el tipo de datos de las columnas, compruebe que la cuadrícula contiene las columnas, tipos de contenido y tipos de datos que se muestran en la tabla siguiente y, a continuación, haga clic en Siguiente.

    Tablas y columnas

    Tipo de contenido

    Tipo de datos

    IncomeGroup

    Discreta

    Text

    OrderNumber

    Key

    Text

    Region

    Discreta

    Text

    vAssocSeqLineItems

      

      

    Line Number

    Key Sequence

    Long

    Model

    Discreta

    Text

  9. En la página Crear conjunto de pruebas, cambie el Porcentaje de datos de prueba a 20 y haga clic en Siguiente.

  10. En la página Finalización del asistente, en Nombre de la estructura de minería de datos, escriba Agrupación en clústeres de secuencia con región.

  11. Como Nombre del modelo de minería de datos, escriba Agrupación en clústeres de secuencia con región.

  12. Active el cuadro Permitir obtención de detalles y, a continuación, haga clic en Finalizar.

Siguiente tarea de la lección

Procesar el modelo de clústeres de secuencia