Crear una estructura del modelo de minería de datos de agrupación en clústeres de secuencia (Tutorial intermedio de minería de datos)

 

Se aplica a: SQL Server 2016 Preview

El primer paso para crear un modelo de minería de datos de agrupación en clústeres de secuencia es utilizar el Asistente para minería de datos con el objeto de crear una nueva estructura de minería de datos y un modelo de minería basados en el algoritmo de clústeres de secuencia de Microsoft.

Usará la misma vista de origen de datos que utilizó para el análisis de cesta, pero agregará una columna que contiene el secuencia identificador. En este escenario, la secuencia significa el orden en el que el cliente agregó los elementos a la cesta de la compra.

También agregará algunas columnas que se utilizan en uno de los modelos para agrupar los clientes por datos demográficos.

Para crear un modelo y una estructura de agrupación en clústeres de secuencia

  1. En el Explorador de soluciones de SQL Server Data Tools (SSDT), haga clic en estructuras de minería de datos y seleccione nueva estructura de minería de datos.

  2. En la página de inicio del Asistente para minería de datos , haga clic en Siguiente.

  3. En la Seleccionar el método de definición compruebe que desde el almacén de datos o base de datos relacional existente está seleccionada y, a continuación, haga clic en siguiente.

  4. En la crear la estructura de minería de datos compruebe que la opción crear estructura de minería de datos con un modelo de minería de datos está seleccionada. A continuación, haga clic en la lista desplegable para la opción Qué técnica de minería de datos desea utilizar?, y seleccione Microsoft Sequence Clustering. Haga clic en Siguiente.

    El Seleccionar vista del origen de datos aparece la página. Bajo vistas del origen de datos disponibles, seleccione pedidos.

    Orders es la misma vista del origen de datos que utilizó para el escenario de la cesta de la compra. Si no ha creado esta vista del origen de datos, consulte Agregar una vista del origen de datos con tablas anidadas ( Tutorial intermedio de minería de datos ).

  5. Haga clic en Siguiente.

  6. En el especificar tipos de tablas página, seleccione la caso casilla de verificación junto a la vAssocSeqOrders de tabla y seleccione la Nested casilla de verificación junto a la vAssocSeqLineItems tabla. Haga clic en Siguiente.

    Nota


    Si se produce un error cuando se selecciona el caso o Nested casillas de verificación, es posible que la combinación en la vista de origen de datos no es correcta. La tabla anidada, vAssocSeqLineItems, debe estar conectado a la tabla de casos, vAssocSeqOrders, por una combinación de varios a uno. Puede modificar la relación haciendo clic con el botón secundario en la línea de combinación e invirtiendo entonces la dirección de la unión. Para obtener más información, consulte crear o cuadro de diálogo Editar relación ( Analysis Services - datos multidimensionales ).

  7. En el especificar los datos de entrenamiento página, elija las columnas para su uso en el modelo activando una casilla de verificación como sigue:

    • IncomeGroupSeleccione la entrada casilla de verificación.

      Esta columna contiene información interesante sobre los clientes que puede utilizar para la agrupación en clústeres. La utilizará en el primer modelo y, a continuación, la omitirá en el segundo.

    • OrderNumberSeleccione la clave casilla de verificación.

      Este campo se utilizará como el identificador de la tabla de casos o clave. En general, nunca debería utilizar el campo clave de la tabla de casos como una entrada, porque la clave contiene valores únicos que no son útiles para la agrupación en clústeres.

    • RegiónSeleccione la entrada casilla de verificación.

      Esta columna contiene información interesante sobre los clientes que puede utilizar para la agrupación en clústeres. La utilizará en el primer modelo y, a continuación, la omitirá en el segundo.

    • LineNumberSeleccione la clave y entrada casillas de verificación.

      El LineNumber campo se utilizará como el identificador de la tabla anidada, o clave de secuencia. La clave para una tabla anidada siempre se debe utilizar para la entrada.

    • ModeloSeleccione la entrada y predicción casillas de verificación.

    Compruebe que las selecciones son correctas y, a continuación, haga clic en siguiente.

  8. En la contenido y el tipo de datos de columnas Especifique página, compruebe que la cuadrícula contiene las columnas, tipos de contenido y los tipos de datos se muestra en la tabla siguiente y, a continuación, haga clic en siguiente.

    Tablas y columnas Tipo de contenido Tipo de datos
    IncomeGroup Discrete Texto
    OrderNumber Key Texto
    Region Discrete Texto
    vAssocSeqLineItems
    Line Number Key Sequence Long
    Modelo Discrete Texto
  9. En la Crear conjunto de pruebas página, cambie la porcentaje de datos de prueba en 20 y, a continuación, haga clic en siguiente.

  10. En la completar el Asistente para página, para el nombre de la estructura de minería de datos, tipo Sequence Clustering with Region.

  11. Para el nombre del modelo de minería de datos, tipo Sequence Clustering with Region.

  12. Compruebe la Permitir obtención de detalles cuadro y, a continuación, haga clic en Finalizar.

Siguiente tarea de la lección

Procesar el modelo de agrupación en clústeres de secuencia

Vea también

Diseñador de minería de datos
Algoritmo de clústeres de secuencia de Microsoft