Agregar una vista del origen de datos con tablas anidadas (Tutorial intermedio de minería de datos)

Para crear el modelo de minería de datos para el análisis de la cesta de la compra, debe crear una vista del origen de datos. Esta vista del origen de datos también se utilizará para el escenario de agrupación en clústeres de secuencia.

Esta vista del origen de datos se diferencia de otras con las que habrá trabajado en que contiene una tabla anidada. Una tabla anidada es aquella que contiene varias filas de información sobre una fila única en la tabla de casos. Por ejemplo, si el modelo analiza los hábitos de compra de los clientes, lo normal sería usar una tabla que tuviese una única fila para cada cliente como tabla de casos. Sin embargo, cada cliente puede hacer varias compras y es posible que se desee analizar el orden en que se realizan las compras o los productos que suelen comprarse juntos. Para representar estas compras de manera lógica en el modelo, agregará a la vista del origen de datos otra tabla que muestre las compras de cada cliente.

Esta tabla de compras anidada se relaciona con la tabla de clientes mediante una relación de varios a uno. La tabla anidada podría contener muchas filas para cada cliente, cada una con un único producto que se compró, quizás con información adicional sobre el orden en el que se realizaron las compras, el precio en el momento del pedido o cualquier promoción que se aplicara. Puede utilizar la información de la tabla anidada como entrada para el modelo o como el atributo de predicción.

En esta lección, hará lo siguiente:

  • Agregará una vista del origen de datos al origen de datos de Adventure Works DW2008R2. 

  • Agregará las tablas anidadas y de casos a esta vista.

  • Especificará la relación de varios a uno entre la tabla de casos y la tabla anidada.

    Nota

    . Es importante que siga el procedimiento descrito de forma exacta, para especificar correctamente la relación entre la tabla de casos y la tabla anidada, y evitar errores al procesar el modelo.

  • Definirá cómo se utilizan las columnas de datos en el modelo.

Para obtener más información acerca de cómo trabajar con las tablas de casos y anidada, y sobre cómo elegir una clave de tabla anidada, vea Tablas anidadas (Analysis Services - Minería de datos).

Para agregar una vista del origen de datos

  1. En el Explorador de soluciones, haga clic con el botón secundario en Vistas del origen de datos y luego seleccione Nueva vista del origen de datos.

    Se abrirá el Asistente para vistas del origen de datos.

  2. En la página Asistente para vistas del origen de datos, haga clic en Siguiente.

  3. En la página Seleccionar un origen de datos, en Orígenes de datos relacionales, seleccione el origen de datos de Adventure Works DW2008R2 que se creó en el Tutorial básico de minería de datos. Haga clic en Siguiente.

  4. En la página Seleccionar tablas y vistas, seleccione las tablas siguientes y, a continuación, haga clic en la flecha derecha para incluirlas en la nueva vista del origen de datos:

    • vAssocSeqOrders

    • vAssocSeqLineItems

  5. Haga clic en Siguiente.

  6. En la página Finalizando el asistente, la vista del origen de datos tendrá el nombre Adventure Works DW2008R2, de forma predeterminada. Cámbielo por Orders y, a continuación, haga clic en Finalizar.

    Se abrirá el Diseñador de vistas del origen de datos y aparecerá la vista del origen de datos Orders.

Crear una relación entre tablas

  1. En el Diseñador de vistas del origen de datos, coloque las dos tablas de modo que estén alineadas horizontalmente, con la tabla vAssocSeqLineItems en el lado izquierdo y la tabla vAssocSeqOrders en el lado derecho.

  2. Seleccione la columna OrderNumber de la tabla vAssocSeqLineItems.

  3. Arrastre la columna hasta la tabla vAssocSeqOrders y colóquela en la columna OrderNumber.

    Nota importanteImportante

    Asegúrese de arrastrar la columna OrderNumber desde la tabla anidada vAssocSeqLineItems, que representa el lado "varios" de la unión, hasta la tabla de casos vAssocSeqOrders, que representa el lado "uno" de la unión.

    Ahora existirá una nueva relación de varios a uno entre las tablas vAssocSeqLineItems y vAssocSeqOrders. Si ha combinado correctamente las tablas, la vista del origen de datos debería aparecer como sigue:

    combinación esperada de varios a uno en tabla de casos y anidada