Adicionando uma exibição da fonte de dados com tabelas aninhadas (Tutorial de mineração de dados intermediário)

Para criar o modelo de mineração para a análise da cesta de mercado, você deve criar uma exibição da fonte de dados. Essa fonte de dados também será usada para o cenário de clustering de sequências.

Esta exibição da fonte de dados é diferente de outras com as quais você talvez tenha trabalhado porque contém uma tabela aninhada. Uma tabela aninhada é uma tabela que contém várias linhas de informações sobre uma única linha da tabela de casos. Por exemplo, se o seu modelo analisasse o comportamento de compra de clientes, normalmente você usaria uma tabela com uma linha exclusiva para cada cliente como a tabela de casos. No entanto, cada cliente pode fazer várias compras e talvez você queira analisar a sequência de compras ou os produtos comprados juntos com frequência. Para representar logicamente essas compras no modelo, adicione outra tabela à exibição da fonte de dados que lista as compras para cada cliente.

Essa tabela de compras aninhada está relacionada à tabela de clientes uma relação muitos para um. A tabela aninhada pode conter várias linhas para cada cliente, cada linha com um único produto comprado, talvez com informações adicionais sobre o pedido em que as compras foram feitas, o preço no momento do pedido ou qualquer promoção aplicável. É possível usar as informações da tabela aninhada como entradas para o modelo ou como o atributo previsível.

Nesta lição, você executará as seguintes tarefas:

  • Você adiciona uma exibição da fonte de dados à fonte de dados do Adventure Works DW2008R2. 

  • Você adiciona as tabelas de casos e aninhada a essa exibição.

  • Você especifica a relação muitos para um entre as tabelas de casos e aninhada.

    ObservaçãoObservação

    . É importante seguir o procedimento descrito com exatidão para especificar corretamente a relação entre a tabela de casos e a tabela aninhada e evitar erros durante o processamento do modelo.

  • Você define como as colunas de dados são usadas no modelo.

Para obter mais informações sobre como trabalhar com tabelas aninhadas e de casos e sobre como escolher uma chave de tabela aninhada, consulte Tabelas aninhadas (Analysis Services - Mineração de Dados).

Para adicionar uma exibição da fonte de dados

  1. No Gerenciador de Soluções, clique com o botão direito do mouse em Exibições de Fonte de Dados e, em seguida, selecione Nova Exibição da Fonte de Dados.

    O Assistente de Exibição da Fonte de Dados é aberto.

  2. Na página Bem-vindo ao Assistente de Exibição da Fonte de Dados, clique em Avançar.

  3. Na página Selecionar uma fonte de dados, em Fontes de dados relacionais, selecione a fonte de dados Adventure Works DW2008R2 criada no Tutorial de data mining básico. Clique em Avançar.

  4. Na página Selecionar Tabelas e Exibições, selecione as seguintes tabelas e clique na seta para a direita a fim de incluí-las na nova exibição da fonte de dados:

    • vAssocSeqOrders

    • vAssocSeqLineItems

  5. Clique em Avançar.

  6. Na página Concluindo o Assistente, por padrão, a exibição da fonte de dados é chamada de Adventure Works DW2008R2. Altere o nome para Orders e, em seguida, clique em Concluir.

    O Designer de Exibição da Fonte de Dados é aberto e a exibição da fonte de dados Orders é exibida.

Para criar uma relação entre duas tabelas

  1. No Designer da Exibição da Fonte de Dados, posicione as duas tabelas para que elas se alinhem horizontalmente, com a tabela vAssocSeqLineItems no lado esquerdo e a tabela vAssocSeqOrders no lado direito.

  2. Selecione a coluna OrderNumber na tabela vAssocSeqLineItems.

  3. Arraste a coluna para a tabela vAssocSeqOrders e coloque-a na coluna OrderNumber.

    Observação importanteImportante

    Certifique-se de estar arrastando a coluna OrderNumber da tabela aninhada vAssocSeqLineItems, que representa os vários lados da junção, para a tabela de casos vAssocSeqOrders, que representa um lado da junção.

    Agora existe uma nova relação muitos para um entre as tabelas vAssocSeqLineItems e vAssocSeqOrders. Se você uniu as tabelas corretamente, a exibição da fonte de dados deverá ser parecida com esta:

    esperada junção muitos-para-um em tabelas aninhadas e de caso