Share via


Criando uma estrutura de modelo de mineração de clustering de sequências (Tutorial de mineração de dados intermediário)

 

Publicado: dezembro de 2016

Aplicável a: SQL Server 2016 Preview

A primeira etapa da criação de um modelo de mineração de clustering de sequências é usar o Assistente de Mineração de Dados para criar uma nova estrutura de mineração e um modelo de mineração baseado no algoritmo Clustering de Sequências da Microsoft.

Você usará a mesma exibição da fonte de dados que você usou para a análise da cesta de compras, mas você irá adicionar uma coluna que contém o sequência identificador. Neste cenário, a sequência significa a ordem em que o cliente adicionou itens à cesta de compras.

Você também adicionará algumas colunas usadas em um dos modelos para agrupar clientes por dados demográficos.

Para criar uma estrutura e um modelo de de clustering de sequências

  1. No Solution Explorer no SQL Server Data Tools (SSDT), clique com botão direito estruturas de mineração e selecione nova estrutura de mineração.

  2. Na página Bem-vindo ao Assistente de Mineração de Dados , clique em Avançar.

  3. No Selecionar método de definição Verifique de warehouse existente de banco de dados ou dados relacional está selecionado e, em seguida, clique em próxima.

  4. Sobre o criar a estrutura de mineração de dados Verifique a opção Criar estrutura de mineração com um modelo de mineração está selecionada. Em seguida, clique na lista suspensa para a opção qual técnica de mineração de dados você deseja usar?, e selecione msc. Clique em Avançar.

    O Selecionar exibição da fonte de dados página será exibida. Em modos de exibição de fonte de dados disponíveis, selecione pedidos.

    Pedidos é a mesma exibição da fonte de dados utilizada para a análise do cenário de cesta de compras. Se você não criou este modo de exibição de fonte de dados, consulte Adicionando uma exibição da fonte de dados com tabelas aninhadas e 40; Tutorial de mineração de dados intermediários e 41;.

  5. Clique em Avançar.

  6. No especificar tipos de tabela página, selecione o caso caixa de seleção ao lado a vAssocSeqOrders da tabela e selecione o Nested caixa de seleção ao lado a vAssocSeqLineItems tabela. Clique em Avançar.

    Dica


    Se ocorrer um erro quando você seleciona o caso ou Nested caixas de seleção, pode ser que a junção na exibição da fonte de dados não está correta. A tabela aninhada, vAssocSeqLineItems, deve estar conectado à tabela de casos, vAssocSeqOrders, por uma relação muitos-para-um. Você pode editar a relação clicando com o botão direito do mouse na linha de junção e invertendo a direção da junção. Para obter mais informações, consulte criar ou editar caixa de diálogo relação & #40. Analysis Services - dados multidimensionais &41;.

  7. Sobre o especificar os dados de treinamento página, escolha as colunas para uso no modelo selecionando uma caixa de seleção da seguinte maneira:

    • IncomeGroupSelecionar o entrada caixa de seleção.

      Essa coluna contém informações interessantes sobre os clientes que poderão ser usadas para clustering. Você a usará no primeiro modelo e vai ignorá-la no segundo.

    • OrderNumberSelecionar o chave caixa de seleção.

      Este campo será usado como o identificador da tabela de casos, ou chave. Em geral, você nunca deve usar o campo de chave da tabela de casos como uma entrada, já que a chave contém valores exclusivos que não são úteis para clustering.

    • RegiãoSelecionar o entrada caixa de seleção.

      Essa coluna contém informações interessantes sobre os clientes que poderão ser usadas para clustering. Você a usará no primeiro modelo e vai ignorá-la no segundo.

    • LineNumberSelecionar o chave e entrada caixas de seleção.

      O LineNumber campo será usado como o identificador para a tabela aninhada, ou sequência chave. A chave para uma tabela aninhada sempre deve ser usada como entrada.

    • ModeloSelecionar o entrada e previsível caixas de seleção.

    Verifique se as seleções estão corretas e, em seguida, clique em próxima.

  8. Sobre o colunas especificar conteúdo e tipo de dados página, verifique se a grade contém as colunas, tipos de conteúdo e tipos de dados mostrados na tabela a seguir e, em seguida, clique em próxima.

    Tabelas/Colunas Tipo de Conteúdo Tipo de Dados
    IncomeGroup Discreto Texto
    OrderNumber Chave Texto
    Região Discreto Texto
    vAssocSeqLineItems
    Número da Linha Key Sequence Longo
    Modelo Discreto Texto
  9. No Criar conjunto de testes página, altere o porcentagem de dados de teste a 20 e clique próxima.

  10. Sobre o Concluindo o assistente página, para o nome da estrutura de mineração, tipo Clustering de sequências com região.

  11. Para o nome do modelo de mineração, tipo Clustering de sequências com região.

  12. Verifique o Permitir drill-through caixa e, em seguida, clique em Concluir.

Próxima tarefa da lição

Processando o modelo de clustering de sequências

Consulte também

Designer de Mineração de Dados
Algoritmo MSC