Criando uma estrutura de modelo de mineração de mala direta (Tutorial de mineração de dados básico)

 

Publicado: dezembro de 2016

Aplicável a: SQL Server 2016 Preview

A primeira etapa para criar um cenário de correspondência destinada é usar o Assistente de Mineração de Dados no SQL Server Data Tools (SSDT) para criar uma nova estrutura de mineração e um modelo de mineração de árvore de decisão.

Nesta tarefa você configurar uma nova estrutura de mineração e adicionar um modelo de mineração inicial com base no Microsoft algoritmo árvores de decisão. Para criar a estrutura, primeiro você selecionará tabelas e exibições e depois identificará as colunas que serão usadas no treinamento e as que serão usadas para teste.

Para criar uma estrutura de mineração para o cenário de mala direta

  1. No Solution Explorer, clique com botão direito estruturas de mineração e selecione nova estrutura de mineração para iniciar o Assistente de mineração de dados.

  2. Na página Bem-vindo ao Assistente de Mineração de Dados , clique em Avançar.

  3. No Selecionar método de definição Verifique de warehouse existente de banco de dados ou dados relacional está selecionado e, em seguida, clique em próxima.

  4. Sobre o criar a estrutura de mineração de dados página em qual técnica de mineração de dados você deseja usar?, selecione Microsoft Decision Trees.

    Dica


    Se você receber um aviso de que não é possível encontrar nenhum algoritmo de mineração de dados, as propriedades do projeto talvez não sejam configuradas corretamente. Esse aviso ocorre quando o projeto tenta recuperar uma lista de algoritmos de mineração de dados do servidor do Analysis Services e não consegue encontrá-lo. Por padrão, SQL Server Data Tools usará localhost como o servidor. Se você estiver usando uma instância diferente ou uma instância nomeada, altere as propriedades do projeto. Para obter mais informações, consulte Criando um projeto do Analysis Services e 40; Tutorial de mineração de dados básicos e 41;.

  5. Clique em Avançar.

  6. No Selecionar exibição da fonte de dados página, o modos de exibição de fonte de dados disponíveis painel, selecione mala. Você pode clicar em Procurar para exibir as tabelas na exibição da fonte de dados e, em seguida, clique em Fechar para retornar ao assistente.

  7. Clique em Avançar.

  8. No especificar tipos de tabela marque a caixa de seleção o caso coluna para vTargetMail para usá-lo como a tabela de casos e, em seguida, clique em próxima. Você usará a tabela ProspectiveBuyer posteriormente para testes; ignore-a por enquanto.

  9. Sobre o especificar os dados de treinamento página, você identificará pelo menos uma coluna previsível, uma coluna de chave e uma coluna de entrada para seu modelo. Marque a caixa de seleção no previsível coluna o BikeBuyer linha.

    Dica


    Observe o aviso na parte inferior da janela. Você não poderá navegar para a próxima página até selecionar pelo menos um entrada um previsível coluna.

  10. Clique em sugerir para abrir o sugerir colunas relacionadas caixa de diálogo.

    O sugerir botão é ativado sempre que pelo menos um atributo previsível foi selecionado. O sugerir colunas relacionadas caixa de diálogo lista as colunas que estão mais relacionadas à coluna previsível e classifica os atributos pela correlação com o atributo previsível. As colunas com uma correlação significativa (confiança acima de 95%) são selecionadas automaticamente para serem incluídas no modelo.

    Examine as sugestões e, em seguida, clique em Cancelar toignore as sugestões.

    Dica


    Se você clicar em OK, listado todas as sugestões serão marcadas como colunas de entrada no assistente. Se você concordar com apenas algumas das sugestões, deverá alterar os valores manualmente.

  11. Verifique a caixa de seleção no chave coluna for selecionada no CustomerKey linha.

    Dica


    Se a tabela de origem na exibição de fonte de dados indicar uma chave, o Assistente de Mineração de Dados escolherá automaticamente essa coluna como uma chave para o modelo.

  12. Marque as caixas de seleção de entrada coluna nas linhas a seguir. Você pode marcar várias colunas ao realçar um intervalo de células e pressionar CTRL durante a marcação de uma caixa de seleção.

    • Idade

    • CommuteDistance

    • EnglishEducation

    • EnglishOccupation

    • Gênero

    • GeographyKey

    • HouseOwnerFlag

    • MaritalStatus

    • NumberCarsOwned

    • NumberChildrenAtHome

    • Região

    • TotalChildren

    • YearlyIncome

  13. Na coluna mais à esquerda da página, marque as caixas de seleção nas linhas a seguir.

    • AddressLine1

    • AddressLine2

    • DateFirstPurchase

    • EmailAddress

    • FirstName

    • LastName

    Verifique se essas linhas só possuem marcações na coluna à esquerda. Essas colunas serão adicionadas à sua estrutura mas não serão incluídas no modelo. No entanto, depois que o modelo for criado, elas estarão disponíveis para detalhamento e teste. Para obter mais informações sobre detalhamento, consulte consultas de detalhamento &40; mineração de dados &41;

  14. Clique em Avançar.

Próxima tarefa da lição

Especificando o tipo de dados e o tipo de conteúdo e 40; Tutorial de mineração de dados básicos e 41;

Consulte também

Especificar tipos de tabelas (Assistente de Mineração de Dados)
Designer de Mineração de Dados
Algoritmo Árvores de Decisão da Microsoft