Explorando o modelo de árvore de decisão (Tutorial de mineração de dados básico)

 

Publicado: dezembro de 2016

Aplicável a: SQL Server 2016 Preview

O algoritmo Árvores de Decisão da Microsoft prevê que colunas influenciam a decisão de compra de uma bicicleta com base nas colunas restantes do conjunto de treinamento.

O Microsoft Visualizador de árvore de decisão fornece as seguintes guias para explorar modelos de mineração de árvore de decisão:

Árvore de Decisão

Rede de Dependências

Guia Árvore de Decisão

Sobre o árvore de decisão guia, você pode exibir árvores de decisão para cada atributo previsível no conjunto de dados.

Nesse caso, o modelo prevê somente uma coluna, comprador de bicicleta, portanto, há apenas uma árvore para exibir. Se houver mais árvores, você pode usar o árvore caixa para escolher outra árvore.

Exibir o TM_Decision_Tree modelo no Visualizador de árvore de decisão, você pode ver os atributos mais importantes no lado esquerdo do gráfico. “Mais importantes” significa que esses atributos têm a maior influência sobre o resultado. Os atributos mais abaixo na árvore (à direita do gráfico) têm menos influência.

Neste exemplo, a idade é o fator mais importante na previsão da compra de bicicletas. O modelo agrupa os clientes por idade e depois mostra o próximo atributo mais importante de cada faixa etária. Por exemplo, no grupo de clientes com idades entre 34 e 40 anos, o número de carros é o fator de previsão mais importante depois da idade.

Para explorar o modelo na guia Árvore de Decisão

  1. Selecione o Visualizador do modelo de mineração guia Data Mining Designer.

    Por padrão, o designer abre o primeiro modelo que foi adicionado à estrutura-- nesse caso, TM_Decision_Tree.

  2. Use os botões de lente de aumento para ajustar o tamanho da exibição da árvore.

    Por padrão, o Visualizador de Árvore da Microsoft mostra somente os três primeiros níveis da árvore. Se a árvore tiver menos de três níveis, o visualizador mostrará só os níveis existentes. Você pode exibir mais níveis usando o Mostrar nível controle deslizante ou o expansão padrão lista.

  3. Deslize Mostrar nível até a quarta barra.

  4. Altere o valor de Plano de Fundo para 1.

    Alterando o fundo configuração, você pode ver rapidamente o número de casos em cada nó que tem o valor de destino 1 para [comprador de bicicleta]. Lembre-se de que neste cenário específico, cada caso representa um cliente. O valor 1 indica que o cliente tenha comprado uma bicicleta; o valor 0 indica que o cliente não comprou uma bicicleta. Quanto mais escuro for o sombreamento do nó, maior será a porcentagem de casos desse nó com o valor de destino.

  5. Coloque o cursor sobre o nó chamado todos os. Uma dica de ferramenta será exibida com as seguintes informações:

    • Número total de casos

    • Número de casos de pessoas que não compram bicicleta

    • Número de casos de compradores de bicicleta

    • Número de casos com valores ausentes para [Comprador de Bicicleta]

    Como alternativa, coloque o seu cursor sobre qualquer nó da árvore para ver a condição exigida para alcançar aquele nó a partir do nó anterior. Você também pode exibir essas informações no legenda de mineração.

  6. Clique no nó para idade > = 34 e 41 <. O histograma é exibido como uma barra horizontal final no nó e representa a distribuição de clientes nesse intervalo de idade que compraram (rosa) e que não compraram (azul) uma bicicleta anteriormente. O Visualizador nos mostra que os clientes entre os 34 e os 40 anos com um ou nenhum carro têm probabilidade de comprar uma bicicleta. Levando isso um pouco mais adiante, descobrimos que a probabilidade de compra de uma bicicleta aumenta caso o cliente tenha realmente entre 38 e 40 anos.

Como você habilitou o detalhamento quando criou a estrutura e o modelo, poderá recuperar informações detalhadas dos casos de modelo e da estrutura de mineração, incluindo as colunas não incluídas no modelo de mineração (por exemplo, emailAddress, FirstName).

Para obter mais informações, consulte Consultas de detalhamento (Mineração de dados).

Para detalhar os dados de caso

  1. Clique em um nó e selecione Detalhar em seguida, colunas do modelo somente.

    Os detalhes para cada caso de treinamento são exibidos em formato de planilha. Esses detalhes vêm da exibição vTargetMail, selecionada como a tabela de caso durante a criação da estrutura de mineração.

  2. Clique em um nó e selecione Detalhar em seguida, colunas do modelo e estrutura.

    A mesma planilha será exibida com as colunas da estrutura anexadas no final.

Voltar ao Início

Guia Rede de Dependências

O rede de dependência guia exibe as relações entre os atributos que contribuem para a capacidade de previsão do modelo de mineração. O visualizador Rede de Dependências reforça as nossas descobertas de que Idade e Região são fatores importantes na previsão de compra de bicicletas.

Para explorar o modelo na guia Rede de Dependências
  1. Clique o comprador de bicicleta nó para identificar suas dependências.

    O nó central para a rede de dependências, comprador de bicicleta, representa o atributo previsível no modelo de mineração. O gráfico destaca todos os nós conectados que têm um efeito sobre o atributo previsível.

  2. Ajustar o todos os Links controle deslizante para identificar o atributo mais influente.

    Enquanto você arrasta para baixo o controle deslizante, atributos que têm apenas um efeito menor na coluna [Bike Buyer] são removidos do gráfico. Ao ajustar o controle deslizante, você poderá descobrir que Idade e Região são os principais fatores para prever se alguém é um comprador de bicicletas.

Tarefas relacionadas

Consulte estes tópicos para explorar os dados usando outros tipos de modelos.

Próxima tarefa da lição

Explorando o modelo de Clustering e 40; Tutorial de mineração de dados básicos e 41;

Consulte também

Tarefas e instruções do visualizador do modelo de mineração
Guia Árvore de Decisão (Visualizador do Modelo de Mineração)
Guia Rede de Dependências (Visualizador do Modelo de Mineração)
Procurar um modelo usando a Exibição de Árvore da Microsoft