Share via


Explorando o modelo Naive Bayes (Tutorial de mineração de dados básico)

O algoritmo Microsoft Naive Bayes oferece diversos métodos para a exibição da interação entre a compra de bicicleta e os atributos de entrada.

O Visualizador do Microsoft Naive Bayes oferece as seguintes guias a serem usadas ao explorar modelos de mineração Naive Bayes:

Rede de Dependências

Perfis de Atributo

Características do Atributo

Discriminação de Atributo

As seções a seguir descrevem como explorar os outros modelos de mineração.

Rede de Dependências

A guia Rede de Dependências funciona como a guia Rede de Dependências para o Visualizador de Árvore da Microsoft. Cada nó no visualizador representa um atributo e as linhas entre os nós representam as relações. No visualizador, é possível ver todos os atributos que afetam o estado do atributo de previsão, Bike Buyer.

Para explorar o modelo na guia Rede de Dependências

  1. Use a lista Modelo de Mineração na parte superior da guia Visualizador do Modelo de Mineração para alternar para o modelo TM_NaiveBayes.

  2. Use a lista Visualizador para alternar para o Visualizador Microsoft Naive Bayes.

  3. Clique no nó Comprador de Bicicleta para identificar suas dependências.

    O sombreamento rosa indica que todos os atributos influenciam a compra de bicicletas.

  4. Ajuste o controle deslizante para identificar o atributo mais influente.

    À medida que você abaixa o controle deslizante, apenas os atributos com o efeito maior sobre a coluna [Bike Buyer] permanecem. Ao ajustar o controle deslizante, você poderá descobrir que alguns dos atributos mais influentes são: o número de carros, a distância do trabalho e o número total de filhos.

Voltar ao início

Perfis de Atributo

A guia Perfis de Atributo descreve como os estados diferentes dos atributos de entrada afetam o resultado do atributo de previsão.

Para explorar o modelo na guia Perfis de Atributo

  1. Na caixa Previsível, verifique se Comprador de Bicicletas é selecionado.

  2. Se a Legenda de Mineração estiver bloqueando a exibição dos Perfis de atributo, tire-a do caminho.

  3. Na caixa de barras Histograma, selecione 5.

    Em nosso modelo, 5 é o número máximo de estados para qualquer variável.

    Os atributos que afetam o estado desse atributo previsível estão listados juntos com os valores de cada estado dos atributos de entrada e suas distribuições em cada estado do atributo previsível.

  4. Na coluna Atributos, localize Número de Carros. Observe as diferenças nos histogramas de compradores de bicicleta (coluna rotulada 1) e não compradores de bicicleta (coluna rotulada 0). Uma pessoa com nenhum ou com um carro tem muito mais probabilidade de comprar uma bicicleta.

  5. Clique duas vezes na célula Número de Carros da coluna comprador de bicicleta (coluna rotulada 1).

    A Legenda de Mineração mostra uma exibição mais detalhada.

Voltar ao início

Características do Atributo

Com a guia Características do Atributo, você pode selecionar um atributo e valor para ver a frequência com que os valores aparecem para outros atributos nos casos do valor selecionados.

Para explorar o modelo na guia Características do Atributo

  1. Na lista Atributo, verifique se Comprador de Bicicleta está selecionado.

  2. Defina o Valor como 1.

    No visualizador, você verá que clientes sem filhos em casa, com pequenas distâncias até o trabalho e que moram na região da América do Norte têm mais probabilidade de comprarem uma bicicleta.

Voltar ao início

Distinção de Atributo

Com a guia Distinção de Atributo, você pode investigar a relação entre dois valores discretos de compra de bicicleta e de outros valores de atributo. Uma vez que o modelo TM_NaiveBayes tem apenas dois estados, 1 e 0, você não precisará fazer quaisquer alterações para o visualizador.

No visualizador, você pode ver que as pessoas que não têm carro tendem a comprar bicicletas, e que as pessoas que têm dois carros tendem a não comprar bicicletas.