Explorando o modelo de clustering (Tutorial de mineração de dados básico)

 

Publicado: dezembro de 2016

Aplicável a: SQL Server 2016 Preview

O Microsoft algoritmo Clustering agrupa casos em clusters que contenham características semelhantes. Esses agrupamentos são úteis para explorar dados, identificando anomalias nos dados e criar previsões.

O Visualizador de Cluster da Microsoft fornece as seguintes guias para serem usadas na exploração de modelos de mineração de cluster:

Diagrama de Cluster

Perfis de Cluster

Características do Cluster

Discriminação do Cluster

Guia Diagrama de Cluster

A guia Diagrama de Cluster exibe todos os clusters existentes em um modelo de mineração. As linhas entre os clusters representam "proximidade" e estão sombreadas com base no grau de semelhança que os clusters têm. A cor real de cada cluster representa a frequência da variável e o estado no cluster.

Para explorar o modelo na guia Diagrama de Cluster

  1. Use o modelo de mineração lista na parte superior do Visualizador do modelo de mineração tab para alternar para o TM_Clustering modelo.

  2. No Visualizador lista, selecione Visualizador de Cluster da Microsoft.

  3. No variável de sombreamento Selecione comprador de bicicleta.

    A variável padrão é população, mas você pode alterar isso para qualquer atributo no modelo, para descobrir quais clusters contêm membros que têm os atributos desejados.

  4. Selecione 1 no estado caixa para explorar os casos em que uma bicicleta foi comprada.

    O densidade legenda descreve a densidade do par de estado de atributo selecionado na variável de sombreamento e o estado. Neste exemplo ele informa que o clusterwith o sombreamento mais escuro tem a maior porcentagem de compradores de bicicleta.

  5. Coloque o seu mouse sobre o cluster com o sombreamento mais escuro.

    Uma dica de ferramenta exibe a porcentagem de casos que têm o atributo comprador de bicicleta = 1.

  6. Selecione o cluster que tem a mais alta densidade, com o botão direito no cluster, selecione Renomear Cluster e digite altos compradores de bicicleta para identificação posterior. Clique em OK.

  7. Localize o cluster com o sombreamento mais claro (e a menor densidade). Clique com botão direito no cluster, selecione Renomear Cluster e digite baixos compradores de bicicleta. Clique em OK.

  8. Clique o altos compradores de bicicleta de cluster e arraste-o para uma área do painel que lhe dará uma visão clara de suas conexões com os outros clusters.

    Quando você seleciona um cluster, as linhas que conectam esse cluster a outros são realçadas para que você possa facilmente ver todas as relações desse cluster. Quando o cluster não estiver selecionado, você poderá dizer pela escuridão das linhas o grau de importância das relações entre todos os clusters do diagrama. Um sombreamento claro ou a ausência dele indica que os clusters não são muito parecidos.

  9. Use o controle deslizante à esquerda da rede para filtrar os links menos importantes e encontrar os clusters com relações mais próximas. O departamento de marketing da Ciclos da Adventure Works pode querer combinar clusters similares na determinação do melhor método de entrega da mala direta.

Voltar ao Início

Guia Perfis de Cluster

O perfis de Cluster guia fornece uma visão geral do TM_Clustering modelo. O perfis de Cluster guia contém uma coluna para cada cluster no modelo. A primeira coluna listas os atributos associados a pelo menos um cluster. O resto do visualizador contém a distribuição dos estados de um atributo para cada cluster. A distribuição de uma variável discreta é mostrada como uma barra colorida com o número máximo de barras exibidas no barras de histograma lista. São exibidos atributos contínuos com um gráfico de diamante que representa o desvio médio e padrão em cada cluster.

Para explorar o modelo na guia Perfis de Cluster

  1. Definir histograma barras para 5.

    Em nosso modelo, 5 é o número máximo de estados para qualquer variável.

  2. Se o legenda de mineração bloqueia a exibição do perfis de atributo, movê-lo fora do caminho.

  3. Selecione o altos compradores de bicicleta coluna e arraste-o à direita do população coluna.

  4. Selecione o baixos compradores de bicicleta coluna e arraste-o à direita do altos compradores de bicicleta coluna.

  5. Clique o altos compradores de bicicleta coluna.

    O variáveis coluna está classificada em ordem de importância para esse cluster. Navegue pela coluna e examine as características do cluster Altos Compradores de Bicicleta. Por exemplo, é mais provável que eles tenham um caminho curto para o trabalho.

  6. Clique duas vezes o idade célula a altos compradores de bicicleta coluna.

    O legenda de mineração exibe mais detalhadas exibição e você pode ver o intervalo de idade desses clientes, bem como a idade média.

  7. Clique com botão direito do baixos compradores de bicicleta coluna e selecione Ocultar coluna.

Voltar ao Início

Guia Características do Cluster

Com o características do Cluster guia, você pode examinar mais detalhadamente as características que compõem um cluster. Em vez de comparar as características de todos os clusters (como na guia Perfis de Cluster), você pode explorar um cluster por vez. Por exemplo, se você selecionar altos compradores de bicicleta do Cluster lista, você pode ver as características dos clientes neste cluster. Embora a exibição seja diferente do visualizador Perfis de Cluster, as informações são as mesmas.

Dica


A menos que você defina um valor inicial para holdoutseed, resultados irão variar sempre que você processar o modelo. Para obter mais informações, consulte elemento HoldoutSeed

Voltar ao Início

Guia Distinção de Cluster

Com o distinção de Cluster guia, você pode explorar as características que distinguem um cluster de outro. Depois de selecionar dois clusters, junto a Cluster 1 lista e uma do Cluster 2 lista, o visualizador calculará as diferenças entre os clusters e exibe uma lista dos atributos que distinguem os clusters.

Para explorar o modelo na guia Distinção de Cluster

  1. No Cluster 1 Selecione altos compradores de bicicleta.

  2. No Cluster 2 Selecione baixos compradores de bicicleta.

  3. Clique em variáveis Classificar em ordem alfabética.

    Algumas das diferenças mais significativas entre os clientes a baixos compradores de bicicleta e altos compradores de bicicleta clusters incluem idade, propriedade de carros, número de filhos e região.

Tarefas relacionadas

Consulte os tópicos a seguir para explorar os outros modelos de mineração.

Próxima tarefa da lição

Explorando o modelo Naive Bayes & #40. Tutorial de mineração de dados básicos e 41;

Tarefa anterior da lição

Explorando o modelo de árvore de decisão e 40; Tutorial de mineração de dados básicos e 41;

Consulte também

Procurar um modelo usando o Visualizador de Cluster da Microsoft
Guia Discriminação de Cluster (Visualizador do Modelo de Mineração)
Guia Perfis de Cluster (Visualizador do Modelo de Mineração)
Guia Características do Cluster (Visualizador do Modelo de Mineração)
Guia Diagrama de Cluster (Visualizador do Modelo de Mineração)