Explorando o modelo de call center (Tutorial de mineração de dados intermediário)

Artigo
11/01/2016

Aplicável a: SQL Server 2016 Preview

Agora que você criou o modelo exploratório, poderá usá-lo para saber mais sobre os dados utilizando as ferramentas a seguir fornecidas no SQL Server Data Tools (SSDT).

Visualizador de rede Neural da Microsoft**:** Este visualizador está disponível na Visualizador do modelo de mineração Guia do Designer de mineração de dados e foi projetado para ajudá-lo a testar as interações nos dados.
Microsoft genérico conteúdo Visualizador de árvore**:** Este visualizador padrão fornece detalhes sobre os padrões e estatísticas descobertos pelo algoritmo durante a geração do modelo.

Visualizador de Rede Neural da Microsoft

O visualizador possui três painéis — entrada, saída, e variáveis.

Usando o saída painel, você pode selecionar valores diferentes para o atributo previsível ou variável dependente. Se seu modelo contiver vários atributos previsíveis, você pode selecionar o atributo do atributo de saída lista.

O variáveis painel compara os dois resultados escolhidos em termos de atributos de colaboração ou variáveis. As barras coloridas representam visualmente com que intensidade a variável afeta os resultados de destino. Você também pode exibir pontuações de comparação de precisão para as variáveis. Uma pontuação de comparação de precisão é calculada de modo diferente de acordo com o tipo de modelo de mineração utilizado, mas geralmente informa o aperfeiçoamento no modelo durante o uso desse atributo para previsão.

O entrada painel permite adicionar influenciadores ao modelo para experimentar vários cenários hipotéticos.

Usando o painel Saída

Neste modelo inicial, você está interessado em verificar como vários fatores afetam a classificação do serviço. Para fazer isso, você pode selecionar o nível de serviço da lista de atributos de saída e compare diferentes níveis de serviço selecionando intervalos nas listas suspensas para valor 1 e valor 2.

Para comparar as classificações de serviço mais baixa e mais alta

Para valor 1, selecione o intervalo com os valores mais baixos. Por exemplo, o intervalo 0-0-0.7 representa as taxas de abandono mais baixas e, portanto, o melhor nível de serviço.

Dica

Os valores exatos nesse intervalo podem variar de acordo com a configuração do modelo.
Para valor 2, selecione o intervalo com os valores mais altos. Por exemplo, o intervalo com o valor >=0.12 representa as taxas de abandono mais altas e, portanto, a pior classificação de serviço. Em outras palavras, 12% dos clientes que telefonaram durante esse turno desligaram antes de falar com um atendente.

O conteúdo de variáveis painel são atualizados para comparar os atributos que contribuem para os valores de resultado. Assim, a coluna esquerda mostra os atributos associados à melhor classificação de serviço, e a coluna direita mostra o atributo associado à pior classificação do serviço.

Usando o painel Variáveis

Nesse modelo, parece que tempo médio por emissão é um fator importante. Essa variável indica o tempo médio necessário para que uma chamada seja atendida, independentemente do tipo de chamada.

Para exibir e copiar a probabilidade e as pontuações de comparação de precisão para um atributo

No variáveis painel, coloque o mouse sobre a barra colorida na primeira linha.

Essa barra colorida mostra a intensidade tempo médio por emissão colabora para o nível de serviço. A dica de ferramenta mostra uma pontuação geral, as probabilidades e as pontuações de comparação de precisão para cada combinação de uma variável e um resultado de destino.
No variáveis painel, clique com botão direito qualquer barra colorida e selecione cópia.
Em uma planilha do Excel, clique em qualquer célula e selecione Colar.

O relatório é colado como uma tabela HTML e mostra apenas as pontuações para cada barra.
Em outra planilha do Excel, clique em qualquer célula e selecione Colar especial.

O relatório é colado como formato de texto e inclui as estatísticas relacionadas descritas na próxima seção.

Usando o painel Entrada

Vamos supor que você esteja interessado em examinar o efeito de um determinado fator, como o turno ou o número de operadores. Você pode selecionar uma determinada variável usando o entrada painel e o variáveis painel é atualizado automaticamente para comparar os dois anteriormente grupos selecionados, dado que a variável especificada.

Para examinar o efeito na classificação de serviço alterando os atributos de entrada

No entrada painel, para atributo, selecione turno.
Para valor, selecione AM.

O variáveis painel é atualizado para mostrar o impacto no modelo quando o turno é AM. Todas as outras seleções permanecem iguais — você ainda está comparando as classificações de serviço mais altas e mais baixas.
Para valor, selecione PM1.

O variáveis painel é atualizado para mostrar o impacto no modelo quando o turno é alterado.
No entrada painel, clique na próxima linha em branco sob atributo, e selecione chamadas. Para valor, selecione o intervalo que indica o número máximo de chamadas.

Uma nova condição de entrada é adicionada à lista. O variáveis painel é atualizado para mostrar o impacto sobre o modelo de um determinado turno quando o volume de chamada é mais alto.
Continue para alterar os valores para Turno e Chamadas de modo a encontrar correlações interessantes entre o turno, o volume de chamadas e a classificação do serviço.

Dica

Para limpar o entrada painel para que você possa usar atributos diferentes, clique em Atualizar conteúdo do visualizador.

Interpretando as estatísticas fornecidas no visualizador

Tempos de espera mais longos constituem um fator importante para uma taxa de abandono alta, indicando uma classificação de serviço mais fraca. Essa pode ser considerada uma conclusão óbvia; no entanto, o modelo de mineração fornece mais alguns dados estatísticos adicionais para ajudar a interpretar essas tendências.

Pontuação: valor que indica a importância geral dessa variável para Discriminar entre os resultados. Quanto mais alta for a pontuação, maior o efeito da variável no resultado.
Probabilidade de valor 1: porcentagem que representa a probabilidade desse valor para esse resultado.
Probabilidade do valor 2: porcentagem que representa a probabilidade desse valor para esse resultado.
Comparação de precisão para o valor 1 e de comparação de precisão para o valor 2: pontuações que representam o impacto de usar essa variável em particular para prever os resultados do valor 1 e 2 do valor. Quanto mais alta for a pontuação, melhor será a variável para prever os resultados.

A tabela a seguir contém alguns valores de exemplo para os influenciadores principais. Por exemplo, o probabilidade do valor 1 é 60,6% e probabilidade do valor 2 é 8,30%, que significa que quando o tempo médio por emissão estava no intervalo de 44-70 minutos, 60,6% dos casos ocorreram no turno com os mais altos níveis de serviço (valor 1), e 8,30% dos casos ocorreram no turno com as piores classificações de serviço (valor 2).

Com base nessas informações, é possível estabelecer algumas conclusões. O menor tempo de resposta para chamada (o intervalo de 44-70) influencia fortemente a melhor classificação do serviço (o intervalo 0,00-0,07). A pontuação (92,35) informa que essa variável é muito importante.

Entretanto, à medida que você examina a lista de fatores contribuintes, percebe alguns outros fatores Por exemplo, o turno parece influenciar o serviço, mas as pontuações de comparação de precisão e as probabilidades relativas indicam que o turno não é um fator preponderante.

Atributo	Value	Favorece < 0,07	Favorece >= 0,12
Tempo médio por emissão	89.087 - 120.000		Pontuação: 100 Probabilidade de valor1: 4,45% Probabilidade de Value2: % 51.94 Comparação de precisão para Value1: 0,19 Comparação de precisão para Value2: 1,94
Tempo médio por emissão	44.000 - 70.597	Pontuação: 92,35 Probabilidade do Valor 1: 60,06 % Probabilidade do Valor 2: 8,30 % Comparação de Precisão para o Valor 1: 2,61 Comparação de Precisão para o Valor 2: 0,31

Voltar ao Início

Visualizador de Árvore de Conteúdo Genérica da Microsoft

Este visualizador pode ser usado para exibir informações ainda mais detalhadas criadas pelo algoritmo durante o processamento do modelo. O Visualizador de árvore de conteúdo MicrosoftGeneric representa o modelo de mineração como uma série de nós, no qual cada nó representa conhecimento adquirido sobre os dados de treinamento. Esse visualizador pode ser usado com todos os modelos, mas o conteúdo dos nós é diferente de acordo com o tipo de modelo.

Para modelos de rede neural ou Regressão logística, você pode encontrar o nó de estatísticas marginais particularmente útil. Esse nó contém estatísticas derivadas sobre a distribuição de valores nos dados. Essas informações poderão ser úteis se você quiser obter um resumo dos dados sem escrever muitas consultas T-SQL. O gráfico de valores de compartimento no tópico anterior foi derivado do nó de estatísticas marginais.

Para obter um resumo dos valores de dados do modelo de mineração

No Designer de mineração de dados no Visualizador do modelo de mineração Selecione .
Do Visualizador lista, selecione Microsoft genérico conteúdo Visualizador de árvore.

A exibição do modelo de mineração é atualizada para mostrar uma hierarquia de nós no painel esquerdo e uma tabela HTML no painel direito.
No legenda de nó painel, clique no nó que tem o nome 10000000000000000.

O nó na extremidade superior em qualquer modelo sempre é o nó raiz do modelo. Em um modelo de rede neural ou de regressão logística, o nó imediatamente sob esse é o nó de estatísticas marginais.
No detalhes do nó painel, role para baixo até encontrar a linha NODE_DISTRIBUTION.
Role para baixo pela tabela NODE_DISTRIBUTION para exibir a distribuição de valores conforme calculados pelo algoritmo de rede neural.

Para usar esses dados em um relatório, selecione e copie as informações para linhas específicas ou use a consulta DMX a seguir para extrair todo o conteúdo do nó.

SELECT *   
FROM [Call Center EQ4].CONTENT  
WHERE NODE_NAME = '10000000000000000'

Também é possível usar a hierarquia de nós e os detalhes na tabela NODE_DISTRIBUTION para desviar caminhos individuais na rede neural e exibir estatísticas da camada oculta. Para obter mais informações, consulte exemplos de consulta de modelo de rede Neural.