Criando previsões em um modelo de cluster de sequências (Tutorial de mineração de dados intermediário)

Artigo
03/03/2017

Publicado: dezembro de 2016

Aplicável a: SQL Server 2016 Preview

Depois de entender o melhor modelo msc ao navegar por ele no visualizador, você pode criar consultas de previsão usando o construtor de consultas de previsão no previsão do modelo de mineração guia no Designer de mineração de dados. Para criar uma previsão, primeiro selecione o modelo de clustering de sequências e selecione os dados de entrada. Para entradas, use uma fonte de dados externa ou crie uma consulta singleton e forneça valores em uma caixa de diálogo.

Esta lição supõe que você já saiba usar o construtor de consultas de previsão e que deseja aprender a criar consultas específicas de um modelo de clustering de sequências. Para obter informações gerais sobre como usar o construtor de consultas de previsão, consulte Ferramentas de consulta de mineração de dados ou na seção do tutorial de mineração de dados básicos, criar previsões e 40; Tutorial de mineração de dados básicos e 41;.

Criando previsões em um modelo regional

Para este cenário, primeiro você criará algumas consultas de previsão singleton, para ter uma ideia de como as previsões podem variar por região.

Para criar uma consulta de previsão singleton em um modelo de clustering de sequências

Clique o previsão do modelo de mineração Guia do Designer de mineração de dados.
No modelo de mineração menu da coluna, selecione consulta Singleton.

O modelo de mineração painel e entrada de consulta Singleton painel exibido.
No modelo de mineração painel, clique em Selecionar modelo. (se o modo de clustering de sequências já tiver sido selecionado, você poderá ignorar esta etapa).

O Selecionar modelo de mineração caixa de diálogo é aberta.
Expanda o nó que representa a estrutura de mineração Clustering de sequências com região, e selecione o modelo Clustering de sequências com região. Clique em OK. Por ora, ignore o painel de entrada; você especificará as entradas depois de configurar as funções de previsão.
Na grade, clique na célula vazia em fonte e selecione função de previsão. Na célula sob campo, selecione PredictSequence.

Dica

Você também pode usar o Predict função. Nesse caso, não se esqueça de escolher a versão do Predict função que usa uma coluna de tabela como argumento.
No modelo de mineração painel, selecione a tabela aninhada v Assoc Seq Line Items, e arraste-a para a grade, até o critérios/argumento caixa a PredictSequence função.

Arrastar e soltar nomes de tabela e coluna permite que você crie instruções complexas sem erros de sintaxe. No entanto, ele substitui o conteúdo atual da célula, o que inclui outros argumentos opcionais para o PredictSequence função. Para exibir os outros argumentos, você pode adicionar temporariamente uma segunda instância da função à grade para referência.
Clique o resultado botão no canto superior do construtor de consultas de previsão.

Os resultados esperados contêm uma única coluna com o título expressão. O expressão coluna contém uma tabela aninhada com três colunas da seguinte maneira:

$SEQUENCE	Número da Linha	Modelo
1		Mountain-200

O que significam esses resultados? Lembre-se de que você não especificou entradas. Dessa forma, a previsão é feita em relação à toda a população de casos, e o Analysis Services retorna a previsão geral mais provável.

Adicionando entradas a uma consulta de previsão singleton

Até agora, você não especificou entradas. A próxima tarefa, você usará o entrada de consulta Singleton painel para especificar algumas entradas à consulta. Primeiro, use [Região] como uma entrada do modelo de clustering de sequências regional para determinar se as sequências previstas são iguais para todas as regiões. Assim, você aprenderá a modificar a consulta para adicionar a probabilidade de cada previsão e mesclar os resultados para facilitar sua exibição.

Para gerar previsões para um grupo de clientes específico

Clique o Design botão no canto superior esquerdo do construtor de consultas de previsão para voltar à grade de criação de consultas.
No entrada de consulta Singleton caixa de diálogo, clique o valor caixa região, e selecione Europa.
Clique o resultado botão para exibir as previsões para clientes na Europa.
Clique o Design botão no canto superior esquerdo do construtor de consultas de previsão para voltar à grade de criação de consultas.
No entrada de consulta Singleton caixa de diálogo, clique o valor caixa região, e selecione América do Norte.
Clique o resultado botão para exibir as previsões para clientes na América do Norte.

Adicionando probabilidades usando uma expressão personalizada

Gerar a probabilidade de cada previsão é ligeiramente mais complicado, já que a probabilidade é um atributo da previsão e é gerada como uma tabela aninhada. Se você já conhece DMX (Data Mining Extensions), poderá alterar com facilidade a consulta e adicionar uma instrução de subseleção na tabela aninhada. No entanto, você também poderá criar uma instrução de subseleção no Construtor de Consultas de Previsão ao adicionar uma expressão personalizada.

Para gerar probabilidades para uma sequência prevista usando uma expressão personalizada

Clique o Design botão no canto superior esquerdo do construtor de consultas de previsão para voltar à grade de criação de consultas.
Na grade, em fonte, clique em uma nova linha e selecione expressão personalizada.
Deixe a caixa em campo em branco.
Para Alias, tipo t.
No critérios/argumento digite a instrução de Subseleção completa, conforme mostrado no exemplo de código a seguir. Não se esqueça de incluir os parênteses inicial e final.
```
(SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))  
```
Clique o resultado botão para exibir as previsões para clientes na Europa.

Agora, os resultados contêm duas tabelas aninhadas, uma com a previsão e outra com a probabilidade da previsão. Se a consulta não funcionar, você poderá alternar para o modo de design e examinar a instrução completa da consulta, que deve ser assim:

SELECT  
  PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]),  
  ( (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))) as [t]  
FROM  
  [Sequence Clustering with Region]  
NATURAL PREDICTION JOIN  
(SELECT 'Europe' AS [Region]) AS t

Trabalhando com resultados

Quando houver muitas tabelas aninhadas nos resultados, talvez seja melhor mesclá-los para obter uma exibição melhor. Para fazer isso, você pode manualmente modifique a consulta e adicione o NIVELADO palavra-chave.

Para mesclar conjuntos de linhas aninhadas em uma consulta de previsão

Clique o consulta botão no canto do construtor de consultas de previsão.

A grade se transformará em um painel aberto, onde você poderá exibir e modificar a instrução DMX criada pelo Construtor de Consultas de Previsão.

Após o Selecione palavra-chave, digite NIVELADO.

O texto completo da consulta deve ser similar ao seguinte:

SELECT FLATTENED  
  PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]),  
  ( (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))) as [t]  
FROM  
  [Sequence Clustering with Region]  
NATURAL PREDICTION JOIN  
(SELECT 'Europe' AS [Region]) AS t

Clique o resultados botão no canto superior do construtor de consultas de previsão.

Depois de editar manualmente uma consulta, você não conseguirá voltar ao modo Design sem perder as alterações. No entanto, é possível salvar a instrução DMX criada manualmente em um arquivo de texto e então voltar para o modo Design. Quando você fizer isso, a consulta será revertida para a última versão válida do modo Design.

Criando previsões em um modelo relacionado

Os exemplos anteriores usaram uma coluna da tabela de casos, Região, como a entrada da consulta de previsão singleton, porque você estava interessado em saber se o modelo encontrou diferenças entre regiões. No entanto, depois de explorar o modelo, você decidiu que as diferenças não são significativas o suficiente para justificar recomendações de personalização de produtos por região. O que realmente interessa a você na previsão são os itens selecionados pelos clientes. Dessa forma, nas consultas a seguir, você usará o modelo de clustering de sequências que não inclui Região para gerar recomendações para todos os clientes.

Usando colunas da tabela aninhada como entrada

Primeiro, você criará uma consulta de previsão singleton que obtém um único item como entrada e retorna o próximo item mais provável. Para obter uma previsão desse tipo, use uma coluna de tabela aninhada como o valor de entrada. Isso acontece porque o atributo que está sendo previsto, Modelo, faz parte de uma tabela aninhada. O Analysis Services fornece a entrada de tabela aninhada caixa de diálogo para ajudá-lo a facilmente criar consultas de previsão aninhada atributos de tabela, usando o construtor de consultas de previsão.

Para usar uma tabela aninhada como entrada para uma previsão

Clique o Design botão no canto superior esquerdo do construtor de consultas de previsão para voltar à grade de criação de consultas.
No entrada de consulta Singleton caixa de diálogo, clique o valor caixa região, e selecione a linha vazia para limpar a entrada para esse campo.
No entrada de consulta Singleton caixa de diálogo, clique o valor caixa vAssocSeqLineItems, e então clique no botão (...).
No entrada de tabela aninhada caixa de diálogo, clique em Add.
Na nova linha, clique na caixa em modelo, e selecione pneu de passeio na lista. Clique em OK.
Clique o resultado botão para exibir as previsões.

O modelo recomenda os itens a seguir para todos os clientes que escolherem Pneu de Passeio como o primeiro item. Você já sabe, pela exploração do modelo, que os clientes frequentemente compram os produtos Pneu de Passeio e Tubo de Pneu para Passeio juntos e, portanto, essas recomendações parecem boas.

$SEQUENCE	Número da Linha	Modelo
1		Tubo de pneu para passeio
2		Sport-100
3		Jersey Logo de manga longa

Criando uma consulta de previsão em massa usando entradas de tabela aninhada

Agora que você já está satisfeito com o modelo que cria o tipo de previsões que poderão ser usadas em recomendações, crie uma consulta de previsão mapeada para uma fonte de dados externa. Essa fonte de dados fornecerá valores que representam produtos atuais. Como você está interessado na criação de uma consulta de previsão que ofereça ID do Cliente e uma lista de produtos como entrada, adicione a tabela de clientes como uma tabela de caso e a tabela de compras como a tabela aninhada. Em seguida, adicione funções de previsão, como feito anteriormente, para criar recomendações.

Esse procedimento é igual ao usado na criação de previsões para o cenário de cesta de compras da Lição 3; no entanto, em um modelo de clustering de sequências, as previsões também precisam do pedido como entrada.

Para criar uma consulta de previsão usando entradas de tabela aninhada

No modelo de mineração painel, selecione o modelo Clustering de sequências, se não ainda estiver selecionada.
No Selecionar tabela (s) de entrada caixa de diálogo, clique em Selecionar tabela de casos.
No Selecionar tabela caixa de diálogo fonte de dados, selecione pedidos. No nome de tabela/exibição lista, selecione vAssocSeqOrders e, em seguida, clique em OK.
No Selecionar tabela (s) de entrada caixa de diálogo, clique em Selecionar tabela aninhada.
No Selecionar tabela caixa de diálogo para fonte de dados, selecione Orders. No nome de tabela/exibição lista, selecione vAssocSeqLineItems e, em seguida, clique em OK.

O Analysis Services tentará detectar relacionamentos e os criará automaticamente, caso os tipos de dados forem iguais e se os nomes de colunas forem similares. Se os relacionamentos criados estiverem incorretos, você pode clique com botão direito na linha de associação e selecionar modificar conexões para editar a coluna de mapeamento, ou com o botão direito na linha de associação e selecione Excluir para remover completamente o relacionamento. Nesse caso, como as tabelas já foram unidas na exibição da fonte de dados, esses relacionamentos serão automaticamente adicionados ao painel de design.
Adicione uma nova linha à grade. Para fonte, selecione vAssocSeqOrders e campo, selecione CustomerKey.
Adicione uma nova linha à grade. Para fonte, selecione função de previsão, e campo, selecione PredictSequence.
Arraste vAssocSeqLineItems até o critérios/argumento caixa. Clique no final o critérios/argumento caixa e, em seguida, digite os argumentos a seguir: 2.

O texto completo no critérios/argumento caixa deve ser: [Sequence Clustering].[v Assoc Seq Line Items],2
Clique o resultado botão para exibir as previsões para cada cliente.

Você concluiu o tutorial sobre modelos de clustering de sequências.

Próximas etapas

Se você concluiu todas as seções de Tutorial de mineração de dados intermediário & #40. Analysis Services – Data Mining e 41;, a próxima etapa será aprender a usar instruções de Data Mining Extensions (DMX) para criar modelos e gerar previsões. Para obter mais informações, consulte Criando e consultando modelos de mineração de dados com DMX: tutoriais & #40. Analysis Services – Data Mining e 41;.

Se você já conhece conceitos de programação, também poderá usar Objetos de Gerenciamento de Análise (AMO) para começar a trabalhar com objetos de mineração de dados programaticamente. Para obter mais informações, consulte Classes de mineração de dados AMO.

Consulte também

Exemplos de consulta de um modelo de clustering de sequências
Conteúdo do modelo de mineração para modelos de clustering de sequência (Analysis Services – Data Mining)

Share via