Personalizando e processando o modelo de previsão (Tutorial de mineração de dados intermediário)

 

Publicado: dezembro de 2016

Aplicável a: SQL Server 2016 Preview

O algoritmo MTS da Microsoft oferece vários parâmetros que afetam o modo como um modelo é criado e como os dados de tempo são analisados. Alterar essas propriedades pode afetar significativamente a forma como o modelo de mineração faz previsões.

Para esta tarefa do tutorial, você executará as seguintes tarefas para modificar o modelo:

  1. Você irá personalizar a forma como seu modelo trata os períodos de tempo, adicionando um novo valor para o PERIODICITY_HINT parâmetro.

  2. Você aprenderá dois outros parâmetros importantes para o algoritmo MTS: FORECAST_METHOD, que permite controlar o método usado na previsão, e PREDICTION_SMOOTHING, que permite personalizar a combinação de previsões de longo prazo e de curto prazo.

  3. Opcionalmente, você dirá ao algoritmo como deseja inserir os valores ausentes.

  4. Depois de fazer todas as alterações, você implantará e processará o modelo.

Definindo os parâmetros de série temporal

Dicas de periodicidade

O PERIODICITY_HINT parâmetro fornece o algoritmo com informações sobre períodos de tempo adicionais que você espera ver nos dados. Por padrão, os modelos de série temporal tentarão detectar automaticamente um padrão nos dados. Porém, se você já souber o ciclo de tempo esperado, fornecer uma dica de periodicidade poderá melhorar a exatidão do modelo. No entanto, se você fornecer a dica de periodicidade errada, poderá diminuir exatidão; portanto, se você não souber ao certo que valor deve ser usado, é melhor usar o padrão.

Por exemplo, a exibição usada neste modelo agrega dados de vendas de Adventure Works DW Multidimensional 2012 mensalmente. Portanto, cada intervalo de tempo usado pelo modelo representa um mês, e todas as previsões também estarão em meses. Como há 12 meses em um ano e você espera que padrões de vendas mais ou menos repetir anualmente, você definirá o PERIODICITY_HINT parâmetro 12, para indicar que 12 intervalos de tempo (meses) constituem um ciclo completo de vendas.

Método de previsão

O FORECAST_METHOD parâmetro controla se o algoritmo de série temporal está otimizado para previsões a curto ou longo prazo. Por padrão, o FORECAST_METHOD parâmetro for definido como MIXED, o que significa que dois algoritmos diferentes são combinados e equilibrados para oferecer bons resultados de previsão de curto e longo prazo.

Entretanto, se você quiser usar um algoritmo específico, poderá altera o valor para ARIMA ou ARTXP.

Ponderando previsões de longo prazo contra previsões de curto prazo

Você também pode personalizar a forma como as previsões de longo prazo e de curto prazo são combinadas usando o parâmetro PREDICTION_SMOOTHING. Por padrão, esse parâmetro é definido como 0,5, o que geralmente oferece o melhor equilíbrio para a precisão geral.

Para alterar parâmetros do algoritmo

  1. Sobre o modelos de mineração guia, clique com botão direito previsão, e selecione definir parâmetros de algoritmo.

  2. No PERIODICITY_HINT linha do parâmetros de algoritmo caixa de diálogo, clique o valor coluna, digite {12}, incluindo as chaves.

    Por padrão, o algoritmo também adicionará o \ {1 valor .

  3. No FORECAST_METHOD de linha, verifique o valor caixa de texto está em branco ou definido para MIXED. Caso tenha sido inserido um valor diferente, digite MIXED para alterar o parâmetro para o valor padrão.

  4. No PREDICTION_SMOOTHING de linha, verifique o valor caixa de texto está em branco ou definido como 0,5. Caso tenha sido inserido um valor diferente, clique em valor e digite 0,5 para alterar o parâmetro para o valor padrão.

    Dica


    O parâmetro PREDICTION_SMOOTHING só está disponível no SQL Server Enterprise. Dessa forma, não é possível exibir ou alterar o valor do parâmetro PREDICTION_SMOOTHING no SQL Server Standard. Porém, o comportamento padrão é usar os dois algoritmos e atribuir o mesmo valor a ambos.

  5. Clique em OK.

Manipulando dados ausentes (opcional)

Na maioria dos casos, seus dados de venda poderão ter lacunas preenchidas por nulos, ou uma loja pode não ter conseguido cumprir o prazo da emissão de relatórios, deixando uma célula vazia no final da série. Nesses cenários, o Analysis Services gera o erro a seguir e não processa o modelo.

"Erro (mineração de dados): carimbos não sincronizados, começando com a série , do modelo de mineração, . Todas as séries temporais devem terminar na mesma marca de tempo e não podem ter pontos de dados ausentes arbitrariamente. A definição do parâmetro MISSING_VALUE_SUBSTITUTION como Previous ou como uma constante numérica corrigirá automaticamente pontos de dados ausentes, onde possível."

Para impedir esse erro, você pode especificar que o Analysis Services forneça automaticamente novos valores para preencher as lacunas usando qualquer um dos métodos a seguir:

  • Usando um valor médio. Essa média é calculada usando todos os valores válidos da mesma série de dados.

  • Usando o valor anterior. Você pode substituir valores anteriores por várias células ausentes, mas não pode preencher os valores iniciais.

  • Usando um valor constante fornecido por você.

Para especificar que as lacunas sejam preenchidas por valores médios

  1. Sobre o modelos de mineração guia, clique o previsão coluna e selecione definir parâmetros de algoritmo.

  2. No parâmetros de algoritmo na caixa de MISSING_VALUE_SUBSTITUTION de linha, clique no valor coluna e digite significa.

Criar o modelo

Para usar o modelo, você deve implantá-lo em um servidor e processar o modelo executando os dados de treinamento pelo algoritmo.

Para processar o modelo de previsão

  1. Sobre o modelo de mineração menu SQL Server Data Tools, selecione processar estrutura de mineração e todos os modelos.

  2. No aviso que pergunta se você deseja construir e implantar o projeto, clique em Sim.

  3. No processar a estrutura de mineração - previsão caixa de diálogo, clique em executar.

    A caixa de diálogo Andamento do Processo é aberta para exibir informações sobre o processamento do modelo. O processamento do modelo pode demorar algum tempo.

  4. Depois que o processamento estiver completo, clique em Fechar para sair da caixa de diálogo Progresso do Processo .

  5. Clique em Fechar novamente para sair do processar a estrutura de mineração - previsão caixa de diálogo.

Próxima tarefa da lição

Explorando o modelo de previsão e 40; Tutorial de mineração de dados intermediário e 41;

Consulte também

Referência técnica do algoritmo MTS
Algoritmo MTS
Requisitos e considerações de processamento (Mineração de dados)