Share via


Explorando o modelo de previsão (tutorial de mineração de dados intermediário)

Agora que você criou o modelo de mineração de previsão, já pode explorar os resultados usando a guia Visualizador do Modelo de Mineração do Data Mining Designer. O Visualizador Microsoft Time Series contém duas guias: Gráficos e Modelo.

O modelo de mineração de previsão que você criou descreve as vendas de produtos em três regiões diferentes — Europa, América do Norte e Pacífico — referentes aos anos de 2005 a 2010. Por isso, o algoritmo Microsoft Time Series cria um modelo de série temporal que contém várias árvores, cada uma contendo uma combinação diferente de região, produto e atributo previsível.

Cada uma das guias no visualizador exibe uma exibição diferente das informações no modelo de série temporal completo.

  • Guia Gráficos

  • Guia Modelo

  • Visualizador de Conteúdo Genérico

Guia Gráficos

A guia Gráficos do Visualizador MicrosoftTime Series mostra graficamente cada uma das árvores que o algoritmo cria. Uma árvore de série temporal contém uma combinação exclusiva de produto, região e atributo previsível.

A legenda à direita do visualizador relaciona a série temporal selecionada na lista suspensa e inclui uma caixa de seleção para cada série temporal. É possível marcar e desmarcar as caixas de seleção na legenda para controlar a série temporal exibida no visualizador.

Também é possível alterar as opções de exibição, como as cores usadas em cada série temporal, ou se os valores são exibidos em pontos do gráfico.

Para selecionar uma série temporal

  1. Clique na guia Gráficos da guia Visualizador do Modelo de Mineração, se ela não estiver visível.

  2. Clique na lista suspensa à direita da exibição do gráfico e marque todas as caixas de seleção: o gráfico deve conter 24 linhas de séries diferentes.

  3. Clique em OK.

  4. Desmarque as caixas de seleção à direita do gráfico para ocultar temporariamente as linhas de todas as séries que se baseiem em Valor.

  5. Agora, desmarque as caixas de seleção relacionadas às bicicletas R750 e R250.

    Agora o gráfico contém apenas as seis linhas de série para que seja possível comparar mais facilmente as tendências para as bicicletas M200 e T1000.

    • M200 Europe: Quantity

    • M200 North America: Quantity

    • M200 Pacific: Quantity

    • T1000 Europe: Quantity t

    • T1000 North America: Quantity

    • T1000 Pacific: Quantity

Séries prevendo a quantidade M200 e T1000Séries prevendo a quantidade M200 e T1000

O gráfico exibe dados históricos e previstos. Os dados previstos aparecem sombreados para diferenciá-los dos dados históricos. Para facilitar a comparação de séries diferentes, também é possível alterar as cores associadas a cada linha no gráfico. Para obter mais informações, consulte Como alterar as cores usadas no Visualizador de Mineração de Dados.

As linhas de tendência mostram que o total de vendas para todas as regiões normalmente cresce, com pico a cada 12 meses, em dezembro. As previsões costumam seguir essa tendência. O gráfico que também exibe os dados referentes à bicicleta T1000 começam muito depois dos dados para a outra série de produto.

Por padrão, o Analysis Services mostra cinco etapas de previsão para cada série temporal. É possível alterar esse valor para exibir mais ou menos etapas de previsão. Também é possível exibir graficamente o desvio padrão para a previsão adicionando-se barras de erro ao gráfico.

Para alterar as opções de previsão e exibição na exibição do Gráfico

  1. Altere o valor para Etapas de previsão gradativamente de 5 para 10 e depois para 6.

    ObservaçãoObservação

    Nas linhas de tendência com grandes flutuações nos dados históricos, as flutuações são ampliadas durante a previsão.

  2. Marque a caixa de seleção Mostrar Desvios.

  3. Coloque o mouse sobre as barras de erro da série M200.

  4. Coloque o mouse sobre as barras de erro da série T1000 Pacific.

Você usará esses resultados para investigação mais detalhada. Posteriormente, você desenvolverá um modelo com a média de todas as regiões e, por isso, não sujeito a tanta flutuação.

Voltar ao início

Guia Modelo

A guia Modelo do Visualizador Time Series da Microsoft no Designer de Mineração de Dados permite exibir a série temporal como um gráfico da árvore de decisão. Uma árvore separada é calculada para cada série incluída no modelo. Em um modelo de série temporal, o gráfico da árvore de decisão talvez tenha um único nó, se a série temporal for linear, ou talvez tenha vários nós e condições associados a cada ramificação, como uma árvore de decisão comum.

Os nós no gráfico da árvore de decisão para uma série temporal contêm algumas das seguintes informações:

  • A concentração de casos para o estado do atributo previsível especificado no controlePlano de Fundo. Tanto a janela Nó de Legenda quanto a Dica de Ferramenta que aparecem quando você posiciona o mouse sobre um item da árvore fornecem o número exato de casos.

  • A fórmula de regressão para o nó. A fórmula de regressão ARTXP somente está disponível nos nós folha. A equação ARIMA está disponível no nó raiz da árvore.

  • Um gráfico losango que representa o intervalo do atributo. O losango fica na posição mediana do nó, e sua largura representa a variação do atributo naquele nó.

Para exibir a árvore de decisão para um modelo de série temporal

  1. Na lista Árvore, na guia Modelo do visualizador, selecione a série M200 North America: Amount.

    Um único nó é exibido no gráfico.

  2. Posicione o cursor do mouse sobre o nó.

    Para um nó Tudo, a Dica de Ferramenta exibida inclui informações como o número de casos em toda a série e as equações de série temporal derivadas da análise dos dados.

  3. Clique no nó e exiba a Legenda de Mineração.

    A Legenda de Mineração inclui informações semelhantes a essas na Dica de Ferramenta, mas fornece mais detalhes, como um histograma dos valores.

  4. Na lista Árvore, na guia Modelo do visualizador, selecione a série M200 Pacific: Amount.

    Agora, o gráfico de árvore contém um nó Tudo e dois nós filho. O texto nos nós filho descreve as condições que dividem a árvore,

  5. Coloque o cursor do mouse sobre um dos nós filho e examine o conteúdo da Dica de Ferramenta. Se desejar, clique no nó e exiba a Legenda de Mineração.

    Para os nós filho, a descrição inclui a contagem de casos em cada ramificação da árvore e as condições adicionais que causaram a divisão da árvore.

Voltar ao início

Visualizador de Árvore de Conteúdo Genérica

Além do visualizador personalizado para a série temporal, o Analysis Services fornece o Visualizador de Árvore de Conteúdo Genérica da Microsoft. Esse visualizador pode ser usado em todos os modelos de mineração de dados, independentemente do algoritmo ou do tipo de modelo utilizado. O Visualizador da Árvore de Conteúdo Genérico está disponível na lista suspensa do Visualizador.

Nesse visualizador, cada modelo de mineração, independentemente dos dados ou do algoritmo usado na análise, é representado como uma árvore que contém uma série de nós. Cada nó representa informações sobre algum subconjunto dos dados. O conteúdo exato do nó é diferente, dependendo do algoritmo e do tipo do atributo previsível; no entanto, o esquema geral do conteúdo é o mesmo.

Como o modelo de data mining criado é do tipo misto, combinando algoritmos ARTXP e ARIMA, o Analysis Services usa cada um para criar modelos ARTXP e ARIMA à parte para cada série temporal. Quando você usa o Visualizador Time Series da Microsoft para navegar no modelo de mineração de previsão, o Analysis Services combina os resultados dos dois algoritmos e mostra o modelo de mineração como uma única árvore, com cada nó da árvore tendo algum conteúdo dos dois algoritmos.

No entanto, quando você usa o Visualizador de Árvore de Conteúdo Genérica da Microsoft, o conteúdo gerado por cada algoritmo é exposto como dois tipos diferentes de nós no modelo de mineração de previsão. É possível executar uma busca detalhada na versão ARTXP do modelo ou na versão ARIMA do modelo para visualizar os níveis crescentes de detalhe.

Para exibir detalhes de uma determinada série de dados no visualizador de conteúdo genérico

  1. Na guia Visualizador do Modelo de Mineração, selecione Visualizador de Árvore de Conteúdo Genérica da Microsoft na lista suspensa Visualizador.

  2. No painel Legenda de Nó, clique no nó (Tudo) superior.

  3. No painel Detalhes do Nó, exiba o valor de ATTRIBUTE_NAME.

    Esse valor mostra qual série, ou combinação de produto e região, está contida nesse nó. No exemplo do AdventureWorks, o nó superior pertence à série M200 Europe.

  4. No painel Legenda de Nó, localize o primeiro nó que tenha nós filho.

    Se um nó de série tiver filhos, a exibição de árvore exibida na guia Modelo do Visualizador MTS também terá uma estrutura de ramificação.

  5. Expanda o nó e clique em um dos nós filho.

    A coluna NODE_DESCRIPTION do esquema contém a condição que causou a divisão da árvore.

  6. No painel Legenda de Nó, clique no nó ARIMA superior e expanda o nó até que todos os nós filho estejam visíveis.

  7. No painel Detalhes do Nó, exiba o valor de ATTRIBUTE_NAME.

    Esse valor informa qual série temporal está contida nesse nó. O nó superior na seção ARIMA corresponde ao nó superior na seção (Tudo). No exemplo do AdventureWorks, esse nó contém a análise ARIMA da série M200 Europe.

Para obter mais informações, consulte Conteúdo do modelo de mineração para modelos de série temporal (Analysis Services – Mineração de dados).

Voltar ao início