Share via


Distribuições de colunas (mineração de dados)

No Microsoft SQL Server Analysis Services, é possível definir as distribuições de colunas em uma estrutura de mineração para simular como os algoritmos processarão os dados na colunas quando você criar modelos de mineração. Com relação a certos algoritmos, é útil definir a distribuição de colunas contínuas antes de processar o modelo, principalmente quando se sabe que as colunas contêm distribuições comuns de valores. Se as distribuições não estiverem definidas, os modelos de mineração resultantes poderão produzir previsões menos precisas do que se as distribuições estiverem definidas, uma vez que os algoritmos terão menos informações com as quais interpretar dados.

Os algoritmos que estão disponíveis em Analysis Services fornecem suporte aos seguintes tipos de distribuição:

  • Normal
    Os valores para a coluna contínua formam um histograma com uma distribuição normal.

    Histograma com distribuição normal

  • Log Normal
    Os valores para a coluna contínua formam um histograma, onde a curva é alongada na extremidade superior e é inclinada em direção à extremidade inferior.

    Histograma com distribuição normal de log

  • Uniform
    Os valores para a coluna contínua formam uma curva plana, na qual todos os valores são igualmente prováveis.

    Histograma com distribuição uniforme

Para obter mais informações sobre os algoritmos que Analysis Services fornece, consulteAlgoritmos de mineração de dados (Analysis Services – Mineração de Dados).

Consulte também

Referência

Distribuições (DMX)

Conceitos

Tipos de conteúdo (mineração de dados)

Estruturas de mineração (Analysis Services – Mineração de dados)

Métodos de discretização (mineração de dados)

Colunas da estrutura de mineração