Algoritmos de mineração de dados (Analysis Services – Mineração de Dados)

Artigo
07/30/2013

Um algoritmo de mineração de dados é um conjunto de heurística e cálculos que cria um modelo de mineração de dados. Para criar um modelo, o algoritmo primeiro analisa os dados que você fornece, procurando tipos de padrões ou tendências específicos. O algoritmo usa os resultados dessa análise para definir os parâmetros ideais para criar o modelo de mineração. Esses parâmetros são aplicados pelo conjunto de dados inteiro para extrair padrões acionáveis e estatísticas detalhadas.

O modelo de mineração que um algoritmo cria a partir de seus dados pode assumir vários formatos, incluindo:

Um conjunto de clusters que descreve como os casos em um conjunto de dados estão relacionados.
Uma árvore de decisão que prevê um resultado e descreve como critérios diferentes afetam esse resultado.
Um modelo matemático que prevê as vendas.
Um conjunto de regras que descreve como são agrupados produtos em uma transação e as probabilidades de que os produtos sejam comprados juntos.

O Microsoft SQL Server Analysis Services fornece múltiplos algoritmos a serem usados nas soluções de mineração de dados. Estes algoritmos são implementações de algumas das metodologias mais populares usadas em mineração de dados. Todos os algoritmos de mineração de dados da Microsoft podem ser personalizados e são completamente programáveis usando as APIs fornecidas, ou usando os componentes de mineração de dados no SQL Server Integration Services.

Você também pode usar algoritmos de terceiros em conformidade com a OLE DB para Mineração de Dados ou desenvolver algoritmos personalizados que podem ser registrados como serviços e, em seguida, usados dentro da estrutura de Mineração de Dados do SQL Server.

Escolhendo o algoritmo certo

A escolha do melhor algoritmo para uma tarefa analítica específica pode ser um desafio. Embora você possa usar algoritmos diferentes para executar a mesma tarefa empresarial, cada algoritmo produz um resultado diferente e alguns podem produzir mais de um tipo de resultado. Por exemplo, você pode usar o algoritmo Árvores de Decisão da Microsoft não apenas para previsão, mas também como uma maneira de reduzir o número de colunas em um conjunto dados uma vez que a árvore de decisão pode identificar colunas que não afetam o modelo de mineração final.

Escolhendo um algoritmo por tipo

O Analysis Services inclui os seguintes tipos de algoritmos:

Algoritmos de classificação preveem uma ou mais variáveis discretas, com base nos outros atributos do conjunto de dados.
Algoritmos de regressão preveem uma ou mais variáveis contínuas, como lucro ou perda, com base nos outros atributos do conjunto de dados.
Algoritmos de segmentação dividem dados em grupos ou clusters de itens que têm propriedades semelhantes.
Algoritmos de associação encontram correlações entre atributos diferentes em um conjunto de dados. A aplicação mais comum desse tipo de algoritmo é para criar regras de associação, que podem ser usadas em uma análise da cesta de compras.
Algoritmos de análise de sequência resumem sequências frequentes ou episódios em dados, como um fluxo de caminho da Web.

Porém, não há nenhuma razão para você ficar limitado a um algoritmo em suas soluções. Os analistas experientes às vezes usam um algoritmo para determinar as entradas mais efetivas (ou seja, variáveis) e então aplicam um algoritmo diferente para prever um resultado específico baseado naqueles dados. A mineração de dados do SQL Server permite que você compile vários modelos em uma única estrutura de mineração, de modo que, dentro de uma única solução de mineração de dados, você possa usar um algoritmo de clustering, um modelo de árvores de decisão e um modelo naïve Bayes para obter exibições diferentes de seus dados. Você também pode usar vários algoritmos em uma única solução para executar tarefas separadas, por exemplo, você pode usar regressão para obter previsões financeiras e um algoritmo de rede neural para executar uma análise de fatores que influenciam as vendas.

Escolhendo um algoritmo por tarefa

Para ajudar você a selecionar um algoritmo para usar com uma tarefa específica, a tabela a seguir fornece sugestões para os tipos de tarefas para as quais cada algoritmos é tradicionalmente usado.

Exemplos de tarefas	Algoritmos da Microsoft a serem usados
Prevendo um atributo discreto Sinalizar os clientes em uma lista de compradores potenciais como bons ou ruins. Calcular a probabilidade de um servidor falhar dentro dos próximos 6 meses. Categorizar resultados de pacientes e explore os fatores relacionados.	Algoritmo Árvores de Decisão da Microsoft Algoritmo Naïve Bayes da Microsoft Algoritmo Microsoft Clustering Algoritmo Rede Neural da Microsoft
Prever um atributo contínuo Prever as vendas do próximo ano. Prever visitantes de site considerando as tendências históricas e sazonais. Gerar uma contagem de risco considerando a demografia.	Algoritmo Árvores de Decisão da Microsoft Algoritmo MTS Algoritmo Regressão Linear da Microsoft
Prever uma sequência Executar uma análise de sequência de cliques no site da empresa. Analisar os fatores que conduzem à falha do servidor. Capturar e analisar sequências de atividades durante visitas de pacientes externos, formular práticas recomendadas para atividades comuns.	Algoritmo MSC
Localizando grupos de itens comuns em transações Usar análise da cesta de compras para determinar colocação de produto. Sugerir produtos adicionais a um cliente para compra. Analisar dados de pesquisa de visitantes para um evento, encontrar quais atividades estão correlacionadas, planejar atividades futuras.	Algoritmo Associação da Microsoft Algoritmo Árvores de Decisão da Microsoft
Localizando grupos de itens semelhantes Criar grupos de perfis de risco de paciente em atributos como demografia e comportamentos. Analisar usuários por padrões de navegação e compra. Identificar servidores que têm características de uso semelhantes.	Algoritmo Microsoft Clustering Algoritmo MSC

Prevendo um atributo discreto

Sinalizar os clientes em uma lista de compradores potenciais como bons ou ruins.
Calcular a probabilidade de um servidor falhar dentro dos próximos 6 meses.
Categorizar resultados de pacientes e explore os fatores relacionados.

Algoritmo Árvores de Decisão da Microsoft

Algoritmo Naïve Bayes da Microsoft

Algoritmo Microsoft Clustering

Algoritmo Rede Neural da Microsoft

Prever um atributo contínuo

Prever as vendas do próximo ano.
Prever visitantes de site considerando as tendências históricas e sazonais.
Gerar uma contagem de risco considerando a demografia.

Algoritmo Árvores de Decisão da Microsoft

Algoritmo MTS

Algoritmo Regressão Linear da Microsoft

Prever uma sequência

Executar uma análise de sequência de cliques no site da empresa.
Analisar os fatores que conduzem à falha do servidor.
Capturar e analisar sequências de atividades durante visitas de pacientes externos, formular práticas recomendadas para atividades comuns.

Algoritmo MSC

Localizando grupos de itens comuns em transações

Usar análise da cesta de compras para determinar colocação de produto.
Sugerir produtos adicionais a um cliente para compra.
Analisar dados de pesquisa de visitantes para um evento, encontrar quais atividades estão correlacionadas, planejar atividades futuras.

Algoritmo Associação da Microsoft

Algoritmo Árvores de Decisão da Microsoft

Localizando grupos de itens semelhantes

Criar grupos de perfis de risco de paciente em atributos como demografia e comportamentos.
Analisar usuários por padrões de navegação e compra.
Identificar servidores que têm características de uso semelhantes.

Algoritmo Microsoft Clustering

Algoritmo MSC

Conteúdo relacionado

A tabela a seguir fornece links para recursos de aprendizado para cada algoritmo de mineração de dados fornecido no Analysis Services:

Descrição do algoritmo básico	Explica o que o algoritmo faz e como funciona, e descreve possíveis cenários comerciais onde o algoritmo poderia ser útil.
	Algoritmo Associação da Microsoft Algoritmo Microsoft Clustering Algoritmo Árvores de Decisão da Microsoft Algoritmo Regressão Linear da Microsoft Algoritmo Regressão Logística da Microsoft Algoritmo Naïve Bayes da Microsoft Algoritmo Rede Neural da Microsoft Algoritmo MSC Algoritmo MTS
Referência técnica	Fornece detalhes técnicos sobre a implementação do algoritmo, com referências acadêmicas conforme o necessário. Lista os parâmetros que podem ser definidos para controlar o comportamento do algoritmo e personalizar os resultados no modelo. Descreve os requisitos de dados e fornece dicas de desempenho se possível.
	Referência técnica do algoritmo de associação da Microsoft Referência técnica do algoritmo Microsoft Clustering Referência técnica do algoritmo Árvores de Decisão da Microsoft Referência Técnica do Algoritmo de Regressão Linear da Microsoft Referência técnica do algoritmo Regressão Logística da Microsoft Referência técnica do algoritmo Microsoft Naive Bayes Referência técnica do algoritmo Rede Neural da Microsoft Referência técnica do algoritmo MSC Referência técnica do algoritmo MTS
Conteúdo do modelo	Explica como as informações são estruturadas dentro de cada tipo de modelo de mineração de dados, e explica como interpretar as informações armazenadas em cada um dos nós.
	Conteúdo do modelo de mineração para modelos de associação (Analysis Services – Mineração de Dados) Conteúdo do modelo de mineração para modelos de clustering (Analysis Services – Mineração de Dados) Conteúdo do modelo de mineração para modelos de árvore de decisão (Analysis Services – Mineração de Dados) Conteúdo do modelo de mineração para modelos de regressão linear (Analysis Services – Mineração de Dados) Conteúdo do modelo de mineração para modelos de regressão logística (Analysis Services – Mineração de Dados) Conteúdo do modelo de mineração para modelos Naive Bayes (Analysis Services – Mineração de Dados) Conteúdo do modelo de mineração para modelos de rede neural (Analysis Services – Mineração de Dados) Conteúdo do modelo de mineração para modelos de clustering de sequências (Analysis Services – Mineração de Dados) Conteúdo do modelo de mineração para modelos de série temporal (Analysis Services – Mineração de dados)
Consultas de mineração de dados	Fornece diversas consultas que você pode usar com cada tipo modelo. Os exemplos incluem consultas de conteúdo que permitem que você saiba mais sobre os padrões no modelo e consultas de previsão que o ajudarão a criar previsões com base nesses padrões.
	Exemplos de consulta de um modelo de associação Exemplos de consulta de modelo de clustering Exemplos de consulta de modelo de árvores de decisão Exemplos de consulta de modelo de regressão linear Exemplos de consulta de modelo de regressão logística Exemplos de consulta de modelo Naive Bayes Exemplos de consulta de modelo de rede neural Exemplos de consulta de um modelo de clustering de sequências Exemplos de consulta de um modelo de série temporal

Tarefas relacionadas

Tópico	Descrição
Determinar o algoritmo usado por um modelo de mineração de dados	Consultar os parâmetros usados para criar um modelo de mineração
Criar um algoritmo de plug-in personalizado	Algoritmos de plug-in
Explorar um modelo usando um visualizador específico de algoritmo	Visualizadores do Modelo de Mineração de Dados
Exibir o conteúdo de um modelo usando um formato de tabela genérico	Procurar um modelo usando o Visualizador de Árvore de Conteúdo Genérica da Microsoft
Aprender sobre como configurar seus dados e usar algoritmos para criar modelos	Estruturas de mineração (Analysis Services – Mineração de dados) Modelos de mineração (Analysis Services – Mineração de Dados)

Consulte também

Conceitos

Ferramentas de mineração de dados

Algoritmos de mineração de dados (Analysis Services – Mineração de Dados)

Escolhendo o algoritmo certo

Escolhendo um algoritmo por tipo

Escolhendo um algoritmo por tarefa

Conteúdo relacionado

Tarefas relacionadas

Consulte também

Conceitos

Recursos adicionais