Algoritmos de mineração de dados (Analysis Services – Mineração de Dados)

O algoritmo de mineração de dados é o mecanismo que cria um modelo de mineração de dados. Para criar um modelo, um algoritmo primeiro analisa um conjunto de dados e procura padrões e tendências específicos. O algoritmo usa os resultados dessa análise para definir os parâmetros do modelo de mineração. Esses parâmetros são aplicados pelo conjunto de dados inteiro para extrair padrões acionáveis e estatísticas detalhadas.

O modelo de mineração que um algoritmo cria pode assumir vários formatos, incluindo:

  • Um conjunto de regras que descreve como são agrupados produtos em uma transação.

  • Uma árvore de decisão que prevê se um determinado cliente comprará um produto.

  • Um modelo matemático que prevê as vendas.

  • Um conjunto de clusters que descreve como os casos em um conjunto de dados estão relacionados.

Microsoft SQL Server Analysis Services fornece vários algoritmos para serem usados nas soluções de mineração de dados. Esses algoritmos são um subconjunto de todos os algoritmos que podem ser usados para mineração de dados. Você também pode usar algoritmos de terceiros compatíveis com a especificação OLE DB para Data Mining. Para obter mais informações sobre esses algoritmos de terceiros, consulte Algoritmos de plug-in.

Tipos de algoritmos de mineração de dados

O Analysis Services inclui os seguintes tipos de algoritmos:

  • Algoritmos de classificação prevêem uma ou mais variáveis discretas, com base nos outros atributos do conjunto de dados. Um exemplo de um algoritmo de classificação é Algoritmo Árvores de Decisão da Microsoft.

  • Algoritmos de regressão prevêem uma ou mais variáveis contínuas, como lucro ou perda, com base nos outros atributos do conjunto de dados. Um exemplo de um algoritmo de regressão é Algoritmo MTS.

  • Algoritmos de segmentação dividem dados em grupos ou clusters de itens que têm propriedades semelhantes. Um exemplo de um algoritmo de segmentação é Algoritmo Microsoft Clustering.

  • Algoritmos de associação encontram correlações entre atributos diferentes em um conjunto de dados. A aplicação mais comum desse tipo de algoritmo é para criar regras de associação, que podem ser usadas em uma análise de cesta básica. Um exemplo de um algoritmo de associação é Algoritmo Associação da Microsoft.

  • Algoritmos de análise de seqüência resumem seqüências freqüentes ou episódios em dados, como um fluxo de caminho da Web. Um exemplo de um algoritmo de seqüência é Algoritmo MSC.

Aplicando os algoritmos

A escolha do melhor algoritmo para uma tarefa empresarial específica pode ser um desafio. Embora você possa usar algoritmos diferentes para executar a mesma tarefa empresarial, cada algoritmo produz um resultado diferente e alguns podem produzir mais de um tipo de resultado. Por exemplo, você pode usar o algoritmo Árvores de Decisão da Microsoft não apenas para previsão, mas também como uma maneira de reduzir o número de colunas em um conjunto dados uma vez que a árvore de decisão pode identificar colunas que não afetam o modelo de mineração final.

Você também não tem que usar algoritmos independentemente. Em uma solução de mineração de dados, é possível usar alguns algoritmos para explorar dados e, em seguida, usar outros algoritmos para prever um resultado específico com base nesses dados. Por exemplo, você pode usar um algoritmo de cluster, que reconhece padrões, para dividir dados em grupos que são mais ou menos homogêneos e, em seguida, usar os resultados para criar um modelo de árvore de decisão melhor. Você pode usar vários algoritmos em uma solução para executar tarefas separadas, por exemplo, usando um algoritmo de árvore de regressão para obter informações de previsão financeira e um algoritmo com base em regras para executar uma melhor análise de cesta básica.

Os modelos de mineração podem prever valores, produzir resumos de dados e localizar correlações ocultas. Para ajudar você a selecionar algoritmos para a solução de mineração de dados, a tabela a seguir fornece sugestões para quais algoritmos devem ser usados para tarefas específicas.

Tarefa

Algoritmos da Microsoft a serem usados

Prevendo um atributo discreto.

Por exemplo, prever se o destinatário da campanha de mala-direta comprará um produto.

Algoritmo Árvores de Decisão da Microsoft

Algoritmo Naïve Bayes da Microsoft

Algoritmo Microsoft Clustering

Algoritmo Rede Neural da Microsoft, (Analysis Services – Mineração de Dados)

Prevendo um atributo contínuo.

Por exemplo, prever as vendas do próximo ano.

Algoritmo Árvores de Decisão da Microsoft

Algoritmo MTS

Prevendo uma seqüência.

Por exemplo, executar uma análise de seqüência de cliques no site da empresa.

Algoritmo MSC

Localizando grupos de itens comuns em transações.

Por exemplo, usar a análise de cesta básica para sugerir produtos adicionais a um cliente para compra.

Algoritmo Associação da Microsoft

Algoritmo Árvores de Decisão da Microsoft

Localizando grupos de itens semelhantes.

Por exemplo, segmentar dados demográficos em grupos para entender melhor as relações entre atributos.

Algoritmo Microsoft Clustering

Algoritmo MSC

Uma vez que cada modelo retorna um tipo diferente de resultado, o Analysis Services fornece um visualizador separado para cada algoritmo. Quando você procura um modelo de mineração no Analysis Services, o modelo é exibido na guia Visualizador do Modelo de Mineração do Designer de Mineração de Dados, que usa o visualizador adequado ao modelo. Para obter mais informações, consulte Exibindo um modelo de mineração de dados.

Detalhes do algoritmo

A tabela a seguir fornece links para os tipos de informações disponíveis para cada algoritmo:

  • Descrição do algoritmo básico   Fornece uma explicação básica do que o algoritmo faz e como funciona, junto com um cenário comercial no qual esse algoritmo pode ser útil.

  • Referência técnica   Lista os parâmetros que podem ser definidos para controlar o comportamento do algoritmo e personalizar os resultados no modelo. Fornece detalhes técnicos adicionais sobre a implementação do algoritmo, dicas de desempenho e requisitos de dados.

  • Consultando um modelo   Fornece exemplos de consultas que você pode usar com cada tipo modelo.É possível consultar um modelo para obter mais informações sobre seus padrões ou fazer previsões com base nesses padrões.

  • Conteúdo do modelo de mineração    Descreve o modo como as informações são armazenadas em uma estrutura comum para todos os tipos de modelo e explica como interpretar essas informações. Após criar um modelo, você poderá explorá-lo usando os visualizadores fornecidos no BI Development Studio ou escrever consultas para retornar informações diretamente do conteúdo do modelo utilizando DMX.

Descrição do algoritmo básico

Referência técnica

Consultando

Conteúdo do modelo de mineração

Algoritmo Associação da Microsoft

Referência técnica do algoritmo de associação da Microsoft-

Consultando um modelo de associação (Analysis Services - Mineração de dados)

Conteúdo do modelo de mineração para modelos de associação (Analysis Services – Mineração de Dados)

Algoritmo Microsoft Clustering

Referência técnica do algoritmo Microsoft Clustering

Consultando um modelo de clustering (Analysis Services – Mineração de dados)

Conteúdo do modelo de mineração para modelos de clustering (Analysis Services – Mineração de Dados)

Algoritmo Árvores de Decisão da Microsoft

Referência técnica do algoritmo Árvores de Decisão da Microsoft

Consultando um modelo de árvores de decisão (Analysis Services – Mineração de dados)

Conteúdo do modelo de mineração para modelos de árvore de decisão (Analysis Services – Mineração de Dados)

Algoritmo Regressão Linear da Microsoft

Referência Técnica do Algoritmo de Regressão Linear da Microsoft

Consultando um modelo de regressão linear (Analysis Services – Mineração de Dados)

Conteúdo do modelo de mineração para modelos de regressão linear (Analysis Services – Mineração de Dados)

Algoritmo Regressão Logística da Microsoft

Referência técnica do algoritmo Regressão Logística da Microsoft

Consultando um modelo de regressão logística (Analysis Services – Mineração de Dados)

Conteúdo do modelo de mineração para modelos de regressão logística (Analysis Services – Mineração de Dados)

Algoritmo Naïve Bayes da Microsoft

Referência técnica do algoritmo Microsoft Naive Bayes

Consultando um modelo Naive Bayes (Analysis Services – Mineração de Dados)

Conteúdo do modelo de mineração para modelos Naive Bayes (Analysis Services – Mineração de Dados)

Algoritmo Rede Neural da Microsoft, (Analysis Services – Mineração de Dados)

Referência técnica do algoritmo Rede Neural da Microsoft

Consultando um modelo de rede neural (Analysis Services – Mineração de Dados)

Conteúdo do modelo de mineração para modelos de rede neural (Analysis Services – Mineração de Dados)

Algoritmo MSC

Referência técnica do algoritmo MSC (Analysis Services - Mineração de Dados)

Consultando um modelo de clusterização de sequência (Analysis Services – Mineração de Dados)

Conteúdo do modelo de mineração para modelos de clustering de sequências (Analysis Services – Mineração de Dados)

Algoritmo MTS

Referência técnica do algoritmo MTS

Consultando um modelo de série temporal (Analysis Services - Mineração de Dados)

Conteúdo do modelo de mineração para modelos de série temporal (Analysis Services – Mineração de dados)