Criando uma nova estrutura de mineração

Quando você cria uma solução de mineração de dados no Microsoft SQL Server Analysis Services, a primeira etapa é para criar uma estrutura de mineração usando Assistente de Mineração de Dados (Analysis Services - Mineração de dados) em Business Intelligence Development Studio. A estrutura de mineração define o domínio de dados a partir do qual serão criados modelos de mineração. Todos os modelos de mineração se baseiam em uma estrutura.

Estruturas de mineração usam fontes de dados relacionais ou OLAP (processamento analítico online). As estruturas de mineração relacionais são baseadas em dados armazenados em tabelas, arquivos ou sistemas de banco de dados relacionais, que foram definidos como uma exibição de fonte de dados. As estruturas de mineração OLAP se baseiam em uma dimensão e em medidas relacionados a partir do cubo OLAP existente no mesmo banco de dados que a estrutura de mineração.

Para obter mais informações:Criando bancos de dados, Projetando objetos multidimensionais do banco de dados do Analysis Services

O Assistente de Mineração de Dados define automaticamente uma estrutura de dados e permite adicionar um modelo de mineração inicial para a estrutura. Uma vez que a estrutura de mineração pode conter vários modelos de mineração, você pode usar o Designer de mineração de dados para adicionar mais modelos de mineração à estrutura.

As seções a seguir fornecem mais informações sobre como criar novas estruturas de mineração com o Assistente de Mineração de Dados e como definir opções na estrutura de mineração que permitirão que você crie um conjunto de teste ou execute consultas nos dados da estrutura de mineração.

  • Criando uma estrutura de mineração relacional

  • Criando uma estrutura de mineração OLAP

  • Habilitando a validação e o detalhamento

Criando uma estrutura de mineração relacional

As estruturas de mineração relacionais podem se basear em quaisquer dados disponíveis por meio de uma fonte de dados OLE DB. Se os dados de origem estiverem contidos em diversas tabelas, você poderá criar uma exibição de fonte de dados que reúna as tabelas e as colunas desejadas. Se as tabelas incluírem relações de um-para-muitos -- por exemplo, você tem vários registros de compra para cada cliente que você deseja analisar -- você poderá adicionar tabelas e usar uma tabela como a tabela de casos e dados do lado muitos da relação como tabelas aninhadas.

Para obter mais informações:Tabelas aninhadas (Analysis Services - Mineração de Dados)

O Assistente de Mineração de Dados o conduz pelas seguintes etapas para criar a estrutura para um novo modelo de mineração:

  1. Selecionando um tipo de fonte de dados, nesse caso, um banco de dados relacional.

  2. Decidindo se deve ser criada somente uma estrutura ou uma com um modelo de mineração.

  3. Selecionando um algoritmo para o modelo.

  4. Selecionando uma fonte de dados.

  5. Selecionando uma tabela de casos e, opcionalmente, qualquer tabela aninhada.

  6. Selecionando o tipo de cada coluna; previsível, entrada ou chave.

  7. Especificando os tipos de conteúdo da coluna.

  8. Especificando um conjunto de dados de validação opcional.

  9. Habilitando o detalhamento na estrutura; nomeando e salvando a nova estrutura de mineração e o modelo de mineração associado.

Para obter mais informações:Algoritmos de mineração de dados (Analysis Services – Mineração de Dados), Colunas do modelo de mineração, Colunas da estrutura de mineração, Tipos de dados (Mineração de Dados), Tipos de conteúdo (mineração de dados)

Criando uma estrutura de mineração OLAP

Os cubos OLAP geralmente contêm tantos membros e tantas dimensões que pode ser difícil saber por onde começar a mineração de dados. Para ajudar a identificar os padrões que os cubos contêm, geralmente você identifica uma única dimensão de interesse e, em seguida, começa a explorar os padrões relacionados à dimensão. A tabela a seguir lista várias tarefas de mineração de dados OLAP comuns, descreve os cenários de amostra nos quais você pode aplicar cada tarefa e identifica o algoritmo de mineração de dados a ser usado para cada tarefa.

Tarefa

Cenário de exemplo

Algoritmo

Agrupar membros em clusters

Segmente uma dimensão de cliente com base nas propriedades do membro do cliente, os produtos que os clientes compram e a quantidade de dinheiro que eles gastam.

Microsoft Algoritmo de Cluster

Localizar membros interessantes ou anormais

Identifique lojas interessantes ou anormais em uma dimensão de loja com base em vendas, lucros, local da loja e tamanho da loja.

Algoritmo de Árvores de Decisão da Microsoft

Localizar células interessantes ou anormais

Identifique as vendas por loja que contradizem as tendências típicas com o tempo.

Algoritmo Microsoft Time Series

O Assistente de Mineração de Dados o conduz pelo seguinte processo para criar a estrutura para um novo modelo de mineração:

  1. Selecionando um tipo de fonte de dados, nesse caso, um cubo.

    ObservaçãoObservação

    O cubo OLAP deve existir dentro do mesmo banco de dados como a estrutura de mineração. Você não pode usar um cubo criado pelo suplemento PowerPivot para Excel como uma fonte para mineração de dados.

  2. Selecionando um algoritmo.

  3. Selecionando uma dimensão de cubo de fonte.

  4. Selecionando uma chave de caso.

  5. Selecionando colunas de caso.

  6. Selecionando tabelas aninhadas.

  7. Selecionando o uso de cada coluna; previsível, entrada ou chave.

  8. Especificando os tipos de conteúdo da coluna.

  9. Dividindo o cubo de fonte.

  10. Criando um conjunto de dados de teste opcional.

  11. Nomeando e salvando a nova estrutura de mineração e o modelo de mineração associado.

Você pode definir as seguintes opções na última página do assistente:

  • Permitir detalhamento

  • Criar dimensão do modelo de mineração

  • Criar um cubo usando a dimensão do modelo de mineração

Se você optar por criar uma nova dimensão de modelo de mineração no cubo de origem, poderá incluir as informações que o algoritmo de mineração de dados encontra na fonte de dados OLAP. Ao criar uma dimensão de modelo de mineração, você pode procurar e consultar o conteúdo do modelo que foi armazenado na forma de uma dimensão. Essa opção está disponível para os modelos criados usando os algoritmos Cluster Microsoft, as Árvores de Decisão da Microsoft e Regras de Associação da Microsoft.

Se você selecionar a opção para criar um novo cubo, um novo cubo é definido no banco de dados, incluindo a dimensão do modelo de mineração e, opcionalmente, quaisquer dimensões relacionadas. Isto permite fatiar seus dados de fato pela hierarquia que foi descoberta pelo modelo de mineração.

Para obter mais informações:Algoritmos de mineração de dados (Analysis Services – Mineração de Dados), Colunas do modelo de mineração, Colunas da estrutura de mineração, Tipos de dados (Mineração de Dados), Tipos de conteúdo (mineração de dados)

Habilitando o detalhamento e a validação

Quando você cria a estrutura de mineração, você também deve definir duas opções importantes para trabalhar com os dados: validação e detalhamento. A validação permite que você particione os dados na estrutura de mineração em um conjunto de treinamento e um conjunto de teste para uso com todos os modelos associados àquela estrutura. Para obter mais informações, consulte Particionando dados em conjuntos de treinamento e teste (Analysis Services - Mineração de dados).

O detalhamento permite que você exiba dados de origem na estrutura de mineração, consultando o modelo de mineração. Isso é útil quando você está visualizando os resultados de um modelo de mineração e quer ver detalhes adicionais a partir dos casos subjacentes. Por exemplo, talvez você queira encontrar informações de contato, os casos que foram usados para treinar um determinado cluster e assim por diante. Para usar o detalhamento, você deve habilitá-lo quando você cria a estrutura de mineração; você não pode habilitá-lo posteriormente. Para obter mais informações, consulte Usando a análise nos modelos de mineração e nas estruturas de mineração (Analysis Services – Mineração de dados).