Projetos de mineração de dados (Analysis Services - Mineração de Dados)

Ao desenvolver uma solução de mineração de dados no Analysis Services, primeiro você cria um projeto do Analysis Services. Nesse projeto define-se a fonte de dados que será usada para a análise e, depois, um modelo que inclui um algoritmo e instruções personalizadas para manusear os dados. Você também pode continuar a testar e refinar o modelo dentro do projeto. Quando estiver satisfeito com a solução, poderá implantá-la em outro servidor ou usá-la em um aplicativo para fornecer previsões e análises.

As seções a seguir descrevem as ferramentas e os processos para criar uma solução de mineração de dados e fornecem links para recursos usados em cada etapa.

Criando um projeto do Analysis Services

Quando você desenvolve uma solução de mineração de dados, você cria primeiramente um novo projeto do Analysis Services usando o Business Intelligence Development Studio. Cada projeto de mineração de dados contém os seguintes objetos: fontes de dados, exibições de fonte de dados (que têm como base as fontes de dados), estruturas de mineração (que definem como os dados são usados no modelo) e modelos de mineração (que criam e armazenam padrões).

Para obter mais informações:Definindo um projeto do Analysis Services, Definindo uma fonte de dados com o Assistente para Fonte de Dados (Analysis Services)

Definindo uma fonte de dados

A fonte de dados define a cadeia de conexão e as informações de autenticação que o servidor Analysis Services usará para se conectar com a fonte de dados. A fonte de dados pode conter várias tabelas ou exibições. O Analysis Services pode usar conjuntos de dados de bancos de dados relacionais e OLAP (Processamento Analítico Online) ou de fornecedores externos.

Depois de definir essa conexão a uma fonte de dados, você cria uma exibição que identifica os dados específicos que são relevantes para seu modelo. A exibição da fonte de dados também permite que você personalize a forma como os dados na fonte de dados são fornecidos para o modelo de mineração. É possível modificar a estrutura dos dados para torná-la mais relevante para o seu projeto ou selecionar apenas determinados tipos de dados. Se quiser filtrar dados, poderá fazê-lo na exibição da fonte de dados ou nos filtros que são aplicados no nível do modelo.

Os requisitos relacionados à quantidade de dados que será necessária e a como os dados devem ser limpos e formatados vão varias de acordo com o algoritmo usado para investigar os dados.

Para obter mais informações:, Definindo uma exibição da fonte de dados (Analysis Services)

Adicionando estruturas de mineração a um projeto do Analysis Services

Quando tiver dados suficientes para iniciar a análise, você pode selecionar as colunas de dados mais relevantes para seu problema nos negócios e adicionar estruturas de mineração ao projeto. Uma estrutura de mineração define a coluna de dados e as colunas com tabelas aninhadas que são obtidas na exibição da fonte de dados ou em um cubo OLAP no projeto.

Para adicionar uma nova estrutura de mineração, basta iniciar o Assistente de Mineração de Dados que o guiará pelo processo de definição de dados e, como opção, pela criação de um modelo de mineração de dados inicial. Ao criar uma estrutura, você também pode dividir os dados para incluir um conjunto de dados de treinamento, usado para criar modelos, e um conjunto de dados de teste, usado para testar ou validar todos os modelos de mineração com base naquela estrutura. É possível usar a guia Estrutura de Mineração do Designer de Mineração de Dados para modificar estruturas de mineração existentes, inclusive a adição de colunas e de tabelas aninhadas.

Para obter mais informações:Criando uma nova estrutura de mineração, Designer de mineração de dados, Assistente de Mineração de Dados (Analysis Services - Mineração de dados)

Trabalhando com modelos de mineração de dados

Para cada estrutura de mineração, é possível adicionar um ou mais modelos de mineração. O modelo de mineração define o algoritmo ou o método de análise que você usará nos dados. Você processa cada modelo ao executar os dados em uma exibição de fonte de dados através do algoritmo, o que gera um modelo matemático de dados. Esse processo também é conhecido como treinamento de modelo.

Depois que o modelo foi processado, você pode explorá-lo visualmente e criar consultas de previsão usando esse modelo de mineração.

O Analysis Services fornece diversas opções para o processamento dos objetos do modelo de mineração, incluindo recursos para controlar quais objetos são processados e como. Por exemplo, você pode processar uma estrutura e armazenar os dados em cache e, depois, continuar a adicionar novos modelos à estrutura. Se os dados forem armazenados em cache, você poderá usar consultas de detalhamento para retornar informações detalhadas sobre os casos usados no modelo.

Para obter mais informações:Algoritmos de mineração de dados (Analysis Services – Mineração de Dados), Processando objetos do Analysis Services, Usando a análise nos modelos de mineração e nas estruturas de mineração (Analysis Services – Mineração de dados).

Validando modelos de mineração de dados

Depois de criar um modelo, será possível investigar os resultados e tomar decisões sobre quais modelos apresentam o melhor desempenho. Na guia Visualizador do Modelo de Mineração do Designer de Mineração de Dados, o Analysis Services fornece visualizadores para cada tipo de modelo de mineração, que podem ser usados para explorar os modelos de mineração.

Na guia Gráfico de Precisão de Mineração do designer, o Analysis Services fornece ferramentas que podem ser usadas para comparar diretamente modelos de mineração e escolher o mais preciso ou útil. Essas ferramentas incluem um gráfico de comparação de precisão, um gráfico de ganho e uma matriz de classificação. 

Você também pode usar um relatório de validação cruzada, novo no SQL Server 2008, para realizar subamostragens interativas dos seus dados e determinar se o modelo é mais adequado para um conjunto de dados específico. As estatísticas fornecidas pelo relatório podem ser usadas para comparar objetivamente modelos e avaliar a qualidade dos seus dados de treinamento.

Para obter mais informações:Exibindo um modelo de mineração de dados, Validando modelos de mineração de dados [Analysis Services - Mineração de Dados]

Criando previsões

O principal objetivo da maioria dos projetos de mineração de dados é usar um modelo de mineração para criar previsões. Depois de explorar e comparar modelos de mineração, você pode usar uma das diversas ferramentas para criar previsões. O Analysis Services fornece uma linguagem de consulta chamada DMX (Data Mining Extensions) que é a base para a criação de previsões e de fácil criação de scripts. Para ajudá-lo a criar consultas de previsão DMX, o SQL Server fornece um construtor de consultas, disponível no SQL Server Management Studio e no Business Intelligence Development Studio, e modelos DMX para o editor de consultas no Management Studio. No BI Development Studio, você acessa o construtor de consultas na guia Previsão de Modelo de Mineração do Designer de Mineração de Dados.

Para obter mais informações:Criando consultas de previsão DMX, Referência de instrução DMX (Data Mining Extensions)

SQL Server Management Studio

Depois de usar o BI Development Studio para criar modelos de mineração para seu projeto de mineração de dados, você poderá gerenciar e trabalhar com os modelos e criar previsões no Management Studio. Usando as ferramentas de consulta no SQL Server Management Studio, você pode explorar os dados nos seus modelos, criar consultas de conteúdo complexas ou gerenciar objetos de mineração de dados armazenados em uma instância do SQL Server.

Para obter mais informações:Mineração de dados no SQL Server Management Studio, Mineração de dados no SQL Server Management Studio

SQL Server Reporting Services

Depois de criar um modelo de mineração, você talvez queira distribuir os resultados para um público maior. Como os resultados dos modelos de mineração de dados são armazenados em um esquema consistente que é prontamente acessado via consulta de bancos de dados, você pode usar diversas ferramentas cliente para apresentar resultados de análises, para explorar padrões no modelo ou para fazer previsões.

Use o Designer de Relatórios no Microsoft SQL Server Reporting Services para criar relatórios, que podem ser usados para apresentar as informações contidas em um modelo de mineração. É possível usar o resultado de qualquer consulta DMX como base de um relatório e aproveitar os recursos de parametrização e formatação disponíveis no Reporting Services.

Para obter mais informações:Tipo de conexão do Analysis Services para DMX (SSRS), Integrando o Reporting Services em aplicativos

Trabalhando programaticamente com mineração de dados

O Analysis Services fornece várias ferramentas que podem ser usadas para trabalhar programaticamente com mineração de dados. A linguagem DMX fornece instruções que podem ser usadas para criar, treinar e usar modelos de mineração de dados. É possível executar essas tarefas usando uma combinação de XMLA (XML for Analysis) e ASSL (Analysis Services Scripting Language), ou usando Objetos de Gerenciamento de Análise (AMO).

Você pode acessar todos os metadados associados à mineração de dados usando conjuntos de linhas de esquema de mineração de dados. Por exemplo, você pode usar conjuntos de linhas de esquema para determinar os tipos de dados aos quais um algoritmo dá suporte ou os nomes de modelo que existem em um banco de dados.

Para obter mais informações:Referência DMX (Data Mining Extensions), Conjuntos de linhas do esquema de mineração de dados, Usando XML for Analysis no Analysis Services (XMLA)