Novidades (Analysis Services - Mineração de dados)

ObservaçãoObservação

Para o SQL Server 2008 R2, não houve alterações no conteúdo listado neste tópico.

Esta última versão do Microsoft SQL Server Analysis Services apresenta novos recursos e aprimoramentos. Para obter mais informações sobre os novos recursos de análise na memória, e sobre o modo integrado do Sharepoint para Analysis Services, consulte PowerPivot para SharePoint.

Compatibilidade com Suplementos de Mineração de Dados para o Office 2007

O SQL Server 2008 R2 oferece suporte à criação e ao gerenciamento e usa os modelos de mineração de dados do Microsoft Excel quando você usa os Suplementos de Mineração de Dados do SQL Server 2008 para o Office 2007. A versão deste suplemento grátis popular pode ser usada para conectar a instâncias do Analysis Services que estejam usando o SQL Server 2008 R2 ou o SQL Server 2008. Não é possível usar diretamente os conjuntos de dados multidimensionais na memória que são criados pelo PowerPivot para Excel.

Compatibilidade com PowerPivot para Excel 2010

Você pode instalar os Suplementos de Mineração de Dados no mesmo computador que o suplemento do PowerPivot para Excel e usá-los dentro da mesma pasta de trabalho do Excel 2010. No entanto, para usar os suplementos de Mineração de Dados, você deve ter instalada a versão de 32 bits do Excel 2010. O cliente de PowerPivot pode executar em uma versão de 32 bits ou de 64 bits do Excel 2010.

Para obter mais informações sobre os suplementos, consulte Suplementos de Mineração de Dados para o Office 2007.

Novos exemplos e recursos

Os Manuais Online não incluem mais bancos de dados e aplicativos de exemplo do SQL Server. Esses exemplos de bancos de dados e aplicativos agora estão disponíveis no site Exemplos do SQL Server. Esse site não só facilita a localização desses exemplos pelos usuários, como também fornece novos exemplos relacionados ao Microsoft SQL Server e ao Business Intelligence. No site de exemplos do SQL Server, é possível fazer o seguinte:

  • Procurar exemplos enviados por desenvolvedores, usuários e pela comunidade Most Valuable Professional (MVP) do Microsoft.

  • Faça o download de exemplos de bancos de dados de e projetos de código.

  • Visualize ou participe de uma área de discussão onde você possa relatar problemas e fazer perguntas sobre os exemplos de cada área de tecnologia.

  • Exemplos adicionais que usam o cliente do PowerPivot e a nova instância integrada do Sharepoint do Analysis Services podem ser encontrados no site PowerPivot.com.

Recursos de mineração de dados no SQL Server 2008

A versão R2 do SQL Server 2008 oferece suporte aos recursos a seguir que eram novos no SQL Server 2008.

Criação de conjuntos de teste de controle

Ao criar uma estrutura de mineração, agora é possível dividir os dados na estrutura de mineração em conjuntos de treinamento e teste permanentes. A definição da partição é armazenada com a estrutura, por isso é possível reutilizar os conjuntos de teste e treinamento com qualquer modelo de mineração baseado nessa estrutura.

Para obter mais informações sobre como usar conjuntos de dados de treinamento e teste, consulte Particionando dados em conjuntos de treinamento e teste (Analysis Services - Mineração de dados).

Para obter mais informações sobre todos os recursos de validação de modelo no SQL Server 2008, consulte Validando modelos de mineração de dados [Analysis Services - Mineração de Dados].

Filtrando casos de modelo

Agora é possível anexar filtros a um modelo de mineração e aplicá-lo durante o treinamento e o teste. Aplicar um filtro ao modelo permite controlar os dados usados para treinar o modelo e acessar com mais rapidez o desempenho do modelo nos subconjuntos dos dados.

Para obter mais informações sobre como criar filtros de modelos de mineração, consulte Criando filtros para modelos de mineração (Analysis Services - Mineração de dados).

Para obter informações sobre como filtrar dados para teste de modelo de mineração, consulte Ferramentas para criar gráficos de precisão de modelos (Analysis Services - Mineração de dados).

Validação cruzada para vários modelos de mineração

A validação cruzada é um método estabelecido de avaliar a exatidão de modelos de mineração de dados. Na validação cruzada, você divide os dados da estrutura de mineração em subconjuntos, cria modelos nos subconjuntos e mede a exatidão do modelo para cada partição. Ao examinar as estatísticas retornadas, é possível determinar a confiabilidade do modelo de mineração e comparar com mais facilidade os modelos que se baseiam na mesma estrutura.

Para obter mais informações, Validação cruzada (Analysis Services - Mineração de dados).

Aperfeiçoamentos para o algoritmo MTS

Para melhorar a exatidão e estabilidade de algumas predições nos modelos de série temporal, um novo algoritmo foi adicionado ao algoritmo Microsoft MTS. Com base no conhecido algoritmo ARIMA, o novo algoritmo fornece melhores previsões a longo prazo que o algoritmo ARTxp usado pelo Analysis Services. (ARTxp é um algoritmo de árvore de regressão automática que é aperfeiçoado para um único intervalo de tempo ou previsões a curto prazo.)

Para obter mais informações sobre modelos de mineração de série temporal, consulte Algoritmo MTS e PredictTimeSeries (DMX).

Detalhamento para casos de estrutura e colunas de estrutura

No SQL Server 2008, ao habilitar o detalhamento em uma estrutura de mineração, é possível consultar essa estrutura e retornar detalhes sobre os casos usados para treinamento e teste. Você pode criar consultas de detalhamento em uma estrutura usando o DMX (Data Mining Extensions).

Para obter mais informações, consulte Usando a análise nos modelos de mineração e nas estruturas de mineração (Analysis Services – Mineração de dados).

Para obter exemplos de consultas DMX em uma estrutura de mineração, consulte SELECT FROM <estrutura>.CASES.

Para obter exemplos de detalhamento de um modelo para dados de estrutura, consulte SELECIONAR A PARTIR DE CASOS DE <modelo> (DMX).

Definindo o alias de colunas do modelo de mineração

Agora você pode adicionar aliases a colunas em um modelo de mineração para tornar o conteúdo da coluna mais fácil de entender e referenciar a coluna em instruções DMX.

Para obter mais informações sobre como gerenciar e exibir aliases, consulte Definindo propriedades em um modelo de mineração ou Como criar um alias para uma coluna de modelo.

Para obter informações sobre como criar um alias de coluna usando DMX, consulte ALTER MINING STRUCTURE (DMX).

Consultando os conjuntos de linhas do esquema de mineração de dados

No SQL Server 2008, muitos dos conjuntos de linhas de esquema de mineração de dados OLE DB existentes foram expostos como um conjunto de tabelas do sistema que pode ser facilmente consultado usando as instruções DMX. Isso facilita a recuperação de metadados relacionado a modelos e estruturas para extrair detalhes do conteúdo do modelo de mineração ou para monitorar uma instância ou serviço do Analysis Services.

Para obter mais informações, consulte Consultando os conjuntos de linhas do esquema de mineração de dados (Analysis Services - Mineração de Dados).

Alterações nos modelos de clustering

No SQL Server 2008, a configuração padrão do algoritmo de clustering Microsoft foi alterada para usar normalização de pontuação zero, por padrão. O objetivo dessa alteração é minimizar o efeito de atributos que podem ter grandes magnitudes e muitas exceções. Normalmente, a normalização da pontuação z melhora os resultados do clustering. No entanto, ela pode alterar os resultados do clustering em distribuições anormais. Além disso, clientes que migram soluções de uma versão anterior do Analysis Services para o Analysis Services do SQL Server 2008 podem observar que os modelos de clustering agora produzem resultados diferentes. Para obter mais informações, consulte Referência técnica do algoritmo Microsoft Clustering.

Aprimoramentos do Analysis Services

Se usar o Analysis Services para criar cubos OLAP que também são usados para mineração de dados, talvez você descubra que ele é muito mais fácil para criar dimensões e suas hierarquias e atributos relacionados. O Designer de Dimensão inclui um novo designer de Relação de Atributo que ajuda a criar relações de atributo e a verificar se elas seguem as melhores práticas.

Para obter mais informações, consulte Novidades (Analysis Services - Banco de Dados Multidimensional).