Novidades (Analysis Services - Mineração de dados)

Esta última versão do MicrosoftSQL ServerAnalysis Services apresenta novos recursos e aprimoramentos.

Criação de conjuntos de teste de controle

Ao criar uma estrutura de mineração, agora é possível dividir os dados na estrutura de mineração em conjuntos de treinamento e teste permanentes. A definição da partição é armazenada com a estrutura, por isso é possível reutilizar os conjuntos de teste e treinamento com qualquer modelo de mineração baseado nessa estrutura.

Os dados são divididos aleatoriamente entre as partições de treinamento e teste, mas também é possível especificar a semente usada para criar as partições se for necessário recriar uma.

Você pode especificar o tamanho do conjunto de teste como uma porcentagem dos dados totais ou como um número total de linhas ou combinar esses requisitos. Para obter mais informações sobre como usar conjuntos de dados de treinamento e teste, consulte Particionando dados em conjuntos de treinamento e teste (Analysis Services - Mineração de dados).

Para obter mais informações sobre todos os recursos de validação de modelo no SQL Server 2008, consulte Validando modelos de mineração de dados [Analysis Services - Mineração de Dados].

Filtrando casos de modelo

Agora é possível anexar filtros a um modelo de mineração e aplicá-lo durante o treinamento e o teste. Aplicar um filtro ao modelo permite controlar os dados usados para treinar o modelo e acessar com mais rapidez o desempenho do modelo nos subconjuntos dos dados.

Por exemplo, talvez você queira conhecer a precisão de um modelo de correspondência dirigida apenas para os clientes com um determinado nível de renda. É possível aplicar o filtro na coluna de receita do modelo de mineração ao criar o gráfico de comparação de precisão e ver os resultados somente para essas informações demográficas.

O Business Intelligence Development Studio também fornece novos editores de filtro para ajudar a criar condições complexas que possam ser aplicadas a tabelas de casos e tabelas aninhadas.

Para obter mais informações sobre como criar filtros de modelos de mineração, consulte Criando filtros para modelos de mineração (Analysis Services - Mineração de dados).

Para obter informações sobre como filtrar dados para teste de modelo de mineração, consulte Ferramentas para criar gráficos de precisão de modelos (Analysis Services - Mineração de dados).

Validação cruzada para vários modelos de mineração

A validação cruzada é um método estabelecido de avaliar a exatidão de modelos de mineração de dados. Na validação cruzada, você divide os dados da estrutura de mineração em subconjuntos, cria modelos nos subconjuntos e mede a exatidão do modelo para cada partição. Ao examinar as estatísticas retornadas, é possível determinar a confiabilidade do modelo de mineração e comparar com mais facilidade os modelos que se baseiam na mesma estrutura.

A validação cruzada está disponível na exibição Gráfico de Precisão de Mineração do Designer de Mineração de Dados. Também é possível particionar uma estrutura de mineração, testar vários modelos de mineração e gerar uma análise usando procedimentos armazenados do Analysis Services.

No SQL Server 2008, para gerar um relatório de validação cruzada, especifique a estrutura de mineração, o atributo previsível e o número de pastas nas quais os dados de caso serão segmentados.

O Analysis Services retorna uma tabela que relata estatísticas como probabilidades ou erros de raiz quadrada média para partições individuais, e o desvio médio e padrão de todas as medidas para os modelos agregados. Para obter mais informações, Validação cruzada (Analysis Services - Mineração de dados).

Suporte para os Suplementos de Mineração de Dados para o Office 2007

O SQL Server 2008 oferece suporte à criação e ao gerenciamento e usa os modelos de mineração de dados do Microsoft Excel quando você usa os Suplementos de Mineração de Dados do SQL Server 2008 para o Office 2007. A última versão desse suplemento gratuito e popular passou a oferecer suporte às partições de teste e treinamento do lado servidor, validação cruzada e muitas novas ferramentas analíticas, como a análise do carrinho de compras e um cálculo de previsão que podem ser impressos.

Você também pode usar o assistente de Modelo de Documento para criar facilmente a documentação para estruturas e modelos que estiverem armazenados em uma instância do SQL Server 2008. Para obter mais informações sobre os suplementos, consulte Suplementos de Mineração de Dados para o Office 2007.

Aperfeiçoamentos para o algoritmo MTS

Para melhorar a exatidão e estabilidade de algumas predições nos modelos de série temporal, um novo algoritmo foi adicionado ao algoritmo MTS. Com base no conhecido algoritmo ARIMA, o novo algoritmo fornece melhores previsões a longo prazo que o algoritmo ARTxp usado pelo Analysis Services. (ARTxp é um algoritmo de árvore auto-regressivo que é aperfeiçoado para um único intervalo de tempo ou previsões a curto prazo.)

Por padrão, a nova implementação do algoritmo MTS usa o algoritmo ARTxp, treinando uma versão do modelo do algoritmo ARIMA para treinar outra. Depois, o algoritmo pesa os resultados desses dois modelos para fornecer as características de previsão que você prefere. Se você não quiser usar essa implementação padrão, poderá especificar o algoritmo MTS para usar apenas o algoritmo ARTxp ou ARIMA. No SQL Server 2008 Enterprise, é possível especificar um peso personalizado dos algoritmos para fornecer a melhor previsão em um período variável.

O algoritmo MTS agora também aceita dados durante a previsão para ativar novos cenários de negócios. Por exemplo, é possível criar um modelo de previsão de receita com base nas médias dos produtos, agregados regionais ou outros grandes conjuntos de dados. Você pode aplicar esse modelo à série temporal que mostra as vendas de um determinado produto. Ao aplicar o modelo geral, é possível aproveitar a estabilidade e disponibilidade dos dados agregados e personalizar a previsão para esse produto.

Você também pode treinar modelos usando várias séries e aplicá-los a novos dados para prever cenários hipotéticos.

Para obter mais informações sobre modelos de mineração de série temporal, consulte Algoritmo MTS e PredictTimeSeries (DMX).

Detalhamento para casos de estrutura e colunas de estrutura

No SQL Server 2008, ao habilitar o detalhamento em uma estrutura de mineração, é possível consultar essa estrutura e retornar detalhes sobre os casos usados para treinamento e teste. Você pode criar consultas de detalhamento em uma estrutura usando o DMX (Data Mining Extensions).

Além disso, se o detalhamento for habilitado em um modelo de mineração e na estrutura de mineração relatada, será possível criar consultas que recuperam colunas de dados da estrutura de mineração subjacente. Isso será útil se você quiser descobrir informações detalhadas sobre casos em um nó específico. Por exemplo, você pode recuperar informações de contato para clientes em um cluster específico.

Para obter mais informações, consulte Usando a análise nos modelos de mineração e nas estruturas de mineração (Analysis Services – Mineração de dados).

Para obter exemplos de consultas DMX em uma estrutura de mineração, consulte SELECIONAR A PARTIR DE CASOS DE <structure>..

Para obter exemplos de detalhamento de um modelo para dados de estrutura, consulte SELECIONAR A PARTIR DE CASOS DE <modelo> (DMX).

Definindo o alias de colunas do modelo de mineração

Agora você pode adicionar aliases a colunas em um modelo de mineração para tornar o conteúdo da coluna mais fácil de entender e referenciar a coluna em instruções DMX.

Por exemplo, se você criar uma estrutura de mineração contendo versões contínuas e de dados discretos dos mesmos dados, é possível dar-lhes o mesmo nome para facilitar a comparação.

Para obter mais informações sobre como gerenciar e exibir aliases, consulte Definindo propriedades em um modelo de mineração ou Como criar um alias para uma coluna de modelo.

Para obter informações sobre como criar um alias de coluna usando DMX, consulte ALTER MINING STRUCTURE (DMX).

Consultando os conjuntos de linhas do esquema de mineração de dados

No SQL Server 2008, muitos dos conjuntos de linhas de esquema de mineração de dados OLE DB existentes foram expostos como um conjunto de tabelas do sistema que pode ser facilmente consultado usando as instruções DMX. Isso facilita a recuperação de metadados relacionado a modelos e estruturas para extrair detalhes do conteúdo do modelo de mineração de dados ou para monitorar uma instância ou serviço do Analysis Services.

Para obter mais informações, consulte Consultando os conjuntos de linhas do esquema de mineração de dados (Analysis Services - Mineração de Dados).

Novo local de exemplos

Os Manuais Online já não incluem bancos de dados e aplicativos de exemplo do SQL Server. Esses exemplos de bancos de dados e aplicativos agora estão disponíveis no site Exemplos do SQL Server. Esse site não só facilita a localização desses exemplos pelos usuários, como também fornece novos exemplos relacionados ao MicrosoftSQL Server e ao Business Intelligence. No site de exemplos do SQL Server, é possível fazer o seguinte:

  • Procurar exemplos enviados por desenvolvedores, usuários e pela comunidade Most Valuable Professional (MVP) do Microsoft.

  • Baixar exemplos de bancos de dados e de projetos de código.

  • Exibir ou participar de uma área de discussão onde é possível relatar questões e fazer perguntas sobre os exemplos de cada área de tecnologia.

Instalação lado a lado com o SQL Server 2005 Analysis Services

Agora, o SQL Server 2008Analysis Services pode ser instalado lado a lado com o SQL Server 2005 Analysis Services (SSAS). Para obter mais informações, consulte Trabalhando com várias versões e instâncias do SQL Server.

Para saber sobre questões importantes relativas à instalação lado a lado que afetam o Analysis Services, consulte o arquivo Leiame que acompanha esta versão.

Backup e restauração de bancos de dados do Analysis Services

A capacidade de fazer backup e restaurar um banco de dados do Analysis Services foi aprimorada. Há menos restrições no tamanho do banco de dados, e o tempo necessário para fazer backup e restaurar operações ficou bastante reduzido.

Para obter mais informações, consulte Novidades (Analysis Services - Banco de Dados Multidimensional).

Outros aprimoramentos do Analysis Services

Se você usar o Analysis Services para criar cubos OLAP que também usam mineração de dados, talvez ache muito mais fácil criar dimensões e suas hierarquias e atributos relacionados. O Designer de Dimensão inclui um novo designer de Relação de Atributo que ajuda a criar relações de atributo e a verificar se elas seguem as melhores práticas.

Para obter mais informações, consulte Novidades (Analysis Services - Banco de Dados Multidimensional).