Share via


Business Intelligence

Planejando a solução de BI Microsoft primeiro

Stacia Misner

 

Em uma visão geral:

  • Introdução ao BI
  • Evitar problemas comuns com bancos de dados corporativos
  • Um passeio pela pilha Microsoft BI
  • Criando uma solução simples

Conteúdo

O que É BI?
O que está errado com consultar seus bancos de dados corporativos?
Suporte para qualquer decisão
BI em ação
A pilha de BI Microsoft
Uma abordagem ao desenvolvimento de soluções
Guia de Introdução
Próximas etapas

Banco de mais dados (DBAs) administradores haveencountered alguma forma de business intelligence (BI) ao gerenciamento de dados e a implementação do Microsoft SQL Server ’s sua organização. Muitos outros profissionais de TI, que tenham responsabilidades DBA, provavelmente tenha ouvido falar de BI, mas não tenham experiência de primeira com ele ou realmente mesmo saber o que é. Neste artigo, você descobrirá o que é todos os confusão sobre. Uma vez entendido o que as tecnologias de BI podem realmente fazer e ver como soluções de BI são construídas na plataforma Microsoft BI, você vai descobrir por que BI não está apenas para os DBAs. Se você estiver experientes sobre BI, você vai ser em uma posição melhor para oferecer suporte a sua organização é iniciativas de BI quando eles surgem (e serão) e você também perceberá como você pode usar BI para controlar e analisar dados relevantes para sua função, tornando seu trabalho mais fácil e deepening sua compreensão dos dados.

Este artigo é o primeiro em uma série de artigos que apresentar a pilha de BI da Microsoft. Neste artigo inicial, Defino BI e descrever a arquitetura de alto nível de uma solução de BI em geral de condições. Eu também fornecer algum esclarecimento sobre o processo de criação de uma solução de BI. Para investigar para as tecnologias de BI do SQL Server mencionadas neste artigo, você pode ler a complementar artigos escritos por Derek Comingore nesta edição (consulte" Criação de uma base de dados para uma solução de BI") e por Scot Reagin e me em problemas futuros.

O que É BI?

Vários anos atrás, enquanto que foi coauthoring Business Intelligence: Making Better Decisions Faster (Microsoft Press, 2002), fiquei surpreso por como altamente meus colegas disagreed sobre quais tecnologias devem ser consideradas dentro do domínio de BI e, portanto, dentro do escopo do catálogo. Foi uma experiência reveladora para ouvir como opiniões divergentes entre BI profissionais sobre quais ferramentas eles considerados ferramentas de BI e que elas excluídas. Essa diferença da opinião ainda existe no setor de TI e muitos continuem debater a definição de BI. Para mim, BI é quanto sobre processo comercial como é sobre tecnologia, para iniciar definindo BI essa perspectiva.

Como um processo comercial, BI é uma série de atividades executadas para coletar e analisar dados para que você possa tomar melhores decisões e melhorar sua empresa, compartilhar os resultados de sua análise com outras pessoas. Se você precisar de informações para decidir como para tornar mais eficiente sua rotina diária ou para oferecer suporte a planejar longo prazo, como orçamento do próximo ano, as etapas que necessárias para localizar, transferir, formatar e estudar os dados fazem parte do BI. Além disso, BI inclui os processos de que usar para disponibilizar os resultados para referência posterior para que você e outras pessoas podem medir o impacto das decisões feitas após estudar os dados. Normalmente, BI é um processo iterativo. Analisar os dados para ver o que aconteceu, você tomar providências para garantir a coisas boas manter acontecendo e parada coisas ruins e, em seguida, você analisar os dados em um ponto posterior para determinar se suas ações feita coisas melhor ou pior e se fatores externos ajudaram ou impedido seus esforços.

Dada essa definição ampla de BI, você está usando BI mesmo quando você estiver jotting para baixo de bits de informações ou criando listas para ajudá-lo tomar decisões durante o dia. Introduzir tecnologia em alguns ou todos os processos de negócios que usar para coletar, analisar e compartilhar informações podem tornar esses processos mais eficiente. As organizações tendem a iniciar pequeno quando a adoção de tecnologia de BI, geralmente usá-lo primeiro para resolver problemas específicos. Com o passar do tempo, o uso de tecnologia de BI incrementalmente cresce como a ênfase é deslocado para disseminar informações com eficiência em toda a organização. Como sua estratégia de BI continua a amadurecer, a organização geralmente adquire mais sofisticadas ferramentas para permitir maior interação com e a exploração de dados.

O que está errado com consultar seus bancos de dados corporativos?

Em qualquer definição de BI, os dados são sempre o ponto focal. Você deve estar se perguntando por que você precisa se preocupar com para criar uma solução de BI quando você pode simplesmente consultar um ou mais dos bancos de dados da sua organização para obter os dados que necessários. Se você for o único consumidor dos dados que você está coletando, se você tiver as ferramentas, habilidades e os privilégios de segurança para acessar os bancos de dados corporativos, e se todos os dados que você precisa estiverem em dessas fontes, provavelmente você não precisa uma solução de BI formal. Por outro lado, se você precisar regularmente compartilhar informações com outras pessoas cujo habilidades técnicas e os privilégios de segurança variam, você precisará criar uma solução de BI que é simples de usar e manter. Você também precisa considerar que depois de ouvir seus colegas sobre esta solução de BI organizada, será deseja usá-la também. Para antecipar essa demanda, sua solução deve ser escalonável desde o início.

Superficialmente, permitindo que todos na empresa para executar relatórios para obter dados de bancos de dados corporativos pode parecer uma boa idéia, mas essa abordagem provavelmente não é muito popular com os DBAs. Como eles dirá a você, consultar bancos de dados corporativos diretamente pode vir com mais de alguns problemas. Aqui estão algumas das mais comuns:

  • Se os dados da organização são armazenados em diferentes plataformas em formatos diferentes, consolidar os dados em um formato comum que é útil para análise pode ser um desafio. Dados não podem ser copiados diretamente das tabelas de origem uma tabela de destino comuns mas terão que ser manipulados de alguma forma antes que ele está armazenado.
  • Definições de dados podem não estar consistentes em vários bancos de dados e reconciliar dados parece estar semelhante pode ser difícil. Por exemplo, a receita de um banco de dados de venda pode ser calculada de acordo com um conjunto de regras comerciais, mas ser sujeitos a totalmente diferente conjunto de regras comerciais em um banco de dados Contabilidade geral.
  • Cada banco de dados provavelmente é estruturado e otimizado para inserir dados ou para executar pesquisas. Mesmo se você deseja consultar apenas um banco de dados, executando consultas analíticas geralmente requer o resumo de grandes quantidades de dados, que é uma operação cara em termos de recursos do banco de dados. Conseqüentemente, suas consultas podem levar um longo tempo para executar e pode criar contenção de recursos com outros aplicativos que realizam inserir, operações de atualização ou pesquisa.
  • Dados históricos é geralmente arquivados em vez de indefinidamente mantidos em um banco de dados corporativo. Se você desejar examinar tendências longo do tempo — uma atividade de BI comuns — sua solução talvez precise ser um repositório de dados que não persistem no banco de dados corporativo.
  • Alguns dados necessários para análise pode não estar disponível no banco de dados corporativo. Ele pode estar em arquivos simples, planilhas ou dados não estruturados formatos como documentos do Microsoft Word. Mais problemático é obter as informações pessoas tiverem armazenado em sua máquina local — ou em sua cabeça.
  • Mesmo se dados estiverem disponíveis, problemas de qualidade, às vezes, significa que você não pode usá-lo diretamente da fonte. Talvez seja necessário baixar os dados e limpá-lo antes de você pode analisá-lo. A menos que os dados podem ser limpos dentro a fonte, você precisará limpar os dados manualmente sempre que você acessá-lo — certificando-se de você aplicar sempre as mesmas regras. Além disso, você não pode ter certeza de que todos outra usando os mesmos dados é seguir as regras mesmas para a limpeza-lo.

Para resolver esses problemas com acesso a dados, uma solução de BI geralmente inclui um banco de dados criado exclusivamente para abrigar os dados usados para análise. Significa tendo como um banco de dados que você pode evitar problemas de contenção de recurso entre atividades gerar dados e atividades consumir os dados. Dando um passo adiante, você poderá reestruturar os dados para que consultas Resumindo dados podem ser executado muito mais rápido. Quando você precisar consolidar dados de várias fontes de dados, você pode centralizar a ele e aplicar lógica comercial para colocar os dados em um formato comum com significado consistente. Você também pode incorporar dados que não vêm de um banco de dados, como um documento XML ou uma planilha, para esse local central. Outra vantagem de criar um banco de dados separado é que você pode preservar dados históricos por tempo necessário após os dados são removidos de bancos de dados de origem. Finalmente, você pode automatizar o processo de limpeza e aprimorar os dados de análise, garantindo que as mesmas regras sejam aplicadas a cada vez que os dados são acessados.

Suporte para qualquer decisão

Uma solução de BI deve fazer mais do que lhe oferece melhor acesso a dados. Ele especificamente deve oferecer suporte a seus esforços de tomada de decisão. Em geral, uma solução de BI deve ajudam a avaliar e responder às condições de negócios, se você precisar de um modo de exibição abrangente de todos os de toda a organização ou uma perspectiva estreita de um departamento, grupo de trabalho ou até mesmo uma equipe de um. Na verdade, a capacidade de mover rapidamente de um modo de exibição resumido para uma exibição detalhada dos dados é um recurso importante de BI.

O objetivo de uma solução de BI é permitir que você gaste seu tempo analisar os dados e encontrar respostas para perguntas em vez de rastrear, consolidar, reformatação e reconciliar dados propriamente ditos. Quando você tem tempo suficiente qualidade para analisar os dados, geralmente pode detectar problemas no início e etapas para parar negativas tendências de continuar. Você também pode usar BI descobrir correlações entre pontos de dados aparentemente não relacionados e, em seguida, se adapte seus estratégias para ativar suas idéias em dólares salvos ou dólares acumulados. Cada decisão de que tornar cada dia, como faria seu trabalho, se você estiver solucionando um problema ou se planejar o futuro, converte direta ou indiretamente em um custo ou um lucro para a sua empresa.

BI em ação

Noções básicas sobre BI em um nível teórico é bom, mas realmente ver-la em ação ajuda você a compreender seus benefícios. Para mostrar como BI funciona, os três outros artigos desta série descrevem o desenvolvimento de uma solução de BI para uma empresa fictícia chamada Adventure Works. No final deste artigo, explicarei como obter o banco de dados exemplo Adventure Works, que é um fabricante de bicicletas fictício que vende produtos em todo o mundo. Ele mantém uma equipe de vendas para vender seus produtos atacado para revendedores como lojas de bicicleta de especialidade pequeno ou estilo de depósito grande compras tomadas. A Adventure Works também vende produtos diretamente para clientes individuais através da Internet. Os dados da Adventure Works fornecem muitas oportunidades de análise que se ajustam bem a uma solução de BI.

Lembre-se de que uma solução de BI se destina a oferecer suporte a decisões. Com isso em mente, vamos considerar os tipos de perguntas que Adventure Works precisa responder antes de tomar decisões principais:

  • O canal de venda que é mais lucrativo? A Adventure Works deve decidir se deseja investir na adição de mais equipe de vendas para desenvolver relações com revendedores mais ou para expandir sua presença na Internet venda. Para ajudar guia essa decisão, analistas precisam a capacidade de comparar o desempenho de vendas com o tempo entre revendedores e seu site. Os pontos de dados de desempenho de vendas (chamados medidas) que analistas precisam comparar incluem dólares de vendas, quantidade da ordem e lucratividade. Uma tendência positiva na lucratividade é a medida mais importante porque vendas altas medido em dólares ou número de unidades vendidas não se beneficiar da empresa se esses vendas resultar em perda net.
  • É por demanda para determinados produtos crescente ou decrescente? A Adventure Works deve coincidir com níveis de produção a demanda de venda. Se a demanda por alguns produtos está crescendo, Adventure Works deverá ajustar seus processos de fabricação para garantir mais esses produtos estão disponíveis para venda e assim aumentam as vendas. Se é declínio demanda por outros produtos, Adventure Works precisa reduzir sua produção ou possivelmente eliminar linhas de produtos para evitar uma situação de oversupply esses produtos devem ser vendidos em uma perda.

Mesmo se não analisar dados de vendas em seu trabalho, recomendo que você acompanhar como criamos uma solução de BI para Adventure Works. Você pode aplicar o mesmo design e desenvolvimento princípios descritos nesta série de seus próprios dados.

A pilha de BI Microsoft

Agora vamos examinar a arquitetura de tecnologia de BI mais próximo. A pilha de BI do Microsoft fornece todas as ferramentas que necessárias para criar, gerenciar e usar uma solução de BI. SQL Server 2008 é a base da pilha como a plataforma de dados que hospeda o mart de dados ou o data warehouse. Um mart dados é um armazenamento de dados específicos do assunto. Um depósito de dados é uma coleção toda a empresa de dados que contém vários assuntos. A linha entre data warehouses e data marts é manchada, mas você não precisa se preocupar sobre as diferenças. Nesta série, uso o termo dados mart. (Embora essa série de artigos se refere especificamente para o SQL Server 2008, você também pode criar uma solução de BI semelhante usando o SQL Server 2005 e seus componentes de BI com pouca ou nenhuma modificação de instruções fornecidas.)

SQL Server 2008 inclui três componentes de BI: Integration Services (SSIS), SSAS (Analysis Services) e SSRS (Reporting Services). Esses componentes estendem a plataforma de dados com funcionalidade de integração de dados, suporte de banco de dados multidimensional e uma camada de apresentação de dados, respectivamente. Figura 1 ilustra a relação entre esses componentes uns aos outros em uma solução de BI.

fig01.gif

Figura 1 componentes do SQL Server 2008 em uma solução de BI

Depois de criar as estruturas físicas do seu mart de dados, use o SSIS para preenchê-lo com os dados que extrair de outras fontes de dados. SSIS fornece as ferramentas necessárias para automatizar os processos para limpeza de dados, consolidar dados de várias fontes e transformar os dados em uma estrutura bem adequado para análise. Você pode agendar a execução periódica desses processos usando SQL Server Agent. Em seu artigo SSIS em p. 31, Derek Comingore explica como desenvolver extração, transformação e carga (ETL) processos de uma solução de BI.

Adicionar um banco de dados do SSAS à sua solução de BI permite para oferecer suporte a mais sofisticadas, alto desempenho consultas interativas. Você usa SSAS para copiar os dados relacionais em uma estrutura de banco de dados multidimensional, chamada um cubo. Um cubo bem projetado otimiza dados para consultas ad hoc, adicionando índices e o equivalente funcional de tabelas de resumo (conhecido como agregações) para retornar resultados de consulta que podem ser exponencialmente mais rápidos do que uma consulta comparável para um banco de dados relacional. Você também pode incorporar lógica de cálculo complexo no cubo para simplificar a consultas que exigiriam caso contrário, centenas de linhas de código Transact-SQL para replicar ao usar uma fonte de dados relacional. Muitas ferramentas front-end (chamadas de navegadores de cubo) permitem que você consulta um cubo sem escrever uma única linha de código. Na edição do próximo mês, Scot Reagin mostrará como desenvolver um cubo como parte de uma solução de BI.

Se você estiver armazenando os dados em um mart de dados do SQL Server ou um cubo SSAS, você pode adicionar SSRS para sua arquitetura de solução para disponibilizar os dados para os usuários. SSRS é uma plataforma relatório que inclui ferramentas para desenvolver relatórios, para proteger e gerenciar relatórios publicados usando uma infra-estrutura administrativa centralizada e para oferecer suporte ao usuário acesso aos relatórios. Você pode usar um aplicativo Web do SSRS ou o Microsoft Office SharePoint Server 2007 (MOSS) para exibir relatórios, use o recurso de inscrição para receber relatórios por email ou chamar o SSRS Web service em seu próprio aplicativo para exibir seus relatórios. Exibe o modo de exibição padrão de um relatório no formato HTML, mas você também pode exportar um relatório para outros tipos de arquivo, como PDF ou Excel. Próximo mês, explicarei mais sobre como usar SSRS na camada de apresentação de dados de sua solução de BI.

A pilha Microsoft BI também inclui várias tecnologias do Microsoft Office que expanda as opções para a camada de apresentação de dados. Excel 2007 é uma opção popular para análise de dados de suporte em soluções de BI. Você pode acessar seu mart de dados do SQL Server ou procurar um cubo SSAS diretamente do Excel (como mostrado na Figura 2 ) e explorar dados muito mais livremente do que ao exibir um relatório do SSRS.

fig02.gif

Figura 2 usando o Excel 2007 para procurar um cubo

Ao usar o Excel para explorar dados relacionais e multidimensionais, você pode usar seus algoritmos de mineração de dados para descobrir padrões ocultos de informações em seus dados ou para detectar anomalias nos dados (que significa que você pode corrigir problemas antes de preencher seu mart dados). Uma ótima maneira de Introdução à mineração de dados é baixar um suplemento gratuito para o Excel a partir do Microsoft e, em seguida, usá-lo para analisar os dados que importar para o Excel de qualquer fonte ou ao modo de exibição a saída de um modelo de mineração de dados criado e armazenado no servidor SSAS. Um suplemento para o Visio 2007 também está disponível para o compartilhamento modelos de mineração de dados com anotações. Você pode aprender mais sobre download e uso desses suplementos no" Dados mineração suplementos para o Office 2007."

Uma opção de cada vez mais popular para compartilhamento de dados está serviços do Excel, que está disponível no MOSS. Usando o Excel 2007, você primeiro crie uma pasta de trabalho que contém uma tabela dinâmica que usa um cubo SSAS como sua fonte de dados e você e publicar a conexão de dados e sua pasta de trabalho em serviços do Excel. Embora você pode publicar pastas de trabalho que contêm dados de outros tipos de fontes de dados, uma das vantagens de usar SSAS, tabelas dinâmicas e serviços do Excel juntos é a capacidade de usar muita a mesma funcionalidade de navegação de cubo em uma interface HTML simples que preserva a familiaridade do Excel. Outra vantagem é a capacidade de centralizar a administração e o acesso de pastas de trabalho do Excel. Para obter mais informações sobre serviços do Excel, consulte" Excel Services Technical Overview."

Ainda outra vantagem de usar serviços do Excel para navegação do cubo é que você pode incorporar tabelas dinâmicas e gráficos de tabela dinâmica em uma página de painel do MOSS usando a Web Part do Excel Web Access. Um painel é um tipo de conteúdo especial SharePoint que lhe permite apresentar dados de várias fontes em uma única página usando uma variedade de Web Parts. Você mesmo pode adicionar um filtro para a página de painel e conectá-lo a todos ou alguns as Web Parts para alterar dinamicamente o conteúdo na página com base na seleção filtro. Figura 3 mostra um painel do MOSS de exemplo. O MOSS também inclui uma Web Part para exibir relatórios do SSRS que são armazenados no servidor MOSS (uma SSRS configuração opcional conhecido como modo integrado) ou você pode usar Web Parts que vêm com SSRS para exibir relatórios de armazenados no servidor de relatórios (a configuração padrão conhecido como modo nativo).

fig03.gif

Figura 3 usando uma página de painel do MOSS para exibir pastas de trabalho e relatórios

Para painéis com ainda mais funcionalidade, você pode usar o Microsoft Office PerformancePoint Server 2007 (PPS). Você usa PPS para desenvolver scorecards e painéis que você pode implantar em MOSS. Um scorecard é um relatório que compara o desempenho real para um destino definido e mostra os resultados usando ícones codificadas por cor. Você pode exibir um scorecard PPS usando um tipo especial de Web Part em um painel MOSS padrão ou como parte de um painel PPS. No painel, você pode adicionar relatórios PPS para zonas do painel para apresentar diferentes modos de exibição dos mesmos dados (como mostrado na Figura 4 ) ou para mostrar dados relacionados de fontes diferentes.

fig04.gif

Figura 4 usando um painel PPS para exibir dados

Como você pode ver, a pilha de BI da Microsoft fornece várias opções para o desenvolvimento, administração e a implementação da solução de BI, mas ela não impede você usando outras opções. A pilha Microsoft BI de cima para baixo está uma arquitetura extensível na qual você pode conectar seus próprios aplicativos personalizados ou aplicativos de terceiros quando precisar oferecer suporte a requisitos específicos.

Uma abordagem ao desenvolvimento de soluções

A melhor maneira de começar a aprender sobre a pilha Microsoft BI é criar uma solução simples. Artigos complementares nesta série de mostram como criar uma solução usando o SSIS, SSAS e SSRS. Quando você terminar a série, você terá uma idéia geral de como cada um desses componentes funciona. Não se sentem necessidade, no entanto, para usar cada componente na pilha para cada solução de BI que você criar.

Como você reúne a solução de BI, pretende gastar a maior parte do tempo executando tarefas de preparação de dados, como reestruturação e limpeza. Em termos de BI, este conjunto de tarefas é chamado de extração, transformação e carregamento (ETL) processos.

Antes de começar o desenvolvimento de ETL, você deve planejar cuidadosamente o design de sua solução de BI. Na minha experiência, o desenvolvimento de uma solução de BI vai mais suavemente quando você tem um problema comercial específico para resolver e abordar o design considerando primeiro como as pessoas precisam interagir com informações. Usando uma abordagem centrada no usuário, você pode trabalhar sua forma para trás através os processos de negócios aplicáveis para criar uma solução que recupera corretamente e estruturas de dados para oferecer suporte a sua necessidade de negócios. Essa recomendação pode parecer uma abordagem óbvia, mas já vi muitas pessoas tentam unidade o desenvolvimento de soluções dos dados disponíveis check-out para os usuários e eólica com uma solução que nunca é usada.

Depois de você se deparam com o design inicial, você estará pronto para começar a desenvolver. Se sua solução de BI usa SSIS, SSAS e SSRS, comece criando e preenchendo estruturas de dados da solução de BI usando SSIS. Depois dos dados estiverem no lugar, você continuar a próxima etapa, criando um cubo. Depois que o desenvolvimento estiver concluído, você processa o cubo carregá-lo com dados. Em seguida, você usar SSRS para desenvolver um relatório que consulta o cubo e exibe os resultados da consulta em um relatório. Você verá como depurar esse processo sobre os próximos três artigos desta série. Para seus próprios projetos, você deve abordar esse processo incrementalmente e iterativamente para certificar-se de que os resultados de uma etapa funcionam satisfatoriamente em etapas subseqüentes.

Guia de Introdução

Para concluir a solução de BI inteira descrita nos artigos restantes nesta série, você precisa instalar o SQL Server 2008, incluindo o SSIS, SSAS e o SSRS. Se você tiver acesso ao SQL Server, um servidor SSAS e um servidor de relatórios em sua rede, você só precisa instalar as ferramentas de desenvolvimento no seu computador. "Para obter instruções de instalação do produto, consulte" Como: instalar o SQL Server 2008 (instalação)." Você pode Baixe os bancos usados para construir a solução para Adventure Works do CodePlex. O banco de dados primeiro, AdventureWorks2008, é representante de um banco de dados processamento transacional online (OLTP), que captura as transações geradas por operações de negócios nos departamentos de vendas, produção e recursos humanos. Você usará esse banco de dados como uma fonte para o mart dados que você criar usando o SSIS. O segundo banco de dados, AdventureWorksDW2008, é um exemplo de dados que representam práticas recomendadas em design do depósito de dados. Você pode usar esse banco de dados como uma fonte para seu cubo SSAS, se você decidir ignorar o aprendizado sobre SSIS e ir diretamente para o desenvolvimento de cubo.

Próximas etapas

Depois que você se familiarizar com os componentes de BI do SQL Server, você deve encontrar um projeto simples de sua preferência para continuar a criação de seu conhecimento. Você não precisa um mart dados completos para começar, mas você deve tentar estruturar os dados usando os princípios descritos no próximo artigo desta série. Depois de você começa a usar BI, você provavelmente nunca verá dados exatamente da mesma maneira novamente.

Stacia Misner é um consultor de BI, do professor e autor, bem como o fundador e principal dos dados Inspirations. Ela tem 25 anos de experiência no setor de TI, com nove anos voltados para a pilha de BI da Microsoft. Stacia escreveu vários livros sobre BI e SQL Server. Seu livro mais recente, Microsoft SQL Server 2008 Reporting Services Step by Step (Microsoft Press, 2009), foi lançado anteriormente este ano. Ela pode ser contatada pelo smisner@datainspirations.com.