商业智能

规划您的第一个 Microsoft BI 解决方案

Stacia Misner

 

一眼:

  • BI 简介
  • 避免常见的问题与公司的数据库
  • 一个通过 Microsoft BI 堆栈遍历
  • 构建一个简单的解决方案

内容

BI 是什么?
有什么问题查询您公司的数据库?
决策支持
在操作中的 BI
Microsoft BI 堆栈
解决方案开发的方法
快速入门
下一步

大多数数据库管理组织已经数据和 Microsoft SQL Server 实现同时管理员 (DBA) haveencountered 某种形式的商业智能 (BI)。 许多其他 IT 专业人员,没有 DBA 的职责的 BI 可能听说过但不要具有与它的直接体验或确实知道它是什么。 在本文中,您将找出所有在 fuss 有关。 一旦您了解什么 BI 技术可以真正执行和查看 BI 解决方案在 Microsoft BI 平台上如何构造,您会发现 BI 为什么不只是为了 DBA。 如果您了解有关 BI 您将一个更好的位置,以支持您的组织的 BI 活动时它们会 (它们将),您将还实现如何使用 BI 来跟踪和分析您的角色相关的数据,使您的工作更容易和加深您对该数据的理解。

本文是一系列文章,介绍 Microsoft BI 堆栈的第一个。 在这初始篇文章我将定义 BI,并描述 BI 解决方案的高级体系结构通常条款。 此外提供一些深入了解构建 BI 解决方案的过程。 要深入探讨此文章中提到了 SQL Server BI 技术,可以阅读该助理由 Derek Comingore 编写此问题 (请参见"中的文章 生成 BI 解决方案的基础数据"),按 Scot Reagin 和我在即将开始的问题。

BI 是什么?

几年前时我已 coauthoring Business Intelligence: Making Better Decisions Faster (Microsoft 按,2002年),我是惊讶,如何强同行 disagreed 有关哪些技术应被视为 BI 的域中,因此该简介册的范围内,。 它是一个 enlightening 体验这样分歧的意见,BI 专业人员在了解哪些工具认为它们 BI 工具和它们排除。 在 IT 行业中仍然存在这种差异的观点,许多继续讨论 BI 的定义。 我,BI 是尽可能有关业务流程原样有关技术,以便开始从该角度定义 BI。

作为一个业务流程,BI 是分析的在收集和分析数据,以便您可以做出更好的决策,并提高您的业务与其他人共享您的结果时执行的活动的一系列。 是否需要决定如何使您的日常效率更高或支持长期范围规划,如下一年的预算的信息,采取的措施来查找、 传输、 格式和研究数据属于所有 BI。 鍙 ﹀ 的方式  BI 包括您使用对您的结果可供以后参考以便您和其他人可以测量的研究数据后所做的决策影响该进程。 通常,BI 是一个迭代的过程。 您可以分析数据请参阅所发生,您采取措施以确保良好的内容保持发生和坏事情停止,然后您分析稍后数据以确定是否您的操作所做操作,更好或差和外部因素帮助还是 hindered 您的工作。

给定此广泛的定义的 BI,您使用 BI 即使在您的信息的位向便笺或创建列表,以帮助您做出全天的决策。 引入的业务流程,用于收集部分或全部技术,分析和共享信息可以使这些进程效率更高。 组织往往采用通常它使用首次,以解决特定问题的 BI 技术时启动小。 随着时间,使用 BI 技术随着增量重点将转移到整个组织中有效地传播的信息。 随着不断成熟的 BI 策略,组织通常会获得更复杂的工具来启用更好地交互和研究数据。

有什么问题查询您公司的数据库?

在 BI 的任何定义数据始终是焦点。 您可能想知道为什么要费神创建 BI 解决方案时您可以只是查询一个或多个组织的数据库获得所需的数据。 如果您唯一使用者的您正在收集,数据如果您有工具、 技能和访问公司数据库,安全权限,并且您需要的所有数据都是这些源中,您可能不需要正式的 BI 解决方案。 与之相反,如果您经常需要与其他人的技能和安全权限不同共享信息,需要创建一个简单使用和维护的 BI 解决方案。 您还需要考虑一旦您的同事听到有关此简洁的 BI 解决方案,它们需要使用它太。 预计此请求,您的解决方案应可伸缩从开始处。

在图面,允许公司运行从企业数据库中获取数据的报表中的每个人都可能看起来像一个不错的主意,但这种方法可能会非常受欢迎,DBA 与。 因为它们将告诉您,直接查询公司的数据库可以附带几个问题。 下面是几个更常见的:

  • 如果组织的数据存储在不同的格式不同的平台中,将数据合并为可用于分析的通用格式可以是极具挑战性。 数据无法直接从源表复制到一个公共的目标表,但将必须存储之前以某种方式操作。
  • 数据定义可能不一致跨多个的数据库,协调似乎类似的数据可以很困难。 渚嬪的方式  收入在销售数据库中的可能会根据一组业务规则来计算但属于完全不同的设置总帐数据库中的业务规则。
  • 每个数据库可能是结构化,优化为插入数据或执行查询。 即使您希望查询只是一个数据库,则通常运行分析的查询将需要在大量的数据是在数据库资源方面的昂贵的操作的摘要。 因此,您的查询需要很长时间执行,并可以为与执行其他应用程序的资源插入更新或查找操作创建争用。
  • 历史数据通常存档而非在公司数据库中无限期地维护。 如果您希望随着时间的推移查看趋势 — 常见的 BI 活动 — — 您的解决方案可能需要的数据不会保留在公司数据库中的一个储存库。
  • 所需的分析可能不能在公司数据库中的某些数据。 可能在平面文件、 电子表格,或非结构化的数据 (如 Word 文档的格式。 获得问题多多人在其本地计算机上存储的信息,或在其头中。
  • 即使数据是可用的质量问题有时意味着您不能直接从源使用它。 您可能需要下载数据并进行之前,您可以分析对它进行清理。 除非源中,可以清除数据,您将需要清理数据手动每次访问它,并确保每次都应用相同的规则。 此外,您不能确保其他使用相同的数据的每个人是按照相同的规则的清理它。

若要解决这些问题与数据访问,BI 解决方案通常包括数据库创建以独占方式来保存用于分析数据。 如有一个数据库意味着可以避免生成数据的活动和活动使用的数据之间的任何资源争用问题。 重新设置再进一步,您可以数据结构,以便汇总数据的查询可以运行得更快。 如果您要合并来自多个数据源的数据,您就可以集中它和应用业务逻辑,以将数据放到一个具有一致的意义的通用格式。 您还可以将合并没有进入此中央位置从 XML 文档或电子表格的数据库的数据。 创建一个单独的数据库的另一个好处是后的数据来自源数据库的清除可以保留历史数据,只要有必要的。 最后,可以自动执行清理和增强分析,数据的过程确保相同的规则应用每次访问数据。

决策支持

BI 解决方案应执行超过赋予您更好地访问数据。 它应专门支持您决策的工作。 一般情况下,BI 解决方案可帮助您评估和业务的条件的响应是否需要在整个组织的一个包罗万象的视图或部门、 工作组,或甚至一个团队的一个窄透视。 实际上,从汇总视图中快速移动到数据的详细视图是 BI 的一个重要功能。

BI 解决方案的目标是使您可以在分析数据并查找问题的答案,而不是向下跟踪、 合并、 重新格式化和协调数据本身的时间。 当有足够的质量时间来分析数据通常可以早期发现问题和采取措施来停止继续负趋势。 您可以使用 BI 发现看起来不相关的数据点之间的关联,和然后适应您的策略,打开您深入了解美元保存或盈余分析的美元。 像您的工作还是您解决问题的未来规划进行每个工作日的每个决策转换直接或间接成本或一个利润为您的公司。

在操作中的 BI

理论级别上的了解 BI 良好,但实际操作中看到它帮助您了解其优点。 若要向您展示 BI 的工作原理,在三个其他本系列文章描述了为一个虚构的公司名艾德 BI 解决方案的开发。 本文末尾我将说明如何获得即销售其产品的全球范围内的一个虚构的自行车制造商的 Adventure Works 示例数据库。 它可以维护一个销售人员销售其产品大规模到如小专业自行车商店或大型仓库式购物插座的经销商。 冒险工作还直接给通过 Internet 的单个客户销售产品。 艾德数据提供了许多很好地适应 BI 解决方案的分析商机。

请记住 BI 解决方案旨在支持决策。 与此记住让我们来考虑艾德需要之前关键决策回答的问题的类型:

  • 哪个销售通道是更具盈利能力? 冒险工作必须决定是否要投资中添加多个销售人员开发与多个销售商的关系或展开其 Internet 销售状态。 若要帮助指南这一决定分析人员需要能够比较销售分销商和其 Internet 站点之间的时间。 在销售业绩数据点 (称为度量值) 需要比较分析师的包括销售美元,订单数量和收益率。 正趋势的收益率是最重要的度量值,因为高销售额以美元或销售的单位数不受益公司,如果这些销售导致网络丢失。
  • 是否要求对于某些增长或递减的产品吗? 冒险工作必须与销售要求生产级别相匹配。 如果对某些产品的需求增长,艾德必须调整其制造流程,以确保多个这些产品可用于销售并因此增加销售。 如果对其他产品的需求递减,艾德需要减小其生产或可能消除产品线,以避免丢失在销售这些产品的必须的 oversupply 情况。

即使您不在您的作业中分析销售数据,我建议您按照以及我们的艾德生成 BI 解决方案。 您可以应用相同的设计和开发此您自己的数据系列中所述的原则。

Microsoft BI 堆栈

现在让我们看一下在的 BI 技术体系结构。 Microsoft BI 堆栈提供您需要生成、 管理并使用 BI 解决方案的所有工具。 数据平台承载数据集市或数据仓库 SQL Server 2008 是堆栈的基础。 一个数据集市是一个特定于主题的数据存储区。 一个数据仓库为企业范围内集合的包含多个主题的数据。 数据集市和数据仓库之间线条是模糊,但您不需要担心,区别。 本系列文章,不使用该术语数据集市。 (尽管这一系列文章专门引用 SQL Server 2008,可以生成一个类似的 BI 解决方案 SQL Server 2005 及其 BI 组件使用很少或根本不提供该说明修改)。

SQL Server 2008 包括三个 BI 组件: 集成服务 (SSIS)、 Analysis Services (SSAS),和报表服务 (SSRS)。 这些组件分别将数据平台扩展数据集成功能、 与多维数据库支持数据演示文稿图层。 图 1 显示了这些 BI 解决方案中的另一个组件的关系。

fig01.gif

图 1 SQL Server 2008 一个 BI 解决方案中的组件

设计您数据集市的物理结构之后,使用 SSIS 与您从其他数据源中提取的数据填充它。 SSIS 提供了自动清理数据的进程所需工具,合并来自多个源的数据和转换为结构数据,也适合于分析。 您可以计划定期执行这些过程使用 SQL Server 代理。 本文他 SSIS p。 31,Derek Comingore 解释了如何开发提取、 转换和加载 (ETL) 处理为 BI 解决方案。

将一个 SSAS 数据库添加到 BI 解决方案可以支持更复杂的、 高性能的交互式查询。 使用 SSAS 将关系数据复制到一个称为多维数据集的多维数据库结构。 精心设计多维数据集通过向索引和摘要表 (称为聚合) 的功能等效项返回查询结果,可将指数快一关系数据库比较查询优化的特殊查询的数据。 您也可以嵌入复杂计算逻辑来简化查询,否则需要数百行 Transact-SQL 代码时使用关系数据源复制到多维数据集中。 很多的前端工具 (称为多维数据集浏览器) 可让您无需编写一行代码查询多维数据集。 在月刊的下个月的 Scot Reagin 将向您介绍如何开发一个 BI 解决方案的一部分的多维数据集。

是否您正在将数据存储在一个 SQL Server 数据集市或 SSAS 多维数据集,可以将 SSRS 添加到您的解决方案体系结构,以使数据可用的用户。 SSRS 是一个报告的平台,包括开发报告,以保护和管理已发布的报表,使用集中式管理基础结构和支持用户对报告的访问权限的工具。 可以使用 SSRS Web 应用程序或 Microsoft Office SharePoint Server 2007 (MOSS),可以查看报告,接收通过电子邮件,报表中使用订阅功能在您自己的应用程序显示在报表中调用 SSRS Web 服务。 报表的默认视图显示 HTML 格式,但还可以将报表导出为 PDF 或 Excel 其他文件类型。 下个月,我将介绍更多有关使用数据表示层的 BI 解决方案中的 SSRS。

Microsoft BI 堆栈还包括几种 Office 技术的展开数据表示层的选项。 Excel 2007 是一个常见的选择,为支持 BI 解决方案中的数据分析。 可以访问您 SQL Server 数据集市或浏览 SSAS 多维数据集直接从 Excel (如 图 2 所示),比查看一个 SSRS 报表时,您可以更随意浏览数据。

fig02.gif

图 2 使用 Excel 2007 将浏览多维数据集

除了用于浏览关系和多维数据 Excel 可以使用其数据挖掘算法发现您的数据中的信息的隐藏的模式,或检测数据 (这意味着可以解决问题之前填充您数据集市) 中的异常。 若要开始使用数据挖掘一个很好的方法是 Excel 从 Microsoft 下载一个可用外接程序,然后使用它分析您导入到 Excel 来自任何源或视图创建数据挖掘模型的输出,并存储在 SSAS 服务器上的数据。 外接程序的 Visio 2007 还提供了用于共享批注的数据挖掘模型。 您可以了解下载和使用这些加载项在" 数据挖掘加载 Office 2007."

共享数据的越来越流行选择为 Excel Services,在 MOSS 中可用。 使用 Excel 2007,您首先创建工作簿包含数据透视表的 SSAS 多维数据集用作其数据源,然后将数据连接和工作簿发布到 Excel 服务。 尽管您可以发布的工作簿包含来自其他类型的一个使用 SSAS 的优点的数据源的数据的数据透视表和 Excel Services 组合在一起是 Excel 的在纯 HTML 界面的保留在熟悉中使用相同的多维数据集浏览功能的能力。 另一个优点是可以集中管理和对 Excel 工作簿的访问。 有关 Excel 服务的详细信息,请参阅" Excel 服务技术概述."

还使用 Excel 服务浏览多维数据集的另一个优点是您可以嵌入数据透视表放入 MOSS 仪表板页中使用该 Excel Web Access Web Part 透视图表。 仪表板是特殊 SharePoint 内容类型,允许您显示在一页使用不同的 Web 部件上的多个来源的数据。 您甚至可以将筛选器添加到仪表板页面并进行连接它的 Web 部件来动态更改内容在根据选定内容筛选器页上的所有或部分。 图 3 显示了示例 MOSS 仪表板。 MOSS 还包括另外一个 Web 部件显示 SSRS 报告存储在 MOSS 服务器 (可选 SSRS 配置称为集成模式),或您使用可以提供的 Web 部件 SSRS 显示存储在报表服务器 (默认的配置称为本机模式) 上的报告。

fig03.gif

图 3 使用一个 MOSS 仪表板页面以显示工作簿和报表

对于具有更多的功能的仪表板,可以使用 Microsoft Office PerformancePoint Server 2007 (PPS)。 您使用 PPS 记分卡和仪表板,则可以部署 MOSS 的开发。 记分卡是一个报告,比较已定义目标的实际性能,并显示在使用彩色的图标的结果。 您可以显示 PPS 记分卡使用的一个特殊类型的 Web 部件标准 MOSS 仪表板中或 PPS 仪表板的一部分。 在该的仪表板可以将 PPS 报表添加到仪表板区域相同的数据的不同视图 (如 图 4 所示) 或显示来自不同源的相关的数据中。

fig04.gif

图 4 使用 PPS 仪表板显示数据

正您所见,如 Microsoft BI 堆栈提供用于开发、 管理和您的 BI 解决方案的实现的多个选项,但它不是通过阻止您使用其他选项。 从上到下 Microsoft BI 堆栈是一个可扩展的结构,在其中您可以插入您自己的自定义应用程序或第三方应用程序需要支持特定的要求时。

解决方案开发的方法

要开始学习 Microsoft BI 堆栈,最好是构建一个简单的解决方案。 此系列中相应配套的文章介绍如何通过使用 SSIS、 SSAS 和 SSRS 生成解决方案。 在完成一系列您将有一个整体上的了解每个组件是如何工作。 不要认为 compelled,但是,用于每个组件在堆栈中生成的每个 BI 解决方案。

为您整理 BI 解决方案,计划花费大部分时间执行数据准备任务,如重新构建和清理。 在 BI 的术语这组任务调用在提取中,转换和加载 (ETL) 过程。

在开始开发 ETL 之前,必须仔细规划您 BI 解决方案的设计。 我的经验 BI 解决方案的开发顺利多后解决并通过第一个考虑如何人需要交互的信息的方法设计一个特定的业务问题。 通过采用一种以用户为中心的方法,可以使用您可以向后通过适用的业务流程设计解决方案的正确检索和数据结构支持您的业务需要。 此建议可能看起来是一个明显的方法,但过许多人试图驱动器可用出数据中的解决方案开发用户并设置风力永远不会获取使用的解决方案。

您采用最初的设计后,您准备开始开发。 如果您的 BI 解决方案使用 SSIS SSAS,SSRS,首先创建并填充使用 SSIS BI 解决方案的数据结构。 数据后,您继续下一步,通过生成多维数据集。 您的开发完成后,处理加载它的数据多维数据集。 然后,使用 SSRS 开发查询多维数据集,并显示在报表中的查询结果的报告。 您将看到如何完成此过程逐过程中这一系列三个项目。 您自己的项目应逐步方法此过程并反复以确保一个步骤的结果工作 satisfactorily 的后续步骤。

快速入门

若要完成整个剩余本系列文章中描述的 BI 解决方案,您需要安装 SQL Server 2008,包括 SSIS、 SSAS 和 SSRS。 如果在您的网络访问 SQL Server、 一个 SSAS 服务器和一个报表服务器,您只需要在您的计算机上安装开发工具。 有关产品安装的说明,请参阅" 如何: 安装 SQL Server 2008 (安装程序)." 您可以 下载示例数据库用于 CodePlex 从生成的艾德的解决方案. 第一个数据库,AdventureWorks2008,是捕获交易记录生成在销售、 生产和人力资源部门的业务操作的联机事务处理 (OLTP) 数据库的代表。 您将为您生成使用 SSIS 在数据集市作为源中使用此数据库。 第二个数据库 AdventureWorksDW2008,是表示在数据仓库设计的最佳做法的示例。 您可以使用此数据库作为源 SSAS 多维数据集如果您决定要跳过 SSIS 学习,并跳转到多维数据集的开发直接。

下一步

您熟悉 SQL Server BI 组件后,您应发现自己要继续建立您的知识的一个简单的项目。 您不需要开始,一个成熟数据集市,但您应尝试使用原则下一本系列文章中描述您的数据的结构。 一旦您开始使用 BI,您将可能永远不会看到数据完全相同的方式再次。

Stacia Misner 是 BI 顾问、 教师版和作者,以及 founder 和数据 Inspirations 的主体。 她具有 25 年的经验,IT 行业中九年侧重于 Microsoft BI 堆栈。 有关 BI 和 SQL Server Stacia 编写了几个简介册。 其最新簿 Microsoft SQL Server 2008 Reporting Services Step by Step (Microsoft 按,2009年),今年早期发布。 她可以在访问 smisner@datainspirations.com.