使用数据挖掘

数据挖掘使您得以访问对困难业务问题作出明智决策所需的信息。Microsoft SQL Server 2005 Analysis Services (SSAS) 提供了用于数据挖掘的工具,您可借助这些工具标识数据中的规则和模式,从而确定出现问题的原因并预测将来将要出现的问题。在 Analysis Services 中创建数据挖掘解决方案时,首先要创建描述业务问题的模型,然后通过生成数据的数学模型的算法运行数据,此过程称作“定型模型”**。然后依据该算法直观地浏览挖掘模型或创建预测查询。Analysis Services 可以使用来自关系数据库和 OLAP 数据库的数据集,并包括可用来调查数据的各种算法。有关数据挖掘进程的高级概述,请参阅数据挖掘概念

SQL Server 2005 提供了各种可用于数据挖掘的环境和工具。以下各部分概括了用于创建数据挖掘解决方案的典型进程,并标识了每个步骤所使用的资源。

创建 Analysis Services 项目

若要创建数据挖掘解决方案,必须首先创建一个新的 Analysis Services 项目,然后为该项目添加并配置数据源和数据源视图。数据源定义连接到挖掘模型所基于的数据源时使用的连接字符串和身份验证信息。数据源视图提供数据源的摘要信息,您可以使用该摘要信息修改数据结构使其与项目的关系更密切。

有关详细信息,请参阅:定义 Analysis Services 项目使用数据源向导定义数据源使用数据源视图向导定义数据源视图

向 Analysis Services 项目中添加挖掘结构

创建完 Analysis Services 项目之后,您可以添加挖掘结构以及基于每个结构的一个或多个挖掘模型。挖掘结构(包括表和列)派生自该项目中的现有数据源视图或 OLAP 多维数据集。添加新的挖掘结构将启动数据挖掘向导,您可以使用该向导定义结构并指定创建基于该结构的初始模型时使用的算法和定型数据。

有关详细信息,请参阅:创建新的挖掘结构数据挖掘算法数据挖掘向导

您可以使用数据挖掘设计器的**“挖掘结构”**选项卡修改现有的挖掘结构,包括添加列和嵌套表。

有关详细信息,请参阅:数据挖掘设计器

使用数据挖掘模型

在使用您定义的挖掘模型之前,必须对它们进行处理,以使 Analysis Services 可将定型数据传递给算法来填充模型。Analysis Services 提供了数个用于处理挖掘模型对象的选项,其中包括控制处理哪些对象以及如何处理这些对象的功能。

有关详细信息,请参阅:在 Analysis Services 中的处理处理数据挖掘对象

对模型进行了处理之后,您可以调查结果并确定性能最佳的模型。Analysis Services 在数据挖掘设计器的**“挖掘模型查看器”选项卡中为每一种挖掘模型类型都提供了查看器,您可以使用这些查看器浏览挖掘模型。Analysis Services 还在设计器的“挖掘准确性图表”**选项卡中提供了一些工具,您可以使用这些工具直接比较挖掘模型并选择最适合您用途的挖掘模型。这些工具包括提升图、利润图和分类矩阵。

有关详细信息,请参阅:查看数据挖掘模型验证数据挖掘模型

创建预测

大多数数据挖掘项目的主要目标是使用挖掘模型来创建预测。浏览并比较了挖掘模型之后,您可以使用数种工具之一来创建预测。Analysis Services 提供了一种称为数据挖掘扩展插件 (DMX) 的查询语言,该语言是创建预测的基础。为了帮助您生成 DMX 预测查询,SQL Server 在 SQL Server Management Studio 和 Business Intelligence Development Studio 中提供了查询生成器,并在 Management Studio 中提供了用于查询编辑器的 DMX 模板。在 BI Development Studio 中,您可以从数据挖掘设计器的**“挖掘模型预测”**选项卡中访问查询生成器。

有关详细信息,请参阅:创建 DMX 预测查询数据挖掘扩展插件 (DMX) 语句参考

SQL Server Management Studio

使用 BI Development Studio 生成了用于数据挖掘项目的挖掘模型之后,您可以在 Management Studio 中管理和使用模型并创建预测。

有关详细信息,请参阅:SQL Server Management Studio 中的数据挖掘

SQL Server Reporting Services

创建完挖掘模型之后,您可能需要将结果分发给更多的用户。可以使用 Microsoft SQL Server 2005 Reporting Services (SSRS) 中的报表设计器来创建报表,这些报表可用于显示挖掘模型包含的信息。您可以使用任何 DMX 查询的结果作为报表的基础,并可利用 Reporting Services 中提供的参数化和格式化功能。

有关详细信息,请参阅:使用报表设计器使用 Analysis Services DMX 查询设计器

通过编程使用数据挖掘

Analysis Services 提供了数种工具,您可以借助这些工具通过编程使用数据挖掘。数据挖掘扩展插件 (DMX) 语言提供了一些语句,您可以使用这些语句创建、定型和使用数据挖掘模型。还可以通过使用 XML for Analysis (XMLA) 和 Analysis Services 脚本语言 (ASSL) 的组合或使用分析管理对象 (AMO) 来执行这些任务。

您可以使用数据挖掘架构行集访问所有与数据挖掘关联的元数据。例如,可以使用架构行集来确定算法支持的数据类型,或确定数据库中存在的模型名称。

有关详细信息,请参阅:数据挖掘扩展插件 (DMX) 参考Data Mining Schema RowsetsAnalysis Services Administration Programming (SSAS)Using XML for Analysis in Analysis Services (XMLA)

请参阅

概念

开发 Analysis Services 解决方案和项目
数据挖掘概念
挖掘结构 (Analysis Services)
SQL Server Analysis Services

其他资源

数据挖掘扩展插件 (DMX) 参考
介绍 Business Intelligence Development Studio
SQL Server Management Studio 和 Business Intelligence Development Studio

帮助和信息

获取 SQL Server 2005 帮助