数据挖掘中级教程(Analysis Services - 数据挖掘)

Microsoft Analysis Services 提供用于创建和使用数据挖掘模型的集成环境。您可以方便地绑定到数据源、针对同一个数据创建和测试多个模型并部署要用于进行预测分析的模型。

在数据挖掘基础教程中,您学习了如何使用 Business Intelligence Development Studio 创建数据挖掘解决方案,而且生成了三个支持目标邮递活动的模型,这些模型可用来分析客户购买行为并确定潜在的购买目标。

为了完成以下教程,您应该熟悉数据挖掘基础教程中所介绍的数据挖掘工具和挖掘模型查看器。本中级教程基于这些经验而构建,其中介绍了几个新方案(包括预测和市场篮分析)。您将学习如何创建时序模型、关联模型以及顺序分析和聚类分析模型。您还将学习如何在模型中使用嵌套表以及如何针对嵌套表创建筛选器。

所有的方案都使用 AdventureWorksDW2008R2 数据源,但是您将为不同的方案创建不同的数据源视图。只要您是首先创建数据源,就可以按任何顺序做练习。

这些课程是相互独立的,可以单独完成。

课程方案

在成功完成目标邮寄活动之后,系统已经要求您利用自己的数据挖掘知识来开发几个要用于进行业务规划的新模型。这包括下列类型的新模型:

  • 时序模型,用来预测产品在全世界不同地区的销售额。您将为每个地区开发单独的模型,而且还开发一个可用于进行交叉预测的通用模型。

  • 关联模型,用于分析在访问 Adventure Works Cycles 电子商务网站时所购买产品的分组。您可以基于这个市场篮模型为客户推荐产品。

  • 顺序分析和聚类分析模型,用于分析客户购买产品的顺序。您可以基于这个模型规划对网站设计或新产品进行的更改。

  • 神经网络模型和逻辑回归模型 -- 执行呼叫中心数据的探索性分析。基于对基础模型的理解,您将创建一个模型以便标识可供改进呼叫中心的客户体验的可能策略。

学习内容

本教程将讲述如何创建和使用多种类型的数据挖掘算法。本教程还介绍了以下概念:

  • 使用嵌套表生成模型

  • 选择嵌套表键、时序键或顺序键

  • 在创建模型或进行预测时筛选嵌套表

  • 确定是否有足以支持模型的数据

  • 创建通用模型并将其应用到多个数据集

本教程分为以下几课:

要求

请确保已安装下列软件:

  • Microsoft SQL Server 2008 R2

  • Microsoft SQL Server Analysis Services

  • 带有 AdventureWorksDW2008R2 数据库的 SQL Server。

为了增强安全性,默认情况下将不安装该示例数据库。若要安装 Microsoft SQL Server 的正式数据库,请访问 Microsoft SQL Sample Databases(Microsoft SQL 示例数据库)页,并选择 SQL Server 2008R2。

注意注意

阅读教程时您可能会发现,如果在文档查看器工具栏中添加“下一个主题”“上一个主题”按钮,在各个步骤间来回移动会更容易。有关详细信息,请参阅向帮助中添加“上一步”和“下一步”按钮