自行车购买者 DMX 教程

在本教程中,您将学习如何使用数据挖掘扩展插件 (DMX) 查询语言来创建、定型和浏览挖掘模型。然后,您将使用这些挖掘模型创建预测,确定客户是否将购买自行车。

挖掘模型将使用 AdventureWorksDW2008R2 示例数据库(存储虚构公司 Adventure Works Cycles 的数据)中所包含的数据创建。Adventure Works Cycles 是大型跨国制造公司。公司生产金属和复合材料的自行车,产品远销北美、欧洲和亚洲市场。公司总部设在华盛顿州的伯瑟尔市,拥有 290 名雇员,而且拥有多个活跃在世界各地的地区性销售团队。有关 AdventureWorksDW2008R2 示例数据库的详细信息,请参阅Adventure Works 示例数据仓库

教程方案

Adventure Works Cycles 已决定通过创建使用数据挖掘功能的自定义应用程序来扩展其数据分析。自定义应用程序的目的是能够:

  • 输入潜在客户的特定特征并预测这些客户是否将购买自行车。

  • 输入潜在客户的列表及其特征,并预测哪些客户将购买自行车。

在第一种情况下,客户数据由客户注册页提供;在第二种情况下,潜在客户的列表由 Adventure Works Cycles 市场部提供。

此外,市场部还请求了将现有客户根据各种特征(例如,他们的居住地、孩子个数以及上下班路程)分组到不同类别中。他们要查看这些群集是否可用于帮助确定特定的客户类型。这将需要另外的挖掘模型。

Microsoft SQL Server Analysis Services 提供了多个可用于完成这些任务的工具:

数据挖掘扩展插件 (DMX) 是 Analysis Services 提供的一种查询语言,可以使用它来创建和处理挖掘模型。Microsoft 决策树算法创建的模型可用于预测某人是否将购买自行车。生成的模型可以将单个客户或客户表作为一个输入。Microsoft 聚类分析算法可以根据共享特征创建客户分组。本教程的目的是提供将在自定义应用程序中使用的 DMX 脚本。

有关详细信息,请参阅数据挖掘项目(Analysis Services - 数据挖掘)

挖掘结构和挖掘模型

开始创建 DMX 语句之前,了解 Analysis Services 用来创建挖掘模型的主要对象十分重要。挖掘结构是一种数据结构,它定义生成挖掘模型的数据域。单个挖掘结构可以包含多个共享相同域的挖掘模型。挖掘模型可向挖掘结构所代表的数据应用挖掘模型算法。

挖掘结构的构造块是挖掘结构列,这些列对数据源所包含的数据进行说明。这些列包含诸如数据类型、内容类型以及数据分发方式等信息。

挖掘模型必须包含挖掘结构中所述的键列,以及其余列的子集。挖掘模型定义每个列的用法以及用于创建挖掘模型的算法。例如,在 DMX 中,您可以将一列指定为键列或 PREDICT 列。如果有一列未指定,则会将该列假定为一个输入列。

在 DMX 中,有两种创建挖掘模型的方式。您可以使用 CREATE MINING MODEL 语句同时创建挖掘结构以及关联的挖掘模型,也可以首先使用 CREATE MINING STRUCTURE 语句创建挖掘结构,然后使用 ALTER STRUCTURE 语句向结构中添加挖掘模型。下表对这些方法进行了说明。

  • CREATE MINING MODEL
    使用此语句可以创建挖掘结构以及关联的同名挖掘模型。挖掘模型名称后追加有“Structure”,以便与挖掘结构区分开。如果要创建包含单一挖掘模型的挖掘结构,则此语句将非常有用。

    有关详细信息,请参阅 CREATE MINING MODEL (DMX)

  • ALTER MINING STRUCTURE
    使用此语句可以向服务器中已存在的挖掘结构中添加挖掘模型。如果要创建包含多个不同挖掘模型的挖掘结构,则此语句将非常有用。由于各种原因,您可能需要在单一挖掘结构中添加多个挖掘模型。例如,可以创建使用不同算法的多个挖掘模型来判断哪种算法效果最佳。可以创建使用相同算法的多个挖掘模型,但通过将每一个挖掘模型中的一个参数设置为不同的值来查找最佳参数设置。

    有关详细信息,请参阅 ALTER MINING STRUCTURE (DMX)

因为您将创建包含多个挖掘模型的挖掘结构,因此使用本教程中的第二种方法。

有关详细信息,请参阅

数据挖掘扩展插件 (DMX) 参考, 了解 Select 语句 (DMX), 预测查询 (DMX)

学习内容

本教程分为以下几课:

要求

执行本教程前,请确保安装了下列各项:

  • Microsoft SQL Server 

  • Microsoft SQL Server 2005 Analysis Services (SSAS)、SQL Server 2008 Analysis Services (SSAS) 或 SQL Server Analysis Services 

  • AdventureWorksDW2008R2 数据库。为了增强安全性,默认情况下将不安装该示例数据库。若要安装 Microsoft SQL Server 的正式示例数据库,请访问 Microsoft SQL Sample Databases(Microsoft SQL 示例数据库)页,并选择要安装的数据库。 有关如何安装示例数据库的详细信息,请参阅初始安装 (Analysis Services)

注意注意

阅读教程时,建议您将“下一个主题”按钮和“上一个主题”按钮添加到文档查看器工具栏中。有关详细信息,请参阅向帮助中添加“上一步”和“下一步”按钮