第 1 课:创建市场篮挖掘模型

在本课中,您将创建一个挖掘模型,使用该模型,可以预测客户要同时购买的 Adventure Works Cycles 产品。如果您不熟悉挖掘结构及其在数据挖掘中的作用,请参阅挖掘结构(Analysis Services – 数据挖掘)

您将在本课中创建的关联挖掘结构支持根据 Microsoft 关联算法添加挖掘模型。在后面的课程中,您将使用挖掘模型来预测客户要同时购买的产品类型,这称为市场篮分析。例如,您可能会发现客户要同时购买山地自行车、自行车轮胎和头盔。

在本课中,挖掘结构是使用嵌套表定义的。使用嵌套表是因为将由结构定义的数据域分别包含在两个不同的源表中。有关嵌套表的详细信息,请参阅嵌套表(Analysis Services – 数据挖掘)

CREATE MINING STRUCTURE 语句

为了创建包含嵌套表的挖掘结构,可以使用 CREATE MINING STRUCTURE (DMX) 语句。可以将语句中的代码分为下列几部分:

  • 命名结构

  • 定义键列

  • 定义挖掘列

  • 定义嵌套表列

下面是 CREATE MINING STRUCTURE 语句的一般示例:

CREATE MINING STRUCTURE [<Mining Structure Name>]
(
   <key column>,
   <mining structure columns>,
   <table columns>
   (  <nested key column>,
      <nested mining structure columns> )
) 

代码的第一行定义了结构的名称:

CREATE MINING STRUCTURE [Mining Structure Name]

有关在 DMX 中命名对象的信息,请参阅标识符 (DMX)

代码的下一行定义了挖掘结构的键列,它唯一标识源数据中的实体:

<key column>

代码的下一行用于定义与挖掘结构关联的挖掘模型所使用的挖掘列:

<mining structure columns>

代码中接下来几行定义了嵌套表列:

<table columns>
(  <nested key column>,
   <nested mining structure columns> )

有关您可以定义的挖掘结构列类型的信息,请参阅挖掘结构列

注意注意

默认情况下,Business Intelligence Development Studio 为每个挖掘结构创建 30% 的维持数据集;但是,如果使用 DMX 创建挖掘结构,则必须手动添加维持数据集(如果需要)。

课程任务

在本课中,您将执行以下任务:

  • 创建新的空白查询

  • 更改查询以创建挖掘结构

  • 执行查询

创建查询

第一步是连接到 Analysis Services 实例,并在 SQL Server Management Studio 中创建一个新的 DMX 查询。

在 SQL Server Management Studio 中创建一个新的 DMX 查询

  1. 打开 SQL Server Management Studio。

  2. 在**“连接到服务器”对话框中,针对“服务器类型”,选择 Analysis Services。在“服务器名称”中,键入 LocalHost 或在本课中要连接到的 Analysis Services 实例的名称。单击“连接”**。

  3. 对象资源管理器中,右键单击 Analysis Services 实例,指向**“新建查询”**,再单击 DMX

    将打开查询编辑器,其中包含一个新的空白查询。

更改查询

下一步是修改上述 CREATE MINING STRUCTURE 语句以创建市场篮挖掘结构。

自定义 CREATE MINING STRUCTURE 语句

  1. 在查询编辑器中,将 CREATE MINING STRUCTURE 语句的一般示例复制到空白查询中。

  2. [mining structure name] 
    

    替换为

    [Market Basket]
    
  3. <key column>
    

    替换为

    OrderNumber TEXT KEY
    
  4. <table columns>
    (  <nested key column>,
       <nested mining structure columns> )
    

    替换为

        [Products] TABLE (
            [Model] TEXT KEY
        )
    

    TEXT KEY 语言指定 Model 列为嵌套表的键列。

    现在,完整的挖掘结构语句应该如下所示:

    CREATE MINING STRUCTURE [Market Basket] (
        OrderNumber TEXT KEY,
        [Products] TABLE (
            [Model] TEXT KEY
        )
    )
    
  5. 在**“文件”菜单中,单击“DMXQuery1.dmx 另存为”**。

  6. 在**“另存为”**对话框中,浏览到相应的文件夹,并将文件命名为 Market Basket Structure.dmx。

执行查询

最后一步是执行查询。创建并保存查询后,需要执行该查询(即,需要执行该语句)以便在服务器中创建挖掘结构。有关在查询编辑器中执行查询的详细信息,请参阅 SQL Server Management Studio 数据库引擎查询编辑器窗口

执行查询

  • 在查询编辑器中,单击工具栏中的**“执行”**。

    执行完语句后,将在查询编辑器底部的**“消息”**选项卡中显示查询状态。所显示的消息应为:

    Executing the query 
    Execution complete
    

    现在,服务器中便有了名为**“市场篮”**的新结构。

在下一课中,您将向刚才创建的市场篮挖掘结构中添加挖掘模型。