第 2 课:向市场篮挖掘结构中添加挖掘模型

新建日期: 2005 年 12 月 5 日

在本课中,您将向在第 1 课:创建市场篮挖掘模型中创建的市场篮挖掘结构中添加两个挖掘模型。可使用这些挖掘模型创建预测。

若要预测客户通常会同时购买的产品类型,您需要使用 Microsoft 关联算法创建两个挖掘模型,此算法对于 MINIMUM_PROBABILTY 参数使用两个不同的值。

MINIMUM_PROBABILTY 是 Microsoft 关联算法参数,对于通过指定某个规则必须具有的最小概率来确定挖掘模型包含的规则数非常重要。例如,将该值设置为 0.4 将指定不生成发生概率小于百分之四十的规则。

您将在下一课中浏览更改 MINIMUM_PROBABILTY 参数所产生的影响。

ALTER MINING STRUCTURE 语句

为了向挖掘结构中添加包含嵌套表的挖掘模型,您需要使用 ALTER MINING STRUCTURE (DMX) 语句。可以将语句中的代码分为下列几部分:

  • 标识挖掘结构
  • 命名挖掘模型
  • 定义键列
  • 定义输入列和可预测列
  • 定义嵌套表列
  • 标识算法和参数更改

下面是 CREATE MINING MODEL 语句的一般示例:

ALTER MINING STRUCTURE [<Mining Structure Name>]
ADD MINING MODEL [<Mining Model Name>]
(
    [<key column>],
    <mining model columns>,
    <table columns>
    (  [<nested key column>],
       <nested mining model columns> )
) USING <algorithm>( <algorithm parameters> )

代码的第一行标识挖掘模型将添加到的现有挖掘结构:

ALTER MINING STRUCTURE [<mining structure name>]

代码的第二行命名添加到挖掘结构中的挖掘模型:

ADD MINING MODEL [<mining model name>]

有关在 DMX 中命名对象的信息,请参阅标识符 (DMX)

代码的接下来的各行定义挖掘结构中将由挖掘模型使用的各列:

[<key column>],
<mining model columns>,

您只能使用挖掘结构中现有的各列,列表中的第一列必须是挖掘结构中的键列。

代码的其余各行定义嵌套表。代码的嵌套表部分的第一行定义嵌套表的名称:

<table columns>

代码的嵌套表部分的第二行定义将嵌套表绑定到父表的键列:

(  [<nested key column>],

代码的嵌套表部分的下一行表示嵌套表中将由挖掘模型使用的其余各列。

   <nested mining model columns> )

代码的最后一行定义将用于生成挖掘模型的算法和算法参数。

) USING <algorithm>( <algorithm parameters> )

您可以使用以下语法指定将挖掘模型中的一列用于进行预测:

<column name> PREDICT,

使用默认的 MINIMUM_PROBABILTY 向结构中添加关联挖掘模型

第一步是根据 Microsoft 关联算法,使用默认的 MINIMUM_PROBABILTY 值向市场篮挖掘结构中添加新的挖掘模型。

添加关联挖掘模型

  1. 对象资源管理器中,右键单击 Analysis Services 实例,指向**“新建查询”**,再单击 DMX

    将打开查询编辑器,其中包含一个新的空白查询。

  2. 将 ALTER MINING STRUCTURE 语句的一般示例复制到空白查询中。

  3. <mining structure name> 
    

    替换为

    Market Basket
    
  4. <mining model name> 
    

    替换为

    [Default Association]
    
  5. <mining model columns>,
    <table columns>
    (  [<nested key column>],
       <nested mining model columns> )
    

    替换为

    OrderNumber TEXT KEY,
        [Products] TABLE PREDICT (
            [Model] TEXT KEY
        )
    

    在此示例中,[Products] 表被指定为 PREDICT。

  6. USING <algorithm>( <algorithm parameters> )
    

    替换为

    Using Microsoft_Association_Rules
    

    现在,结果语句应该如下所示:

    ALTER MINING STRUCTURE [Market Basket]
    ADD MINING MODEL [Association]
    (
        OrderNumber TEXT KEY,
        [Products] TABLE PREDICT (
            [Model] TEXT KEY
        )
    )
    Using Microsoft_Association_Rules
    
  7. 在**“文件”菜单中,单击“DMXQuery1.dmx 另存为”**。

  8. 在**“另存为”**对话框中,浏览到相应的文件夹,并将文件命名为 Default_Association_Model.dmx

  9. 在工具栏中,单击**“执行”**按钮。

更改默认的 MINIMUM_PROBABILTY 向结构中添加关联挖掘模型

下一步是根据 Microsoft 关联算法,将默认的 MINIMUM_PROBABILTY 值更改为 0.01,然后向市场篮挖掘结构中添加新的挖掘模型。更改参数可使 Microsoft 关联算法创建更多规则。

添加关联挖掘模型

  1. 对象资源管理器中,右键单击 Analysis Services 实例,指向**“新建查询”**,再单击 DMX

    将打开查询编辑器,其中包含一个新的空白查询。

  2. 将 ALTER MINING STRUCTURE 语句的一般示例复制到空白查询中。

  3. <mining structure name> 
    

    替换为

    Market Basket
    
  4. <mining model name> 
    

    替换为

    [Modified Association]
    
  5. <mining model columns>,
    <table columns>
    (  [<nested key column>],
       <nested mining model columns> )
    

    替换为

    OrderNumber TEXT KEY,
    [Products] TABLE PREDICT (
            [Model] TEXT KEY
        )
    

    在此示例中,[Products] 表被指定为 PREDICT。

  6. USING <algorithm>( <algorithm parameters> )
    

    替换为

    USING Microsoft_Association_Rules (Minimum_Probability = 0.1)
    

    现在,结果语句应该如下所示:

    ALTER MINING STRUCTURE [Market Basket]
    ADD MINING MODEL [Modified Assocation]
    (
        OrderNumber TEXT KEY,
        [Products] TABLE PREDICT (
            [Model] TEXT KEY
        )
    )
    USING Microsoft_Association_Rules (Minimum_Probability = 0.1)
    
  7. 在**“文件”菜单中,单击“DMXQuery1.dmx 另存为”**。

  8. 在**“另存为”**对话框中,浏览到相应的文件夹,并将文件命名为 Modified Association_Model.dmx

  9. 在工具栏中,单击**“执行”**按钮。

在下一课中,您将处理市场篮挖掘结构及其关联的挖掘模型。

下一个

第 3 课:处理市场篮挖掘结构