创建市场篮结构和模型(数据挖掘中级教程)

 

适用于: SQL Server 2016 Preview

您已创建了一个数据源视图,现在将使用数据挖掘向导创建一个新的挖掘结构。 在本任务中,将创建基于 Microsoft 关联算法的挖掘结构和挖掘模型。

备注


如果遇到说明 vAssocSeqLineItems 不能用作嵌套表的错误,请返回本课中的前一个任务,并确保通过从 vAssocSeqLineItems 表(多端)拖到 vAssocSeqOrders 表(一端)来创建多对一联接。 还可以通过右键单击联接线来编辑这两个表之间的关系。

创建关联挖掘结构

  1. 在解决方案资源管理器中 SQL Server Data Tools (SSDT), ,用鼠标右键单击 挖掘结构 ,然后选择 新建挖掘结构 若要打开数据挖掘向导。

  2. “欢迎使用数据挖掘向导” 页上,单击 “下一步”

  3. 选择定义方法 页上,确认 从现有关系数据库或数据仓库 已选择,然后单击 下一步

  4. 创建数据挖掘结构 页面上,在 您想要使用何种数据挖掘技术?, ,选择 Microsoft 关联规则 从列表中,然后单击 下一步选择数据源视图 页将出现。

  5. 选择 订单可用数据源视图, ,然后单击 下一步

  6. 指定表类型 页上,在 vAssocSeqLineItems 表的行中,选择 嵌套 复选框,然后在嵌套的表 vAssocSeqOrders 行中,选择 用例 复选框。 单击“下一步” 。

  7. 指定定型数据 页上,清除任何可能选中的框。 为设置键事例表 vAssocSeqOrders,选择 密钥 OrderNumber 旁边的复选框。

    由于市场篮分析的目的是确定在单个事务中包括哪些产品,因此不需要使用 CustomerKey 字段。

  8. 通过设置嵌套表 vAssocSeqLineItems 的键选择 密钥 Model 旁边的复选框。 输入 执行此操作时,将会自动选中复选框。 选择 可预测 复选框 模型 以及。

    在市场篮模型中,您不关心的购物篮中产品的序列,因此不应包括 LineNumber 作为嵌套表的键。 将使用 LineNumber 为仅在顺序非常重要的模型中的键。 您将在第 4 课中创建使用 Microsoft 顺序分析和聚类分析算法的模型。

  9. 选中 IncomeGroup 和 Region 左侧的复选框,但是不进行任何其他选择。 选中最左侧的列会将这些列添加到结构中以供日后参考,但不会用在模型中。 您选择的内容应如下所示:

    对话框外观如何

  10. 单击“下一步” 。

  11. 指定列内容和数据类型页上,查看所选内容,应将下表中所示,然后单击 下一步

    内容类型 数据类型
    IncomeGroup 离散 Text
    Order Number Key Text
    地区 离散 Text
    vAssocSeqLineItems
    Model Key Text
  12. 创建测试设置 页上,该选项的默认值 的测试数据百分比 为 30%。 该选项更改为 0。 单击“下一步” 。

    备注


    Analysis Services 为测量模型精确度提供不同的图表。 但是,某些精确度图表类型(如提升图和交叉验证报告)旨在进行分类和估计。 关联预测不支持这些方法。

  13. 完成向导 页上,在 挖掘结构名称, ,类型 关联

  14. 挖掘模型名称, ,类型 关联

  15. 选择选项 允许钻取, ,然后单击 完成

    数据挖掘设计器将打开以显示 关联 刚创建的挖掘结构。

课程中的下一个任务

修改和处理市场篮模型 #40; 数据挖掘中级教程 )

另请参阅

Microsoft 关联算法
内容类型(数据挖掘)