浏览 Naive Bayes 模型(数据挖掘基础教程)

 

适用于: SQL Server 2016 Preview

Microsoft Naive Bayes 算法提供几种方法来显示自行车的购买和输入的属性之间的交互。

Microsoft Naive Bayes 查看器提供了以下选项卡,用于浏览 Naive Bayes 挖掘模型︰

依赖关系网络

属性配置文件

属性特征

属性对比

依赖关系网络

依赖关系网络 选项卡上的工作方式与 依赖关系网络 选项卡上的 Microsoft 树查看器。 查看器中的每个节点代表一个属性,而节点之间的线条代表关系。 在查看器中,您可以查看影响可预测属性 Bike Buyer 的状态的所有属性。

在“依赖关系网络”选项卡中浏览模型

  1. 使用 挖掘模型 列表顶部的 挖掘模型查看器 选项卡切换到 TM_NaiveBayes 模型。

  2. 使用 查看器 列表切换到 Microsoft Naive Bayes 查看器

  3. 单击 Bike Buyer 节点以确定其依赖项。

    粉色阴影指示所有属性都会对自行车购买行为产生影响。

  4. 调整滑块可标识影响最大的属性。

    向下滑动滑块时,将只保留对 [Bike Buyer] 列影响最大的属性。 通过调整滑块,可以发现影响最大的几个属性为:拥有汽车的数量、通勤距离以及子女总数。

返回页首

属性配置文件

属性配置文件 选项卡描述了输入的属性的影响可预测属性的结果的不同状态如何。

在“属性配置文件”选项卡中浏览模型

  1. 可预测 框中,确认 Bike Buyer 处于选中状态。

  2. 如果 挖掘图例 阻止显示 属性配置文件, ,将其移开。

  3. 直方图 条框中,选择 5

    在我们的模型中,任意一个变量的最大状态数均为 5。

    系统会列出影响该可预测属性的状态的属性以及输入属性的每个状态的值及其在该可预测属性的每个状态中的分布。

  4. 属性 列中,查找 Number Cars Owned。 请注意,自行车购买者(标为 1 的列)与非自行车购买者(标为 0 的列)的直方图的差异。 如果一个人拥有的汽车数量为 0 或 1,则此人很有可能会购买自行车。

  5. 双击 Number Cars Owned 自行车购买者中的单元格 (标为 1 的列) 列。

    挖掘图例 显示更详细的视图。

返回页首

属性特征

属性特性,而 选项卡上,您可以选择属性和值以查看所选的值事例中的其他属性的值的出现频率。

在“属性特征”选项卡中浏览模型

  1. 属性 列表中,验证 Bike Buyer 处于选中状态。

  2. 设置 1

    在查看器中,您将看到,家中无子女、通勤距离较近和居住在北美洲地区的客户更有可能购买自行车。

返回页首

属性对比

属性对比 选项卡上,你可以调查自行车购买行为的两个离散值和其他属性值之间的关系。 因为 TM_NaiveBayes 模型有只有两种状态 1 和 0,无需对查看器进行任何更改。

在查看器中,您会看到,没有汽车的人一般会购买自行车,而有两辆汽车的人一般不会购买自行车。

相关任务

请参阅以下主题以了解其他挖掘模型。

下一课

第 5 课︰ 测试模型 (数据挖掘基础教程 )

课程中的前一个任务

浏览聚类分析模型 (数据挖掘基础教程 )

另请参阅

使用 Microsoft Naive Bayes 查看器浏览模型
“属性对比”选项卡(挖掘模型查看器)
“属性配置文件”选项卡(挖掘模型查看器)
“属性特征”选项卡(挖掘模型查看器)
“依赖关系网络”选项卡(挖掘模型查看器)