第 3 课:处理自行车购买者挖掘结构

在本课中,您将使用 AdventureWorksDW2008R2 示例数据库中的 INSERT INTO 语句和 vTargetMail 视图,来处理在第 1 课:创建自行车购买者挖掘结构第 2 课:向自行车购买者挖掘结构添加挖掘模型中创建的挖掘结构和挖掘模型。

处理挖掘结构时,Analysis Services 将读取源数据并生成支持挖掘模型的结构。处理挖掘模型时,挖掘结构定义的数据将通过所选择的数据挖掘算法进行传递。该算法将搜索趋势和模式,然后在挖掘模型中存储此信息。因此,挖掘模型不包含实际源数据,而是包含由算法发现的信息。有关处理挖掘模型的详细信息,请参阅处理数据挖掘对象

仅在更改了结构列或源数据的情况下,才需要重新处理挖掘结构。如果将挖掘模型添加到已处理的挖掘结构中,则可使用 INSERT INTO MINING MODEL 语句定型新的挖掘模型。

定型结构模板

为了定型挖掘结构及其关联的挖掘模型,请使用 INSERT INTO (DMX) 语句。可以将语句中的代码分为下列几部分:

  • 标识挖掘结构

  • 列出挖掘结构中的列

  • 定义定型数据

下面是 INSERT INTO 语句的一般示例:

INSERT INTO MINING STRUCTURE [<mining structure name>]
(
   <mining structure columns>
)
OPENQUERY([<datasource>],'<SELECT statement>')

代码的第一行标识将定型的挖掘结构:

INSERT INTO MINING STRUCTURE [<mining structure name>]

代码的第二行指定由挖掘结构定义的列。必须列出挖掘结构的每一列,并且每列必须映射到源查询数据所包含的对应列。

(
   <mining structure columns>
)

代码的最后一行定义将用于定型挖掘结构的数据:

OPENQUERY([<datasource>],'<SELECT statement>')

在本课中,您将使用 OPENQUERY 来定义源数据。有关定义源查询的其他方法的信息,请参阅 <source data query>

课程任务

在本课中,您将执行以下任务:

  • 处理自行车购买者挖掘结构

处理预测性挖掘结构

使用 INSERT INTO 处理挖掘结构

  1. 对象资源管理器中,右键单击 Analysis Services 实例,指向**“新建查询”**,再单击 DMX

    将打开查询编辑器,其中包含一个新的空白查询。

  2. 将 INSERT INTO 语句的一般示例复制到空白查询中。

  3. [<mining structure name>] 
    

    替换为

    Bike Buyer
    
  4. <mining structure columns>
    

    替换为

    [Customer Key],
    [Age],
    [Bike Buyer],
    [Commute Distance],
    [Education],
    [Gender],
    [House Owner Flag],
    [Marital Status],
    [Number Cars Owned],
    [Number Children At Home],
    [Occupation],
    [Region],
    [Total Children],
    [Yearly Income]
    
  5. OPENQUERY([<datasource>],'<SELECT statement>')
    

    替换为

    OPENQUERY([Adventure Works DW2008R2],
       'SELECT CustomerKey, Age, BikeBuyer,
             CommuteDistance,EnglishEducation,
             Gender,HouseOwnerFlag,MaritalStatus,
             NumberCarsOwned,NumberChildrenAtHome, 
             EnglishOccupation,Region,TotalChildren,
             YearlyIncome 
        FROM dbo.vTargetMail')
    

    OPENQUERY 语句将引用 Adventure Works DW2008R2 数据源,以访问 vTargetMail 视图。该视图包含将用于定型挖掘模型的源数据。

    现在,完整的语句应该如下所示:

    INSERT INTO MINING STRUCTURE [Bike Buyer]
    (
       [Customer Key],
       [Age],
       [Bike Buyer],
       [Commute Distance],
       [Education],
       [Gender],
       [House Owner Flag],
       [Marital Status],
       [Number Cars Owned],
       [Number Children At Home],
       [Occupation],
       [Region],
       [Total Children],
       [Yearly Income]   
    )
    OPENQUERY([Adventure Works DW2008R2],
       'SELECT CustomerKey, Age, BikeBuyer,
             CommuteDistance,EnglishEducation,
             Gender,HouseOwnerFlag,MaritalStatus,
             NumberCarsOwned,NumberChildrenAtHome, 
             EnglishOccupation,Region,TotalChildren,
             YearlyIncome 
        FROM dbo.vTargetMail')
    
  6. 在**“文件”菜单中,单击“DMXQuery1.dmx 另存为”**。

  7. 在**“另存为”**对话框中,浏览到相应的文件夹,并将文件命名为 Process Bike Buyer Structure.dmx。

  8. 在工具栏中,单击**“执行”**按钮。

在下一课中,您将浏览在本课中向挖掘结构添加的挖掘模型中的内容。