第 1 課:建立自行車買主採礦結構

 

適用於: SQL Server 2016 Preview

在這一課,您將建立一個可讓您預測 Adventure Works Cycles 的潛在客戶是否將購買自行車的採礦結構。 如果您不熟悉採礦結構和使用者資料採礦中的角色,請參閱 採礦結構和 #40。Analysis Services-資料採礦 )

在這一課,您將建立自行車買主採礦結構支援加入採礦模型,根據 Microsoft 群集演算法Microsoft 決策樹演算法。 在後面的課程中,您將使用群集採礦模型來探索可分組客戶的不同方式,並將使用決策樹採礦模型來預測潛在客戶是否會購買自行車。

CREATE MINING STRUCTURE 陳述式

若要建立採礦結構時,您使用 建立採礦結構 #40; DMX ) 陳述式。 陳述式中的程式碼可分成下列各部份:

  • 命名結構。

  • 定義索引鍵資料行。

  • 定義採礦資料行。

  • 定義選擇性的測試資料集。

以下是 CREATE MINING STRUCTURE 陳述式的一般範例:

CREATE MINING STRUCTURE [<mining structure name>]  
(  
    <key column>,  
    <mining structure columns>  
)   
WITH HOLDOUT (<holdout specifier>)  

程式碼的第一行定義結構的名稱:

CREATE MINING STRUCTURE [<mining structure name>]  

命名的物件中的資料採礦延伸模組 (DMX) 的相關資訊,請參閱 識別碼 #40; DMX )

程式碼的下一行定義採礦結構的索引鍵資料行,可唯一識別來源資料中的實體:

<key column>,  

在您要建立的採礦結構中,客戶識別碼 CustomerKey 定義來源資料中的實體。

程式碼的下一行用來定義採礦資料行,與採礦結構相關聯的採礦模型將使用這些資料行:

<mining structure columns>  

您可以使用 DISCRETIZE 函數 離散化連續資料行,可以使用下列語法︰

DISCRETIZE(<method>,<number of buckets>)

如需有關分隔資料行的詳細資訊,請參閱 離散化方法 #40; 資料採礦 )。 如需採礦結構資料行,您可以定義類型的詳細資訊,請參閱 採礦結構資料行

程式碼的最後一行定義採礦結構中的選擇性資料分割:

WITH HOLDOUT (<holdout specifier>)  

您將資料的某些部分指定為用來測試與結構相關的採購模型,而將剩餘的資料指定為用來定型模型。 根據預設,Analysis Services 所建立的測試資料集會包含所有案例資料的 30%。 您要加入規格,規定測試資料集應該包含 30% 的案例,最多可達 1000 個案例。 如果 30% 的案例數少於 1000,則測試資料集將包含較小的數量。

課程工作

您將在這一課執行下列工作:

  • 建立新的空白查詢。

  • 改變查詢來建立採礦結構。

  • 執行查詢。

建立查詢

第一步是連接到 Analysis Services 的執行個體,並在 Transact-SQL 中建立新的 DMX 查詢。

若要在 SQL Server Management Studio 中建立新的 DMX 查詢

  1. 開啟 Transact-SQL。

  2. 連接到伺服器 對話方塊中,如 伺服器類型, ,請選取 Analysis Services。 在 伺服器名稱, ,型別 LocalHost, ,或輸入執行個體名稱 Analysis Services 您想要連線到這一課。 按一下 [連接]

  3. 物件總管] 中, ,以滑鼠右鍵按一下 [執行個體 Analysis Services, ,指向 新查詢, ,然後按一下 [ DMX 開啟 查詢編輯器 以及新的空白查詢。

改變查詢

下一步是修改上述 CREATE MINING STRUCTURE 陳述式來建立自行車買主採礦結構。

若要自訂 CREATE MINING STRUCTURE 陳述式

  1. 在查詢編輯器中,將 CREATE MINING STRUCTURE 陳述式的一般範例複製到空白查詢中。

  2. 取代下列項目:

    [<mining structure>]   
    

    成為:

    [Bike Buyer]  
    
  3. 取代下列項目:

    <key column>   
    

    成為:

    CustomerKey LONG KEY  
    
  4. 取代下列項目:

    <mining structure columns>   
    

    成為:

    [Age] LONG DISCRETIZED(Automatic,10),  
    [Bike Buyer] LONG DISCRETE,  
    [Commute Distance] TEXT DISCRETE,  
    [Education] TEXT DISCRETE,  
    [Gender] TEXT DISCRETE,  
    [House Owner Flag] TEXT DISCRETE,  
    [Marital Status] TEXT DISCRETE,  
    [Number Cars Owned] LONG DISCRETE,  
    [Number Children At Home] LONG DISCRETE,  
    [Occupation] TEXT DISCRETE,  
    [Region] TEXT DISCRETE,  
    [Total Children]LONG DISCRETE,  
    [Yearly Income] DOUBLE CONTINUOUS  
    
  5. 取代下列項目:

    WITH HOLDOUT (holdout specifier>)  
    

    成為:

    WITH HOLDOUT (30 PERCENT or 1000 CASES)  
    

    現在,完整的採礦結構陳述式應該如下所示:

    CREATE MINING STRUCTURE [Bike Buyer]  
    (  
       [Customer Key] LONG KEY,  
       [Age]LONG DISCRETIZED(Automatic,10),  
       [Bike Buyer] LONG DISCRETE,  
       [Commute Distance] TEXT DISCRETE,  
       [Education] TEXT DISCRETE,  
       [Gender] TEXT DISCRETE,  
       [House Owner Flag] TEXT DISCRETE,  
       [Marital Status] TEXT DISCRETE,  
       [Number Cars Owned]LONG DISCRETE,  
       [Number Children At Home]LONG DISCRETE,  
       [Occupation] TEXT DISCRETE,  
       [Region] TEXT DISCRETE,  
       [Total Children]LONG DISCRETE,  
       [Yearly Income] DOUBLE CONTINUOUS  
    )  
    WITH HOLDOUT (30 PERCENT or 1000 CASES)  
    
  6. 檔案 ] 功能表上,按一下 [ 另存 DMXQuery1.dmx 為

  7. 另存新檔 對話方塊中,瀏覽至適當的資料夾,並將檔案 Bike Buyer Structure.dmx

執行查詢

最後的步驟是執行查詢。 在建立及儲存查詢以後,將需要執行查詢。 也就是說,必須執行此陳述式,才能夠在伺服器上建立採礦結構。 如需在 [查詢編輯器] 中執行查詢的詳細資訊,請參閱 Database Engine 查詢編輯器 & #40。SQL Server Management Studio )

若要執行查詢

  1. 在 [查詢編輯器] 工具列上,按一下 Execute

    查詢的狀態會顯示在 訊息 在底部的 [查詢編輯器的陳述式完成執行之後的索引標籤。 訊息應該顯示如下:

    Executing the query   
    Execution complete  
    

    新的結構,名為 Bike Buyer 現在存在於伺服器上。

在下一課,您會將採礦模型加入剛才建立的結構中。

下一課

第 2 課:將採礦模型加入 Bike Buyer 採礦結構中