建立預測 (基本資料採礦教學課程)

測試好採礦模型的精確度,確定它們能符合您的要求之後,您可以在資料採礦設計師的 [採礦模型預測] 索引標籤中,利用「預測查詢產生器」來建立資料採礦延伸模組 (DMX) 預測查詢。

預測查詢產生器有三個檢視。您可以利用 [設計][查詢] 檢視來建立和檢查您的查詢。之後,您便可以在 [結果] 檢視中執行查詢和檢視結果。

如需有關如何使用「預測查詢產生器」的詳細資訊,請參閱<建立 DMX 預測查詢>。

建立查詢

建立預測查詢的第一個步驟是,選取採礦模型和輸入資料表。

若要選取模型和輸入資料表

  1. 在資料採礦設計師的 [採礦模型預測] 索引標籤的 [採礦模型] 方塊中,按一下 [選取模型]

  2. [選取採礦模型] 對話方塊中,於樹狀結構內導覽至 [目標郵寄] 結構,並展開此結構,然後選取 TM_Decision_Tree,再按一下 [確定]

  3. [選取輸入資料表] 方塊中,按一下 [選取案例資料表]

  4. [選取資料表] 對話方塊的 [資料來源] 清單中,選取 Adventure Works DW2008R2。

  5. [資料表/檢視表名稱] 中,選取 [ProspectiveBuyer (dbo)] 資料表,再按一下 [確定]

    [ProspectiveBuyer] 資料表與 [vTargetMail] 案例資料表最為相似。

對應資料行

選好輸入資料表之後,「預測查詢產生器」會根據資料行的名稱,在採礦模型和輸入資料表之間建立預設的對應。此結構中至少必須有一個資料行符合外部資料中的資料行。

重要事項重要事項

您用來判斷模型精確度的資料必須包含可對應至可預測資料行的資料行。

若要將結構資料行對應至輸入資料表資料行

  1. 以滑鼠右鍵按一下連接 [採礦模型] 視窗與 [選取輸入資料表] 視窗的線條,然後選取 [修改連接]

    請注意,並非每一個資料行都會對應。我們將會加入數個 [資料表資料行] 的對應。

  2. [資料表資料行] 底下,按一下 [Bike Buyer] 資料格,並從下拉式清單中選取 [ProspectiveBuyer.Unknown]。

    這會將可預測的資料行 [Bike Buyer] 對應到輸入資料表資料行。

  3. 按一下 [確定]

  4. [方案總管] 中,以滑鼠右鍵按一下 [目標郵寄] 資料來源檢視,並選取 [檢視表設計工具]

  5. 以滑鼠右鍵按一下 ProspectiveBuyer 資料表標題,並選取 [新增具名計算]

  6. [資料行名稱] 方塊中,輸入 calcAge。

  7. [運算式] 方塊中輸入 DATEDIFF(YYYY,[BirthDate],getdate()),然後按一下 [確定]

    輸入資料表沒有對應的 [Age] 資料行。此運算式將會從輸入資料表的 BirthDate 資料行中計算客戶的年齡。由於 [Age] 已被識別為用來預測自行車購買能力的最具影響力資料行,所以它必須同時存在於模型和輸入資料表中。

  8. 在資料採礦設計師中,選取 [採礦模型預測] 索引標籤,然後重新開啟 [修改連接] 視窗。

  9. [資料表資料行] 底下,按一下 [Age] 資料格,並從下拉式清單中選取 [ProspectiveBuyer.calcAge]。

  10. 按一下 [確定]

設計預測查詢

若要設計預測查詢

  1. [採礦模型預測] 索引標籤工具列上的第一個按鈕是 [切換到設計檢視 / 切換到結果檢視 / 切換到查詢檢視] 按鈕。按一下此按鈕上的向下箭頭,然後選取 [設計]

  2. [採礦模型預測] 索引標籤的方格中,按一下 [來源] 資料行中第一個空白資料列內的資料格,再選取 [預測函數]

    這會指定 PredictProbability 函數的目的地資料行。如需有關函數的詳細資訊,請參閱<資料採礦延伸模組 (DMX) 函數參考>。

  3. [預測函數] 資料列的 [欄位] 資料行中,選取 [PredictProbability]

  4. 從上面的 [採礦模型] 視窗中選取 [Bike Buyer],並將其拖曳到 [準則/引數] 資料格中。

    當您放開滑鼠時,[TM_Decision_Tree].[Bike Buyer] 就會出現在 [準則/引數] 資料格中。

  5. [來源] 資料行中,按一下下一個空白資料列,然後選取 [TM_Decision_Tree]

  6. [TM_Decision_Tree] 資料列的 [欄位] 資料行中,選取 [Bike Buyer]

  7. [TM_Decision_Tree] 資料列中,於 [準則/引數] 資料行內輸入 =1

  8. [來源] 資料行中,按一下下一個空白資料列,然後選取 [ProspectiveBuyer]

  9. [ProspectiveBuyer] 資料列的 [欄位] 資料行中,選取 [ProspectiveBuyerKey]

    這會在預測查詢中加入唯一識別碼,供您辨識可能會購買和可能不會購買自行車的人。

  10. 將其他五個資料列加入至方格中。針對每一個資料列選取 [ProspectiveBuyer] 當做 [來源],然後在 [欄位] 資料格中加入以下資料行:

    • calcAge

    • LastName

    • FirstName

    • AddressLine1

    • AddressLine2

最後,執行此查詢並瀏覽結果。

若要執行查詢並檢視結果

  1. [採礦模型預測] 索引標籤中,選取 [結果] 按鈕。

  2. 當執行此查詢並顯示結果之後,您可以檢閱結果。

    [採礦模型預測] 索引標籤會顯示可能購買自行車之潛在客戶的連絡資訊。[運算式] 資料行會指出預測正確的機率。您可以利用這些結果來判斷哪些潛在的客戶應該成為郵寄目標。

  3. 按一下 [儲存],儲存結果。