圖表模型精確度的工具 (Analysis Services - 資料採礦)

SQL Server Management Studio 和 Business Intelligence Development Studio 都有提供 [採礦精確度圖表] 索引標籤,此索引標籤會提供用來驗證採礦模型的多種工具:

  • 「增益圖」(Lift Chart)、「收益圖」(Profit Chart) 和「散佈圖」 (Scatter Plot) 都可以在 [增益圖] 索引標籤上檢視。使用 [輸入選擇] 索引標籤來選擇模型及設定選項,然後按一下 [增益圖] 索引標籤,並從 [圖表類型] 清單中選取您要的圖表類型。如果此模型代表線性迴歸,就會自動顯示散佈圖。

  • 「分類矩陣」(Classification Matrix) 有時稱為「混淆資料表」(Confusion Table),可以在 [輸入選擇] 索引標籤上設定,然後顯示在 [分類矩陣] 索引標籤上。

  • 「交叉驗證」(Cross-Validation) 報表可以在 [採礦精確度圖表] 索引標籤的 [交叉驗證] 索引標籤上設定及檢視。

    [!附註]

    [採礦精確度圖表] 索引標籤無法搭配時間序列模型一起使用。

增益圖

增益圖繪出測試資料集的預測查詢結果,以對照資料集現有的可預測資料行的已知值。此圖表顯示採礦模型的結果,另外也會顯示理想模型所產生之結果的表示法以及隨機猜測結果的表示法。隨機線條上的任何改進都稱為「增益」(Lift)。此模型所展示的增益越多,就表示此模型越有效。增益圖只能比較包含分隔可預測屬性的採礦模型。

您可以使用 [輸入選擇] 索引標籤來設定目標模型及選擇測試資料集,以建立增益圖。然後按一下 [增益圖] 索引標籤,檢視完成的圖表。

如需詳細資訊,請參閱:增益圖 (Analysis Services - 資料採礦), 採礦精確度圖表索引標籤:如何主題, 圖表模型精確度的工具 (Analysis Services - 資料採礦)

收益圖

收益圖是增益圖的變化,其中整合了有關使用模型所產生之預測的商務成本資訊。在輸入與成本相關的事實 (例如郵寄費用) 之後,Analysis Services 會顯示曲線以顯示模型所提供的增益,並計算使用模型時的投資報酬率。

您可以使用 [輸入選擇] 索引標籤來設定目標模型及選擇測試資料集,以建立收益圖。然後,請按一下 [增益圖] 索引標籤,然後從 [圖表類型] 清單中選取 [收益圖][收益圖設定] 對話方塊隨即自動開啟。在您設定收益圖所特有的參數之後,[採礦精確度圖表] 索引標籤上顯示的圖表會自動變更為顯示每單位的收益和損失。

如需詳細資訊,請參閱:收益圖 (Analysis Services - 資料採礦), 收益圖表設定對話方塊 (採礦精確度圖表檢視)

散佈圖

散佈圖會繪製可預測連續屬性之模型的精確度,比較每個案例的實際值與預測值。每當可預測屬性具有連續值時,都會產生散佈圖,而不是增益圖。

如果您的模型支援必要的可預測資料行和輸入資料行,您可以在資料採礦設計師的 [採礦精確度圖表] 索引標籤上建立散佈圖。首先,您可以使用 [輸入選擇] 索引標籤來設定目標模型及選擇測試資料集。然後,按一下 [增益圖] 索引標籤。[採礦精確度圖表] 索引標籤上顯示的圖表會自動變更為顯示一個圖,該圖會顯示輸入與預測值之間的線性關係。

如需詳細資訊,請參閱:散佈圖 (Analysis Services - 資料採礦)

分類矩陣

分類矩陣是另一種方式,可檢查結構中的採礦模型建立預測的精確度。為了建立分類矩陣,Analysis Services 會使用測試資料集中現有的實際值來計算良好預測和不良預測的數目。矩陣是重要的工具,因為它不僅會顯示模型正確預測值的頻率,也會顯示模型預測錯誤的值。分類矩陣會顯示每個可預測屬性的真肯定、誤判、真否定、誤否定的實際計數。

您可以在資料採礦設計師的 [採礦精確度圖表] 索引標籤上建立分類矩陣。首先,請使用 [輸入選擇] 索引標籤來設定目標模型及選擇測試資料集。然後,按一下 [分類矩陣] 索引標籤。此圖表會自動顯示,不需要進一步的組態設定。

**如需詳細資訊,請參閱:**<分類矩陣 (Analysis Services - 資料採礦)>、<採礦精確度圖表索引標籤:如何主題>、<圖表模型精確度的工具 (Analysis Services - 資料採礦)

交叉驗證報表

交叉驗證是一種進階的資料採礦技術,可幫助您衡量模型的有效性。當您建立交叉驗證報表時,Analysis Services 會將資料分成多個交叉區段,並自動在子集上建立及定型多個模型,然後再計算所有模型的精確度。藉由檢閱所產生的統計資料,您可以評估模型在不同資料集上的通用程度,或判斷結構上的數個模型中哪一個執行效果最好。

您可以在資料採礦設計師中的 [採礦精確度圖表] 索引標籤上建立交叉驗證報表,其方式是選取模型或結構,然後使用 [交叉驗證] 索引標籤來設定摺疊數目、目標屬性等選項。

如需詳細資訊,請參閱:交叉驗證 (Analysis Services - 資料採礦), 交叉驗證報表 (Analysis Services - 資料採礦)