比較用來預測模型的預測 (中繼資料採礦教學課程)

適用於： SQL Server 2016 Preview

在本教學課程的先前步驟中，您建立了多個時間序列模型：

為了概述時間序列預測的功能，您將檢閱變更，了解使用擴充或取代資料的選項如何影響預測結果。

EXTEND_MODEL_CASES

REPLACE_MODEL_CASES

比較原始結果與加入資料後的結果

讓我們來看看只與太平洋地區 M200 產品線相關的資料，了解以新資料更新模型會如何影響結果。請記得原始資料數列在 2004 年 6 月結束，而我們取得 7 月、8 月和 9 月的新資料。

M200 Pacific	更新的實際銷售資料	加入資料之前的預測	擴充預測
7-25-2008	65	32	65
8-25-2008	54	37	54
9-25-2008	61	32	61
10-25-2008	無資料	36	32
11-25-2008	無資料	31	41
12-25-2008	無資料	34	32

您將會注意到使用擴充資料 (此處以粗體顯示) 的預測完全重複實際資料點。重複是預設行為。只要有可用的實際資料點，預測查詢就會傳回實際值，只在新的實際資料點已經用完後才會輸出新的預測值。

一般而言，相較於模型資料開頭的資料，演算法對新資料的變更賦予較重的加權。不過，在此情況下，新銷售數字比起上一個週期增幅僅為 20-30%，因此對預計銷售造成些微的上揚，在此之後銷售預測轉而向下，重複加入新資料之前月份的趨勢。

請記得，原始採礦模型揭露地區之間和產品線之間有很大的差異。例如，M200 模型的銷售非常強，而 T1000 模型的銷售則在所有地區都很低。此外，有些數列沒有太多的資料。數列沒有相同的起點，呈現不齊現象。

序列預測 M200 與 T1000 數量

因此，當您根據一般模型做預測，此模型以全球銷售而不是以原始資料集為基礎，預測會如何變更？為確保不遺失任何資訊或扭曲預測，您可以將結果儲存至資料表，將預測的資料表聯結至歷程記錄資料的資料表，然後在圖形中顯示兩組歷程記錄資料和預測。

下圖只以 M200 一個產品線為基礎。圖形將初始採礦模型中的預測與使用彙總採礦模型的預測相比較。

Excel 圖表比較預測

您可以從此圖中得知，彙總採礦模型保留值的整體範圍和趨勢，同時將個別資料數列中的波動降至最低。

您已經學會如何建立及自訂可用於預測的時間序列模型。

您已經學會使用 EXTEND_MODEL_CASES 參數，加入新資料及建立預測來更新時間序列模型，而不需重新處理模型。

您已經學會使用 REPLACE_MODEL_CASES 參數以及將模型套用至不同資料數列，建立可用於交叉預測的模型。