Microsoft 時序群集演算法

Microsoft 時序群集演算法是 Microsoft SQL Server Analysis Services 所提供的時序分析演算法。您可以使用此演算法來探索資料,其中包含可以由下列路徑或 [順序] 來連結的事件。此演算法會透過分組或群集相同的時序來尋找最常見的時序。下面是一些時序的範例:

  • 描述使用者在導覽或瀏覽網站時建立之點選路徑的資料。

  • 描述客戶在線上零售店將商品放入購物車之順序的資料。

這個演算法在許多方面與 Microsoft 群集演算法很相似。不過,Microsoft 時序群集演算法會尋找時序中路徑相似的案例群集,而非包含相似屬性的案例群集。

範例

Adventure Works Cycles 網站會對使用者造訪的網頁及造訪順序收集相關資訊。因為該公司提供線上訂購,客戶必須登入站台。這樣為公司提供每一個客戶設定檔的點選資訊。在此資料上使用 Microsoft 時序群集演算法,公司可以找出具有類似點選模式或時序的客戶群組或群集。然後,公司可以使用這些群集來分析使用者在整個網站的移動情形、識別哪些頁面與某項特定產品最有關係,並預測下次最可能再造訪哪些頁面。

演算法的運作方式

Microsoft 時序群集演算法是一種混合式演算法,它結合了群集技術與 Markov 鏈結分析,可識別群集及其時序。Microsoft 時序群集演算法的其中一項特徵就是它會使用時序資料。這項資料通常代表資料集內的一系列事件或各狀態之間的轉換,例如特定使用者的一系列產品採購或網頁點選。此演算法會檢查所有轉換的機率並測量資料集內所有可能時序之間的差異或距離,以便判斷哪些時序最適合當做群集的輸入使用。在此演算法已經建立候選時序的清單之後,它就會使用此時序資訊當做群集之 EM 方法的輸入。

如需實作的詳細說明,請參閱<Microsoft 時序群集演算法技術參考 (Analysis Services - 資料採礦)>。

時序群集模型所需的資料

當您準備資料以供定型時序群集模型使用時,應該要了解特定演算法的需求,包括所需的資料量以及資料的使用方式。

時序群集模型的需求如下:

  • 單一key 資料行:時序群集模型需要可識別記錄的索引鍵。

  • 時序資料行:對於時序資料而言,此模型必須具有包含時序識別碼資料行的巢狀資料表。此時序識別碼可以是任何可排序資料類型。例如,您可以使用網頁識別碼、整數或文字字串,只要資料行可識別時序中的事件即可。每個時序只能有一個時序識別碼,而且每個模型只能有一種時序。

  • 選擇性非時序屬性:此演算法支援加入與時序無關的其他屬性。這些屬性可以包含巢狀資料行。

例如,在先前所述的 Adventure Works Cycles 網站範例中,時序群集模型可能會包含訂單資訊當做案例資料表、每筆訂單之特定客戶的相關人口統計當做非時序屬性,以及包含客戶瀏覽網站或將商品放入購物車之時序的巢狀資料表當做時序資訊。

如需有關時序群集模型所支援之內容類型和資料類型的詳細資訊,請參閱<Microsoft 時序群集演算法技術參考 (Analysis Services - 資料採礦)>的<需求>一節。

檢視時序群集模型

此演算法所建立的採礦模型會包含資料中最常見時序的描述。若要瀏覽此模型,您可以使用 [Microsoft 時序群集檢視器]。當您檢視時序群集模型時,Analysis Services 就會顯示包含多項轉換的群集。您也可以檢視相關的統計資料。如需詳細資訊,請參閱<以 Microsoft 時序群集檢視器檢視採礦模型>。

如果您想要知道更多詳細資訊,您可以在 Microsoft 一般內容樹狀檢視器中瀏覽此模型。針對此模型所儲存的內容包括每個節點中所有值的分佈、每個群集的機率,以及有關轉換的詳細資料。如需詳細資訊,請參閱<時序群集模型的採礦模型內容 (Analysis Services - 資料採礦)>。

建立預測

在此模型已定型之後,結果會儲存成一組模式。您可以使用資料中最常見時序的描述來預測新時序的下一個可能步驟。不過,因為此演算法包含其他資料行,所以您可以使用產生的模型來識別時序資料與非循序輸入之間的關聯性。例如,如果您將人口統計資料加入至模型,就可以針對特定客戶群組進行預測。您可以自訂預測查詢,以便傳回變動數目的預測或傳回描述性統計資料。

如需有關如何針對資料採礦模型建立查詢的詳細資訊,請參閱<查詢資料採礦模型 (Analysis Services - 資料採礦)>。如需如何使用查詢搭配時序群集模型的範例,請參閱<查詢時序群集模型 (Analysis Services - 資料採礦)>。

備註

  • 不支援使用預測模型標記語言 (PMML) 來建立採礦模型。

  • 支援鑽研。

  • 支援 OLAP 採礦模型的使用和資料採礦維度的建立。