Share via


資料採礦演算法

資料採礦演算法是建立採礦模型的機制。若要建立模型,演算法首先會分析一組資料,尋找特定模式和趨勢。接著,演算法會使用此分析結果來定義採礦模型的參數。

演算法建立的採礦模型可以有各種形式,包括:

  • 一組規則,描述交易中的產品如何群組在一起。
  • 決策樹,預測特定客戶是否會購買產品。
  • 預測銷售的數學模型。
  • 一組叢集,描述資料集的案例如何相關。

Microsoft SQL Server 2005 Analysis Services (SSAS) 會提供數種演算法供您在資料採礦方案中使用。這些演算法是適用於資料採礦之所有演算法的子集。您也可以使用符合 OLE DB for Data Mining 規格的協力廠商演算法。如需有關協力廠商演算法的詳細資訊,請參閱<外掛程式演算法>。

檢閱演算法

Analysis Services 包括下列演算法類型:

  • 分類演算法會根據資料集內的其他屬性,預測一或多個分隔變數。Microsoft 決策樹演算法 為分類演算法的一個範例。
  • 迴歸演算法會根據資料集內的其他屬性,預測一或多個連續變數,例如利潤或損失。Microsoft 時間序列演算法 為迴歸演算法的一個範例。
  • 分割演算法會將項目的資料劃分為具有相似屬性的群組或叢集。Microsoft 群集演算法 為分割演算法的一個範例。
  • 關聯分析演算法會尋找資料集內的不同屬性之間的相互關聯。這種演算法最常應用在建立關聯規則,這些規則可以用在購物籃分析。Microsoft 關聯分析演算法 為關聯分析演算法的一個範例。
  • 時序分析演算法會摘要資料的時序或時段,例如 Web 路徑流程。Microsoft 時序群集演算法 為時序分析演算法的一個範例。

套用演算法

選擇特定商務工作適用的正確演算法並不容易。您可以使用不同的演算法來執行相同的商務工作,每一個演算法會產生不同的結果,且部分演算法還會產生一種以上的結果類型。例如,您可以使用 Microsoft 決策樹演算法,不僅用來預測也可以減少資料集內的資料行數目,因為決策樹可以識別不影響最終採礦模型的資料行。

您也不必個別地使用演算法—在單一資料採礦方案中,您可以使用某些演算法來探索資料,然後使用其他演算法根據該資料來預測特定結果。例如,您可以使用會辨識模式的群集演算法,將資料分解為同質性更高或更低的群組,然後使用結果來建立更好的決策樹模型。您可以在一個方案內使用多種演算法來執行個別的工作,例如,使用迴歸樹演算法來取得財務預測資訊,而使用以規則為基礎的演算法來執行購物籃分析。

採礦模型可以預測值、產生資料的摘要,以及尋找隱藏的相互關聯。為了協助您選取適合資料採礦方案的演算法,下表提供哪些演算法適用於特定工作的建議。

工作 適用的 Microsoft 演算法

預測分隔屬性。 例如,預測目標郵寄活動的收件者是否會購買產品。

Microsoft 決策樹演算法

Microsoft 貝氏機率分類演算法

Microsoft 群集演算法

Microsoft 類神經網路演算法 (SSAS)

預測連續屬性。 例如,預測下一個年度的銷售。

Microsoft 決策樹演算法

Microsoft 時間序列演算法

預測順序。 例如,執行公司網站的點選流向分析。

Microsoft 時序群集演算法

在交易中尋找通用項目的群組。 例如,使用購物籃分析來建議使用者購買的其他產品。

Microsoft 關聯分析演算法

Microsoft 決策樹演算法

尋找相似項目的群組。 例如,將人口統計資料分割為群組,更容易瞭解屬性之間的關聯性。

Microsoft 群集演算法

Microsoft 時序群集演算法

因為每一個模型會傳回不同類型的結果,Analysis Services 會為每一種演算法提供個別的檢視器。在 Analysis Services 中瀏覽採礦模型時,該模型會使用適合它的檢視器顯示在資料採礦設計師的 [採礦模型檢視器] 索引標籤上。如需詳細資訊,請參閱<檢視資料採礦模型>。

演算法詳細資料

您可以使用函數來擴充採礦模型傳回的結果。下表列出在 Analysis Services 中所有演算法支援的函數。

BottomCount

RangeMin

BottomPercent

TopCount

Predict

TopPercent

RangeMax

TopSum

RangeMid

個別演算法可能支援其他函數。Microsoft 提供的演算法皆不允許重複的索引鍵。

請參閱

概念

資料採礦概念
採礦結構 (Analysis Services)
Microsoft 關聯分析演算法
Microsoft 群集演算法
Microsoft 決策樹演算法
Microsoft 貝氏機率分類演算法
Microsoft 類神經網路演算法 (SSAS)
Microsoft 時序群集演算法
Microsoft 時間序列演算法
Microsoft 線性迴歸演算法
Microsoft 羅吉斯迴歸演算法
外掛程式演算法
使用資料採礦工具

其他資源

資料採礦延伸模組 (DMX) 參考

說明及資訊

取得 SQL Server 2005 協助