CREATE MINING MODEL (DMX)

在資料庫中建立新採礦模型與採礦結構。您可以在陳述式中定義新模型,或者使用預測模型標記語言 (PMML),來建立模型。第二個選項只供進階使用者使用。

採礦結構的命名方式,是在模型名稱後附加「_structure」,這可確保結構名稱與模型名稱一樣保持唯一。

若要建立現有採礦結構的採礦模型,請使用 ALTER MINING STRUCTURE (DMX) 陳述式。

語法

CREATE [SESSION] MINING MODEL <model>
(
    [(<column definition list>)]
)
USING <algorithm> [(<parameter list>)] [WITH DRILLTHROUGH]
CREATE MINING MODEL <model> FROM PMML <xml string>

引數

model

模型的唯一名稱。

column definition list

資料行定義的逗號分隔清單。

algorithm

資料採礦提供者的提供者自訂名稱。

parameter list

選擇性。提供者自訂之演算法參數的逗號分隔清單。

XML string

(僅限進階使用)。XML 編碼的模型 (PMML)。字串必須使用單引號 (') 括住。

備註

SESSION 子句可以讓您建立在連接關閉或工作階段逾時的時候,就自動移除的採礦模型。SESSION 採礦模型並不要求使用者必須是資料庫管理員,而且只在連接開啟時才會使用磁碟空間,所以很有用。

WITH DRILLTHROUGH 子句能夠鑽研新採礦模型。只有在您建立模型時,才能啟用鑽研。

CREATE MINING MODEL 陳述式會建立以資料行定義清單、演算法及演算法參數清單為基礎的新採礦模型。

資料行定義清單

定義使用資料行定義清單之模型結構的方式,是包含每個資料行的下列資訊:

  • 名稱 (強制的)
  • 資料類型 (強制的)
  • 散發
  • 模型旗標的清單
  • 內容類型 (強制的)
  • 指出預測這個資料行之演算法的預測要求,由 PREDICTPREDICT_ONLY 子句指出
  • 與屬性資料行的關係 (只有適用時才是強制的),由 RELATED TO 子句指示

使用下列資料行定義清單的語法,以定義單一資料行:

<column name>    <data type>    [<Distribution>]    [<Modeling Flags>]    <Content Type>    [<prediction>]    [<column relationship>] 

使用下列資料行定義清單的語法,以定義巢狀資料表資料行:

<column name>    TABLE    [<prediction>] ( <non-table column definition list> )

除了模型旗標之外,您不能從特定群組使用一個以上的子句來定義資料行。您可以為一個資料行定義多個模型旗標。

如需可用於定義資料行之資料類型、內容類型、資料行散發及模型旗標的清單,請參閱下列主題:

您可以在陳述式中加入子句,以描述兩個資料行之間的關聯性。Analysis Services 支援使用下列 <Column relationship> 子句。

RELATED TO

這個表單表示階層。RELATED TO 資料行的目標可以是巢狀資料表中的索引鍵資料行、案例資料列中的分隔值資料行,或者使用 RELATED TO 子句的另一個資料行 (表示更深的階層)。

使用預測子句描述如何使用預測資料行。下表描述兩個可能的子句。

<prediction> 子句 描述

PREDICT

這個資料行可以依模型預測,也可以在輸入案例中提供以預測其他可預測資料行的值。

PREDICT_ONLY

這個資料行可以依模型預測,但是其值不能用於輸入案例中以預測其他可預測資料行的值。

參數定義清單

您可以使用參數清單調整採礦模型的效能與功能。參數清單的語法如下:

[<parameter> = <value>, <parameter> = <value>,…]

如需與每一種演算法相關聯之參數的清單,請參閱<資料採礦演算法>。

貝氏機率分類範例

以下範例使用 Microsoft 貝氏機率分類演算法建立新的採礦模型。Bike Buyer 資料行定義為可預測屬性。

CREATE MINING MODEL [NBSample]
(
    CustomerKey LONG KEY, 
    Gender TEXT DISCRETE,
    [Number Cars Owned] LONG DISCRETE,
    [Bike Buyer] LONG DISCRETE PREDICT
)
Using Microsoft_Naive_Bayes

關聯模型範例

以下範例使用 Microsoft 關聯演算法建立新採礦模型。陳述式使用資料行,以利用在模型定義中巢狀資料表的能力。模型使用 Minimum_ProbabilityMinimum_Support 參數修改。

CREATE MINING MODEL MyAssociationModel (
    OrderNumber TEXT KEY,
    [Products] TABLE PREDICT (
        [Model] TEXT KEY
    )
)
Using Microsoft_Association_Rules (Minimum_Probability = 0.1, Minimum_Support = 0.01)

時序群集範例

以下範例使用 Microsoft 時序群集演算法建立新的採礦模型。使用兩個索引鍵來定義模型。Order Number 指定個別的訂單。Line Number 指定項目加入訂單的順序。

CREATE MINING MODEL BuyingSequence (
    [Order Number] TEXT KEY,
    [Products] TABLE (
        [Line Number] LONG KEY SEQUENCE,
        [Model] TEXT DISCRETE PREDICT
)
)
Using Microsoft_Sequence_Clustering

時間序列範例

以下範例使用 Microsoft 時間序列演算法建立新的採礦模型。由於時間序列模型可以包含多個索引鍵,因此 TimeIndex 與 ModelRegion 都指定作為索引鍵資料行。在這個範例中,假設資料的週期是 12 個月,因此 PERIODICITY_HINT 參數設定為 12。

ms131986.note(zh-tw,SQL.90).gif附註:
您必須使用大括號字元「{}」來指定 PERIODICITY_HINT 參數。
CREATE MINING MODEL SalesForcast (
        TimeIndex LONG KEY TIME,
        ModelRegion TEXT KEY,
        Amount LONG CONTINUOUS PREDICT,
        Quantity LONG CONTINUOUS PREDICT
)
Using Microsoft_Time_Series (PERIODICITY_HINT = '{12}')

請參閱

參考

資料採礦延伸模組 (DMX) 資料定義陳述式
資料採礦延伸模組 (DMX) 資料操作陳述式
資料採礦延伸模組 (DMX) 陳述式參考

說明及資訊

取得 SQL Server 2005 協助