建立新的採礦結構

當您在 Microsoft SQL Server Analysis Services 中建立資料採礦方案時,第一個步驟是使用 Business Intelligence Development Studio 中的資料採礦精靈 (Analysis Services - 資料採礦)來建立採礦結構。採礦結構會定義用來建立採礦模型的資料網域。所有採礦模型都是以結構為基礎。

採礦結構會使用關聯式或線上分析處理 (OLAP) 資料來源。關聯式採礦結構是以儲存在資料表、檔案或關聯式資料庫系統中的資料為基礎,而且該資料已經定義為成資料來源檢視。OLAP 採礦結構是以 OLAP Cube (與採礦結構存在相同的資料庫上) 中的維度和相關量值為基礎。

**如需詳細資訊,請參閱:**<設計資料庫>、<設計 Analysis Services 多維度資料庫物件>。

資料採礦精靈會自動定義採礦結構,並讓您將初始採礦模型加入至結構中。因為採礦結構可以包含多個採礦模型,所以您可以使用<資料採礦設計師>來加入更多採礦模型到結構中。

下列章節將提供有關使用資料採礦精靈建立新採礦結構的詳細資訊,以及如何在採礦結構上設定選項,以便讓您針對採礦結構中的資料建立測試集或執行查詢。

  • 建立關聯式採礦結構

  • 建立 OLAP 採礦結構

  • 啟用鑑效組和鑽研

建立關聯式採礦結構

關聯式採礦結構能夠以透過 OLE DB 資料來源取得的任何資料為基礎。如果來源資料是包含在多份資料內,您可以建立會同時帶入您所需之資料表與資料行的資料來源檢視。如果資料表包含任何一對多關聯性 (例如,對於每一個想要分析的客戶都有多筆訂購記錄),那麼您可以同時加入兩個資料表,然後使用其中一個資料表做為案例資料表,並將來自關聯性多側中的資料做為巢狀資料表。

**如需詳細資訊,請參閱:**<巢狀資料表 (Analysis Services - 資料採礦)>。

資料採礦精靈會引導您透過下列步驟,來建立新採礦模型的結構:

  1. 選取資料來源類型,以此案例而言是指關聯式資料庫。

  2. 決定要單獨建立結構,還是要建立含有採礦模型的結構。

  3. 選取模型的演算法。

  4. 選取資料來源

  5. 選取案例資料表和任何巢狀資料表 (選擇性)。

  6. 選取每個資料行的類型:可預測、輸入或索引鍵。

  7. 指定資料行內容類型。

  8. 指定選擇性的鑑效組資料集。

  9. 針對結構啟用鑽研。命名並儲存新的採礦結構和相關聯的採礦模型。

**如需詳細資訊,請參閱:**<資料採礦演算法 (Analysis Services - 資料採礦)>、<採礦模型資料行>、<採礦結構資料行>、<資料類型 (資料採礦)>、<內容類型 (資料採礦)

建立 OLAP 採礦結構

OLAP Cube 經常包含很多成員和維度,導致難以得知開始進行資料採礦的位置。為了協助識別 Cube 所包含的模式,您通常會識別重要的單一維度,然後再開始探索與該維度相關的模式。下表會列出數個常見的 OLAP 資料採礦工作,描述您可套用每個工作的範例狀況,並識別用於每一個工作的資料採礦演算法。

工作

範例狀況

演算法

將成員組成群集

依據客戶成員屬性、客戶購買的產品和客戶花費的金額,來分割客戶維度。

Microsoft 群集演算法

尋找特別的或異常的成員

依據銷售量、收益、商店位置和商店大小,在商店維度中識別特別的或異常的商店。

Microsoft 決策樹演算法

尋找特別的或異常的資料格

識別一段時間後與典型趨勢相反的商店銷售。

Microsoft 時間序列演算法

資料採礦精靈會引導您完成下列程序,以便建立新採礦模型的結構:

  1. 選取資料來源類型,以此案例而言是指 Cube。

    [!附註]

    此 OLAP Cube 必須與採礦結構存在於相同的資料庫中。您無法使用 PowerPivot for Excel 增益集建立的 Cube 做為資料採礦的來源。

  2. 選取演算法。

  3. 選取來源 Cube 維度。

  4. 選取案例索引鍵。

  5. 選取案例資料行。

  6. 選取任何巢狀資料表。

  7. 選取每個資料行的使用方式:可預測、輸入或索引鍵。

  8. 指定資料行內容類型。

  9. 配量來源 Cube。

  10. 建立選擇性的測試資料集。

  11. 命名及儲存新的採礦結構和相關聯的採礦模型。

您可以在精靈的最後一頁設定下列選項:

  • 允許使用鑽研

  • 建立採礦模型維度

  • 使用採礦模型維度建立 Cube

如果您選擇要在來源 Cube 中建立新的採礦模型維度,您可以包括資料採礦演算法在 OLAP 資料來源中尋找的資訊。您可以透過建立採礦模型維度,以維度的形式瀏覽並查詢已儲存的模型內容。這個選項適用於使用 Microsoft 群集、Microsoft 決策樹和 Microsoft 關聯規則演算法所建立的模型。

如果您選取要建立新 Cube 的選項,則新的 Cube 會定義在包括採礦模型維度 (及選擇性地包含任何相關維度) 的資料庫上。這樣可以讓您根據採礦模型所找出的階層來配量事實資料。

**如需詳細資訊,請參閱:**<資料採礦演算法 (Analysis Services - 資料採礦)>、<採礦模型資料行>、<採礦結構資料行>、<資料類型 (資料採礦)>、<內容類型 (資料採礦)

啟用鑽研和鑑效組

當您建立採礦結構時,必須同時設定兩個重要的選項,以便使用資料:「鑑效組」(Holdout) 和「鑽研」(Drillthrough)。鑑效組可以讓您將採礦結構中的資料分割成培訓集和測試集,以便搭配與該結構相關聯的所有模型使用。如需詳細資訊,請參閱<將資料分割成培訓集和測試集 (Analysis Services - 資料採礦)>。

鑽研可讓您透過查詢採礦模型,檢視採礦結構中的來源資料。當您要檢視採礦模型的結果,而且想要查看基礎案例的其他詳細資料時,這項功能便很有用。例如,您可能會想要尋找連絡資訊、用來培訓特定群集的案例,以及其他資料。若要使用鑽研,您必須在建立採礦結構時啟用它,無法在建立之後啟用它。如需詳細資訊,請參閱<針對採礦模型和採礦結構使用鑽研 (Analysis Services - 資料採礦)>。