Share via


處理結構和模型 (Analysis Services - 資料採礦)

資料採礦物件在處理之前只是一個空容器。「處理」(Processing) 資料採礦模型也稱為「定型」(Training)。

處理採礦結構:採礦結構會從外部資料來源取得資料 (依資料行繫結和使用方式中繼資料的定義),並讀取資料。系統會完整地讀取這項資料,再加以分析以擷取各種統計資料。Analysis Services 會在本機快取中儲存資料的壓縮表示 (適合以資料採礦演算法進行分析)。您可在模型經過處理後保存此快取或加以刪除。依預設會儲存此快取。如需詳細資訊,請參閱<如何:處理採礦結構>。

處理採礦模型:採礦模型在處理之前是空的,只包含定義。若要處理採礦模型,則該模型所依據的採礦結構必須已經過處理。採礦模型在從採礦結構快取取得資料之後,會套用已在模型上建立的任何篩選,然後再透過演算法傳遞資料集來偵測模式。採礦模型在經過處理之後,只會儲存處理的結果,而非資料本身。如需詳細資訊,請參閱<如何:處理採礦模型>。

下列圖表說明在處理採礦結構和資料模型時的資料流程。

資料處理:來源到結構到模型

在處理期間查詢關聯式存放區

處理可分成三個階段:查詢來源資料、判斷原始統計資料,以及使用模型定義和演算法來定型採礦模型。

Analysis Services 伺服器會發出查詢給提供原始資料的資料庫。這個資料庫可能是 SQL Server 2008 或舊版 SQL Server 資料庫引擎的執行個體。當您處理資料採礦結構時,來源中的資料會傳送到採礦結構,並以新的壓縮格式保存在磁碟上。系統並不會處理資料來源中的每個資料行,而只會處理包含在採礦結構中的資料行 (依繫結而定義)。

Analysis Services 會使用這項資料來建置所有資料和離散化資料行的索引,而且會建立連續資料行的個別索引。系統會針對每個巢狀資料表發出一個查詢,以便建立索引,而且會針對每個巢狀資料表產生額外的查詢,以便處理每對巢狀資料表與案例資料表之間的關聯性。建立多個查詢的原因是要處理特殊的內部線上分析處理 (OLAP) Cube。您可以透過設定伺服器屬性 DatabaseConnectionPoolMax,限制 Analysis Services 傳送至關聯式存放區的查詢數目。如需詳細資訊,請參閱<OLAP 屬性>。

當您處理模型時,模型並不會從資料來源重新讀取資料,而是從採礦結構取得資料摘要。使用所建立的 Cube,連同快取索引及快取的案例資料之後,伺服器就會建立獨立的執行緒來定型模型。

在 SQL Server Enterprise 中,所有處理都會以平行方式進行。在 SQL Server Standard 中,處理會進行序列化。

檢視處理的結果

採礦結構經過處理之後會包含資料的壓縮表示,以供統計資料分析使用。如果尚未清除快取,可以用下列方式存取此快取的資料:

採礦模型經過處理之後只會包含衍生自分析的模式,以及模型結果與快取之定型資料的對應。您可以瀏覽或查詢模型結果 (稱為「模型內容」),或者也可以查詢模型和結構案例 (若已存入快取)。

每個採礦模型的模型內容都是根據建立時所使用的演算法而定。例如,如果某個模式是叢集模型,而另一個模型是決策樹模型,則即使模型使用的資料完全相同,模型的內容也會非常不同。如需詳細資訊,請參閱<採礦模型內容 (Analysis Services - 資料採礦)>。