第 1 課:建立專案和基本封裝
在這一課,您將建立一個從單個一般檔案來源擷取資料的簡易 ETL 封裝,使用兩個查閱轉換元件來轉換資料、將該資料寫入至 AdventureWorksDW2012 中的 FactCurrency 事實資料表。 在這一課,您會學到如何建立新封裝,加入和設定資料來源和目的地連接,以及使用新控制流程和資料流程元件。
重要事項 |
---|
這個教學課程需要 AdventureWorksDW2012 範例資料庫。 如需有關安裝和部署 AdventureWorksDW2012 的詳細資訊,請參閱<SQL Server 範例及範例資料庫使用者入門>。 |
了解封裝需求
這個教學課程需要 Microsoft SQL Server Data Tools。
如需有關安裝 SQL Server Data Tools 的詳細資訊,請參閱<SQL Server Data Tools 下載>。
在建立封裝之前,您需要了解來源資料和目的地使用的格式。 了解這些資料格式之後,您就可以定義必要的轉換,將來源資料對應至目的地。
查看來源
在這個教學課程中,來源資料是一般檔案 SampleCurrencyData.txt 中所含的貨幣記錄資料集。 來源資料具有下列四個資料行:貨幣的平均匯率、貨幣索引鍵、日期索引鍵和收盤匯率。
以下是包含在 SampleCurrencyData.txt 檔案中的來源資料範例:
1.00070049USD9/3/05 0:001.001201442
1.00020004USD9/4/05 0:001
1.00020004USD9/5/05 0:001.001201442
1.00020004USD9/6/05 0:001
1.00020004USD9/7/05 0:001.00070049
1.00070049USD9/8/05 0:000.99980004
1.00070049USD9/9/05 0:001.001502253
1.00070049USD9/10/05 0:000.99990001
1.00020004USD9/11/05 0:001.001101211
1.00020004USD9/12/05 0:000.99970009
使用一般檔案來源資料時,一定要了解一般檔案連接管理員如何解譯一般檔案資料。 如果一般檔案來源是 Unicode,一般檔案連接管理員會將所有資料行定義為 [DT_WSTR],預設資料行寬度為 50。 如果一般檔案來源是以 ANSI 編碼,資料行會定義為 [DT_STR],且資料行寬度為 50。 您或許必須變更這些預設值,好讓字串資料行類型更適合您的資料。 若要這麼做,您必須查看要在其中寫入資料的目的地之資料類型,然後在一般檔案連接管理員內選擇正確類型。
查看目的地
來源資料的最終目的地是 AdventureWorksDW 中的 FactCurrency 事實資料表。 FactCurrency 事實資料表有 4 個資料行,而且與兩個維度資料表之間有關聯性,如下表所示。
資料行名稱 |
資料類型 |
查閱資料表 |
查閱資料行 |
---|---|---|---|
AverageRate |
float |
無 |
無 |
CurrencyKey |
int (FK) |
DimCurrency |
CurrencyKey (PK) |
DateKey |
Int (FK) |
DimDate |
DateKey (PK) |
EndOfDayRate |
float |
無 |
無 |
對應來源資料以便與目的地相容
來源和目的地資料格式的分析指出 CurrencyKey 和 DateKey 值可能需要查閱。 要執行這些查閱的轉換將使用 DimCurrency 和 DimDate 維度資料表的替代索引鍵來取得 CurrencyKey 和 DateKey 值。
一般檔案資料行 |
資料表名稱 |
資料行名稱 |
資料類型 |
---|---|---|---|
0 |
FactCurrency |
AverageRate |
float |
1 |
DimCurrency |
CurrencyAlternateKey |
nchar (3) |
2 |
DimDate |
FullDateAlternateKey |
date |
3 |
FactCurrency |
EndOfDayRate |
float |
課程工作
這一課包含下列工作: