スクリプトコンポーネントを使用した標準以外のテキストファイル形式の解析

[アーティクル]
05/07/2013

ソースデータが標準以外の形式の場合、複数の Integration Services 変換を連結するより、すべての解析ロジックを単一のスクリプトに統合する方がより便利で、同じ結果が得られる場合があります。

例 1 : 行区切りのレコードの解析

例 2 : 親レコードと子レコードの分割

注
複数のデータフロータスクおよび複数のパッケージでより簡単に再利用できるコンポーネントを作成する場合は、このスクリプトコンポーネントサンプルのコードを基にした、カスタムデータフローコンポーネントの作成を検討してください。詳細については、「カスタムデータフローコンポーネントの開発」を参照してください。

複数のデータフロータスクおよび複数のパッケージでより簡単に再利用できるコンポーネントを作成する場合は、このスクリプトコンポーネントサンプルのコードを基にした、カスタムデータフローコンポーネントの作成を検討してください。詳細については、「カスタムデータフローコンポーネントの開発」を参照してください。

例 1 : 行区切りのレコードの解析

この例では、データの各列が個別の行に表示されるテキストファイルを取得し、スクリプトコンポーネントを使用して解析し、変換先テーブルに入れる方法を示します。

スクリプトコンポーネントをデータフローで変換として使用するための構成方法の詳細については、「スクリプトコンポーネントによる同期変換の作成」および「スクリプトコンポーネントによる非同期変換の作成」を参照してください。

このスクリプトコンポーネントの例を構成するには

次のソースデータを含む、rowdelimiteddata.txt という名前のテキストファイルを作成して保存します。

FirstName: Nancy
LastName: Davolio
Title: Sales Representative
City: Seattle
StateProvince: WA

FirstName: Andrew
LastName: Fuller
Title: Vice President, Sales
City: Tacoma
StateProvince: WA

FirstName: Steven
LastName: Buchanan
Title: Sales Manager
City: London
StateProvince:

Management Studio を開き、SQL Server のインスタンスに接続します。
変換先データベースを選択し、新しいクエリウィンドウを開きます。クエリウィンドウで、次のスクリプトを実行して変換先テーブルを作成します。
```
create table RowDelimitedData
(
FirstName varchar(32),
LastName varchar(32),
Title varchar(32),
City varchar(32),
StateProvince varchar(32)
)
```
SQL Server Data Tools を開き、ParseRowDelim.dtsx という名前の新しい Integration Services パッケージを作成します。
フラットファイル接続マネージャーをパッケージに追加し、RowDelimitedData という名前を付け、前の手順で作成した rowdelimiteddata.txt ファイルに接続するように構成します。
OLE DB 接続マネージャーをパッケージに追加し、SQL Server のインスタンスと、変換先テーブルを作成したデータベースに接続するように構成します。
データフロータスクをパッケージに追加し、SSIS デザイナーの [データフロー] タブをクリックします。
フラットファイルソースをデータフローに追加し、RowDelimitedData 接続マネージャーを使用するように構成します。 [フラットファイルソースエディター] の [列] ページで、単一の使用可能な外部列を選択します。
スクリプトコンポーネントをデータフローに追加し、変換として構成します。フラットファイルソースの出力をスクリプトコンポーネントに接続します。
スクリプトコンポーネントをダブルクリックし、[スクリプト変換エディター] を表示します。
[スクリプト変換エディター] の [入力列] ページで、単一の使用可能な入力列を選択します。
[スクリプト変換エディター] の [入力および出力] ページで、出力 0 を選択し、SynchronousInputID を None に設定します。次の 5 つの出力列を、すべて文字列型 [DT_STR]、長さ 32 で作成します。
- FirstName
- LastName
- Title
- City
- StateProvince
[スクリプト変換エディター] の [スクリプト] ページで、[スクリプトの編集] をクリックし、例の ScriptMain クラスに示すコードを入力します。スクリプト開発環境と [スクリプト変換エディター] を閉じます。
SQL Server 変換先をデータフローに追加します。 OLE DB 接続マネージャーと RowDelimitedData テーブルを使用するように構成します。スクリプトコンポーネントの出力をこの変換先に接続します。
パッケージを実行します。パッケージが完成したら、SQL Server 変換先テーブル内のレコードを確認します。

    Public Overrides Sub Input0_ProcessInputRow(ByVal Row As Input0Buffer)

        Dim columnName As String
        Dim columnValue As String

        ' Check for an empty row.
        If Row.Column0.Trim.Length > 0 Then
            columnName = Row.Column0.Substring(0, Row.Column0.IndexOf(":"))
            ' Check for an empty value after the colon.
            If Row.Column0.Substring(Row.Column0.IndexOf(":")).TrimEnd.Length > 1 Then
                ' Extract the column value from after the colon and space.
                columnValue = Row.Column0.Substring(Row.Column0.IndexOf(":") + 2)
                Select Case columnName
                    Case "FirstName"
                        ' The FirstName value indicates a new record.
                        Me.Output0Buffer.AddRow()
                        Me.Output0Buffer.FirstName = columnValue
                    Case "LastName"
                        Me.Output0Buffer.LastName = columnValue
                    Case "Title"
                        Me.Output0Buffer.Title = columnValue
                    Case "City"
                        Me.Output0Buffer.City = columnValue
                    Case "StateProvince"
                        Me.Output0Buffer.StateProvince = columnValue
                End Select
            End If
        End If

    End Sub

public override void Input0_ProcessInputRow(Input0Buffer Row)
    {

        string columnName;
        string columnValue;

        // Check for an empty row.
        if (Row.Column0.Trim().Length > 0)
        {
            columnName = Row.Column0.Substring(0, Row.Column0.IndexOf(":"));
            // Check for an empty value after the colon.
            if (Row.Column0.Substring(Row.Column0.IndexOf(":")).TrimEnd().Length > 1)
            // Extract the column value from after the colon and space.
            {
                columnValue = Row.Column0.Substring(Row.Column0.IndexOf(":") + 2);
                switch (columnName)
                {
                    case "FirstName":
                        // The FirstName value indicates a new record.
                        this.Output0Buffer.AddRow();
                        this.Output0Buffer.FirstName = columnValue;
                        break;
                    case "LastName":
                        this.Output0Buffer.LastName = columnValue;
                        break;
                    case "Title":
                        this.Output0Buffer.Title = columnValue;
                        break;
                    case "City":
                        this.Output0Buffer.City = columnValue;
                        break;
                    case "StateProvince":
                        this.Output0Buffer.StateProvince = columnValue;
                        break;
                }
            }
        }

    }

例 2 : 親レコードと子レコードの分割

この例では、親レコードの前に区切り行があり、親レコードの後に行数不定の子レコード行が続くテキストファイルを取得し、スクリプトコンポーネントを使用して解析し、適切に正規化された親変換先テーブルと子変換先テーブルに入れる方法を示します。この簡単な例は、なんらかの方法で各レコードの先頭と末尾を識別できれば、各親レコードおよび子レコードで複数の行または列を使用するソースファイルに容易に適用できます。

注意
このサンプルは、デモンストレーションのみを目的としています。サンプルを複数回実行すると、重複したキーの値が変換先テーブルに挿入されます。

このスクリプトコンポーネントの例を構成するには

次のソースデータを含む、parentchilddata.txt という名前のテキストファイルを作成して保存します。

******** PARENT 1 DATA child 1 data child 2 data child 3 data child 4 data ******** PARENT 2 DATA child 5 data child 6 data child 7 data child 8 data ********

SQL Server Management Studio を開き、SQL Server のインスタンスに接続します。

変換先データベースを選択し、新しいクエリウィンドウを開きます。クエリウィンドウで、次のスクリプトを実行して変換先テーブルを作成します。

CREATE TABLE [dbo].[Parents](
[ParentID] [int] NOT NULL,
[ParentRecord] [varchar](32) NOT NULL,
 CONSTRAINT [PK_Parents] PRIMARY KEY CLUSTERED 
([ParentID] ASC)
)
GO
CREATE TABLE [dbo].[Children](
[ChildID] [int] NOT NULL,
[ParentID] [int] NOT NULL,
[ChildRecord] [varchar](32) NOT NULL,
 CONSTRAINT [PK_Children] PRIMARY KEY CLUSTERED 
([ChildID] ASC)
)
GO
ALTER TABLE [dbo].[Children] ADD CONSTRAINT [FK_Children_Parents] FOREIGN KEY([ParentID])
REFERENCES [dbo].[Parents] ([ParentID])

SQL Server データツール (SSDT) を開き、SplitParentChild.dtsx という名前の新しい Integration Services パッケージを作成します。
フラットファイル接続マネージャーをパッケージに追加し、ParentChildData という名前を付け、前の手順で作成した parentchilddata.txt ファイルに接続するように構成します。
OLE DB 接続マネージャーをパッケージに追加し、SQL Server のインスタンスと、変換先テーブルを作成したデータベースに接続するように構成します。
データフロータスクをパッケージに追加し、SSIS デザイナーの [データフロー] タブをクリックします。
フラットファイルソースをデータフローに追加し、ParentChildData 接続マネージャーを使用するように構成します。 [フラットファイルソースエディター] の [列] ページで、単一の使用可能な外部列を選択します。
スクリプトコンポーネントをデータフローに追加し、変換として構成します。フラットファイルソースの出力をスクリプトコンポーネントに接続します。
スクリプトコンポーネントをダブルクリックし、[スクリプト変換エディター] を表示します。
[スクリプト変換エディター] の [入力列] ページで、単一の使用可能な入力列を選択します。
[スクリプト変換エディター] の [入力および出力] ページで、出力 0 を選択し、ParentRecords に名前を変更してから、SynchronousInputID を None に設定します。次の 2 つの出力列を作成します。
- ParentID (主キー)、4 バイト符号付き整数型 [DT_I4]
- ParentRecord、文字列型 [DT_STR]、長さ 32
2 つ目の出力を作成し、ChildRecords という名前を付けます。新しい出力の SynchronousInputID は既に None に設定されています。次の 3 つの出力列を作成します。
- ChildID (主キー)、4 バイト符号付き整数型 [DT_I4]
- ParentID (外部キー)、4 バイト符号付き整数型 [DT_I4]
- ChildRecord、文字列型 [DT_STR]、長さ 50
[スクリプト変換エディター] の [スクリプト] ページで、[スクリプトの編集] をクリックします。 ScriptMain クラスに、例に示すコードを入力します。スクリプト開発環境と [スクリプト変換エディター] を閉じます。
SQL Server 変換先をデータフローに追加します。スクリプトコンポーネントの ParentRecords 出力をこの変換先に接続します。OLE DB 接続マネージャーと Parents テーブルを使用するように構成します。
別の SQL Server 変換先をデータフローに追加します。スクリプトコンポーネントの ChildRecords 出力をこの変換先に接続します。 OLE DB 接続マネージャーと Children テーブルを使用するように構成します。
パッケージを実行します。パッケージが完成したら、2 つの SQL Server 変換先テーブル内の親レコードと子レコードを確認します。

    Public Overrides Sub Input0_ProcessInputRow(ByVal Row As Input0Buffer)

        Static nextRowIsParent As Boolean = False
        Static parentCounter As Integer = 0
        Static childCounter As Integer = 0

        ' If current row starts with separator characters,
        '  then following row contains new parent record.
        If Row.Column0.StartsWith("***") Then
            nextRowIsParent = True
        Else
            If nextRowIsParent Then
                ' Current row contains parent record.
                parentCounter += 1
                Me.ParentRecordsBuffer.AddRow()
                Me.ParentRecordsBuffer.ParentID = parentCounter
                Me.ParentRecordsBuffer.ParentRecord = Row.Column0
                nextRowIsParent = False
            Else
                ' Current row contains child record.
                childCounter += 1
                Me.ChildRecordsBuffer.AddRow()
                Me.ChildRecordsBuffer.ChildID = childCounter
                Me.ChildRecordsBuffer.ParentID = parentCounter
                Me.ChildRecordsBuffer.ChildRecord = Row.Column0
            End If
        End If

    End Sub

public override void Input0_ProcessInputRow(Input0Buffer Row)
    {

    int static_Input0_ProcessInputRow_childCounter = 0;
    int static_Input0_ProcessInputRow_parentCounter = 0;
    bool static_Input0_ProcessInputRow_nextRowIsParent = false;

        // If current row starts with separator characters, 
        // then following row contains new parent record. 
        if (Row.Column0.StartsWith("***"))
        {
            static_Input0_ProcessInputRow_nextRowIsParent = true;
        }
        else
        {
            if (static_Input0_ProcessInputRow_nextRowIsParent)
            {
                // Current row contains parent record. 
                static_Input0_ProcessInputRow_parentCounter += 1;
                this.ParentRecordsBuffer.AddRow();
                this.ParentRecordsBuffer.ParentID = static_Input0_ProcessInputRow_parentCounter;
                this.ParentRecordsBuffer.ParentRecord = Row.Column0;
                static_Input0_ProcessInputRow_nextRowIsParent = false;
            }
            else
            {
                // Current row contains child record. 
                static_Input0_ProcessInputRow_childCounter += 1;
                this.ChildRecordsBuffer.AddRow();
                this.ChildRecordsBuffer.ChildID = static_Input0_ProcessInputRow_childCounter;
                this.ChildRecordsBuffer.ParentID = static_Input0_ProcessInputRow_parentCounter;
                this.ChildRecordsBuffer.ChildRecord = Row.Column0;
            }
        }

    }

最新の Integration Services の入手

マイクロソフトが提供する最新のダウンロード、アーティクル、サンプル、ビデオ、およびコミュニティで選択されたソリューションについては、MSDN の Integration Services のページを参照してください。

MSDN の Integration Services のページを参照する

これらの更新が自動で通知されるようにするには、ページの RSS フィードを定期受信します。

Share via

スクリプトコンポーネントを使用した標準以外のテキストファイル形式の解析

例 1 : 行区切りのレコードの解析

このスクリプトコンポーネントの例を構成するには

例 2 : 親レコードと子レコードの分割

このスクリプトコンポーネントの例を構成するには

関連項目

概念

その他のリソース

Share via

スクリプト コンポーネントを使用した標準以外のテキスト ファイル形式の解析

例 1 : 行区切りのレコードの解析

このスクリプト コンポーネントの例を構成するには

例 2 : 親レコードと子レコードの分割

このスクリプト コンポーネントの例を構成するには

関連項目

概念

その他のリソース

スクリプトコンポーネントを使用した標準以外のテキストファイル形式の解析

このスクリプトコンポーネントの例を構成するには

このスクリプトコンポーネントの例を構成するには