Share via


比率サンプリング変換

更新 : 2005 年 12 月 5 日

比率サンプリング変換は、変換入力行の比率を選択することにより、サンプル データセットを作成します。サンプル データセットとは、変換入力からランダムに行を選択し、その結果、入力のサンプルとなるデータセットのことです。

比率サンプリング変換は、特にデータ マイニングに役立ちます。この変換を使用すると、データセットをランダムに 2 つのデータセットに分割できます。たとえば、1 つをデータ マイニング モデルの学習用に、もう 1 つはそのモデルのテスト用に分割します。

また、比率サンプリング変換は、パッケージ開発用のサンプル データセットを作成するうえで役立ちます。比率サンプリング変換をデータ フローに適用すると、データの特性を保持したまま、データセットのサイズを一様に縮小できます。したがって、テスト パッケージは、サイズは小さいが代表的なデータセットを使用するため、実行速度は速くなります。

サンプリング シードを指定して、変換が行の選択に使用する乱数ジェネレータの動作を変更できます。同じサンプリング シードが使用される場合、この変換は、常に同じサンプル出力を作成します。シードを指定しない場合、この変換はオペレーティング システムのタイマを使用して乱数を作成します。したがって、パッケージの開発やテスト中に変換結果を確認する際は標準シードを使用するように選択し、パッケージの稼働時にはランダム シードを使用するように変更します。

この変換は、行サンプリング変換と同様です。ただし、行サンプリング変換は、指定する入力行数を選択してサンプル データセットを作成します。詳細については、「行サンプリング変換」を参照してください。

比率サンプリング変換には、SamplingValue カスタム プロパティがあります。このプロパティは、パッケージの読み込み時にプロパティ式で更新できます。詳細については、「Integration Services の式のリファレンス」、「パッケージでのプロパティ式の使用」、および「変換のカスタム プロパティ」を参照してください。

この変換は、1 つの入力と 2 つの出力をとります。エラー出力はサポートされていません。

ms139864.note(ja-jp,SQL.90).gifメモ :
比率サンプリング変換は、指定した比率に加え、サンプル出力に行を含めるかどうかを決定するアルゴリズムを使用します。したがって、サンプル出力の行数は、指定した比率を正確に反映しない場合があります。たとえば、25,000 行の入力データセットに対して 10% を指定した場合、2,500 行のサンプルが生成されず、サンプルの行がこの数を多少前後することがあります。

比率サンプリング変換の構成

プロパティを設定するには SSIS デザイナから行うか、またはプログラムによって設定します。

[比率サンプリング変換エディタ] ダイアログ ボックスで設定できるプロパティの詳細については、「[比率サンプリング変換エディタ]」を参照してください。

[詳細エディタ] ダイアログ ボックスには、プログラムによって設定できるプロパティが反映されます。[詳細エディタ] ダイアログ ボックスまたはプログラムで設定できるプロパティの詳細については、次のトピックのいずれかを参照してください。

プロパティの設定方法の詳細については、次のトピックのいずれかを参照してください。

参照

概念

パッケージのデータ フローの作成
Integration Services の変換

ヘルプおよび情報

SQL Server 2005 の参考資料の入手

変更履歴

リリース 履歴

2005 年 12 月 5 日

新しい内容 :
  • SamplingValue カスタム プロパティについて、プロパティ式の使用に関する情報を追加しました。