[アーティクル]
10/25/2012

一括インポートのバッチの管理

ここでは、一括インポート操作に対するバッチサイズの決定方法の管理について説明します。既定では、データファイル内のすべての行は、単一のトランザクションでサイズの不明な単一のバッチとしてインポートされます。この場合、インポート操作が完了前に失敗すると、トランザクション全体がロールバックされ、インポート先のテーブルにはデータは追加されません。失敗した操作は、その後、データファイルの最初から再開する必要があります。

大きなデータファイルを単一のバッチとしてインポートすると、問題が発生する場合があります。したがって、bcp と BULK INSERT では、それぞれがデータファイルより小さい一連のバッチとして、データをインポートすることができます。各バッチは個別のトランザクションでインポートおよびログ記録されます。また、あるトランザクションがコミットされた後で、そのトランザクションによってインポートされた行がコミットされます。操作が失敗した場合は、現在のバッチからインポートされた行だけがロールバックされるので、データファイルの最初からではなく、失敗したバッチの最初からデータのインポートを再開できます。

注
バッチのしくみに関する詳細については、「バッチ」を参照してください。

また、バッチのサイズを制限しない選択をする場合でも、コマンドでデータファイルのサイズを推定することによって、パフォーマンスを向上できます。推定サイズは、操作のクエリプランを作成するときに、クエリプロセッサで使用されます。

注
バッチサイズまたはデータファイルのサイズを指定する際、正確さはそれほど重要ではありません。

次の表に、これらの方法をサポートする修飾子の概要を示します。

コマンド	バッチサイズ	バッチあたりに送信される行数	バッチあたりに送信されるサイズ (KB 単位)
bcp1	-bbatch_size	-h "ROWS_PER_BATCH = bb"	-h "KILOBYTES_PER_BATCH = cc"
BULK INSERT2	BATCHSIZE = batch_size	ROWS_PER_BATCH = rows_per_batch	KILOBYTES_PER_BATCH = kilobytes_per_batch 注このオプションを BATCHSIZE と一緒に使用すると、エラーが発生します。
INSERT ...SELECT * FROM OPENROWSET (BULK...)	—3	ROWS_PER_BATCH = rows_per_batch	—3

1bcp コマンドでは、-bbatch_size スイッチを ROWS_PER_BATCH ヒントまたは KILOBYTES_PER_BATCH ヒントと一緒に使用しないでください。これらを組み合わせて使用すると、エラーが発生します。

2 BULK INSERT コマンドでは、BATCHSIZE を ROWS_PER_BATCH または KILOBYTES_PER_BATCH と一緒に使用した場合、BATCHSIZE が優先されます。

3 OPENROWSET では、BATCHSIZE オプションも KILOBYTES_PER_BATCH オプションも使用できません。

次のセクションでは、これらの修飾子の使用方法について説明します。

推定バッチサイズの指定

膨大な数の行をインポートする場合、データをバッチに分割すると、有益な場合あります。1 つのバッチが完了するたびに、そのトランザクションがログに記録されます。何かの理由により一括コピー操作が完了前に終了した場合には、現在のトランザクション (バッチ) だけがロールバックされます。

注
一括ログ記録により、トランザクションログには、インポートされたデータのコピーが記録されます。そのため、ログのサイズがすぐに大きくなりますが、1 つのバッチが終了するたびに、ログをバックアップして、ログ領域を再利用することができます。

バッチのだいたいのサイズを指定して、データファイルを一連のバッチでインポートするには、次の修飾子を使用します。

bcp の場合 : -b
BULK INSERT の場合 : BATCHSIZE

各バッチのデータ行は、個別のトランザクションとして挿入されます。何かの理由により一括インポート操作が完了前に終了した場合には、現在のトランザクションだけがロールバックされます。たとえば、データファイルが 1,000 行から構成され、バッチサイズを 100 行の場合、この操作は Microsoft SQL Server により 10 個の個別のトランザクションとしてログに記録され、各トランザクションではインポート先のテーブルに 100 行が挿入されます。一括インポート操作が 750 行目をインポート中に終了した場合、SQL Server では現在のトランザクションがロールバックされるので、それ以前の 49 行だけが削除されます。最初の 700 行は、インポート先のテーブルに残ります。

SQL Server では、バッチサイズの値に合わせて自動的に読み込み処理が最適化されるため、パフォーマンスが向上することがあります。一般には、バッチサイズは、実用的な範囲で、できるだけ大きくする必要があります。通常、バッチサイズが大きいほど、一括インポート操作のパフォーマンスが向上します。ただし、いくつかの例外があります。インポート先のテーブルに 1 つ以上のインデックスが存在する場合は、並べ替え操作が実行されるため、バッチサイズを大きくするとメモリに負荷がかかる場合があります。また、TABLOCK オプションを使用せずに並列読み込みを実行している間は、バッチサイズが大きいほど、発生するブロックが多くなることがあります。

注
バッチサイズは、SQL Server のインスタンスからデータファイルにデータを一括エクスポートする場合には使用できません。

データファイルの推定サイズの指定

一括インポート操作でバッチサイズを指定しない場合、データファイルの推定サイズを指定し、クエリプロセッサのクエリプランでリソースを有効に割り当てることができます。データファイルの推定サイズを指定するには、次の方法を使用して、行数か、データのサイズ (KB 単位) のいずれかを推定します。

バッチあたりの行数の推定

行数を推定するには、ROWS_PER_BATCH ヒントまたは ROWS_PER_BATCH オプションを使用します。0 より大きな値を指定すると、クエリプロセッサでは ROWS_PER_BATCH の値がクエリプランでリソースを割り当てるためのヒントとして使用されます。この値は、実際の行数と同じ次数になる必要があります。

データファイルのすべての行は、1 バッチで SQL Server のインスタンスにコピーされますが、bcp からは、1,000 行コピーされるごとに、"SQL Server に 1,000 行が送信されました。" というメッセージが表示されます。このメッセージは、情報提供を目的としており、バッチサイズに関係なく表示されます。
バッチあたりのサイズ (KB 単位) の推定

データファイルのサイズ (KB 単位) を推定するには、KILOBYTES_PER_BATCH ヒントまたは KILOBYTES_PER_BATCH オプションを使用します。SQL Server では、指定した値に従って一括インポート操作が最適化されます。

注
サイズの大きなデータファイルを、バッチサイズまたは最小ログ記録の最適化オプションを指定せずに一括インポートした場合、一括インポート操作が完了する前に、トランザクションログがいっぱいになることがあります。このような状況を防ぐには、トランザクションログのサイズを大きくするか、自動的に拡張するように設定します。

サイズの大きなデータファイルを、バッチサイズまたは最小ログ記録の最適化オプションを指定せずに一括インポートした場合、一括インポート操作が完了する前に、トランザクションログがいっぱいになることがあります。このような状況を防ぐには、トランザクションログのサイズを大きくするか、自動的に拡張するように設定します。

一括インポートのバッチの管理

推定バッチサイズの指定

データファイルの推定サイズの指定

関連項目

参照

概念

その他のリソース

一括インポートのバッチの管理

推定バッチ サイズの指定

データ ファイルの推定サイズの指定

関連項目

参照

概念

その他のリソース

推定バッチサイズの指定

データファイルの推定サイズの指定