単一 SQL ステートメントの処理

[アーティクル]
12/16/2008

単一の SQL ステートメントの処理は、SQL Server 2005 で SQL ステートメントを実行する最も基本的な方法です。ローカルのベーステーブルだけを参照する (ビューやリモートテーブルは参照しない) 単一の SELECT ステートメントを処理する手順は、基本的な処理の例です。

SELECT ステートメントの最適化

SELECT ステートメントは非手続き型であり、要求したデータを取得するときにデータベースサーバーで使用する手順が細かく指定されません。つまり、データベースサーバーが SELECT ステートメントを分析して、要求したデータを抽出する最も効率的な方法を決定する必要があります。これを、SELECT ステートメントの最適化と呼びます。また、最適化を行うコンポーネントをクエリオプティマイザと呼びます。オプティマイザへの入力は、クエリ、データベーススキーマ (テーブル定義やインデックスの定義)、およびデータベース統計で構成されます。クエリオプティマイザの出力が、クエリ実行プランです。これは、クエリプランや単にプランと呼ばれることもあります。クエリプランの内容については、このトピックの後半で説明します。

単一 SELECT ステートメントの最適化中のクエリオプティマイザの入出力は、次の図のようになります。

SELECT ステートメントの最適化

SELECT ステートメントは次の事項だけを定義します。

結果セットの形式。ほとんどの場合、選択リスト内で指定します。ただし、ORDER BY、GROUP BY などの句も結果セットの最終形式に影響します。
取得するデータが含まれているテーブル。FROM 句で指定します。
SELECT ステートメントを実行するためにテーブルを論理的に関連付ける方法。FROM の後に指定する WHERE 句や ON 句などで指定する結合により定義します。
基になるテーブルの行が SELECT ステートメントの対象になるために満たす必要がある条件。WHERE 句と HAVING 句で指定します。

クエリ実行プランは、次の事項を定義しています。

基になるテーブルにアクセスする順序
通常、データベースサーバーからベーステーブルにアクセスして結果セットを構築する順序は何とおりもあります。たとえば、SELECT ステートメントが 3 つのテーブルを参照している場合、データベースサーバーは最初に TableA にアクセスし、TableA のデータを使用して TableB から一致する行を抽出します。次に、TableB のデータを使用して TableC のデータを抽出することができます。データベースがテーブルにアクセスする際に可能な順序には、次の組み合わせがあります。
TableC、TableB、TableA
TableB、TableA、TableC
TableB、TableC、TableA
TableC、TableA、TableB
各テーブルからデータを取り出す方法
通常、各テーブルのデータにアクセスする方法にも何とおりかあります。特定のキー値を持つ数行だけが必要な場合、データベースサーバーではインデックスを使用できます。テーブル内のすべての行が必要な場合は、インデックスを無視してテーブルスキャンを実行できます。テーブル内のすべての行が必要で、ORDER BY で指定されたキー列のインデックスがある場合、テーブルスキャンではなくインデックススキャンを行うと、結果セットの並べ替えを個別に行いません。テーブルが非常に小さい場合は、テーブルにどのようにアクセスするときでもテーブルスキャンが最も効率的な方法です。

可能性のある多数のプラン候補の中から実行プランを 1 つ選択する処理を最適化と呼びます。クエリオプティマイザは、SQL データベースシステムで最も重要なコンポーネントの 1 つです。クエリオプティマイザはクエリの分析やプランの選択を行うため、オーバーヘッドが発生します。ただし、クエリオプティマイザが効率的な実行プランを選択すれば、このオーバーヘッドの数倍の負荷を削減することができます。たとえば、2 つの建築会社が一軒の住宅に同じ青写真を提供する場合について考えてみます。一方の会社は数日かけて建築プランを立て、他方の会社はプランを立てずに建築を開始するとします。ほとんどの場合、プロジェクトのプランに時間をかけた会社の方が先に完成します。

SQL Server クエリオプティマイザは、コストベースのオプティマイザです。実行プラン候補ごとに、計算に使用するリソースの量の観点から関連するコストが異なります。クエリオプティマイザでは、候補のプランを分析し、算出コストが最も低いプランを選択する必要があります。複雑な SELECT ステートメントの場合、何千もの実行プラン候補があります。このような場合、クエリオプティマイザはすべての組み合わせを分析するわけではありません。複雑なアルゴリズムを使用して、理論上の最低コストに最も近い実行プランを迅速に見つけ出します。

SQL Server クエリオプティマイザは、リソースコストが最も低い実行プランに限定して選択するわけではありません。妥当なリソースコストで、最も迅速に結果を返すプランを選択します。たとえば、クエリを並列に処理すれば、直列に処理するよりもリソースを多く使用します。ただし、クエリの完了時間は短縮されます。この場合、サーバー側の負荷に悪影響がない限り、並列実行プランを使用して、結果が返されます。

クエリオプティマイザは、テーブルやインデックスから情報を取り出す複数の方法のリソースコストを算出する場合、分布統計に大きく依存します。分布統計は、列やインデックスごとに保存されています。この統計情報は、特定のインデックスや列の値の選択度を表しています。たとえば、車を表すテーブルの場合、同メーカーの車がいくつもあります。ただし、VIN (車両番号) はそれぞれの車両固有のものです。VIN のインデックスの方が、メーカーのインデックスよりも選択度が高いと言えます。インデックス統計が最新でない場合、クエリオプティマイザはテーブルの現在の状態に対して最適な選択ができないことがあります。インデックス統計を最新の状態に保持する方法の詳細については、「インデックス統計」を参照してください。

クエリオプティマイザを使用すると、プログラマやデータベース管理者が入力しなくても、データベース内の状態の変化に合わせてデータベースサーバーを動的に調整できるので、クエリオプティマイザは不可欠です。これにより、プログラマはクエリの最終結果の記述だけに重点を置くことができます。クエリオプティマイザは、ステートメントを実行するたびに、データベースの状態に合わせて効率的な実行プランを構築します。

SELECT ステートメントの処理

SQL Server が単一の SELECT ステートメントを処理する基本的な手順は次のとおりです。

パーサーが SELECT ステートメントをスキャンし、キーワード、式、演算子、識別子などの論理単位に分解します。
基になるデータを結果セットで必要な形式に変換する論理手順を記述するクエリツリーが構築されます。クエリツリーはシーケンスツリーとも呼ばれます。
クエリオプティマイザでは、基になるテーブルにアクセスできるさまざまな方法が分析されます。その中から、使用するリソースが最も少なく、最も短時間で結果を返す一連の手順が選択されます。クエリツリーが更新され、この一連の手順が正確に記録されます。この最終的に得られた最適化済みのクエリツリーを実行プランと呼びます。
リレーショナルエンジンによって、実行プランの実行が開始されます。リレーショナルエンジンは、ベーステーブルからのデータを必要とする手順を処理するときに、要求した行セットのデータを渡すようにストレージエンジンに要求します。
リレーショナルエンジンでは、ストレージエンジンから返されたデータが結果セット用に定義された形式に変換され、結果セットをクライアントに返します。

その他のステートメントの処理

SELECT ステートメントの処理で説明した基本的な手順は、INSERT、UPDATE、DELETE などの SQL ステートメントにも適用されます。UPDATE ステートメントと DELETE ステートメントは、いずれも変更または削除される行セットを対象とする必要があります。これらの行を特定する処理は、SELECT ステートメントの結果セットで使用された、基になる行を特定する処理と同じです。UPDATE ステートメントと INSERT ステートメントのどちらにも、更新または挿入するデータ値を指定する SELECT ステートメントを埋め込むことができます。

CREATE PROCEDURE、ALTER TABLE などの DDL (データ定義言語) ステートメントも、最終的には、システムカタログテーブル上の一連のリレーショナル操作になります。また、場合によっては ALTER TABLE ADD COLUMN など、データテーブルに対する一連のリレーショナル操作になります。

Share via

単一 SQL ステートメントの処理

SELECT ステートメントの最適化

SELECT ステートメントの処理

その他のステートメントの処理

参照

概念

ヘルプおよび情報

その他のリソース