列ストアインデックス

[アーティクル]
10/31/2013

xVelocity メモリ最適化列ストアインデックスでは、各列に対応するデータをグループ化して格納した後、すべての列を結合してインデックス全体を作成します。この動作は、各行に対応するデータをグループ化して格納した後、すべての行を結合してインデックス全体を作成するという従来のインデックスとは異なります。クエリの種類によっては、SQL Server クエリプロセッサで列ストアレイアウトを利用することでクエリの実行回数を大幅に改善することができます。データウェアハウスが急速に大規模化する中、意志決定支援アプリケーションおよび BI アプリケーションでは、非常に大きなデータセットを迅速かつ正確に読み取り、有用な情報や知識として処理する機能が一刻も早く求められるようになっています。このようなデータボリュームの巨大化と、求められる性能の急激な高度化によって、パフォーマンスを徐々に向上することでシステムを維持し、改善することが困難になっています。 SQL Server 列ストアインデックステクノロジは、一般的なデータウェアハウスのデータセットに特に適しています。列ストアインデックスによって、フィルター処理クエリ、集計クエリ、グループ化クエリ、スター結合クエリなどの一般的なデータウェアハウスクエリのパフォーマンスを向上することで、ユーザーが快適にデータウェアハウスを利用できるようになります。

コンテンツ

基礎

基礎: 列ストアインデックスの説明
基礎: 列ストアインデックスの制約と制限
使用例: パーティションテーブルを含む列ストアインデックス
基礎: 一般的な列ストアインデックスのシナリオ
基礎: ビットマップフィルターの最適化

ベストプラクティス

ベストプラクティス: 列ストアインデックスのデータの更新
ベストプラクティス: 列ストアインデックスの列の選択
ベストプラクティス: パーティションテーブル

操作方法

方法: 列ストアインデックスを作成する
方法: 列ストアインデックスのサイズを判断する
方法: 列ストアインデックスのパフォーマンスのトラブルシューティングを実行する

基礎: 列ストアインデックスの説明

SQL Server データベースエンジンの列ストアインデックスを使用して、一般的なデータウェアハウスクエリの処理時間を大幅に短縮することができます。一般的なデータウェアハウスのワークロードには、大量のデータを集約する処理が含まれています。データウェアハウスシステムおよび意志決定支援システムのパフォーマンスを向上するために一般的に使用される手法は、概要テーブルの事前計算、インデックス付きビュー、OLAP キューブなどです。このような手法によってクエリの処理速度が大幅に向上する場合もありますが、このような手法は柔軟性に乏しく維持が困難であり、さらにクエリに関する問題それぞれに対して個別に設計する必要があります。

たとえば、ディメンションキー列 dk1 と dk2 を含む、ファクトテーブル F1 があるとします。 M が、集計関数 (SUM など) であるとします。 M(dk1) を参照するクエリを実行するたびに列 dk1 に対して M を計算するのではなく、概要テーブル F2(dk1, M) を作成して使用することで、結果を事前に算出でき、クエリの実行速度を向上することができます。ただし、M(dk2) を参照する新しいクエリが必要になった場合は、この情報を含む新しい概要テーブル F3(dk2, M) を作成する必要があります。テーブル内の列数が増大し、使用される可能性のある関数が増えると、この手法を維持することが難しくなり、必要なクエリをすべて扱うことが容易ではなくなります。

このオーバーヘッドが、ユーザーに大きな影響を及ぼす可能性があります。ユーザーは SQL Server 列ストアインデックスを使用することで、他のソリューションのオーバーヘッドを減らすことができます。また、列ストアインデクスを使用するとクエリの計算速度が向上するため、事前計算が不要になります。

SQL Server の列ストアテクノロジの特徴は、次のとおりです。

カラムナ (列指向) データ形式: 従来のような行ベースのデータ組織 (行ストア形式と呼ばれます) とは異なり、列ストアインデックスが使用される SQL Server などの列指向データベースシステムでは、データは一度に 1 つの列としてグループ化され、格納されます。 SQL Server クエリプロセッサではこの新しいデータレイアウトを利用でき、クエリの実行回数を大幅に改善することができます。
クエリ結果の高速化: 列ストアインデックスの次の特徴によって、結果をより高速に生成できます。
- 必要な列のみを読み取ります。そのため、ディスクから読み取ってメモリに送られるデータの量が減り、後でメモリからプロセッサキャッシュに送られるデータも減ります。
- 列が効率的に圧縮されます。これにより、読み取りや移動の必要があるデータの量が減ります。
- ほとんどのクエリでは、テーブルの一部の列のみを操作します。そのため、メモリに移動されない列が多数あります。これに加えて圧縮効率も優れているため、バッファープールの使用率が改善され、全体の入出力が減少します。
- 高度なクエリ実行テクノロジにより、バッチと呼ばれる列のまとまりが効率的に処理され、CPU 使用率が下がります。
キー列: 列ストアインデックスにはキー列の概念がないため、1 つのインデックスにおけるキー列の数の制限 (16) は列ストアインデックスには適用されません。
クラスター化インデックスキー: ベーステーブルがクラスター化インデックスの場合、クラスター化されていない列ストアインデックスには、クラスター化キーのすべての列が含まれている必要があります。 CREATE INDEX ステートメントでクラスター化キーの列が指定されていない場合、その列は自動的に列ストアインデックスに追加されます。
分割: 列ストアインデックスとテーブル分割を組み合わせて使用できます。テーブル分割の構文に変更を加える必要はありません。パーティションテーブルの列ストアインデックスは、ベーステーブルにパーティションで固定する必要があります。そのため、パーティション列が列ストアインデックスの列の 1 つである場合、非クラスター化列ストアインデックスはパーティションテーブルにのみ作成できます。
レコードサイズ: インデックスキーレコードの 900 バイトのサイズ制限も、列ストアインデックスには適用されません。
クエリ処理: SQL Server では、列ストアインデックスに加えてバッチ処理を導入し、データの列指向を利用しています。列ストア構造とバッチ処理はどちらもパフォーマンス向上に役立ちますが、どちらか一方のみを利用した場合よりも、パフォーマンスの問題の調査が難しくなる可能性があります。
テーブル更新不可: SQL Server 2012 の場合、列ストアインデックスを含むテーブルは更新できません。この問題を回避するには、「ベストプラクティス: 列ストアインデックスのデータの更新」を参照してください。

列ストアインデックスを作成するための構文については、「CREATE COLUMNSTORE INDEX (Transact-SQL)」を参照してください。

データ型

一般的なビジネスデータ型を列ストアインデックスに含めることができます。以下のデータ型を列ストアインデックスに含めることができます。

char およびvarchar
nchar および nvarchar (varchar(max) および nvarchar(max) を除く)
decimal (および numeric) (有効桁数が 18 桁よりも多い場合を除く)
int、bigint、smallint、および tinyint
float (および real)
bit
money および smallmoney
すべての日付と時刻のデータ型 (datetimeoffset で、小数点以下桁数が 2 を超える場合を除く)

以下のデータ型は、列ストアインデックスに含めることができません。

binary および varbinary
ntext、text、および image
varchar(max) および nvarchar(max)
uniqueidentifier
rowversion (および timestamp)
sql_variant
decimal (および numeric) で、有効桁数が 18 桁よりも多い場合
datetimeoffset で、小数点以下桁数が 2 を超える場合
CLR 型 (hierarchyid および空間型)
xml

パフォーマンスの低下の可能性

意志決定支援クエリのパフォーマンスは、多くの場合、大きなテーブルに対して列ストアインデックスを使用することで改善されますが、クエリによっては悪化する場合があり、またワークロード全体のパフォーマンスも悪化する場合があります。一般的に、クエリオプティマイザーではコストベースの手法を使用し、列ストアインデックスによってクエリの全体的なパフォーマンスが向上する場合にのみ、列ストアインデックスの使用を決定します。ただし、オプティマイザーが使用するコストモデルは概算であり、行ストア (B ツリーまたはヒープ) を使用してテーブルにアクセスした方がパフォーマンスの向上が見込めた場合でも、そのテーブルに列ストアインデックスが使用されることがあります。その場合、IGNORE_NONCLUSTERED_COLUMNSTORE_INDEX クエリヒントを使用するか、インデックスヒントを使用して、オプティマイザーに列ストアインデックスを指定します。それでもオプティマイザーには、列ストアインデックスの情報が含まれる場合があります。そのため、ごくまれに、この方法でもパフォーマンスの問題が解決されないことがあります。列ストアインデックスを使用してもワークロードのパフォーマンスが改善せず、インデックスヒントを使用しても問題を解決できない場合は、列ストアインデックスを削除し、行ストア処理に戻してください。

問題の領域

SQL Server 列ストアインデックスと列ベースのクエリ処理は、大規模なファクトテーブルを含む一般的なデータウェアハウスクエリに最適化されています。また、スタースキーマ構成で結合され、グループ化され、集計される小規模のディメンションテーブルにも適しています。このようなクエリは、ファクトテーブル内の行数が大きい場合でもデータが集計されるため、一般的に小さな結果セットを返します。列ストアインデックスを使用するクエリのパフォーマンスは、次のいずれかの条件に該当する場合には、低下する可能性があります。

データが集計されていないため結果セットが大きい場合。大きな結果セットを返すときには、本質的に、小さな結果セットを返すよりも時間がかかります。
結合、フィルター処理、集計のいずれも実行されない場合。この場合、バッチ処理が発生しません。そのため、列ストアインデックスの効果は圧縮と読み取り列数の削減に限られます。
2 つの大きなテーブルを結合する必要があり、その際にメモリに収まらない大きなハッシュテーブルが作成され、ディスクへの書き込みが必要になる場合。
多数の列が返されることにより、取得する列ストアインデックスの数が増える場合。
列ストアインデックスに対する結合条件に、複数の列が含まれている場合。

以上のいずれかの原因で処理速度が低下した場合、このセクションで説明した方法を使用して解決することができます。

先頭に戻る

基礎: 列ストアインデックスの制約と制限

基本的な制限

列ストアインデックスには、次の制限があります。

1,024 より多い列を持つことはできません。
クラスター化できません。非クラスター化列ストアインデックスのみが利用可能です。
一意なインデックスにすることはできません。
ビューまたはインデックス付きビュー上では作成できません。
スパース列を含めることはできません。
主キーまたは外部キーとして機能することはできません。
ALTER INDEX ステートメントを使用して変更することはできません。そのため、削除して再作成する必要があります。 ALTER INDEX を使用して、列ストアインデックスを無効にしてから再作成することができます。
INCLUDE キーワードを使用して作成することはできません。
インデックスを並べ替えるための ASC または DESC キーワードを含めることはできません。列ストアインデックスは、圧縮アルゴリズムに従って順序付けされます。インデックスには、並べ替えは許可されていません。列ストアインデックスから選択された値が検索アルゴリズムによって並べ替えられる場合がありますが、結果セットを確実に並べ替えるには、ORDER BY 句を使用する必要があります。
従来のインデックスの方法で統計を使用または保持しません。
FILESTREAM 属性を持つ列を含めることはできません。インデックスで使用されていないテーブルの他の列には、FILESTREAM 属性を含めることができます。

列ストアインデックスを持つテーブルは更新できない

この問題を回避するには、「ベストプラクティス: 列ストアインデックスのデータの更新」を参照してください。

メモリの制約の影響

列ストア処理は、メモリ内の処理に最適化されています。 SQL Server は、メモリ不足に陥ったときにデータおよび大部分のデータ構造をディスクに書き込む機能を備えています。メモリの制約が厳しい場合、処理に行ストアが使用されます。アクセス方法として列ストアインデックスが選択されているが、必要なデータ構造を構築するにはメモリが足りない状況が発生する場合もあります。クエリ処理に厳しいメモリ制限が適用される場合、最初に列ストア処理が行われた後で既定の低速のコードパスに移行するため、ある程度パフォーマンスが低下することがあります。すべてのクエリで効果的なメモリ要件は、特定のクエリによって決まります。列ストアインデックスを構築するには、インデックス内の列数 × DOP (並列処理の次数) × 8 MB に相当するメモリが必要です (概算値)。一般的に、文字列である列の比率が増えると、必要なメモリの量も増加します。そのため、DOP を減らすことで、列ストアインデックスを構築するために必要なメモリを減らすことができます。

一部の式の評価が他の式よりも高速化される

列ストアインデックスが使用される場合、一部の一般的な式は、一度に 1 つの行を処理するモードではなくバッチモードを使用して評価されます。列ストアインデックスの使用によるクエリの高速化に加え、バッチモードによってさらに高速化されます。一部のクエリ実行演算子はバッチモード処理に対応しません。

列ストアインデックスは SEEK をサポートしない

クエリによって返される行がごくわずかであると予想される場合、オプティマイザーによって列ストアインデックスが選択される可能性はほとんどありません (例: "干し草の中の針" タイプのクエリ)。テーブルヒントの FORCESEEK を使用すると、オプティマイザーでは、列ストアインデックスが検討されなくなります。

列ストアインデックスと同時に使用できない機能:

ページと行の圧縮、および vardecimal ストレージ形式 (列ストアインデックスは、既に別の形式で圧縮されているため)
レプリケーション
変更の追跡
変更データキャプチャ
ファイルストリーム

先頭に戻る

使用例: パーティションテーブルを含む列ストアインデックス

このトピックの例では、 AdventureWorksDW2012 サンプルデータベース内の FactResellerSalesPtnd という名前のパーティションテーブルを使用します。パーティションテーブルで列ストアインデックスをテストするには、 AdventureWorksDW2012 データベースに接続し、次のコードを実行して、ファクトテーブルをパーティション分割したテーブルを作成します。

注
サンプルデータベースの詳細と、データベースのダウンロード方法の詳細については、「AdventureWorks サンプルデータベース」を参照してください。

FactResellerSalesPtnd テーブルの作成

次のコードを実行して、FactResellerSales テーブルをパーティション分割した、FactResellerSalesPtnd という名前のテーブルを作成します。

USE AdventureWorksDW2012;
GO

CREATE PARTITION FUNCTION [ByOrderDateMonthPF](int) AS RANGE RIGHT 
FOR VALUES (
    20050701, 20050801, 20050901, 20051001, 20051101, 20051201, 
    20060101, 20060201, 20060301, 20060401, 20060501, 20060601, 
    20060701, 20060801, 20060901, 20061001, 20061101, 20061201, 
    20070101, 20070201, 20070301, 20070401, 20070501, 20070601, 
    20070701, 20070801, 20070901, 20071001, 20071101, 20071201, 
    20080101, 20080201, 20080301, 20080401, 20080501, 20080601, 
    20080701, 20080801, 20080901, 20081001, 20081101, 20081201
) 
GO

CREATE PARTITION SCHEME [ByOrderDateMonthRange] 
AS PARTITION [ByOrderDateMonthPF] 
ALL TO ([PRIMARY]) 
GO

-- Create a partitioned version of the FactResellerSales table
CREATE TABLE [dbo].[FactResellerSalesPtnd]( 
    [ProductKey] [int] NOT NULL, 
    [OrderDateKey] [int] NOT NULL, 
    [DueDateKey] [int] NOT NULL, 
    [ShipDateKey] [int] NOT NULL, 
    [CustomerKey] [int] NOT NULL, 
    [EmployeeKey] [int] NOT NULL, 
    [PromotionKey] [int] NOT NULL, 
    [CurrencyKey] [int] NOT NULL, 
    [SalesTerritoryKey] [int] NOT NULL, 
    [SalesOrderNumber] [nvarchar](20) NOT NULL, 
    [SalesOrderLineNumber] [tinyint] NOT NULL, 
    [RevisionNumber] [tinyint] NULL, 
    [OrderQuantity] [smallint] NULL, 
    [UnitPrice] [money] NULL, 
    [ExtendedAmount] [money] NULL, 
    [UnitPriceDiscountPct] [float] NULL, 
    [DiscountAmount] [float] NULL, 
    [ProductStandardCost] [money] NULL, 
    [TotalProductCost] [money] NULL, 
    [SalesAmount] [money] NULL, 
    [TaxAmt] [money] NULL, 
    [Freight] [money] NULL, 
    [CarrierTrackingNumber] [nvarchar](25) NULL, 
    [CustomerPONumber] [nvarchar](25) NULL,
    OrderDate [datetime] NULL,
    DueDate [datetime] NULL,
    ShipDate [datetime] NULL
) ON ByOrderDateMonthRange(OrderDateKey);
GO

-- Using simple or bulk logged recovery mode, and then the TABLOCK 
-- hint on the target table of the INSERT…SELECT is a best practice
-- because it causes minimal logging and is therefore much faster.
ALTER DATABASE AdventureWorksDW2012 SET RECOVERY SIMPLE;
GO

-- Copy the data from the FactResellerSales into the new table
INSERT INTO dbo.FactResellerSalesPtnd WITH(TABLOCK)
SELECT * FROM dbo.FactResellerSales;
GO

-- Create the columnstore index
CREATE NONCLUSTERED COLUMNSTORE INDEX [csindx_FactResellerSalesPtnd]
ON [FactResellerSalesPtnd]
( 
    [ProductKey], 
    [OrderDateKey], 
    [DueDateKey], 
    [ShipDateKey], 
    [CustomerKey], 
    [EmployeeKey], 
    [PromotionKey], 
    [CurrencyKey], 
    [SalesTerritoryKey], 
    [SalesOrderNumber], 
    [SalesOrderLineNumber], 
    [RevisionNumber], 
    [OrderQuantity], 
    [UnitPrice], 
    [ExtendedAmount], 
    [UnitPriceDiscountPct], 
    [DiscountAmount], 
    [ProductStandardCost], 
    [TotalProductCost], 
    [SalesAmount], 
    [TaxAmt], 
    [Freight], 
    [CarrierTrackingNumber], 
    [CustomerPONumber], 
    [OrderDate],
    [DueDate],
    [ShipDate]
);

次に、列ストアインデックスの効果が得られるクエリを実行し、列ストアインデックスが使用されたことを確認します。

列ストアインデックスのテスト

Ctrl キーを押しながら M キーを押すか、[クエリ] メニューの [実際の実行プランを含める] をクリックします。これで、SQL Server Management Studio によって使用される実際の実行プランのグラフィカル表示が有効になります。
クエリエディターウィンドウで、次のクエリを実行します。
```
SELECT SalesTerritoryKey, SUM(ExtendedAmount) AS SalesByTerritory
FROM FactResellerSalesPtnd
GROUP BY SalesTerritoryKey;
```
[結果] ウィンドウの [実行プラン] タブを開き、クラスター化されていない csindx_FactResellerSalesPtnd インデックスのインデックススキャンがクエリプランで選択されていることを確認します。

注

グラフィカルなプラン表示アイコンの詳細については、「プラン表示の論理操作と物理操作のリファレンス」を参照してください。

先頭に戻る

注
グラフィカルなプラン表示アイコンの詳細については、「プラン表示の論理操作と物理操作のリファレンス」を参照してください。

基礎: 一般的な列ストアインデックスのシナリオ

スターデータベーススキーマおよびスノーフレークデータベーススキーマは、通常、データの操作効率よりもデータの取得速度が重視される多次元データウェアハウスやデータマートで使用されます。 SQL Server 2012 の列ストアテクノロジにより、スタースキーマおよびスノーフレークスキーマを対象とするクエリを検出し、高速化することができます。

例:

注
以降の例ではテーブルがそれほど大きくないため、バッチ処理が使用されない場合があります。並列処理などのバッチ実行モードは、コストの高いクエリにのみ使用されます。

A: 2 つのテーブルを結合する集計クエリ

製品 215 の販売数を四半期単位で計算するスター結合クエリがあるとします。 FactResellerSalesPtnd という名前のファクトテーブルが、OrderDateKey 列で分割されます。 DimDate という名前の 1 つのディメンションテーブルが、日付キーでの主キーと外部キーのリレーションシップを利用してファクトテーブルにリンクされます。
```
SELECT d.CalendarYear,
    d.CalendarQuarter,
    COUNT(*) AS NumberSold
FROM dbo.FactResellerSalesPtnd AS f
    JOIN dbo.DimDate AS d
    ON f.OrderDateKey = d.DateKey
WHERE ProductKey = 215
GROUP BY d.CalendarYear, d.CalendarQuarter
ORDER BY d.CalendarYear, d.CalendarQuarter;
```

また、単一のテーブルのみを対象とするクエリが使用される場合も考えられます。そのような場合、SQL Server ではバッチ実行と列ストアテクノロジを利用して、クエリの実行速度の向上を試みます。

B: 1 つのテーブルを対象とする単純な集計クエリ

ファクトテーブルは FactResellerSalesPtnd です。このテーブルは OrderDateKey 列で分割されます。次のクエリは、行数と注文の数を返します。
```
SELECT COUNT(*) AS NumberOfRows, 
    COUNT(DISTINCT(f.SalesOrderNumber)) AS NumberOfOrders
FROM dbo.FactResellerSalesPtnd AS f;
```
一般的なデータウェアハウスのシナリオのクエリの場合、クエリの実行に列ストアインデックスとバッチ実行モードを使用すると、実行速度が一般的に 1.5 倍～ 10 倍向上します。一部のスター結合クエリでは、その効果はもっと大きくなります。

基礎: ビットマップフィルターの最適化

SQL Server では、列指向形式のデータのレイアウトだけでなく、クエリ実行時のパフォーマンスを高めるためにストレージエンジンに渡されるビットマップフィルターも使用されます。このビットマップフィルターにより、結合が実行される前に、含まれる行の数を削減し、結合演算子で処理する行の数を減らすことで、クエリの実行速度を向上します。ビットマップはハッシュ結合のビルド側に作成されますが、実際のビットマップチェックはハッシュ結合のプローブ側で実行されます。グラフィカル実行プランまたは XML 実行プランを使用して、ビットマップフィルターの使用状況を調べることができます。

ベストプラクティス: 列ストアインデックスのデータの更新

列ストアインデックスを含むテーブルは更新できません。この問題は、次の 3 つの方法で回避できます。

列ストアインデックスを含むテーブルを更新するには、列ストアインデックスを削除し、必要に応じて INSERT、DELETE、UPDATE、または MERGE の操作を実行した後で、列ストアインデックスを再構築します。
テーブルをパーティション分割して、パーティションを切り替えます。一括挿入の場合、ステージングテーブルにデータを挿入し、そのステージングテーブルに列ストアインデックスを構築した後、そのステージングテーブルを空のパーティションに切り替えます。それ以外の更新の場合、メインテーブルのパーティションをステージングテーブルに変換し、そのステージングテーブルの列ストアインデックスを無効にするか削除し、更新操作を実行します。その後、ステージングテーブルに列ストアインデックスを再構築するか再作成して、ステージングテーブルをメインテーブルに戻します。
静的データは列ストアインデックスを含むメインテーブルに格納します。新しいデータ、および変更される可能性が高い最新のデータは、列ストアインデックスを含まず、スキーマが同じである別のテーブルに格納します。最新のデータを含むテーブルに更新を適用します。データのクエリを実行するには、そのクエリを各テーブルに対応する 2 つのクエリとして再作成し、UNION ALL を使用してその 2 つの結果セットを結合します。大きなメインテーブルに対してサブクエリを実行する際に、列ストアインデックスの効果が得られます。それと比較して、更新可能なテーブルが十分に小さければ、列ストアインデックスがなくてもパフォーマンスに悪影響が及ぶことはありません。 2 つのテーブルの UNION ALL であるビューに対してクエリを実行することもできますが、パフォーマンス上の利点が小さくなる可能性があります。パフォーマンスはクエリプランに左右されます。また、クエリプランはクエリ、データ、および基数の推定値の影響を受けます。ビューを使用する利点は、ビューの INSTEAD OF トリガーによって列ストアインデックスが含まれないテーブルに更新を迂回できることと、ユーザーやアプリケーションがビューのメカニズムを把握できることです。 UNION ALL を使用するどちらかの手法を使用する場合、一般的なクエリに対するパフォーマンスをテストし、パフォーマンス向上の効果が減少するデメリットよりもこの手法を使用するメリットの方が大きいかどうかを判断してください。

注
テーブルを読み取り専用にするためのメカニズムとして列ストアインデックスを作成しないでください。列ストアインデックスを含むテーブルの更新に関する制限事項は、将来のリリースでは保証されていません。読み取り専用の動作が必要な場合は、読み取り専用ファイルグループを作成して、テーブルをそのファイルグループに移動してください。

テーブルを読み取り専用にするためのメカニズムとして列ストアインデックスを作成しないでください。列ストアインデックスを含むテーブルの更新に関する制限事項は、将来のリリースでは保証されていません。読み取り専用の動作が必要な場合は、読み取り専用ファイルグループを作成して、テーブルをそのファイルグループに移動してください。

ベストプラクティス: 列ストアインデックスの列の選択

列ストアインデックスのパフォーマンス上の利点は、クエリを処理するために読み取って操作する必要のあるデータページの数を減らす圧縮機能によって得られます。圧縮機能は、重複した値が大量に含まれる文字型列や数値型列に対して使用した場合に最も効率が高くなります。たとえば、ディメンションテーブルの中に、郵便番号、市区町村、および販売地域の列が含まれているとします。各市区町村に多数の郵便番号があり、さらに各販売地域に多数の市区町村がある場合、販売地域の列の圧縮率が最も高くなります。市区町村の列はそれよりも圧縮率が低く、郵便番号の列の圧縮率が最も低くなります。どの列も列ストアインデックスに適していますが、販売地域コードの列を列ストアインデックスを追加することで列ストア圧縮の効果を最大にすることができます。郵便番号の列を追加した場合、その効果は最も小さくなります。

先頭に戻る

ベストプラクティス: パーティションテーブル

列ストアインデックスは、一般的にパーティション分割が使用される非常に大きなデータウェアハウスのシナリオでクエリをサポートするために開発されました。列ストアインデックスを含むテーブルのデータを定期的に更新する必要がある場合に、パーティション分割をお勧めします。列ストアインデックスのパーティションを更新する方法については、前のセクション「ベストプラクティス: 列ストアインデックスのデータの更新」を参照してください。

先頭に戻る

方法: 列ストアインデックスを作成する

列ストアインデックスの作成は、一般的なインデックスの作成と似ています。列ストアインデックスを作成するには、Transact-SQL を使用するか、SQL Server Management Studio のグラフィカルツールを使用します。

Transact-SQL を使用した列ストアインデックスの作成

クエリエディターウィンドウで、CREATE COLUMNSTORE INDEX ステートメントを実行します。例については、前の「FactResellerSalesPtnd テーブルの作成」を参照してください。詳細については、「CREATE COLUMNSTORE INDEX (Transact-SQL)」を参照してください。

SQL Server Management Studio を使用した列ストアインデックスの作成

Management Studio のオブジェクトエクスプローラーを使用して SQL Server データベースエンジンのインスタンスに接続します。
オブジェクトエクスプローラーで、SQL Server インスタンスを展開し、[データベース] を展開します。データベースを展開してからテーブルを展開し、テーブルを右クリックして [新しいインデックス] をポイントして、[非クラスター化列ストアインデックス] をクリックします。
[インデックス名] ダイアログボックスの [全般] タブで、新しいインデックスの名前を入力し、[追加] をクリックします。
[複数列の選択] ダイアログボックスで、列ストアインデックスに追加する列を選択し、[OK] を 2 回クリックします。インデックスが作成されます。

方法: 列ストアインデックスのサイズを判断する

列ストアインデックスは、セグメントと辞書の両方で構成されます。次の例では、列ストアインデックス (FactResellerSalesPtnd テーブル内) の合計サイズを、sys.column_store_segments および sys.column_store_dictionaries の on_disk_size 列を結合することで判断します。

SELECT SUM(on_disk_size_MB) AS TotalSizeInMB
FROM
(
   (SELECT SUM(css.on_disk_size)/(1024.0*1024.0) on_disk_size_MB
    FROM sys.indexes AS i
    JOIN sys.partitions AS p
        ON i.object_id = p.object_id 
    JOIN sys.column_store_segments AS css
        ON css.hobt_id = p.hobt_id
    WHERE i.object_id = object_id('FactResellerSalesPtnd') 
    AND i.type_desc = 'NONCLUSTERED COLUMNSTORE') 
  UNION ALL
   (SELECT SUM(csd.on_disk_size)/(1024.0*1024.0) on_disk_size_MB
    FROM sys.indexes AS i
    JOIN sys.partitions AS p
        ON i.object_id = p.object_id 
    JOIN sys.column_store_dictionaries AS csd
        ON csd.hobt_id = p.hobt_id
    WHERE i.object_id = object_id('FactResellerSalesPtnd') 
    AND i.type_desc = 'NONCLUSTERED COLUMNSTORE') 
) AS SegmentsPlusDictionary

方法: 列ストアインデックスのパフォーマンスのトラブルシューティングを実行する

列ストアインデックスが使用されているかどうかを判断するには、クエリ実行プランを調べます。次の 3 つの要素が表示されているときに、最大の効果が得られます。

クエリ実行プランに列ストアインデックスが表示されている。

Columnstore Index Scan 操作アイコン

列ストアインデックスが使用されていないときに、列ストアを使用することでクエリのパフォーマンスが向上すると考えられる場合、WITH (INDEX(<indexname>)) ヒントを使用して強制的に列ストアインデックスを使用する際に、クエリのパフォーマンスを評価します。次に、インデックスヒントを使用したクエリの例を示します。
```
SELECT d.CalendarYear,
    d.CalendarQuarter,
    COUNT(*) AS NumberSold
FROM dbo.FactResellerSalesPtnd AS f WITH (INDEX(csindx_FactResellerSalesPtnd))
    JOIN dbo.DimDate AS d
    ON f.OrderDateKey = d.DateKey
WHERE ProductKey = 215
GROUP BY d.CalendarYear, d.CalendarQuarter
ORDER BY d.CalendarYear, d.CalendarQuarter;
```
グラフィカルなクエリプランで、列ストアインデックスのアイコンにマウスポインターを合わせると、実際の実行モードが行ではなくバッチであると表示される。
グラフィカルな実行プランに Bitmap 物理操作のアイコンが表示される。これは、ビットマップフィルターによって結合処理の前に行数が削減されていることを示しています。

Bitmap 操作アイコン

先頭に戻る

列ストアインデックス

コンテンツ

基礎: 列ストアインデックスの説明