データ依存型ルーティングを使用した SQL Server のスケールアウト

[アーティクル]
07/12/2010

このページはアーカイブです。記載されている内容は情報提供のみを目的としており、ページ内のリンクは有効でない可能性がありますが、これらの情報についてマイクロソフトはいかなる責任も負わないものとします。

公開日: 2005年10月25日

Man Xiong、Brian Goldstein

要約世界中の何百万人もの顧客にサービスを提供するためにアプリケーションの規模が拡大するにつれて、メインフレームクラスのコンピュータを 1 台ホストするよりも、スケールアウトアーキテクチャに移行した方が有益である可能性があります。このホワイトペーパーでは、企業がデータベースアプリケーションのスケールアウトを選択する理由について、およびサーバー連合全体でデータのパーティション分割やデータへのアクセスを実施する手法であるデータ依存型ルーティングの使用方法について説明します。管理容易性と線形スケーリングを証明するために、SQL Server スケーラビリティテストラボにおいて、実際の顧客シナリオである MSN (マイクロソフトネットワーク) のコミュニケーションサービスプラットフォーム (CSP) のシミュレーションを行いました。テストは、Microsoft Windows® Server™ 2003 Enterprise Edition 上で動作している Microsoft® SQL Server™ 2005 Beta 2 を使って実施しました。

トピック

はじめに
スケールアウトを選択する理由
データ依存型ルーティング
MSN コミュニケーションサービスプラットフォーム (CSP)
SQL Server 2005 における MSN CSP のパイロットスタディ
まとめ
付録 A : ハードウェア構成

はじめに

世界中の何百万人もの顧客にサービスを提供するためにアプリケーションの規模が拡大するにつれて、メインフレームクラスのコンピュータを 1 台ホストするよりも、スケールアウトアーキテクチャに移行した方が有益である可能性があります。このホワイトペーパーでは、企業がデータベースアプリケーションのスケールアウトを選択する理由について、およびサーバー連合全体でデータのパーティション分割やデータへのアクセスを実施する手法であるデータ依存型ルーティングの使用方法について説明します。管理容易性と線形スケーリングを証明するために、SQL Server スケーラビリティテストラボにおいて、実際の顧客シナリオである MSN (マイクロソフトネットワーク) のコミュニケーションサービスプラットフォーム (CSP) のシミュレーションを行いました。テストは、Microsoft Windows® Server™ 2003 Enterprise Edition 上で動作している Microsoft® SQL Server™ 2005 Beta 2 を使って実施しました。

対象読者

このホワイトペーパーは、以下の読者を対象としています。

データベースアプリケーションのスケールアウトの実施を検討している開発者またはデータベース管理者。このホワイトペーパー全体から参考となる情報が得られます。
Microsoft SQL Server 上でデータベースアプリケーションのスケールアウトを実施した経験のある開発者またはデータベース管理者。高可用性およびシステム保守プラットフォームとしての SQL Server トランザクションレプリケーションの使用に関する説明から、役立つ情報を得られるでしょう。
ストレージエリアネットワーク (SAN) の管理や I/O システムのスケーリングに関心のあるデータベース管理者またはシステム管理者。

スケールアウトを選択する理由

この 10 年間で、データの記憶容量が急激に増加しました。今では、多くのアプリケーションをインターネット上で利用できるため、企業は、買い物をしたり、電子メールメッセージを保存したり、金融情報を見たりしている何百万人ものオンラインユーザーに対処する必要があります。このようなエンタープライズアプリケーションの中心にデータベースシステムがあります。そして、大規模データセンターにおける主要なデータベースプラットフォームの 1 つが、SQL Server です。

スケーラブルなデータベースプラットフォームを使用すると、アプリケーションの設計者は、システムを小規模な状態からスタートして、必要に応じて拡張することができます。従来のスケーラビリティのほとんどは、プロセッサ、メモリ、ディスク、およびネットワークカードなどを 1 台のサーバーに追加するという完全な SMP (対称型マルチプロセッサ) スケールアップによって実現されていました。これまでの大部分の SQL Server 実装では、スケールアップで十分でした。ただし、単一のデータベースサーバー (以下、"ノード" と表現することもあります) が能力の限界に達して、それ以上の拡張はできないアプリケーションクラスもあります。この障害は、さまざまな形で表面化する可能性がありますが、毎秒、何千件または何百万件ものユーザーリクエストが発生する顧客アプリケーションで多く見られます。これまでは、接続やリクエストごとに必要となる CPU、メモリ、ディスク、ネットワークなどのリソースは、単一システム上で強化するしかありませんでした。

アプリケーションの設計者は、単一システムに障害の発生する可能性が発生した場合、ワークロードとデータベースを SMP ノードのアレイ間でパーティション分割するスケールアウトアーキテクチャを採用することができます。このようにスケールアウトされたシステムは、アレイにノードを追加することによって拡張できます。このパーティション分割はクライアントやアプリケーションからは見えないようにすることが理想的です。クラスタは、単一システムとしてプログラムされ管理されますが、実際にはノードアレイで構成されています。

メモこのノードアレイは、"サーバー連合" とも呼ばれることがあります。

アプリケーションをスケールアウトするには、いくつかの方法があることに注意してください。1 つのアプローチとして、サービスをノード全体に展開する、サービス指向のパーティション分割アーキテクチャを導入する方法があります。適切な例として、1 台目のサーバーにショッピングカタログを、2 台目のサーバーに商品の在庫データベースを、3 台目のサーバーにショッピングバスケットアプリケーションを、それぞれ配置したシステムが挙げられます。このアプリケーションの中間層は、情報ソースごとにどのサーバーにアクセスするかを理解しています。

このホワイトペーパーの中心テーマでもあるもう 1 つのパーティション分割戦略は、巨大なテーブルを複数のデータベースノードで分割するデータパーティション分割です。

スケールアウトは、その実現手段にかかわらず、より多くのコンポーネントを管理する必要があること、および必ずしもすべてのアプリケーションをノード全体でパーティション分割できるわけではないことから、管理上の複雑な問題が発生します。したがって、スケールアウトアーキテクチャは、一部のアプリケーションには適していますが、すべてのアプリケーションに有効なわけではありません。

スケールアウトに適したアプリケーションである場合、スケールアウトは単一システムのスケールアップに比べて次のようなメリットがあります。

市販のコンポーネントを増やさずにアレイを拡張できるため、大幅なコスト削減につながる
単一ノードに障害が発生してもアプリケーション全体を停止させる必要がない
ノードの相対的独立性によって、無理のないフェールオーバーと高可用性設計が実現する

データ依存型ルーティング

スケールアウトされたデータプラットフォームに関する設計では、複数ノード間でデータをパーティション分割するための最良の方法を決定することが重要となります。一部のアプリケーションは、顧客名、店舗の所在地、時間/日付、登録名などのキー値でパーティション分割できます。問題は、データのアクセス方法によってパーティション分割スキーマを調整することです。たとえば、大手保険会社の各支店で、それぞれの顧客レコードを、SQL Server が動作している支店サーバー上で保持する場合を考えてみます。この場合、アプリケーションは支店を単位としてパーティション分割されます。毎夜バッチジョブを実行し、新しく作成されたレコードや修正されたレコードを、本社に設置した SQL Server を実行する集中管理用サーバーにレプリケーションすることができます。ほとんどの場合、支店の外で業務を行う外勤者は集中管理用サーバーにアクセスする必要がなく、一方社内のアナリストはすべての支店サーバーにアクセスしなくても中央のデータベースに対してレポート作成を実行できます。この例では、データアクセスはローカルに実行されます。

別の例について考えてみます。あるオンライン小売業者がすべての販売トランザクションを保存することを検討しているとします。容易に推察されることですが、データサイズが急増する可能性があります。商品 ID、日付、顧客 ID などのデータを、パーティション分割する方法は多数存在します。しかし、さまざまな顧客データを調整するには、どうすればよいでしょうか。顧客サービス担当者は、顧客サポートを要請する顧客からの情報に基づいて、日付、顧客 ID、または商品 ID で検索したいと考えます。マーケットアナリストは、商品 ID と顧客 ID で検索する必要があります。このようなあらゆるクエリが単一の SQL Server インスタンスに集中するように、このアプリケーションをスケールアップすることは大きな意味があります。ハードウェアリソースを使い果たしたという理由で、または予算が制限されているという理由で、市販のハードウェア製品を使用してこの小売販売アプリケーションをスケールアウトする必要がある場合を考えてみてください。この場合、顧客満足度を向上させるには顧客レコードの迅速な表示が最優先事項であるため、顧客 ID でパーティション分割することを選択したと仮定します。

この小売アプリケーションをスケールアウトするには、いくつかの方法があります。たとえば、SQL Server の分散パーティションビューを使用できます。分散パーティションビューの要件の 1 つは、データベースを水平方向にパーティション分割し、SQL Server 連合全体にパーティションを分散させることです。関係するすべてのサーバーに、同様のデータベーススキーマを設定し、UNION ALL ステートメントを発行して、1 つの更新可能なビュー (つまり分散パーティションビュー) に、複数のテーブルを統合する必要があります。

メモ分散パーティションビューには特定の展開要件があります。分散パーティションビューの詳細については、SQL Server 2000 Books Online を参照してください。または、Don Jones による電子書籍『The Definitive Guide for Scaling Out SQL Server』(英語) を参照してください。

もう 1 つのスケールアウトテクニックであるデータ依存型ルーティング (DDR : Data Dependent Routing) について考えてみます。DDR では、主として中間層にあるクライアントアプリケーションに、データベースリクエストを適切なノードにルーティングできるだけのインテリジェンスが必要となります。DDR では、ノード全体のビューがありません。つまり、連合サーバーのそれぞれが、互いに独立しています (データベーススキーマの共有は除きます)。中間層には、データのパーティション分割方法と、データがどのノードに存在するかについてのマッピングが含まれます。

パーティション分割を伴う小売アプリケーションの例に戻って、レコードの保存場所を追跡する方法を検討します。SQL Server データベースを中間層 Web サーバー上に構築したと仮定します。データベースは、複数の連合サーバー全体で顧客 ID によってパーティション分割されており、データが存在するノードに顧客 ID をマップするルックアップテーブルを中間層に作成します。

このルックアップテーブルには、次のようなレコードが含まれます。

顧客 ID	パーティション ID
10015	1
10016	2
10017	1
10018	3

表 1 パーティション ルックアップ テーブル

顧客サービス担当者が顧客 10015 のすべてのトランザクションレコードを表示する場合、アプリケーションは中間層からそのリクエストをノード 1 に送信する必要があることを判断できます。ノード 2 とノード 3 はリクエストを受信する必要はありません。これにより、アクセスが単一ノードに限定されます。

毎夜、商品 ID に基づいた在庫レポート作成を実行するとどうなるでしょうか。顧客 ID でアプリケーションをパーティション分割したため、各商品 ID については、すべてのデータベースノードにレコードが格納されている可能性があります。そのため、アプリケーションは、すべてのノードに問い合わせて、各商品 ID に対応するすべてのレコードを取り出し、それらを統合して結果をソートする必要があります。アクセスが限定されていないため、この処理には非常に時間がかかります。ただし、この処理を顧客のオンラインエクスペリエンスに影響を与えないバックグラウンドジョブとして実行することは可能です。

スケールアウトに関する課題

アプリケーションをスケールアウトするときにいくつかの課題に直面します。

管理ノード数の増加は、運用管理のオーバーヘッドの増加を意味します。計画されたすべての保守タスク (データベースのバックアップ、OS やアプリケーションのサービスパック、バグ修正プログラム、およびインデックスの最適化など) を、単一ノードではなく複数ノード全体に適用する必要があります。ノードの追加と削除は、アプリケーションのユーザーに影響を与えないように行う必要があります。
データ パーティション分割 正しいパーティションキーの選択は、必ずしも容易ではありません。アプリケーションが進化するにつれて、ビジネスニーズの変化に気付き、パーティションキーを見直す必要が生じる可能性があります。また、ノード全体での負荷分散の実現が困難になるおそれがあります。たとえば、データベースを顧客の姓 (ラストネーム) でパーティション分割し、アルファベットの各文字ごとに 26 台のサーバーに展開すると、"S" で始まるラストネームを担当するサーバーは、"X" で始まるラストネームを担当するサーバーよりも読み書き動作が多くなります。
アプリケーションの展開と更新 ビジネスニーズとデータアクセスニーズは時間と共に変化します。これらの変化が、どの程度アプリケーションの可用性に影響を及ぼすでしょうか。
高可用性プラクティス 単一ノードに障害が発生しても、アプリケーションはユーザーへのサービスを提供し続けることができるでしょうか。データベースを単一ノードに復元するのにどのくらい時間がかかるでしょうか。ユーザーに影響を与えることなく単一ノードをオフラインにできるでしょうか。

次のセクションでは、これらの疑問を解決すると共に、スケールアウトに成功したアプリケーションを紹介します。

MSN コミュニケーションサービスプラットフォーム (CSP)

世界中の何百万人もの人々が、Microsoft の MSN Messenger と Hotmail サービスを利用しています。これらのサービスの中心に、大規模な SQL Server データベースに保存されたコミュニケーションサービスプラットフォーム (CSP) があります。現在、CSP をサポートしているデータベースは、Microsoft SQL Server 2000 Enterprise Edition が動作している 100 台の 4 プロセッサバックエンドサーバーにパーティション分割されています。このサーバー連合によって、何億ものユーザーアカウントが処理されます。

このアプリケーションは、SQL Server が、次のことを考慮することによって、どのようにデータ依存型ルーティング (DDR) と共に連合サーバーを使用してスケールアウトに成功したかを示す良い例です。

実際のワークロード量が、使用可能な任意のサーバーハードウェアシステムの処理能力を超えている
アカウントごとにクエリを分離することによって、アプリケーションが行ベースのパーティション分割と DDR に完全に適合する
データベースを適切にパーティション分割することによって、アプリケーションを安価な市販のハードウェア (4 プロセッササーバー) 上で実行できる

図 1 は、システムアーキテクチャの概要を示したものです。MSN コミュニケーションサービスプラットフォームのこの部分は、次の 4 つの階層で構成されます。

Microsoft インターネットインフォメーションサービス (IIS) が動作している Web サーバー
SQL Server 2000 が動作しているルックアップパーティションデータベースサーバー (LPS)
SQL Server 2000 が動作しているデータベースバックエンドサーバー
MSN スケールアウト管理レイヤ

レコードは、PUID (Passport Unique ID) によって、バックエンドデータベースサーバー全体で順序付けが行われ、パーティション分割されます。スケールアウト管理レイヤは、物理的なバックエンドデータベースサーバーに対するデータパーティションのマッピングを、LPS やバックエンドデータベースから独立した専用の SQL Server データベースに格納します。LPS データベースには、データパーティションに対する PUID のマッピングが格納され、データの増加に対応するために複数の LPS サーバー全体でパーティション分割されます。コミュニケーションサービスのユーザーは、Web サーバーにリクエストを提出し、Web サーバーは PUID を使用して LPS リポジトリに問い合わせて、レコードが格納されているデータパーティションを取得します。次に、Web サーバーはスケールアウト管理レイヤに問い合わせて、そのユーザーに関する情報がどのバックエンドデータベースサーバーに保存されているかを特定します。情報は数秒でクライアントに返されます。

Cc966448.scddrtng01(ja-jp,TechNet.10).gif

図 1 ** MSN CSP** アーキテクチャの概要

拡大表示する

MSN スケールアウト管理レイヤ

MSN スケールアウト管理レイヤは、MSN CSP が、パーティション分割、DDR、およびフェールオーバートポロジを LPS とバックエンドデータベースサーバーに展開するためのプラットフォームを提供します。MSN スケールアウト管理レイヤは、管理コンソールを介して管理されます。

"MSN スケールアウト管理レイヤ" は、1 つのプライマリデータベースとそのレプリカ ("セカンダリデータベース" と呼ばれます) を含むデータベースセットとしてフェールセーフセットを定義します。フェールセーフセットは、MSN スケールアウト管理レイヤの高可用性の構成単位です。1 つのフェールセーフセットに、1 つまたは複数のセカンダリデータベースを含めることができます。実際には、プライマリデータベースとセカンダリデータベースを、別々のサーバーに配置して高可用性を実現します。

CSP 用のプライマリデータベースとセカンダリデータベースは、SQL Server のトランザクションレプリケーションによって同期化されます。レプリケーションの代わりにログ配布を使用することもできます。ログ配布が待ち時間を犠牲にしてトランザクション比率を高めることを可能にする一方で、レプリケーションソリューションは同期化にかかる待ち時間を短縮します。

"パーティション" は、データパーティション分割と DDR の構成単位である、パーティション分割されたデータのセットとして定義されます。パーティションは、プライマリデータベース上のマスタコピーと共にフェールセーフセット内に格納され、そのレプリカがセカンダリデータベースに格納されます。通常は、1 つのフェールセーフセットに 1 つまたは複数のパーティションを格納することができます。

"フェールオーバーグループ" は、互いのバックアップとして機能するサーバーのグループとして定義されます。各フェールセーフセットのプライマリデータベースとセカンダリデータベースを、別々のサーバーに配置して高可用性を実現します。ワークロードがプライマリデータベースだけにかかるため、パーティション用のプライマリデータベースは複数のサーバー全体に慎重に配置し、フェールオーバーグループのサーバー間でワークロードを分散させてバランスを図ります。フェールセーフセットがフェールオーバーグループの境界を超えないようにすることで、フェールオーバーグループはそれぞれが独立して機能します。

図 2 に示す例は、2 台のサーバーで構成された単純なフェールオーバーグループです。このグループは、青色と金色で色分けされた 2 つのフェールセーフセットをホストします。この例では、各フェールセーフセットが、パーティションを 1 つずつ格納し、セカンダリデータベースを 1 つずつ保持しています。プライマリデータベース上のデータは、セカンダリデータベース上にあるレプリカにレプリケーションされます。フェールセーフセット 1 のプライマリデータベースは Server 1 に配置され、そのセカンダリデータベースは Server 2 に配置されます。フェールセーフセット 2 のプライマリデータベースは Server 2 に配置され、そのセカンダリデータベースは Server 1 に配置されます。両方の配置は、高可用性のために設計されています。ワークロードのバランスを図るために、Partition #1 用のプライマリデータベースは Server 1 に配置され、Partition #2 用のプライマリデータベースは Server 2 に配置されます。

Cc966448.scddrtng02(ja-jp,TechNet.10).gif

図 2 単純なフェールオーバー グループ

拡大表示する

スケールアウト管理レイヤは、展開と現在の状態に関する次の情報を保存するために、構成データベースを保守します。

フェールセーフセットとフェールオーバーグループのトポロジ
DDR に適した SQL Server データベースに対する各データパーティションのマッピング
すべてのデータベース、SQL Server が動作しているすべてのサーバー、および自動フェールオーバーとリアルタイム DDR 用のすべてのフェールセーフセットの現在の状態

スケールアウト管理レイヤは、データベースサーバーのパーティション分割とフェールオーバートポロジに関する構成ファイルを読み込んで、その内容を専用の SQL Server データベースに保存し、それに従ってサーバーを構成します。また、フェールオーバー操作に関するサーバーの状態を監視して、DDR 用のパーティションマッピングを維持します。

さらに、このアプリケーションは、高可用性ソリューションとしてレプリケーションを使用したシステムのスケールアウトに対する共通のシステム保守操作のために、次のような管理インターフェイスを提供します。

データベースの昇格。ワークロードをリダイレクトし、プライマリデータベースからセカンダリデータベースへのレプリケーションを確立することによって、セカンダリデータベースをプライマリデータベースに変換します。
データベースの降格。プライマリデータベースをセカンダリデータベースに変換します。これによって、レプリケーションキューがクリアされ、そのデータベースに対するレプリケーションが中断します。これがフェールセーフセット内のプライマリデータベースの場合は、適切なセカンダリデータベースが昇格されます。
データベースを "オフライン" としてマーキング。クライアントアプリケーションのデータベースへの問い合わせを拒否し、すべてのレプリケーションプロセスを中断します。これがプライマリデータベースだけの場合は、適切なセカンダリデータベースが昇格されます。
データベースを "オンライン" としてマーキング。このデータベースに対するレプリケーションプロセスを再開します。
データベースを "修復が必要" としてマーキング。レプリケーションキューをクリアし、データベースに対するレプリケーションを中断します。これがプライマリデータベースの場合は、セカンダリデータベースが昇格されます。
データベースの修復。データベースをオフライン状態にしてから、バックアップ処理または復元処理によって修復するようにマーキングされたデータベースを再構成します。
サーバーを "オフライン" としてマーキング。サーバー上のすべてのデータベースが "オフライン" としてマーキングされます。
サーバーを "オンライン" としてマーキング。サーバー上のすべてのデータベースが "オンライン" としてマーキングされます。

MSN スケールアウト管理レイヤのコードは、Microsoft 以外では使用できませんが、.NET Framework、分散管理オブジェクト (DMO : Distributed Management Objects)、および Transact-SQL に対する SQL Server のプログラミングサポートを利用してこれらの機能を実装することができます。

次のセクションでは、システムがスケールアウトの問題を克服する方法、特に、管理容易性と高可用性について説明します。

データとワークロードの増加に対応するためのスケールアウト

スケールアウト管理レイヤの機能を活用する CSP アーキテクチャにより、データの自然増加とクライアントリクエストの増加に対処できます。データは、全データセットの一部を保持している複数のパーティション間で分割されます。パーティションは、高可用性を維持するために別々のサーバー上に配置されたスケールアウト管理レイヤを使用するフェールセーフセット上でホストされます。

新しいレコードがシステムに追加されると、クライアントのリクエスト数および SQL Server が動作しているバックエンドサーバーの CPU 使用率が上昇します。サーバーのフェールオーバーに対応するために、すべてのバックエンドデータベースサーバーのリソース使用率の最大運用指針が設けられています。図 2 に示した最も単純な設計に対する上限は 50% です。この上限を超えたときに、CSP は新しいデータベースサーバーを追加する必要があると判断します。これは、新しいフェールオーバーグループを追加することで解決できます。

開発中の MSN CSP では、最新のフェールオーバーグループ設計が採用されています。図 3 に示すように、サーバーリソースの有効利用を可能にするために、Server 1 上のプライマリデータベースが、Server 2、Server 3、Server 4、および Server 5 にレプリケーションされる 4 つのデータパーティションをホストします。Server 1 に障害が発生すると、Server 2、Server 3、Server 4、および Server 5 が、Server 1 が担っていた負荷の 25% ずつをそれぞれ引き受けます。図には示していませんが、グループ内の他のサーバー上のすべてのプライマリデータベースが同様にレプリケーションされます。この構成によって、1 台のサーバーに障害が発生しても、セカンダリサーバーの負荷が 80% * 25% = 20% しか増えないため、すべてのサーバー上のリソースの最大 80% を使用することができます。実際には、運用チームは多少の余裕を見て上限を 75% に設定します。

図 2 に示したフェールオーバーグループは、リソース使用の上限を 50% に設定した最も単純な設計になっています。フェールオーバーグループ内のパーティション数とサーバー数を増加させると、この上限を上げることができますが、その代わりに管理がより複雑になります。

Cc966448.scddrtng03(ja-jp,TechNet.10).gif

図 3 開発中の MSN CSP で採用されているフェールオーバー グループ アーキテクチャ

拡大表示する

フェールオーバーグループの追加

新しいフェールオーバーグループは、スケールアウト管理レイヤインターフェイスを使用してシステムに追加することができます。フェールオーバーグループが追加されると、DDR とフェールオーバートポロジ用のスケールアウト管理レイヤにある構成データベース内の情報が更新されます。新しいアカウントが要求されると、LPS サーバーがバックエンドデータベースサーバー全体のデータ分割を調べ、新しいフェールオーバーグループが追加されていれば、新しいアカウントが新しいグループに自動的に追加されます。図 4 は、フェールオーバーグループの追加前後のシステムの DDR と高可用性アーキテクチャを示したものです。実際の実行結果の詳細については、このホワイトペーパーのパイロットスタディで説明します。

Cc966448.scddrtng04(ja-jp,TechNet.10).gif

図 4 フェールオーバー グループの追加

拡大表示する

負荷分散

ノード追加後のデータベースサーバーの再負荷分散は、段階的な方法で自動的に実施されます。新しいアカウントが作成されると、LPS サーバーは各データベースサーバーの負荷を評価して、最も余裕のあるサーバーにそのアカウントを追加します。新しいデータベースサーバーは、データベースサーバー負荷のヒューリスティックな指標を使用して、自身の負荷が既存のデータベースサーバーと同じレベルに到達するまで、新しいユーザーアカウントとそれに伴うワークロードを引き受けます。これによって、フェールオーバー中の応答時間やパフォーマンスを犠牲にすることなく、全体のスループットがノード数に比例して増加するスムーズなスケールアウトが保証されます。

高可用性

MSN CSP に関するデータベースのアップタイム要件は、読み取りに対しては 100% です。使用環境がインターネット上に存在すると仮定した場合は、書き込みアクセスに対して年間 10 分のダウンタイムが許容されます。CSP は、2 年間の運用において、この目標を 100% 達成しました。

スケールアウトデータベース設計を使用した高可用性には、長所と短所があります。サーバーの台数が増加すれば、単一システムに障害が発生する可能性も高くなります。ただし、データセット全体をホストしている単一サーバーの障害と比較して、影響を受けるデータは少量です。スケールアウト管理レイヤは、RAID や冗長な電源装置などのさまざまなハードウェアフェールセーフメカニズムと連動する MSN CSP のレプリケーションベースのフェールセーフセットに対して、展開と管理用の基盤を提供します。

高可用性ソリューションとしてのレプリケーション

CSP は、SQL Server のトランザクションレプリケーションを使用して、短い待ち時間とトランザクションの一貫性という保証を提供することによって、高可用性を実現します。ハードウェア、オペレーティングシステム、SQL Server プライマリインスタンスのいずれかが障害発生または保守のためにダウンした場合は、セカンダリコピーがワークロードを引き受けます。CSP は、プライマリとセカンダリの両方を同時に読み書きするようには設計されていないため、セカンダリコピーはフェールオーバーのためだけに使用されます。同時に読み書きしない理由として、次の 2 つがあります。

アプリケーションの設計がかなり複雑になります。プライマリとセカンダリ間の双方向のレプリケーションを実施する必要があります。
同じノード上に、セカンダリコピーと別のデータセットパーティションのプライマリコピーが共存します。セカンダリデータベースからの読み取り時に、プライマリデータベースからのリソースが使用されます。

トランザクションレプリケーションは、トランザクションログを使用して、パブリッシュされたテーブル内のデータに対して行われた増分変更をキャプチャします。Microsoft® SQL Server™ 2000 および 2005 は、INSERT、UPDATE、DELETE の各ステートメントまたはデータに対して行われたその他の変更を監視して、信頼できるキューとして動作するディストリビューションデータベースにそれらの変更を保存します。その後、変更は、サブスクライバに転送され、サブスクライバデータベースへの接続をオープンして、サブスクライバデータベースに SQL コマンドを発行することによって、発生した順に適用されます。

読み取りトランザクションの割合よりも書き込みトランザクションの割合の方が高いアプリケーションでは、レプリケーションがトランザクション処理よりも遅れる可能性があります。基本的には、レプリケーションコマンドの実行速度によって制限されます。一般的な制限要因として、ネットワーク待ち時間、サブスクライバデータベース上のインデックスオーバーヘッド、およびコマンドを実行しているサブスクライバへの接続数が挙げられます。ソースシステムの 1 秒間のトランザクション数がシステムのレプリケーション能力を上回った場合は、レプリケーション待ち時間はトランザクション負荷が減少するまで上昇を続けます。トランザクションレプリケーション待ち時間用のパフォーマンスカウンタ (\SQL Server: Replication dist.\ Dist: Delivery Latency) を使用して、キューの増加を監視することができます。

プライマリシステムに障害が発生すると、レプリケーションキュー内のトランザクションが失われます。トランザクション消失の許容レベルは、ビジネスニーズと、必要なエンドユーザーエクスペリエンスによって異なります。CSP の場合、設計上の上限は 10 分です。つまり、CSP クライアントアプリケーションは、データベースに対する書き込みリクエストの最大 10 分間の消失を許可します。このことは、サービスレベル契約 (SLA) がデータの消失を許可していない他のアプリケーションでは受け入れられない可能性があります。この場合は、別の高可用性ソリューションが必要になります。

レプリケーションの障害を回避するには、次のようにいくつかの方法があります。

データとワークロードをより多くのサーバーコンピュータに展開し、ディストリビュータ単位のワークロードを削減します。ただし、この方法ではハードウェアが十分に活用されない可能性があります。CSP では、この方法を採用しています。
SQL Server が動作しているサーバーごとにディストリビュータが 1 つずつしかないため、複数の SQL Server インスタンスを使用して、各サーバーのディストリビュータを増加させます。元のワークロードをこれらのインスタンス全体に展開することによって、各サーバーの増加したディストリビュータでレプリケーション負荷を処理できます。この方法では、サーバーを追加する必要はありませんが、CPU やメモリなどのハードウェアリソースをインスタンス間で割り当てるための管理を追加する必要があります。複数インスタンスの実行に関するベストプラクティスについては、『SQL Server Consolidation on the 32-Bit Platform using a Clustered Environment』(英語) を参照してください。
Microsoft SQL Server 2005 は、レプリケーションの並列処理をサポートし、またパブリッシャに対する場合と同じ順序でトランザクションがサブスクライバに対して処理されることを保証します。このホワイトペーパーを執筆している時点では SQL Server 2005 がリリースされていないため、この機能はまだ CSP の開発サイトに導入されていません。
SQL Server 2000 上に複数のパブリケーションを作成し、個別のエージェントオプションを使用して、並列処理を増加させます。この方法の場合、トランザクションは、パブリッシャに対するときと同じ順序でサブスクライバに対して処理されるとは限りません。したがって、パブリッシュされたデータセット間のトランザクションの整合性が保証されないことになり、CSP チームではこの方法は採用しませんでした。

MSN CSP 運用チームが、各ノード上のクライアントリクエストのストレスレベルを監視します。アカウントの数やサイズが増加すると、ノードごとのクエリの数も増加します。ストレスレベルがしきい値に達すると、別のフェールオーバーグループがシステムに追加されます。

システム障害の検出とフェールオーバー

MSN スケールアウト管理レイヤは、すべてのノードの状態を監視します。サーバーまたはデータベースの障害が検出されると、ワークロードトラフィックをセカンダリデータベースにリダイレクトして、障害が発生したパーティション用にセカンダリデータベースを昇格させます。

Web サーバーアプリケーションが、スケールアウト管理レイヤにある構成データベース上の情報に基づいて、バックエンドデータベースに対する接続を確立します。そして、処理中の正しい物理データベースインスタンスに対してリクエストを生成します。SQL Server からのリターンコードで、接続の問題を判断できます。接続タイムアウトも障害として扱われます。Web サーバーが、MSN スケールアウト管理レイヤのクライアントを起動して、これにより管理レイヤに障害を通知します。管理レイヤは、障害が発生したデータベースをブラックリストに載せ、瞬時にその Web サーバーをバックアップにリダイレクトします。

システムの保守

前述したように、システム管理では、システムのスケールアウト固有の課題があります。MSN CSP のような OLTP システムの場合は、共通ルーチン管理タスクとして、OS やアプリケーションの更新プログラム、ノードの追加、データベースのバックアップ、およびインデックスの最適化が含まれます。これらのタスクでは、データの有効性とワークロードパフォーマンスに対する影響を最小限に抑える必要があります。いくつかのタスクは、データベースをオフラインにしなくても実行できますが、それ以外のタスクは、オフラインで処理するか、サーバー全体をダウンさせる必要が生じることもあります。ここでは、MSN CSP がスケールアウト管理レイヤの管理操作を使用して、これらすべての共通管理タスクにおいて、どのようにアプリケーションの可用性を維持しているかを説明します。

インデックスの最適化と再構築

高可用性 SLA を満たすためには、一般に、データベースをオフラインにしなければならないインデックスの再構築 (DBCC REINDEX) よりも、オンラインによるインデックスの最適化 (DBCC INDEXDEFRAG) の方が好まれます。MSN CSP の運用チームは、クライアントのリクエストが最も少ない毎週土曜日の夜に、DBCC INDEXDEFRAG ジョブを実行します。インデックスの再構築は、それほど頻繁ではありませんが、6 ～ 8 週間ごとに、断片化が 40% まで増加したときにだけ実施されます。インデックスが再構築された後は、ワークロードのスループットが 5 ～ 10% 改善されます。インデックスの断片化の測定方法と削減方法については、『Microsoft SQL Server 2000 インデックスの最適化に関するベストプラクティス』を参照してください。

後述のパイロットスタディのテストで説明しますが、スケールアウト管理レイヤを使用すると、アプリケーションの可用性に影響を与えずにオフラインインデックス再構築を実現することができます。

データベースの修復

ハードウェアの障害やオペレータの誤操作によって、データベースが破損することがあります。プライマリデータベースが破損した場合は、スケールアウト管理レイヤの自動フェールオーバー操作によって、ワークロードがセカンダリコピーにリダイレクトされます。破損したコピーを復元するために、スケールアウト管理レイヤは次のように動作します。

データベースを "修復が必要" としてマーキングします。
データベースに対して "修復" 処理を実行し、データベースをオフライン状態にして、プライマリデータベースをバックアップし、それを修復が必要としてマーキングされたデータベースに復元します。
プライマリデータベースと新しく復元されたセカンダリデータベース間の待ち時間が目標レベル (10 分) まで下がってから、修復されたデータベースを "オンライン" としてマーキングします。

これで、オペレータの判断によって、このデータベースをプライマリに昇格させることも、またセカンダリの役割を継続させることもできます。

OS または SQL Server の修正プログラム

修正プログラムの中には、システムの再起動や SQL Server サービスの再起動を必要とするものがあります。このような場合は、次のように MSN スケールアウト管理レイヤを使用して、ノードをいったんオフラインにしてから、オンラインに戻す必要があります。

サーバーを "オフライン" にマーキングします。
サーバーに修正プログラムを適用します。
サーバーを "オンライン" にマーキングします。2 つのコピー間でレプリケーションが再開され、同期化されます。
対になっている降格と昇格の役割を入れ替えて、手順 1 ～ 3 を繰り返します。
対になっている降格と昇格の役割を入れ替えて、元の構成に戻します。

SQL Server 2005 における MSN CSP のパイロットスタディ

最も単純なフェールセーフセットを使った小規模な MSN CSP を SQL Server スケーラビリティテストラボ内に展開しました。このパイロット環境によって、テストの実施、異なる構成の試行、さまざまなスケーラビリティデータポイントの設定が可能になりました。パイロットラボ展開は、12 台のクライアント、3 台の Web サーバー、2 台の LPS サーバー、4 台のバックエンドデータベースサーバー、および 1 台のスケールアウト管理レイヤ用管理サーバーで構成されています。3 台の Web サーバーは、負荷分散用のスイッチを介してネットワークに接続されます。すべてのデータベースサーバーのデータファイルとログファイルは、I/O の負荷分散とフェールオーバーを提供するために、各サーバーにインストールされた 2 枚の Emulex 製ホストバスアダプタを介して EMC Clariion SAN 上の同じグループのディスクに格納しました。ハードウェア構成の詳細については、「付録 A」を参照してください。

ノードの追加に伴うスループットの増加

図 5 は、テストにおいて、すべてのバックエンドデータベースサーバーによって処理されたクエリの総数が、バックエンドデータベースサーバーの台数に比例して増加するようすを示したものです。このグラフは、顧客がアプリケーションのスケールアウトを選択する理由を明らかにしています。つまり、顧客はノードの追加に比例してパフォーマンスが向上することを期待しています。さらに、この線形スケーリングは、MSN CSP チームが、ユーザー基盤の拡大に合わせて、自分たちのアプリケーションを現在の 100 台のバックエンドサーバーのサイズにまで拡張できたこと、および、必要に応じて 100 台を超えるサイズにまで拡張できることの理由の 1 つでもあります。

Cc966448.scddrtng05(ja-jp,TechNet.10).gif

図 5 ワークロード パフォーマンスのスケーリングとバックエンド データベース サーバーの台数の関係

拡大表示する

ストレージサブシステムの拡張

以下に示す理由から、直接接続ストレージ (DAS : Direct Attached Storage) ではなく、ストレージエリアネットワーク (SAN : Storage Area Network) を選択しました。

管理の一元化
サーバーを追加せずにストレージが追加できることによる柔軟性とスケーラビリティの向上
ストレージリソースを追加または再配置するときの業務の継続性
SAN によるハードウェアレベルの高可用性ソリューション

SAN の潜在的な欠点として、次のことが挙げられます。

SAN は DAS よりもかなり高価である
管理するために専門知識が必要である

サーバーを追加することによって、ディスクの待ち時間が増加し、ディスクサブシステム上のパフォーマンス障害に至るおそれがあります (パフォーマンスカウンタの Logical Disk/Avg. Disk sec/[Read,Write] で監視できます)。これは、ディスク領域の不足とは別の問題です。EMC Clariion を含め、一部の SAN ベンダは、オンラインディスク LUN 拡張をサポートしています。テストの一環として、バックエンドデータベースサーバーが使用可能な物理スピンドルの数を意図的に制限することによって、EMC Clariion SAN におけるディスクサブシステムのパフォーマンス障害シミュレーションを行いました。

Microsoft Windows Server 2003 は、ストライプセット全体を再構築するのではなく、新しいスピンドルを LUN に連結させるために使用可能なオンラインディスク拡張機能を提供します。EMC Clariion は、ディスクレベルのデータのコピーと移動によって、ストライプセット全体を再構築する機能を提供します。ここで使用するアプリケーションは、EMC アプローチによって、次のような恩恵を受けることができます。

ストライプの再構築によって、データがより均一に物理スピンドルに分配され、LUN 全体のパフォーマンスが向上します。
ディスクサブシステム構成の柔軟性が向上します。たとえば、LUN のサイズを変えずにスピンドル数を増やし、他のデータベースに新しい容量を割り当て、またスピンドル上に余分な領域があるときにスピンドル数を増やさずに LUN の容量を増やすことができます。
操作が OS に対して透過的であるため、ベーシックディスクとダイナミックディスクの両方で実行することができます。

テストでは、2 つのバックエンドデータベースノードからスタートし、後から 2 つのノードを追加して、データベースファイル用に同じグループの物理スピンドルを共有しました。2 つのノードを追加した後、ワークロードのストレスレベルが 2 倍になりました。それに応じて、ディスクキューが増加し、同様にディスク待ち時間も増加しました。ワークロードパフォーマンスは I/O バウンドでした。図 6 の赤い線は、ノードが 2 つから 4 つになってもワークロードの増加がそれに比例しないことを示しています。

メモ実稼動環境では、ワークロードが増加する前に LUN を拡張することをお勧めします。これによって、新しいスケールアウトデータベースサーバーを追加する前に、実稼動環境のパフォーマンスに影響を与えずに、ストレージを拡張して再配分することができます。

EMC は、SAN の LUN 拡張処理に対して、3 つの優先順位レベルを設定しています。テストでは、既定の設定 (下位の優先順位) を採用しました。この設定では完了までに時間はかかりますが、拡張の際のディスク処理が最小限に抑えられることで、同時に発生したワークロードに対する影響も最小限に抑えられます。

	拡張前	拡張後
データの総容量	320 GB	320 GB
ログの総容量	200 GB	200 GB
データ用のスピンドル数	24	32
ログ用のスピンドル数	16	24
ワークロードの拡大/縮小率	1.6	2.0

表 2 ** LUN** 拡張前後の EMC Clariion SAN の比較

表 2 は、LUN 拡張前後の EMC Clariion SAN のディスク構成を示したものです。LUN サイズを変えずに LUN 単位のスピンドル数を増やしていることに注意してください。プロセス全体で 44 時間かかりましたが、ワークロードへの影響はほとんどありませんでした。優先順位が中位または上位の拡張処理を使用すると完了までの時間は短縮されますが、ワークロードに対する影響は大きくなります。同じ優先順位設定にした場合、処理時間は再構成されるディスク領域に比例します。

図 6 は、拡張後に I/O 障害が解消され、ワークロードパフォーマンスが線形スケーリングのレベルにまで回復したようすを示したものです。

Cc966448.scddrtng06(ja-jp,TechNet.10).gif

図 6 ディスク I/O を拡張した場合としない場合のワークロード パフォーマンスのスケーリング

拡大表示する

高可用性ソリューションとしてのレプリケーション

前述したように、スケールアウト管理レイヤとレプリケーションの組み合わせによって、優れた高可用性ソリューションが実現します。1 つの欠点は、SQL Server 2000 でのトランザクションレプリケーションが単一のスレッドに制限されることで、そのため、MSN CSP は使用可能なサーバーリソースを有効利用することができません。

この問題は、SQL Server 2005 ではレプリケーションの並列ストリーミングによって解決されます。ディストリビュータは、トランザクションの順序が完全に保証された複数のストリーム (1 ～ 64) でレプリケーションコマンドを処理することができます。最適のストリーム数とパフォーマンスは、次のような複数の要因に応じて変化します。

CPU 数。ストリーム数は、CPU 数以下にすることをお勧めします。テストの結果、4 プロセッサコンピュータで 64 ストリームのレプリケーションを使用すると、CPU 使用率が大幅に上昇し、ストリーム数が 1 ～ 2 のスループットに匹敵することがわかりました。
ブロック操作。トランザクションがテーブル上で重複すると、ストリームが互いをブロックする可能性があります。CSP のトランザクションワークロードによって発行される書き込みアクセスリクエストは、ほとんどランダムに巨大なテーブル全体に分配されるため、それぞれには数行しか含まれません。そのため、パイロットテストでは、使用するレプリケーションのストリーム数が 4 以下であれば、ブロック操作は問題になりませんでした。
CPU の余力。ストリームを追加すると CPU 使用率が上昇するため、CPU の能力に余裕を持たせておく必要があります。
一定時間内のレプリケーションコマンド数。レプリケーションキューを指定時間内にクリアできれば、余分なストリームを実行する必要がなくなります。

図 7 と図 8 は、テストにおいて、レプリケーションストリーム数が増加した場合に、レプリケーションのスループット指標 (1 秒間に発行されたレプリケーションコマンド数) が大幅に増加したことを示しています。ストリームを追加するたびに CPU 使用率が 1 ～ 2% 上昇します。

図 7 レプリケーションのスループットとストリーム数の関係

図 7 レプリケーションのスループットとストリーム数の関係

図 8 CPU 使用率とレプリケーションストリーム数の関係

図 8 ** CPU** 使用率とレプリケーション ストリーム数の関係

DBMS の保守

次の 3 つの処理をテストした結果、アプリケーションと管理の適切な設計によって、アプリケーションの可用性への影響を最小限に抑えられることが実証されました。

フェールオーバーグループの追加
インデックスの最適化
SQL Server のメジャーバージョンアップグレード

フェールオーバーグループの追加

これは、新しいフェールオーバーグループをスケールアウト管理レイヤの構成ファイルに追加して、ハードウェア構成、OS、および SQL Server インスタンスを新しいコンピュータ上にセットアップすることで実現しました。その後で、スケールアウト管理レイヤが、スキーマ、ストアドプロシージャ、およびレプリケーションを含むデータベースを新しい SQL Server インスタンス上にセットアップしました。また、図 4 に示したように、スケールアウト管理レイヤが LPS サーバー上のパーティションマッピングと DDR 情報を更新し、新しく使用可能になったパーティションを反映させました。これ以降、Web サーバーからのリクエストは、新しい DDR 情報に基づいて、既存のサーバーと新しいサーバーの両方に転送されるようになりました。

インデックスの最適化

挿入 (insert) コマンドと更新 (update) コマンドを大量に実行するデータベースアプリケーションでは、データベースインデックスファイルの断片化が発生し、特定のワークロードに対するパフォーマンスが低下する可能性があります。最適な I/O パフォーマンスを維持するためには、最終的には最適化の実行が必要です。インデックスの最適化とそのベストプラクティスについては、『Microsoft SQL Server 2000 インデックスの最適化に関するベストプラクティス』を参照してください。

SQL Server 2000 は、インデックスを最適化するために、DBCC INDEXDEFRAG と DBCC REINDEX の 2 つのオプションを提供しています。DBCC REINDEX は、断片化レベルが高く、複数のプロセッサが使用可能な場合に、DBCC INDEXDEFRAG よりもかなり早く動作します。ただし、SQL Server 2000 では、データベースをオフラインにしてから、インデックスを再構築する必要があります。SQL Server 2005 では、この 2 つのコマンドがそれぞれ、ALTER INDEX <テーブル> REORGANIZE と ALTER INDEX <テーブル> REBUILD WITH (OFFLINE) に置き換わっています。テストラボでは、スケールアウト管理レイヤを使用して、次の手順で、オフラインインデックス再構築を実施しました。

セカンダリコピーを "オフライン" としてマーキングします。
ALTER INDEX <テーブル> REBUILD WITH (OFFLINE) を実行して、セカンダリコピー上のすべてのインデックスを再構築します。
データベースを "オンライン" にマーキングします。2 つのコピー間でレプリケーションが再開され、同期化されます。プライマリデータベースと新しく復元されたセカンダリデータベース間の待ち時間が許容レベル (10 分) に達するまでに 20 分かかりました。前述したように、プライマリデータベースに障害が発生した場合は、SLA に基づいて、トランザクションの消失が許容されます。
対になっている降格と昇格の役割を入れ替えて、新しいセカンダリコピー上で手順 1 ～ 3 を繰り返します。
元のプライマリを最適化してから、対になっている降格と昇格の役割を入れ替えて、元の構成に戻します。

Microsoft® SQL Server™ 2005 Beta 2 では、オンラインインデックス操作という新しい機能を使用して、オンラインでインデックスの作成、再構築、および削除を行うことができます。ONLINE オプションを使用すると、インデックス操作中に、元になるテーブルまたはクラスタ化インデックスデータと、関連する非クラスタ化インデックスへのユーザーの同時アクセスが可能になります。テストでは、次の SQL Server コマンドを実行して、テーブルのすべてのインデックスをオンラインで再構築しました。

ALTER INDEX ALL ON <table> REBUILD WITH (ONLINE, MAXDOP = degree of 
parallelism desired)

インデックス再構築の並列処理の程度は、手順 1 ～ 4 で設定しました。各サーバーには、4 基の CPU が搭載されています。平均 20% の論理スキャンフラグメンテーションと標準的なストレスレベルの並列ワークロードで、3 種類の方法を使用して、55 GB のデータに対するインデックスの最適化をテストしました。ワークロードのストレスレベルは、CPU の 52% を消費するように調整され、プライマリデータベース上のトランザクション数は 286 でした。すべてのテーブルに対して、ALTER INDEX <テーブル> REORGANIZE を実行した結果、MAXDOP の値によって、オンラインインデックス再構築に CPU が大幅に消費されましたが、CPU 使用率の増加は最小限に抑えられました。MAXDOP を高く設定した場合のオンラインインデックス再構築は、ワークロードパフォーマンスに影響を与える可能性があります。オフラインインデックス再構築は、オンラインでの処理よりもはるかに高速です。オンラインインデックス再構築は、実際の時間は MAXDOP に依存しますが、オンライン ALTER INDEX <テーブル> REORGANIZE よりも高速です。高可用性環境において、操作の完了に要する時間をある程度は許容できるときは、多くの場合、オフラインインデックス再構築よりもオンラインインデックス再構築の方が選択されます。オンラインインデックス再構築とオンライン ALTER INDEX <テーブル> REORGANIZE のどちらを実行するかは、主として、次の 3 つの要因によって決まります。

ワークロードのストレスレベル。ALTER INDEX <テーブル> REORGANIZE は、現在のストレスレベルに応じてリソース使用率を下げることができます。
処理の実行頻度。規模を縮小する場合は、ALTER INDEX <テーブル> REORGANIZE の方が完了までに時間がかかります。
断片化の特性。ALTER INDEX <テーブル> REORGANIZE は、インターリーブされたエクステントをデータファイル内に残します。また、ALTER INDEX <テーブル> REORGANIZE は、インデックス上のエクステントの断片化を修正しません。インデックスのエクステント (8 枚のインデックスページをグループ化したもの) がデータファイル内で連続していないときにインターリーブが発生し、ファイル内で混ざり合った 1 つまたは複数のインデックスからエクステントが削除されます。

SQL Server のオンラインアップグレード

どのようなデータセンターであっても、DBMS のバージョンアップは困難な作業です。ここで、ダウンタイムを発生させずに SQL Server のアップグレードを実施する方法を紹介します。このオンラインでのローリングアップグレードは、MSN CSP のような高度なアプリケーション管理レイヤでのみ実現することができます。

2 台のバックエンドデータベースサーバーのフェールオーバーグループを、次の手順で SQL Server 2000 から SQL Server 2005 にアップグレードしました。

バックエンドデータベースに対して、SQL Server Best Practices Analyzer (BPA) を実行します。このツールによって、互換性の問題が特定され、修正されます。BPA はすべての関連ドキュメントと共に、Microsoft Download Center (英語) からダウンロードできます。この目的での BPA ツールの使用方法は、変更される可能性があります。
Server 1 をオフラインとしてマーキングします。Server 1 上の Partition #1 のプライマリデータベースが降格され、Server 2 上の Partition #1 のセカンダリデータベースが昇格されます。Server 1 にある両方のデータベースに対するレプリケーションプロセスが中断されます。Partition #1 と Partition #2 のすべてのワークロードが Server 2 に向けられます。
Server 1 で SQL Server 2005 のアップグレードを実行します。これには、30 分かかりました。
アップグレード後に、スケールアウト管理レイヤの管理コンソールを使用して、Server 1 をオンラインに戻します。レプリケーション待ち時間が目標値 (10 分) に到達するまで、47 分かかりました。
Server 2 に対して手順 2 ～ 4 を繰り返します。Partition #1 と Partition #2 のすべてのワークロードが Server 1 に向けられます。
Server 1 と Server 2 の間でワークロードのバランスが保たれるように、昇格と降格が行われ、プライマリコピーとセカンダリコピーの元の分散状態が復元されます。

この処理全体で 3 時間を要しましたが、システムの可用性を損なわずに実行することができました。

まとめ

このホワイトペーパーでは、データベースアプリケーションのスケールアウトのメリットと問題点について説明しました。実際の顧客アプリケーションである MSN コミュニケーションサービスプラットフォーム (CSP) を使用してテスト環境でさまざまなシナリオを実行し、データ依存型ルーティングを使用すると、パフォーマンスを直線的に向上させながらデータとワークロードの増加に対処できること、SQL Server トランザクションレプリケーションによる高可用性を実現できること、およびオンラインシステム保守を実施できることを実証しました。この結果により、SQL Server を使用すると、エンタープライズクラスのアプリケーションの適切な管理とスケールアウトを実現できることが明らかになりました。

詳細情報

付録 A : ハードウェア構成

コンピュータ構成

コンピュータの役割	モデル	CPU	物理メモリ	ストレージ	OS バージョン	アプリケーション
データベースサーバー (4)	Dell 6650	2 GHz Xeon x 4	8 GB	ストレージエリアネットワーク (SAN : Storage Area Network)(「SAN 構成」を参照)	Windows Server 2003 Enterprise Edition	SQL Server 2005 Beta 2
LPS サーバー (2)	Dell 6650	2 GHz Xeon x 4	8 GB	直接接続 SCSI ディスクアレイ 146 GB x 5	Windows Server 2003 Enterprise Edition	SQL Server 2005 Beta 2
Web サーバー (3)	Dell 2650	2.4 GHz Xeon x 2	4 GB	ローカルディスク	Windows Server 2003 Enterprise Edition	IIS 6.0
スケールアウト管理レイヤサーバー	Dell 2650	2.4 GHz Xeon x 2	4 GB	ローカルディスク	Windows Server 2003 Enterprise Edition
Web クライアント (12)	Dell 1650	1.4 GHz Pentium III x 2	2 GB	ローカルディスク	Windows Server 2003 Standard Edition

表 3 コンピュータ構成

SAN 構成

EMC Clariion CX600
ディスク速度 : 10,000 RPM
ディスクサイズ : 146 GB
各バックエンドサーバーは、PCI-X が動作している 2 枚の HBA (「ホストバスアダプタ (HBA)」を参照) を介して、2 Gbps の Switched SAN に接続されています。

表 4 は、スケーラビリティテストにおける 4 台のデータベースサーバーのディスクレイアウトを示したものです。

ファイルグループ	拡張前のディスクアレイレイアウト	拡張後のディスクアレイレイアウト
ログと tempdb の RAID グループ	合計で 16 ディスク (RAID 10)。サーバーごとに 8 LUN (25 GB ずつ)。	合計で 24 ディスク (RAID 10)。サーバーごとに 8 LUN (25 GB ずつ)。
データ RAID グループ	合計で 24 ディスク (RAID 10)。サーバーごとに 8 LUN (40 GB ずつ)。	合計で 32 ディスク (RAID 10)。サーバーごとに 8 LUN (40 GB ずつ)。

表 4 データベース サーバーのディスク レイアウト

図 A-1 と図 A-2 は、バックエンドサーバーが 2 台から 4 台に拡張された結果、ストレージ構成が変化したことを示したものです。

Cc966448.scddrtngA1(ja-jp,TechNet.10).gif

図 A-1 ** 2** 台のサーバーのディスク レイアウト

拡大表示する

Cc966448.scddrtngA2(ja-jp,TechNet.10).gif

図 A-2 ** 4** 台のサーバーに対応するためのディスク グループの拡張

拡大表示する

ホストバスアダプタ (HBA)

Emulex LP9802 Host Bus Adapter
バス速度 : 133/100/66 MHz
リンク速度 : 2 Gbps ファイバーチャネル

データ依存型ルーティングを使用した SQL Server のスケール アウト

トピック

はじめに

対象読者

スケール アウトを選択する理由

データ依存型ルーティング

スケール アウトに関する課題

MSN コミュニケーション サービス プラットフォーム (CSP)

MSN スケール アウト管理レイヤ

データとワークロードの増加に対応するためのスケール アウト

フェールオーバー グループの追加

負荷分散

高可用性

高可用性ソリューションとしてのレプリケーション

システム障害の検出とフェールオーバー

システムの保守

インデックスの最適化と再構築

データベースの修復

OS または SQL Server の修正プログラム

SQL Server 2005 における MSN CSP のパイロット スタディ

ノードの追加に伴うスループットの増加

ストレージ サブシステムの拡張

高可用性ソリューションとしてのレプリケーション

DBMS の保守

フェールオーバー グループの追加

インデックスの最適化

SQL Server のオンライン アップグレード

まとめ

詳細情報

付録 A : ハードウェア構成

コンピュータ構成

SAN 構成

ホスト バス アダプタ (HBA)

その他のリソース

データ依存型ルーティングを使用した SQL Server のスケールアウト

スケールアウトを選択する理由

スケールアウトに関する課題

MSN コミュニケーションサービスプラットフォーム (CSP)

MSN スケールアウト管理レイヤ

データとワークロードの増加に対応するためのスケールアウト

フェールオーバーグループの追加

SQL Server 2005 における MSN CSP のパイロットスタディ

ストレージサブシステムの拡張

フェールオーバーグループの追加

SQL Server のオンラインアップグレード

ホストバスアダプタ (HBA)