パフォーマンスと容量の計画 (FAST Search Server 2010 for SharePoint)

 

適用先: FAST Search Server 2010

トピックの最終更新日: 2015-03-09

この記事では、パフォーマンスおよび容量に関する全般的な推奨事項を説明します。これらの推奨事項に従って、Microsoft FAST Search Server 2010 for SharePoint トポロジのパフォーマンスおよび容量に関する諸特性を決定してください。

このセクションの内容

  • コンテンツ ボリュームの容量設計

  • コンテンツ供給の容量設計

  • クエリ パフォーマンスの設計

  • 複数の SharePoint ファームへのクエリ供給

  • 機能のパフォーマンス効果

  • FAST Search Server のパフォーマンスおよび容量テストの結果と推奨事項

FAST Search Server のパフォーマンスおよび容量テストの結果と推奨事項

FAST Search Server 2010 for SharePoint のパフォーマンスおよび容量に関する追加的な情報が記載されたホワイト ペーパーをダウンロードできます。これには、Microsoft によって行われたテストの詳細も記されています。主な内容は次のとおりです。

  • テスト ファームの諸特性

  • テスト結果

  • 推奨事項

  • パフォーマンスとスケーラビリティのトラブルシューティング

このホワイト ペーパーには、インデックス 1 列あたり最高 4,000 万個のアイテムを扱えるように FAST Search Server 2010 for SharePoint を構成する方法も説明されています。

このホワイト ペーパーを読む前に、FAST Search Server 2010 for SharePoint における容量管理の基本的な考え方を必ず理解しておいてください。詳細については、「FAST Search Server ファーム トポロジを計画する (FAST Search Server 2010 for SharePoint)」を参照してください。

ダウンロード可能なホワイト ペーパー:FAST Search Server 2010 for SharePoint Capacity Planning (英語)』(https://www.microsoft.com/downloads/en/details.aspx?FamilyID=65b799e3-825c-4398-8cd7-3311d3297997\&displaylang=en) (英語)

コンテンツ ボリュームの容量設計

一般的なガイドラインですが、インデックスが作成されたアイテム 1,500 万個ごとに 1 つのインデックス列を環境内で展開するように計画してください。この一般的なガイドラインの基本条件は、ファイル共有内の 70% の SharePoint アイテムと 30% ドキュメントについてインデックスが作成され、ソース ドキュメントのサイズは 10 ~ 100 KB というものです。

既定のインデクサー構成では、インデックス列あたりの最大アイテム数は 3000 万です。インデックス列あたりのアイテム数が 1500 万を超えると、インデックス付けとクエリのパフォーマンスに悪影響が現れます。

コンテンツ ボリュームの容量をファームに追加するには、次の 2 つの方法を使用できます。

  • インデックス列を追加する。

    一連の新しいサーバーにインデックス列を追加して、スケール アウトできます。

  • 拡張したコンテンツの容量に最適な設定にする。

    コンテンツが更新される頻度が低く、クエリのボリュームが中程度のシナリオでは、ハードウェアのコストを節約するために列あたりのインデックス付けアイテム数を増やすことをお勧めします。インデクサー構成を変更して、列あたり最大 4000 万アイテムを処理するように設定できます。詳細については、「コンテンツ容量の拡張について (FAST Search Server 2010 for SharePoint)」を参照してください。

インデックス列を追加するときは、「展開オプション (FAST Search Server 2010 for SharePoint)」で概説されているトポロジの推奨事項に従ってください。

重要

多くの画像が取り込まれた PowerPoint プレゼンテーションのようなドキュメントは、ソース ボリュームのサイズを増やすことはあっても、そこに含まれる検索可能なコンテンツはわずかです。このような場合は、検索可能なアイテムのサイズが非常い小さいので、1 列あたりのアイテム数をもっと大きな値で計画してもよいでしょう。

実行中の環境に列を追加するときは、インデックス列のパーティション分割をやり直すためにすべてのコンテンツのインデックスを作り直す必要があります。最初からインデックス列に十分な容量を取るように計画してください。複数の列を含むインデックスを作り直すと、数日かかることがあります。

コンテンツ供給の容量設計

コンテンツ供給チェーンを設計するときは、新規のコンテンツと更新後のコンテンツの検索やインデックス作成のために十分な容量が与えられるようにしなければなりません。設計に際して考慮すべき事項は次のとおりです。

  • コンテンツ検索\uc1\u160 ?\u160 ?\u160 ?これは新規のコンテンツと更新後のコンテンツをシステムに高速で供給できることを意味します。

  • 処理とインデックス作成\uc1\u160 ?\u160 ?\u160 ?これはシステムがアイテムの処理とインデックス作成を効率的に行えることを意味します。

クロールの設計

FAST Search Server 2010 for SharePoint 環境においてコンテンツのクロールは、コンテンツの変更ができるだけ速やかに捕捉されるように調整しなければならない操作の 1 つです。FAST Content SSA はコンテンツ プル方式を採用しており、個々のクロール サイクルの長さによって、インデックス作成の必要なコンテンツの変更が検出されるまでの平均時間が決まります。各自の環境で特定のコンテンツ ソースを使用してテストを行うことでコンテンツのクロールにかかる時間を求め、そのコンテンツのクロールで消費される処理量がユーザー応答時間の目標値に影響しないか判断する必要があります。

FAST Content SSA では、特定のコンテンツ ソースを使用してクロールするコネクタで生成される同時要求数を変更できます。同時要求数の値が大きいほど、クロール速度は速くなります。ここでの目標は、コンテンツ リポジトリで変更が生じた場合にドキュメントのインデックスが必ず作り直されるようにすることです。すべての更新を捕捉できるようにコネクタが設計されている限り、すべてのコンテンツ ソースのクロールに必要な時間を減らしても、アイテムの処理やインデックス作成の負荷が増えることはありません。この場合、FAST Content SSA の容量を増やして得られる唯一の効果はインデックス作成の待機時間が短くなることです。詳細については、「クローラー影響ルールを管理する (FAST Search Server 2010 for SharePoint)」を参照してください。

クロール コンポーネントを追加すれば、Content SSA の規模を拡大できます。詳細については、「Content SSA の複数サーバーの展開 (FAST Search Server 2010 for SharePoint)」を参照してください。

インデックス作成待機時間の容量設計

展開内の全般的なインデックス作成待機時間に影響する主なパラメーターは次の 2 つです。

  • アイテム処理能力。アイテム処理の主なオーバーヘッドは、ドキュメント形式の解析と検索可能なコンテンツやメタデータの抽出に関係しています。コンテンツが大きな PDF や Word ドキュメントのような複雑なドキュメントで構成される場合は、アイテムの処理が環境のボトルネックになることがあります。この場合は、展開内のすべてのサーバーにアイテム処理コンポーネントを配置してください。詳細については、「展開オプション (FAST Search Server 2010 for SharePoint)」を参照してください。

  • インデックス作成能力FAST Search Server 2010 for SharePoint の増分インデックス作成機構によって、新規または更新後のコンテンツのインデックス作成待機時間が低く抑えられています。しかし、インデックスが作成されるアイテムの総数とアイテムの更新率は適当なところでバランスさせる必要があります。

2 ノードの展開で基本ベンチマークを実行して、ボトルネックがどこにあるかを大づかみで把握してください。両方のノードで CPU 負荷の高い状態が続く場合は、アイテムの処理がボトルネックになっている可能性があります。インデックス作成待機時間を短くしたければ、1 列あたりのアイテム数を減らすことをお勧めします。これでアイテムの処理能力が向上し (各ノードがアイテムの処理に寄与する)、インデックスを作り直す時間が短縮され、結果としてインデックス作成待機時間が短縮されます。

クエリ パフォーマンスの設計

クエリ パフォーマンスを設計するとき考慮すべき主なパラメーターは次の 2 つです。

  • 1 秒あたりのクエリ処理数 (QPS: Queries Per Second) のピーク値。ファイアウォールの内側にある検索ソリューションでは、通常、これが制限要因になることはありません。クエリ処理速度のピーク値を 5 QPS より大きくする計画がなければ、この設計パラメーターに関して検索ソリューションの規模拡大を検討する必要はありません。

    QPS を増やす規模拡大とは、展開の検索行を追加することを意味します。詳細については、「検索クラスター」を参照してください。

    高 QPS の展開では、クエリ コンポーネントの追加による Query SSA の規模拡大が必要になることもあります。詳細については、「Query SSA の複数サーバー展開 (FAST Search Server 2010 for SharePoint)」を参照してください。

  • クエリ待機時間。ユーザーがクエリを発行してからクエリの結果が返されるまでの往復の平均的な遅延が、これで決まります。クエリ待機時間を改善する主な方法としては、1 列あたりのアイテム数を増やすこと以外に、1 つまたは複数の追加的な検索行を展開することがあります。こうすれば、インデックス作成の負荷に影響されてクエリ待機時間が長くなることが避けられ、クエリの可用性も向上します。詳細については、「複数の高いレベルの可用性」を参照してください。

複数の SharePoint ファームへのクエリ供給

SharePoint Server 共有サービス アプリケーション フレームワークを使用すると、1 つの親ファームが複数の子ファームにクエリを供給する構成をセットアップできます。子ファームのフロントエンド Web サーバーを親ファームの Query SSA に SSA プロキシ経由で接続します。

機能のパフォーマンス効果

次の表に、FAST Search Server 2010 for SharePoint の検索関連の機能のパフォーマンス効果を要約します。特定の機能の効果は使用状況で変化するので、この表の値は大体の目安と考えてください。この表に掲載されていない機能との相互依存関係もあります。

機能 アイテム処理 インデックス作成 クエリ照合 クエリ処理 RAM - クエリ照合 ディスク アクセス ディスク領域 ネット/IO

詳細な絞り込み条件

M

L

L

H1

L-M2

浅い絞り込み条件

L

H

H3

プロパティ抽出

M

L

トリミングの複製

M

L-H4

フルテキスト並べ替え

L

L

H1

検索語句の強調表示サマリー

M

複合クエリ (多項)

M

M

H

部分文字列検索

L-M5

ステミング

L

L

L

L

スペル チェック

L

L

L

類義語

L

L

L

高ストップワードしきい値6

H

H

H

管理プロパティの昇格6

L

L

L

H=高、M=中、L=低。文字の指定がない項目は、当該機能を使用しないときと同じように、対応するリソースへの効果がほとんどないことを意味します。

メモ:

  1. "詳細な絞り込み条件" と "フルテキスト並べ替え" は、メモリ使用パターンが似ています。クエリ照合コンポーネントは、関連する管理プロパティの集計データをメイン メモリ内に保持します。メモリ使用効果は、1 列あたりのアイテム数と、関連する管理プロパティの重複していない値の個数に比例します。

  2. インデックス内の重複していない値を多数使った文字列の詳細な絞り込み条件は、クエリ照合ノードとクエリ処理ノードの間のインターフェイスによい I/O パフォーマンス効果をもたらします。I/O 負荷のパフォーマンス効果は、ファーム内の列数と QPS に比例します。詳細な絞り込み条件のパフォーマンス チューニングの詳細については、「RefinerConfiguration」を参照してください。

  3. 文字列の浅い絞り込み条件は、クエリ照合ノードとクエリ処理ノードの間のインターフェイスによい I/O パフォーマンス効果をもたらします。I/O 負荷のパフォーマンス効果は、ファーム内の関連する管理プロパティの平均サイズ、列数、および QPS に比例します。ほとんどの場合、クエリを絞り込むときは、詳細な絞り込み条件が推奨されます。

  4. トリミングの複製は、状況によっては、クエリ照合ノードとクエリ処理ノードの間のインターフェイスによい I/O パフォーマンス効果をもたらすことがあります。I/O 負荷のパフォーマンス効果は、ファーム内のクエリの結果ごとの複製の平均個数、列数、および QPS に比例します。

  5. 部分文字列検索は、大きな管理プロパティ (本文など) に適用した場合、インデックスのディスク使用によい効果をもたらします。

  6. この機能の詳細については、「関連性機能」を参照してください。

See Also

Concepts

検索トポロジを計画する (FAST Search Server 2010 for SharePoint)
冗長性と可用性の計画 (FAST Search Server 2010 for SharePoint)
検索トポロジを管理する (FAST Search Server 2010 for SharePoint)