FAST Search Server ファーム トポロジを計画する (FAST Search Server 2010 for SharePoint)

 

適用先: FAST Search Server 2010

トピックの最終更新日: 2012-01-20

このトピックでは、Microsoft FAST Search Server 2010 for SharePoint ファームのトポロジや、パフォーマンスおよびフォールト トレランスに関する理由で複数のサーバーにスケール アウトできる各種コンポーネントについて説明します。

Microsoft SharePoint Server 2010 ファームの全体的なトポロジの詳細については、「検索トポロジを計画する (FAST Search Server 2010 for SharePoint)」を参照してください。

この記事の内容

  • コンテンツ フロー

  • FAST Search for SharePoint ファーム内のコンポーネント

コンテンツ フロー

FAST Search Server 2010 for SharePoint は、サポートされている 1 つ以上のインデックス コネクタを使用してインデックス作成のためのコンテンツを取得します。FAST Content Search Service アプリケーション (SSA) は、既定のインデックス コネクタであり、SharePoint コンテンツ リポジトリ、Web サーバー、Exchange フォルダー、基幹業務データ、ファイル サーバーなど、さまざまなコンテンツ ソースからコンテンツを取得します。より特化されたコンテンツ取得シナリオでは、他の FAST Search Server 2010 for SharePoint インデックス コネクタを使用できます。インデックス コネクタの選択肢の詳細については、「クロールとフェデレーションの計画 (FAST Search Server 2010 for SharePoint)」を参照してください。

アイテムの処理では、取得されたドキュメントから検索可能なコンテンツを抽出し、記述された言語に基づいてアイテムを処理します。

インデックス作成コンポーネントは、検索可能なコンテンツを変換して、後でクエリ照合で使用される変換されたインデックスにします。

クエリの処理では、インデックスに対する実際のクエリ照合の前に、類義語の展開など、クエリ変換の実行によってユーザー クエリを処理します。

クエリ照合では、検索インデックスを使用して、ユーザー クエリに一致するアイテムを返します。アイテムは、指定されたクエリとの関連性によって並べ替えられたクエリ ヒット リストの形で返されます。

FAST Search Server 2010 for SharePoint は、Active Directory とのやり取りを行い、アクセス許可およびグループ メンバーシップの解決をインフラストラクチャに要求します。その後、コンテンツ ソースの設定に従って、現在のユーザーが参照を許可されているアイテムのみを返します。

FAST Search Server 2010 for SharePoint ファーム内のコンポーネント

FAST Search Server 2010 for SharePoint は 1 つのノードで実行できます。または、スケール アウトによって 1 つ以上のコンポーネントを複数のノードで実行することもできます。その場合は、多数のアイテムのインデックス作成、より多くのアイテムの更新、インデックス作成の遅延の短縮、または 1 秒あたりに応答できるクエリ数の拡大がシステムによって可能になります。

次の図は、FAST Search Server 2010 for SharePoint の主なコンポーネントを示しています。

FAST Search for SharePoint ファームのトポロジ

FAST Search Server ファーム トポロジ

以下では、各コンポーネントの機能を説明します。

アイテム処理

アイテム処理コンポーネントは、インデックス作成の対象となるアイテムをインデックス コネクタから受け取り、与えられた構成に従ってそれらのアイテムを処理します。その後、処理されたアイテムをインデックス サービスに送ります。

アイテム処理サービスの主な機能は次のとおりです。

  • クロールされたプロパティから管理プロパティへのマッピング。   管理プロパティには、アイテムに関連付けられたメタデータなど、インデックス付けされるコンテンツが含まれます。

    最初に、クロールされたアイテムの初期セットに対してクロールされたプロパティの探索を行います。この結果に基づいて、管理プロパティへのマッピングを変更できます。

  • ドキュメント形式 (Word、Excel、PDF など) の解析。   これには、検索可能なテキストおよびメタデータをこれらの形式から抽出する処理が含まれます。

  • クロールされたコンテンツからのプロパティの抽出。   プロパティ抽出では、名前、日付など、さまざまなプロパティを検出して管理プロパティにマップします。こうすることで、これらのプロパティをクエリ処理したり、これらのプロパティに基づいたクエリの絞り込みを適用したりできます。抽出される主なプロパティは、会社名、個人名、場所、および日付です。

    たとえば、組織に関連する製品名の辞書などを使用して、カスタムのプロパティ エクストラクターを作成することもできます。

  • インデックス作成前のアイテムの言語処理。   検索では、ユーザーが容易に関連情報を探し出せるように、言語の構造およびバリエーションに関する情報を利用するための言語情報が定義されます。このアイテムが持つクエリとの関連性は、必ずしもクエリとドキュメントの双方に共通する単語に基づいて決定されるわけではなく、むしろそのコンテンツが情報に対するユーザーのニーズをどの程度満たすかによって決定されます。

    言語処理には、記述された言語の検出と、特定の言語に基づいたコンテンツの言語的正規化が含まれます。言語的正規化には、文字の正規化とステミング バリエーションの正規化が含まれます。

FAST Search Server 2010 for SharePoint では、たとえば抽出するプロパティの種類やそれらのクエリ処理方法を指定することで、アイテムの処理方法をカスタマイズできます。

コンテンツ配布元は、インデックス コネクタとやり取りし、インデックス コネクタからインデックス サービスへのドキュメントのフィードを調整できます。フォールト トレランスのために、プライマリおよびバックアップのコンテンツ配布元を設定することできます。

フォールト トレランスおよびパフォーマンス上の理由から、複数のアイテム処理ノードを設定できます。アイテム処理の操作によっては、処理量が多いので複数の処理ノードがないとフィード速度を維持できないものがあります。

Web リンク分析 (Web アナライザー)

Web アナライザーには主に 2 つの機能があります。検索クリックスルー ログとハイパーリンク構造の分析です。どちらも検索結果のランク付けの改善につながります。

検索クリックスルー ログでクリック数が多いアイテムは、人気が高いものであり、閲覧の少ないアイテムよりも高いランク スコアを獲得します。また、他の多くのアイテムからリンクされているアイテムもユーザーとの関連が深いと見なされ、ランク スコアが高くなります。

Web アナライザーは、リンク グラフを分析したり、インデックス内のアイテムに対するリンクのカーディナリティに基づいてアンカー テキストやクエリに依存しないランクの昇格を追加したりすることで、検索の関連性を向上させます。アンカー テキストは、参照するアイテムを記述したもので、クエリ用語がそのアンカー テキストに一致すると再現率と関連性が向上します。また、多くのリンクによって参照されているアイテムはランクが高くなります。

Web アナライザーを多くのノードにスケール アウトすると、分析に必要な合計時間を短縮できます。そのためには、リンク分析時に使用される専用の参照データベースとリンク処理コンポーネントを追加します。

リンク処理コンポーネントは、リンク処理の際に Web アナライザーからタスクを受け取ります。大規模なインストールでは、複数のリンク プロセッサが使用されます。

参照データベース コンポーネントは、リンク処理によって生成されたリンク情報を取得する、キーおよび値の検索用サーバーを表しています。アイテム処理では、URL をキーとして使用してアイテムに関するリンク情報を検索します。大規模なインストールでは、複数の参照データベース コンポーネントが使用されます。

検索クラスター

検索クラスターは、インデックス作成とクエリ照合のための主要なトポロジを提供します。これらのコンポーネントは、行および列で構成されたサーバーのマトリックスを使用する独自のスケーリング モデルを必要とします。次の図に、検索クラスターのトポロジで使用される重要な概念を示します。

FAST 検索クラスターのアーキテクチャ

FAST Search クラスター アーキテクチャ

  • インデックス列   完全な検索可能インデックスは、1 台のサーバーに置くには大きすぎる場合、互いに共通の要素を持たない複数のインデックス列に分割できます。クエリは検索クラスター内のすべてのインデックス列に対して評価され、各インデックス列の結果が結合されて最終的なクエリ ヒット リストになります。

  • 検索行   検索クラスター内のインデックス付けされたすべてのアイテムを含む検索ノードのセットです。検索行は検索ノードで構成され、検索ノードは検索クラスター内のインデックス列ごとに 1 つ存在します。複数の検索行を使用すると、パフォーマンス負荷の共有やフォールト トレランスが可能になります。

  • プライマリ インデクサーとバックアップ インデクサー   フォールト トレランスのためにバックアップ インデクサーを構成できます。これら 2 つのインデクサーは同じセットのインデックスを生成しますが、インデックスをクエリ照合ノードに配布するのはプライマリ インデクサーのみです。

重要

プライマリ インデクサー ノードとバックアップ インデクサー ノードは、展開構成ファイル (deployment.xml) のインデクサー行として指定されます。検索行とインデクサー行は、展開構成ファイルで同じ行番号設定を使用します。

インデックス作成

インデックス作成コンポーネントは、受け取ったアイテムに基づいて変換されたインデックスを作成します。また、これらの変換されたインデックスをクエリ照合コンポーネントに送り、後でクエリ評価に使用できるようにします。

インデックス サービスは、インデックス ディスパッチャー コンポーネントとインデックス作成コンポーネントという 2 つのコンポーネントで構成されます。インデックス サービスが複数のノード上に展開されている場合、これらのコンポーネントのインスタンスも複数のノード上に展開されることになります。

インデックス列が複数ある場合、一貫性のある検索結果を生成するためにそれらを結合する必要があります。この場合は、インデックス作成ノードをインデックス列ごとに展開する必要があります。インデックス ディスパッチャーは、処理されたアイテムの適切な列へのルーティングを管理します。

インデックス サービスは、アイテムの数に従ってスケール アウトされます。インデックス サービスが 1 つのノードで実行される場合は、1 秒あたりに処理できるアイテム数とインデックスに含めることのできるアイテム総数の双方が制限されます。インデックス サービスをスケール アウトするには、このサービスを複数のインデックス列にわたって展開します。各インデックス列にはインデックスの一部が含まれ、それらのインデックス列を結合すると完全なインデックスが形成されます。この場合、各インデックス作成ノードはインデックス全体の一部のみを処理するため、1 秒あたりにインデックス付けできるアイテム数とアイテムの総数の双方がスケール アウトされます。また、バックアップのインデックス作成ノードによってフォールト トレランスを実現することもできます。

フォールト トレランスとパフォーマンスの双方の理由から、複数のインデックス ディスパッチャーを使用することもできます。通常は、インデックス ディスパッチャーをプライマリのインデックス作成ノードと同じノードに展開します。

クエリ照合

クエリ照合サービスでは、インデックス サービスで作成された変換されたインデックスを使用して、クエリに一致するアイテムを取得したうえでこれらのアイテムをクエリ ヒット リストとして返します。通常、クエリには、ANDOR など、クエリ演算子で結合された複数の用語が含まれます。クエリ照合サービスはインデックス内の各用語を参照し、それらの用語が出現するアイテムの一覧を取得します。たとえば、AND 演算子の場合、クエリ ヒット リストはすべての用語を含むアイテムのセットで構成されることになります。返されるアイテムの順序は、要求された並べ替えメカニズムに基づいており、こうしたメカニズムは、通常、アイテムのさまざまなプロパティから算出される複雑なランク付けか、1 つ以上のアイテム プロパティに基づいた並べ替えです。

クエリ照合サービスは、クエリ ヒット リスト内のアイテムごとにヒット部分を強調した概要を返すこともできます。ヒットが強調された概要は、一致するクエリ用語が強調表示された元のアイテムの断片的な情報で構成されます。

クエリ照合サービスでは、クエリ結果に関連する詳細な絞り込みが行われます。クエリの絞り込みによって、クエリ結果に対して計算された集計済み統計データによるクエリ結果のドリル ダウンが可能になります。クエリ照合サービスは、大きな結果セットで詳細な絞り込みができるように集計データを管理します。

クエリ照合サービスを行および列の設定に展開すると、フォールト トレランスを実現したり、コンテンツおよびクエリのボリュームを縮小したりできます。インデックス列では、インデックス全体を互いに共通の要素を持たない列のセットに分割することで、コンテンツのボリュームをスケール アウトできます。検索行では、インデックスの同じパーティションを複数のクエリ照合ノードで複製することで、クエリのボリュームをスケール アウトできます。

重要

クエリ照合サービスでの列の数は、インデクサー サービスでの列の数と常に同じです。これは、インデックス列がインデックスの分割を表しており、各クエリ照合ノードはインデックスのそうしたパーティションを 1 つしか処理できないからです。

検索行とインデクサー行のスケール アウトは独立して行われます。検索行では、フォールト トレランスの実現とクエリの能力向上のために別の検索行が複製されます。インデクサー行は、インデックス作成時のフォールト トレランスのためのバックアップ メカニズムとして機能します。

クエリ処理

クエリ処理コンポーネントは、クエリの前処理と結果の後処理を実行します。クエリ処理には、クエリ言語の解析、言語処理、アイテムレベルのセキュリティ処理が含まれます。結果の処理には、複数のインデックス列から得られた結果の結合、クエリ ヒット リストの書式設定、クエリ絞り込みデータの書式設定、重複データの削除が含まれます。

クエリ処理コンポーネントは、FAST Search Authorization (FSA) コンポーネントとやり取りして、クエリを実行しているユーザーにそのユーザーが参照を承認された結果だけを表示するようにします。そのため、クエリ処理サービスはユーザーの権限を確認し、届いたクエリを現在のユーザーとグループ メンバーシップに対応するアクセス フィルターを使用して書き直します。

クエリ処理サービスは、フォールト トレランスの実施や 1 秒あたりのクエリ数の拡大のために、複数ノードにわたってスケール アウトできます。その場合は、すべてのノードを同じ方法で設定する必要があります。

システム管理

SharePoint Server 2010 サーバーの全体管理のインターフェイスとサイト コレクションのユーザー インターフェイスは、FAST Search Server 2010 for SharePoint の展開および機能を管理するための管理インターフェイスになります。一般的なシステム管理サービスとしては、UI およびコマンドレット ベースのシステム、機能の構成、ログ記録、インデックス スキーマ管理、検索の承認があります。

重要

管理操作によっては Windows PowerShell コマンドレットやコマンド ライン ツールを使用しないと実行できないものがあります。

管理コンポーネントには、検索機能を制御する機能 (プロパティ抽出の実行方法の決定、使用する類義語の確定、おすすめコンテンツとして使用するアイテムの決定など) が含まれます。

FSA マネージャーは、管理サービスの一部であり、インデックス付けされたコンテンツに関するユーザーの承認を管理します。これにより、ユーザーが読み取りの資格を持つアイテムのみがクエリ結果に表示されることになります。FSA マネージャーは、要求に関するサービス、Active Directory サービス、または他の LDAP ベースのディレクトリ サービスとやり取りして、承認のプロセスを管理します。

インデックス スキーマ管理

管理サービスの重要な部分としてインデックス スキーマ管理があります。インデックス スキーマには、システム内の他のすべてのサービスのインデックス スキーマに関連する構成ファイルを生成するために必要な構成エンティティがすべて含まれます。

インデックス スキーマは、アイテムのどの管理プロパティがインデックス付けされるのか、またそれらのプロパティがどのようにインデックス付けされ、どのプロパティがクエリ ヒット リストで返されるかを制御します。

ランク プロファイルは、インデックス スキーマの一部であり、クエリ ヒット リストの並べ替えが関連性によってどのように行われるかを制御します。関連性の算出法は、ランク プロファイル パラメーターのセットを使用して構成できます。

FAST Search Authorization (FSA)

FAST Search Authorization (FSA) マネージャーは、管理サービスの一部であり、インデックス付けされたコンテンツに関するユーザーの承認を管理します。

FSA マネージャーは、コンテンツ ソース リポジトリに対するユーザーの読み取りアクセス許可に基づいて、インデックス付けされたアイテムへのアクセス権をユーザーに付与します。これにより、ユーザーが読み取りの資格を持つアイテムのみがクエリ結果に表示されることになります。

FSA マネージャーは、Active Directory サービスや他の LDAP ベースのディレクトリ サービスとやり取りして、承認のプロセスを管理します。

FAST Search Web クローラー

FAST Search Web クローラーは、インターネット サイトとイントラネット サイトが混在する複雑な Web クロール シナリオで使用できるオプションのインデックス コネクタです。

Web サイトのクロールに FAST Search Content SSA を使用する場合と FAST Search Web クローラーを使用する場合の違いについては、「クロールとフェデレーションの計画 (FAST Search Server 2010 for SharePoint)」を参照してください。

FAST Search Web クローラーは、Web ページを読み取ってそれらのページのリンクをたどっていくことで、複雑に絡み合ったアイテム群を処理します。その後、取得したアイテムをアイテム処理サービスに渡します。

FAST Search Web クローラーのアーキテクチャの詳細については、「FAST Search Web クローラーを使用して Web コンテンツをクロールする」を参照してください。

See Also

Concepts

検索トポロジを計画する (FAST Search Server 2010 for SharePoint)
展開オプション (FAST Search Server 2010 for SharePoint)
クロールとフェデレーションの計画 (FAST Search Server 2010 for SharePoint)
冗長性と可用性の計画 (FAST Search Server 2010 for SharePoint)
パフォーマンスと容量の計画 (FAST Search Server 2010 for SharePoint)

Other Resources

インデックス スキーマを計画する (FAST Search Server 2010 for SharePoint) (現在不使用)