クロールとフェデレーションの計画 (FAST Search Server 2010 for SharePoint)

 

適用先: FAST Search Server 2010

トピックの最終更新日: 2016-11-29

この記事では、Microsoft FAST Search Server 2010 for SharePoint によるコンテンツのフェデレーション、クロール、およびインデックス作成について理解を深めながら、クロールとフェデレーションを計画する方法を説明します。

エンド ユーザーが FAST Search Server 2010 for SharePoint でエンタープライズ検索機能を使用できるようにするには、ユーザーによる検索の対象とするコンテンツのクロールまたはフェデレーションを行う必要があります。

この記事では、次の 3 種類のインデックス コネクタについて個別に説明します。

  1. Microsoft SharePoint Server 2010 インデックス コネクタおよびクロール フレームワーク

    この統合されたインデキシング コネクタまたは Business Connectivity Services の統合インデックス コネクタを使用すれば、ほとんどのコンテンツ ソースをクロールできます。ほとんどの構成および運用タスクで SharePoint Server 2010 サーバーの全体管理を使用します。

  2. フェデレーション検索コネクタ

    フェデレーション検索コネクタは、クエリをターゲット システムに渡し、その結果をそのシステムから受け取ることにより、実際のコンテンツのクロールは実行せずに結果を表示できます。ほとんどの構成および運用タスクで SharePoint Server 2010 サーバーの全体管理を使用します。

  3. FAST Search Server 2010 for SharePoint 個有のインデックス コネクタ

    FAST Search Server 2010 for SharePoint は、Web、データベース、および Lotus Notes コンテンツをクロールするために 3 種類のインデックス コネクタを追加で提供します。これらのインデックス コネクタは、主に、XML ファイルと Windows PowerShell コマンドレットを編集して構成し、コマンド ラインを使用して操作します。

この記事の内容

  • コンテンツ ソースを特定し、使用するインデックス コネクタを決定する

    ここでは、使用するインデックス コネクタを決める際に役立つ情報を提供します。

  • SharePoint Server 2010 に統合されたインデックス コネクタの使用を計画する

    ここでは、SharePoint Server 2010 インデックス コネクタ フレームワークと FAST Search Content Search Service アプリケーションの使用を計画する際に役立つ情報を提供します。

  • フェデレーションを計画する

    ここでは、SharePoint Server 2010 フレームワークと FAST Search Query Search Service アプリケーションを使用するエンドユーザー クエリでフェデレーション検索結果を含める方法の計画に役立つ情報を提供します。

  • FAST Search Server 2010 for SharePoint のインデックス コネクタの使用を計画する

    ここでは、FAST Search Server 2010 for SharePoint 固有のコネクタの使用を計画する方法を説明します。

    • FAST Search Web クローラーについて

    • FAST Search データベース コネクタについて

    • FAST Search Lotus Notes コネクタについて

    • コンテンツをクロール対象に含めるか、除外する

    • クロール スケジュールを設定する

コンテンツ ソースを特定し、使用するインデックス コネクタを決定する

FAST Search Server 2010 for SharePoint では、さまざまなコンテンツ ソースについて各種のインデックス コネクタが使用されます。クロール対象のコンテンツの種類、個人の好み、組織の固有のニーズによって、どのインデックス コネクタを使用するかが決まります。

Microsoft SharePoint Server 2010 で提供されている各種のインデックス コネクタを使用すれば、ほとんどのコンテンツ ソースをクロールできます。サーバーの全体管理のユーザー インターフェイスでは、これらのインデックス コネクタは、FAST Search コネクタとも総称されます。これは単体のコネクタというよりも、複数のインデックス コネクタのコレクションを表すことに注意してください。FAST Search コネクタは、FAST Search Content Search Service アプリケーション (Content SSA) によって 1 つまたは複数のコンテンツ ソースに関連付けられます (したがって、インデックス コネクタにも関連付けられます)。Content SSA は、Microsoft SharePoint Server 2010 フロントエンドと FAST Search Server 2010 for SharePoint バックエンドも接続します。

FAST Search Server 2010 for SharePoint をインストールすると、FAST Search Server 2010 for SharePoint 固有の 3 種類のインデックス コネクタにもアクセスできるようになります。これらのコネクタは Web、データベース、および Lotus Notes コンテンツをインデックスに供給できます。次の表に、使用可能なインデックス コネクタとその推奨ユース ケースを要約します。

コンテンツの種類 インデックス コネクタ 推奨ユース ケース

SharePoint

SharePoint インデックス コネクタ

すべてのユース ケースで使用します。

ファイル共有

ファイル共有インデックス コネクタ

すべてのユース ケースで使用します。

Exchange パブリック フォルダー

Exchange インデックス コネクタ

すべてのユース ケースで使用します。

ユーザー プロファイル

ユーザー プロファイル インデックス コネクタ

すべてのユース ケースで使用します。

この種類のコンテンツは、FAST Search Query Search Service アプリケーションでクロールされます。

Web サイト

Web サイト インデックス コネクタ

クロール対象の Web サイトの分量が限定的で、動的なコンテンツを含まないときに使用します。

FAST Search Web クローラー

RSS Web コンテンツをクロールするときに使用します。

Web サイトのコンテンツが JavaScript などの動的データを含むときに使用します。

組織で高度な Web クロール、構成、およびスケジューリングのオプションを使用する必要があるときに使用します。

RSS Web コンテンツをクロールするときに使用します。

Web サイトのコンテンツで高度なログオン オプションが使われているときに使用します。

データベース

Business Data Catalog ベースのインデックス コネクタ

優先される構成手段が Microsoft SharePoint Designer 2010 の場合に使用します。

データベースの増分クロールのためにタイムスタンプに基づく変更検出を行うときに使用します。

優先される操作手段が Microsoft SharePoint Server 2010 サーバーの全体管理の場合に使用します。

変更ログに基づいてクロールを有効にするときに使用します。これはコネクタ モデル ファイルに直接手を加えて、データベース内にストアド プロシージャを作成することで実現されます。

FAST Search データベース コネクタ

優先される構成手段が SQL クエリの場合に使用します。

SQL クエリで高度なデータ結合操作オプションが必要なときに使用します。

高度な増分更新機能を使うときに使用します。FAST Search データベース コネクタでは、利用できる更新情報がない場合、増分クロールのためにチェックサムに基づく変更検出が行われます。このコネクタではタイムスタンプに基づく変更検出と、更新および削除フラグに基づく変更検出もサポートされます。

Lotus Notes

Lotus Notes インデックス コネクタ

優先される操作手段が Microsoft SharePoint Server 2010 サーバーの全体管理の場合に使用します。

FAST Search Lotus Notes コネクタ

Lotus Notes ロールのサポートなど、Lotus Notes のすべてのセキュリティ サーポートが必要なときに使用します。

Lotus Notes データベースを添付ファイルとしてクロールするときに使用します。

基幹業務のデータ

Business Data Catalog ベースのインデックス コネクタ

コンテンツ ソースのデータに基幹業務アプリケーションのデータが含まれているときに使用します。

変更ログに基づいてクロールを有効にするときに使用します。これはコネクタ モデル ファイルに直接手を加えて、データベース内にストアド プロシージャを作成することで実現されます。

コンテンツのクロールとインデックス作成について

コンテンツのクロールが正常に行われると、その結果、検索クエリから使用される個々のファイルやコンテンツの部分がインデックス コネクタによってアクセスされて読み取られます。コンテンツをクロールすることによって、それらのアイテムに関してクロールされた一連のプロパティが作成されます。これらのクロールされたプロパティは、検索インデックス (インデックスとも呼ばれる) に格納された管理プロパティにマッピングされます。

注意

インデックス コネクタはホスト サーバー上のファイルを変更しません。ホスト サーバー上のファイルはアクセスされて読み取られるだけで、それらに変更が加えられることはありません。場合によっては、インデックス コネクタがホスト サーバー上のコンテンツを読み取るとき、クロールされたファイルの最終アクセス日付が更新されることがあります。これが当てはまるのは、特定のコンテンツ ソースをホストする一部のサーバーに限られます。

SharePoint Server 2010 に統合されたインデックス コネクタの使用を計画する

SharePoint Server 2010 に統合されているインデックス コネクタを使用すれば、ほとんどのコンテンツ ソースをクロールできます。ほとんどの構成および運用タスクで SharePoint Server 2010 サーバーの全体管理を使用します。

これらのインデックス コネクタは、FAST Search Content Search Service アプリケーション (Content SSA) を構成することによってセットアップされます。Content SSA は、特に FAST Search Server 2010 for SharePoint バックエンドとの情報のやり取りを有効にします。Content SSA 内では、コンテンツ ソース (複数) の場所、クロール スケジュール、およびその他の情報を指定します。Content SSA のフィード対象となる既定のコンテンツ コレクション名は sp です。

FAST Search コネクタのクロール対象は次のとおりです。

  • SharePoint サイト

  • Web サイト

  • Microsoft Office ドキュメントなどのコンテンツを含むファイル共有

  • Exchange パブリック フォルダー

  • 基幹業務のデータ (データベースのコンテンツなど)

  • カスタム リポジトリ (特注のコネクタでアクセスされる)

コンテンツ ソースを計画する

FAST Search Content Search Service アプリケーション (Content SSA) でのコンテンツ ソースは、クロールするコンテンツの種類、クロールする URL、およびクロールする深さと時期を指定するために使用できるオプション セットです。既定のコンテンツ ソースは、ローカルの SharePoint サイトです。このコンテンツ ソースを使用して、特定の Content SSA に関連付けられているすべての Web アプリケーションにあるすべてのコンテンツをクロールする方法を指定できます。既定では、特定の Content SSA を使用する Web アプリケーションごとに、FAST Search Server 2010 for SharePoint は各サイト コレクションのトップレベル サイトの開始アドレスを既定のコンテンツ ソースに追加します。

既定のコンテンツ ソースを使用して検索要件を満たすことができるのは一部の組織だけです。多くの組織では、コンテンツ ソースを追加する必要があります。追加のコンテンツ ソースを計画するのは、次の作業を行う必要がある場合です。

  • SharePoint サイト、ファイル共有、ビジネス データなど、さまざまな種類のコンテンツをクロールする。

  • コンテンツによってクロール スケジュールを変える。

  • クロールするコンテンツの量を制限または増やす。

  • さまざまなサイトをクロールするときに異なる優先順位を設定する。

Content SSA では最大 500 個のコンテンツ ソースを作成でき、各コンテンツ ソースには、500 個の開始アドレスを入れることができます。管理をできるだけ簡単にするために、作成するコンテンツ ソースの数を制限することをお勧めします。

さまざまな種類のコンテンツのクロールを計画する

1 つのコンテンツ ソースにつき 1 種類のコンテンツしかクロールできません。つまり、SharePoint サイトの開始アドレスを含んでいるコンテンツ ソースと、ファイル共有の開始アドレスを含んでいる別のコンテンツ ソースは作成できますが、SharePoint サイトとファイル共有両方の開始アドレスを含んでいる 1 つのコンテンツ ソースは作成できません。次の表に、構成できるコンテンツ ソースの種類を示します。

使用するコンテンツ ソースの種類 対象のコンテンツ

SharePoint サイト

同じファームの SharePoint サイト、または別々の Microsoft SharePoint Server 2010、Microsoft SharePoint Foundation 2010、Microsoft Search Server 2010 ファームの SharePoint サイト

同じファームの SharePoint サイト、または別々の Microsoft Office SharePoint Server 2007、Windows SharePoint Services 3.0、Microsoft Search Server 2008 ファームの SharePoint サイト

Microsoft Office SharePoint Portal Server 2003 または Windows SharePoint Services 2.0 ファームの SharePoint サイト

注意

SharePoint Server 2010、SharePoint Foundation 2010、または Search Server 2010 上の SharePoint サイトをクロールする場合と異なり、SharePoint Server 2010 クローラーは、以前のバージョンの SharePoint 製品とテクノロジによって作成されたサイト コレクションにあるすべてのサブサイトを自動的にクロールできません。このため、以前のバージョンの SharePoint サイトをクロールするときには、各トップレベル サイトの開始アドレスとクロールする各サブサイトの URL を指定する必要があります。

Web サイト

組織で SharePoint サイトに配置されていないその他の Web コンテンツ

インターネット上にある Web サイトのコンテンツ

ファイル共有

組織のファイル共有にあるコンテンツ

Exchange パブリック フォルダー

Microsoft Exchange Server のコンテンツ

Lotus Notes

Lotus Notes データベースに格納されている電子メール メッセージ

注意

他の種類のコンテンツ ソースとは異なり、Lotus Notes コンテンツ ソース オプションは、該当する必要なソフトウェアをインストールして構成するまでユーザー インターフェイスに表示されません。詳細については、「Lotus Notes Connector を構成して使用する (FAST Search Server 2010 for SharePoint)」を参照してください。

ビジネス データ

基幹業務アプリケーションに保存されているビジネス データ

ビジネス データ用のコンテンツ ソースを計画する

ビジネス データ コンテンツ ソースの場合、データをホストするアプリケーションを Business Data Connectivity Service アプリケーションのアプリケーション モデルで指定する必要があります。1 つのコンテンツ ソースで、Business Data Connectivity Service に登録されているすべてのアプリケーションをクロールすることも、複数のコンテンツ ソースを使用してアプリケーションを個別にクロールすることもできます。

ほとんどの場合、ビジネス データをサイト コレクションに統合する計画を立てる担当者は、全体のコンテンツ計画プロセスの担当者とは異なります。このため、ビジネス アプリケーションの管理者をコンテンツ計画チームに加えて、ビジネス アプリケーションのデータをコンテンツに統合する方法、およびそのデータをサイト コレクションで効果的に配置する方法についてその管理者からアドバイスを得ることができるようにします。

Business Connectivity Services モデルについて

データベースや Web サービスなどの特定のリポジトリをクロールするには、SharePoint Server 2010 検索コネクタ フレームワークが必要です。このフレームワークは、Business Connectivity Services (BCS) モデルに基づいて外部データ ソースをクロールできるようにするものです。これらのモデル ファイルでは、クロールの対象となる外部コンテンツ ソースの接続の詳細と構造が定義されます。すべての BCS モデルが Business Connectivity Service にインポートされます。基幹業務のデータまたはカスタム リポジトリという種類のコンテンツ ソースをセットアップするときに特定のモデルとサービスを指し示します。

いくつかの BCS モデルがあらかじめ設計されており、これをデータベース コンテンツ、Web サービス (WCF)、および .NET カスタム コードで使用できます。また、自分独自のカスタム BCS モデルを作成したり、コネクタ フレームワークと BCS モデルを使用してカスタム コネクタを作成することもできます。

SharePoint Server 2010 検索コネクタ フレームワークに基づいてモデルを作成するには、それぞれの要件や目標に応じて、SharePoint Designer か Microsoft Visual Studio 2010 を使用する必要があります。

SharePoint Designer は、次の目的で使用します。

  • データベースや Web サービスなどの、そのままでサポートされる外部コンテンツ ソースをクロールするために必要な BCS モデルを作成する。

  • BCS アプリケーションの間でモデルをインポート/エクスポートする。

Microsoft Visual Studio は、次の目的で使用します。

  • .NET BCS コネクタのメソッドを実装する。

  • 自分のリポジトリ用のカスタム コネクタを作成する。

同じ Business Connectivity Service (BCS) から複数のコンテンツ ソースを抽出でき、さまざまな Search Service アプリケーションから共有 BCS 内の同じモデルを指し示すことができます。

SharePoint Server 2010 コネクタ フレームワークとBusiness Connectivity Servicesの詳細およびカスタム コネクタの作成方法については、「SharePoint Server Search コネクタ フレームワーク (MSDN)」を参照してください。

インデックス コネクタ プロトコルを計画する

クロールするすべてのコンテンツには、コネクタを使用してアクセスする必要があります。FAST Search Server 2010 for SharePoint には、SharePoint Server 2010 コネクタ フレームワークをとおして、一般的なすべてのインターネット プロトコル用のコネクタが用意されています。ただし、SharePoint Server 2010 によってインストールされないコネクタが必要なコンテンツをクロールする場合は、そのコンテンツをクロールする前にサード パーティのコネクタかカスタム コネクタをインストールする必要があります。既定でインストールされるインデックス コネクタ プロトコルの一覧については、「既定のインデックス コネクタ プロトコル (FAST Search Server 2010 for SharePoint)」を参照してください。他のマイクロソフト製品またはサードパーティ ソフトウェアによって作成されたコンテンツをクロールするために、追加のインデックス コネクタをインストールできます。詳細については、「追加の構成が必要なコンテンツ ソース (FAST Search Server 2010 for SharePoint)」を参照してください。

対象とするファイルの種類と IFilter を計画する

FAST Search Server 2010 for SharePoint は、一般的なほとんどのファイルの種類をクロールしてメタデータとコンテンツを抽出します。いくつかのファイルの種類と IFilter は、初回インストール時に自動的にインストールされます。初期展開で使用するコンテンツ ソースを計画するときには、クロールするコンテンツが使用しているファイルの種類が含まれているかどうかを確認します。ファイルの種類が含まれていない場合は、Advanced Filter Pack を有効にするか、そのファイルの種類に対応したサードパーティの IFilter をインストールおよび登録することにより追加する必要があります。

特定のファイルの種類がクロールされないようにする場合は、そのファイルの種類のファイル名拡張子をファイルの種類除外リストに追加します。こうすると、その拡張子が付いているファイル名はクロールされません。既定でクロールに含まれる、または除外されるファイルの種類と IFilter の一覧については、「IFilter とファイルの種類のリファレンス (FAST Search Server 2010 for SharePoint)」を参照してください。

クロールのスケジュールとルールを計画し、クロールの影響を管理する

Content SSA と SharePoint クローラーを使用してコンテンツをクロールする場合、クロールのスケジュールとルールを使用してクロールが影響を及ぼすものと影響範囲を計画する必要があるかどうか、必要がある場合はいくつのクロールのスケジュールとルールを使用する必要があるかを、いくつかの要素に基づいて決定します。

注意

1 つ以上のコンテンツ ソースの増分クロールを開始する前に、フル クロールを完全に実行する必要があります。

たとえば、クロール スケジュールやクロール ルールを構成したり、クロールの影響を管理する必要に迫られるのは、次のような状況です。

  • ダウン タイムと使用率のピーク時に対応するため。

  • 更新頻度が高いコンテンツをより頻繁にクロールするため。

  • 低速サーバーに配置されているコンテンツのクロールを、それ以外のサーバーに配置されているコンテンツとは別に実行するため。

  • 関連性が低いと思われるコンテンツをクロールから除外するため。

  • 特定の (外部) Web サイトまたはコンテンツ サーバーへの要求頻度を増やしたり減らしたりするため。

  • 既定のコンテンツ アクセス アカウントとは異なるアカウントを使用してコンテンツをクロールするため。

詳細な情報とその他の考慮事項については、SharePoint Server 2010 の記事「クロールとフェデレーションの計画を立てる (SharePoint Server 2010)」から関連するセクションを参照してください。異なるスケジュールに基づくコンテンツ クロールの詳細については、「クロールのスケジュールを計画するときの考慮事項」セクションおよび「フル クロールを実行する理由」セクションを参照してください。クローラー影響ルールの詳細については、「クロールの影響の管理を計画する」セクションを参照してください。

認証を計画する

SharePoint Server 2010 クローラーがコンテンツ ソースに指定されている開始アドレスにアクセスするとき、その SharePoint Server 2010 クローラーは、そのコンテンツをホストするサーバーの認証を受け、アクセスを許可される必要があります。つまり、SharePoint Server 2010 クローラーが使用するドメイン アカウントには、コンテンツに対する読み取りアクセス権以上の権限が必要です。

既定では、既定のコンテンツ アクセス アカウントが使用されます。または、FAST Search Content SSA のクロール ルールを使用して、特定のコンテンツをクロールするときに使用する別のコンテンツ アクセス アカウントを指定できます。既定のコンテンツ アクセス アカウントを使用する場合でも、クロール ルールで指定した別のコンテンツ アクセス アカウントを使用する場合でも、使用するコンテンツ アクセス アカウントには、クロール対象のすべてのコンテンツに対する読み取りアクセス許可が必要です。コンテンツ アクセス アカウントに読み取りアクセス許可がない場合は、コンテンツはクロールされず、インデックスも作成されないので、クエリに使用できません。

詳細については、SharePoint Server 2010 の記事「クロールとフェデレーションの計画を立てる」からセクション「認証を計画する」を参照してください。

フェデレーションを計画する

フェデレーション検索とは、複数の Web リソースまたはデータベースを同時にクエリしてエンド ユーザーに 1 つの検索結果ページを提供する機能です。FAST Search Server 2010 for SharePoint で、FAST Search Query Search Service アプリケーションにフェデレーション対象を構成して、エンド ユーザーがサーバーによってクロールされていないコンテンツをローカル システムで検索および取得できるようにします。フェデレーション対象によって、クエリをリモート検索エンジンとフィードに送信できるようになります。このため、フェデレーション コンテンツがクロールされたコンテンツの一部であるかのように結果がエンド ユーザーに表示されます。

FAST Search Server 2010 for SharePoint では、SharePoint Server 2010 をとおして、次の種類のフェデレーション対象をサポートしています。

  • **このサーバーのインデックスを検索する。**組織に SharePoint Server 2010 を実行しているサーバーがある場合、任意のローカル インデックスをフェデレーション対象として使用できます。たとえば、社内の人事部サーバーにある SharePoint サイトからのみ、従業員の連絡先情報を入手できるとします。そのサイトがクロールの範囲に含まれていない場合でも、検索センター サイトから検索を開始したユーザーが、そのユーザーに閲覧が許可されている従業員の連絡先情報の結果を取得できるように、フェデレーション対象を構成できます。次の条件が適用されます。

    1. フェデレーション対象は [このサーバーのインデックスを検索] に設定します。

    2. クエリ テンプレートは必要ありません。SharePoint Server 2010 では、オブジェクト モデルを使用してフェデレーション対象にクエリを実行します。

    3. 既定のサーバー認証が使用されます。

    4. 高度な検索クエリはサポートされていません。

  • FAST Search インデックス。

    検索結果をローカル FAST Search Server 2010 for SharePoint インデックスから検索センターまたは FAST Search センターに連携するときに使用するオプションです。

  • **OpenSearch 1.0 または 1.1。**OpenSearch 標準をサポートしているパブリック Web サイトをフェデレーション対象として使用できます。Bing などのインターネット検索エンジン、つまり、RSS または Atom プロトコルをサポートしている検索結果ページがこれに当たります。知的所有権に関わる技術研究について内部サイトを検索したユーザーに対して、パブリック Web サイトにある関連する研究情報も表示するとします。Bing 検索クエリのフェデレーション対象を構成すると、Web 検索結果が自動的に含まれます。次の条件が適用されます。

    1. クエリは、http://www.example.com/search.aspx?q=TEST のように URL として検索エンジンに送信できます。

    2. 検索結果は、RSS、Atom、または別の構成済み XML 形式で返されます。

    3. フェデレーション対象の機能、クエリ テンプレート、および応答要素は、フェデレーション対象に関連付けられている OpenSearch 記述 (.osdx) ファイルに格納されています。

    4. FAST Search Server 2010 for SharePoint 固有の OpenSearch 拡張機能では、トリガーを追加する機能および XSL コードを検索結果と関連付ける機能がサポートされています。

    5. 検索結果に表示するメタデータの選択は、OpenSearch 場所によって決まります。

    OpenSearch の詳細については、https://www.opensearch.org/home (英語) を参照してください。

フェデレーションの概要とフェデレーションで使用する認証方式の計画については、SharePoint Server 2010 の記事「クロールとフェデレーションの計画を立てる」からセクション「フェデレーションを計画する」を参照してください。

フェデレーション対象のインポートに使用できるフェデレーション検索コネクタの概要については、エンタープライズ検索センターの「Federated Search Connector Gallery (英語)」を参照してください。

FAST Search Server 2010 for SharePoint のインデックス コネクタの使用を計画する

Microsoft SharePoint Server 2010 に統合されたインデックス コネクタに加え、FAST Search Server 2010 for SharePoint は、Web、Lotus Notes、およびデータベース コンテンツ用の追加のコンテンツ インデックス コネクタを提供します。

これらのインデックス コネクタは主に、XML ファイルや Windows PowerShell コマンドレットを編集することによって構成され、それらの操作はコマンドラインから行います。

FAST Search Web クローラーについて

FAST Search Web クローラーは、Web サイトのコンテンツのクロールに使用される、カスタマイズ可能なインデックス コネクタです。FAST Search Web クローラーは、組織で多数の外部 Web サイトをクロールしているような、大規模な環境に対応できます。さらに、FAST Search Web クローラーは、JavaScript を含む Web サイトのような動的な Web コンテンツをクロールできます。

FAST Search Web クローラーは、定義済みの一連の Web サイト (内部か外部かは問わない) からコンテンツを収集します。FAST Search Web クローラー の構成は、XML ファイルのコピーを編集することによって行われます。FAST Search Web クローラー は、複数のコマンドライン ツールで操作できます。

FAST Search Web クローラーは、通常、FAST Search Server 2010 for SharePoint 環境内の 1 つのコンポーネントとして存在します。その内部を見ると、FAST Search Web クローラーは複数のプロセスや論理エンティティのコレクションとして構成されており、ほとんどの場合、それらは単一のサーバー上で実行されます。クロール対象の Web サイト数や総ページ数が大きいときは、これらのプロセスを複数のホストに分散配置することによって、FAST Search Web クローラーの規模を拡大できます。これには追加的な構成が必要です。

FAST Search Web クローラーは、HTTP、HTTPS、および FTP コンテンツをクロールでき、NTLM バージョン 1 (それと限定的な拡張バージョン 2)、ダイジェスト認証、基本認証、およびフォーム ベースのログオン認証をサポートします。RSS スケジューリングもサポートされ、フィード内のリンクされたドキュメントにタグを付けることができます。

FAST Search データベース コネクタについて

FAST Search データベース コネクタは、データベース コンテンツ ソースからコンテンツを収集する特殊なインデックス コネクタです。

このインデックス コネクタは、XML テンプレートを使用して構成されます。このコネクタの操作には、jdbcconnector.bat ファイル内のコマンドライン オプションを使用します。構成されたコネクタの実行後、クロールされたプロパティを SharePoint Server 2010 サーバーの全体管理の管理プロパティにマッピングすると、コネクタによって収集されたコンテンツでの検索が有効になり、検索がカスタマイズされます。

このコネクタでは、1 つの SQL ステートメントがクロール データベースに対して実行されます。このステートメントは完全にカスタマイズ可能です。FAST Search データベース コネクタは、更新情報がない場合、増分クロールのためにチェックサムに基づく変更検出を使用します。このコネクタではタイムスタンプに基づく変更検出と、更新および削除フラグに基づく変更検出もサポートされます。データベースに対して運用前および運用後の手続きを実行してからクロールを行うように指示することもでき、これは一部のユース ケースで有利に作用します。

FAST Search Lotus Notes コネクタについて

FAST Search Lotus Notes コネクタは、ユーザー ディレクトリ コネクタとコンテンツ コネクタの 2 つの部分から成る特殊なインデックス コネクタです。コンテンツ コネクタは Lotus Notes コンテンツ ソースからコンテンツを収集します。ユーザー ディレクトリ コネクタは、エンドユーザーがアクセス権のある Lotus Notes コンテンツだけをアクセスするようにします。ユーザー ディレクトリ コネクタは Active Directory ユーザー ディレクトリを Lotus Notes ユーザー アカウントでマッピングし、FAST Search Authorization と密接に統合されています。

このコネクタの構成には、ユーザー ディレクトリ コネクタ用とコンテンツ コネクタ用の 2 つの XML テンプレートを使用します。このコネクタの操作は、lotusnotesconnector.bat ファイル内と lotusnotessecurity.bat ファイル内のコマンドライン オプションを使用して行います。構成されたコンテンツ コネクタの実行後、クロールされたプロパティを SharePoint Server 2010 サーバーの全体管理の管理プロパティにマッピングすると、コンテンツ コネクタによって収集されたコンテンツでの検索が有効になり、検索がカスタマイズされます。

FAST Search Lotus Notes コネクタは、Lotus Notes バージョン 6.5.6, 7.x および 8.x と、Lotus Domino バージョン 6.5, 7.x および 8.x をサポートしています。

このコネクタでは、ロールなどの Lotus Notes セキュリティがすべてサポートされ、Lotus Notes データベースに添付ファイルとしてインデックスを作成できます。

コンテンツをクロール対象に含めるか、除外する

FAST Search Server 2010 for SharePoint に固有のそれぞれのコネクタには、対応する構成ファイル内に、ルールを含めるか除外するかを指示するパラメーターがあります。

重要

クロールの対象となるコンテンツ ソースには、過剰な負荷をかけないでください。

他の管理者がクロールしている組織内のコンテンツについては、その管理者と調整して、サーバーのパフォーマンスと容量に基づき影響ルールを設定できます。外部サイトについては、このような調整はほとんどの場合行えません。外部サーバー上の大量のコンテンツを要求したり、頻繁に要求を行ったりすると、クロールで使用されるリソースや帯域幅が多すぎる場合には、要求先のサイトの管理者によって以後のアクセスが制限される可能性があります。そのため、より低速でクロールするのがベスト プラクティスとなります。こうすれば、関連性のあるコンテンツをクロールするためのアクセス権を失うリスクを減らすことができます。

FAST Search Web クローラーでは、要求の待機時間を設定してクロール速度を調整する、同じ Web サイトに同時に送られる同時要求数の上限を設定する、複数のサイトがホストされている特定の IP アドレスでの同時クロールを有効/無効にする、などの操作を行うことができます。同時にクロールする同時 Web サイト数を制限することで FAST Search Web クローラー の帯域幅を制限することもできます。

クロール スケジュールを設定する

FAST Search Lotus Notes コネクタと FAST Search データベース コネクタは、Windows タスク スケジューラを使用してクロールをスケジューリングします。FAST Search Web クローラーのクロールのスケジューリングは、XML 構成ファイル内のパラメーターを設定することで行えます。FAST Search Web クローラーのクロールのスケジューリングは、XML 構成ファイル内のパラメーターを設定することで行えます。

ヒント

手動で開始されたフル クロール サイクルを終了してから追加的なクロールをスケジューリングすることをお勧めします。これでフル クロールにかかる時間がわかり、最初のクロールがまだ完了しないうちに新しいクロールや増分クロールを開始することを避けることができます。

See Also

Concepts

FAST Search 固有のコネクタの展開を計画する (FAST Search Server 2010 for SharePoint)