更新 : 2009-04-16
Microsoft Office SharePoint Server 2007 のクローラでは、プロトコル ハンドラを使用してコンテンツにアクセスしてから IFilter にアクセスして、クロールされるファイルからコンテンツを抽出します。IFilter は、エンジンがドキュメントのコンテンツにインデックスを作成する前に、アプリケーション固有の書式設定を削除します。プロトコル ハンドラと IFilter がインストールされる対象のファイルの種類のみが Office SharePoint Server 2007 によってクロールされます。
このセクションでは、既定で Office SharePoint Server 2007 インストールに含まれる IFilter とプロトコル ハンドラについて、また、追加の IFilter とプロトコル ハンドラのインストールおよび登録を行う方法について説明します。
クローラは、プロトコル ハンドラと IFilter を次のように使用します。
-
クローラはコンテンツ ソースの開始アドレスを取得し、URL のプレフィックスに基づいてプロトコル ハンドラを呼び出します。
-
プロトコル ハンドラはコンテンツ ソースに接続し、システム レベルのメタデータとアクセス制御リストの情報を抽出します。
-
プロトコル ハンドラは、ファイル名拡張子に基づいて各コンテンツ項目のファイル タイプを特定し、そのファイル タイプに関係付けられた適切な IFilter を呼び出します。
-
IFilter はコンテンツを抽出し、設定された書式があればそれを解除して、コンテンツ項目のメタデータを取得します。
-
コンテンツは対応する言語用の 1 つ以上のワード ブレーカによって解析され、コンテンツ インデックス (フルテキスト インデックスとも呼ばれます) に追加されます。メタデータとアクセス制御リストが検索データベースに追加されます。
このセクションの内容 :
関連項目