コンテンツ ソースについて (Search Server 2008)

更新日: 2009年4月

適用対象: Microsoft Search Server 2008

 

トピックの最終更新日: 2015-03-09

注意

別途記載のない限り、この記事の情報は Microsoft Search Server 2008 と Microsoft Search Server 2008 Express の両方に適用されます。

コンテンツは、Web ページ、Microsoft Office Word 文書、ビジネス データ、電子メール メッセージなど、クロール可能な任意のアイテムです。コンテンツは、Web サイト、ファイル共有、SharePoint サイトなどのコンテンツ リポジトリに格納されています。コンテンツ ソースは、コンテンツがクロールされる方法やクロールのスケジュールを定義する設定を指定します。コンテンツ ソースには、コンテンツ リポジトリのクロールを開始する 1 つ以上のアドレス (開始アドレスとも呼ばれます) が含まれています。これらの設定は、コンテンツ ソース全体内のすべての開始アドレスに適用されます。

既定のコンテンツ ソース

組織に必要なクロールが SharePoint サイトに含まれたコンテンツのみの場合は、追加のコンテンツ ソースを作成する必要はありません。Search Server 2008 は、最初の展開時に既定のコンテンツ ソースを定義します。既定のコンテンツ ソースは、"ローカルの Office SharePoint Server サイト" と呼ばれます。サーバー ファーム内のすべての Web アプリケーションの開始アドレスは、既定のコンテンツ ソースの一部として自動的に含まれます。このコンテンツ ソースは既定ではクロールされません。既定のコンテンツ ソース内のコンテンツのインデックスを作成するには、クロールを手動で開始するか、クロールを行うスケジュールを作成します。

新しいコンテンツ ソースを作成する

コンテンツ ソースの作成時、クロール対象のコンテンツの種類を定義する設定、コンテンツがクロールされるタイミング、クロールの動作 (開始アドレスの名前空間内でクロールする深さ、許可されるサーバー ホップ数など) を指定します。クロールする複数の種類のコンテンツ リポジトリがある場合、または一部のコンテンツ リポジトリを異なるスケジュールでクロールする場合、追加のコンテンツ ソースを作成する必要があります。Search Server には、最大 500 個のコンテンツ ソースをサポートする 1 つの共有サービス プロバイダ (SSP) があります。詳細については、「コンテンツをクロールするための計画を立てる (Search Server 2008)」の「コンテンツ ソースを計画する」を参照してください。クロールの動作を構成する方法の詳細については、「クロールされるコンテンツの量を制限または増加させる (Search Server 2008)。」を参照してください。

コンテンツ リポジトリの種類

クロールできるコンテンツの種類は、コンテンツ ソースごとに 1 種類のみです。つまり、SharePoint サイトの URL を含むコンテンツ ソースと、ファイル共有の URL を含む別のコンテンツ ソースを作成できますが、SharePoint サイトとファイル共有の両方の URL を含む単一のコンテンツ ソースを作成することはできません。

次の表に、Search Server でクロールおよびインデックス作成が可能なコンテンツの種類の一覧を示します。

コンテンツ ソースの種類 含まれるコンテンツの種類

SharePoint サイト

  • 同じファーム、または別々の Microsoft Office SharePoint Server 2007 ファーム、Windows SharePoint Services 3.0 ファーム、または Search Server 2008 ファームの SharePoint サイト

  • Microsoft Office SharePoint Portal Server 2003 ファーム、または Microsoft Windows SharePoint Services 2.0 ファームの SharePoint サイト

    注意

    Search Server 2008 クローラは、Office SharePoint Server 2007、Windows SharePoint Services 3.0、または Search Server 2008 のサイトとサブサイトをすべて自動的にクロールできます。古いバージョンの SharePoint 製品とテクノロジはクロールできますが、クロールする各トップ レベルのサイト (サイト コレクション) とサブサイトの URL を指定する必要があります。
    Microsoft Office SharePoint Portal Server 2003 ファームのサイト ディレクトリで指定されたサイトは、ポータル サイトのクロール時にクロールされます。サイト ディレクトリの詳細については、「About the Site Directory (英語)」 (https://go.microsoft.com/fwlink/?linkid=88227&clcid=0x411) を参照してください。

Web サイト

  • SharePoint サイトで見つからない組織内の Web コンテンツ

  • インターネット上の Web サイトのコンテンツ

    注意

    クローラは、Web サイトと SharePoint サイトのコンテンツ タイプを使用するとき、同じように動作します。異なるのは、それらのコンテンツ ソースの種類に対して構成できるクロール設定のみです。

ファイル共有

  • 組織内のファイル共有のコンテンツ

Exchange パブリック フォルダ

  • Microsoft Exchange Server コンテンツ

Lotus Notes

  • Lotus Notes データベースに保存されているコンテンツ

    注意

    Lotus Notes のコンテンツ ソース オプションは、インデックス サーバーを Lotus Notes と連携して動作するように構成するまで、ユーザー インターフェイスに表示されません。詳細については、「Lotus Notes をクロールするための準備をする (Search Server 2008)」を参照してください。

コンテンツの開始アドレス

各コンテンツ ソースは、クローラがコンテンツのリポジトリに接続するために使用する開始アドレスの一覧を維持しています。各コンテンツ ソースには、最大 500 個の開始アドレスを保持できます。複数のコンテンツ ソースを使用して同じアドレスをクロールすることはできません。たとえば、サイト コレクションとそのすべてのサブサイトをクロールするための特定のコンテンツ ソースを使用する場合、それらのサブサイトの 1 つをクロールする別のコンテンツ ソースを異なるスケジュールで使用することはできません。

コンテンツのクロール

コンテンツ ソースを使用して、手動でクロールを開始するか、選択したコンテンツ ソースをクロールするタイミングと頻度をスケジュールすることができます。コンテンツ ソースの一部のコンテンツを異なるスケジュールでクロールする場合は、そのコンテンツの分割コンテンツ ソースを作成する必要があります。パフォーマンスおよび管理上の理由から、分割するコンテンツ ソースの数はできるだけ少なくすることをお勧めします。手動でクロールを開始する方法またはクロールをスケジュールする方法については、「コンテンツのクロール (Search Server 2008)」を参照してください。

認証

コンテンツ ソースに指定されている開始アドレスにクローラがアクセスするとき、クローラはそのコンテンツをホストするサーバーの認証を受け、アクセスの許可を受ける必要があります。クローラによって使用されるユーザー アカウントには、コンテンツをクロールするために少なくとも読み取りアクセス許可が必要です。既定で、Search Server は、既定のコンテンツ アクセス アカウントを使用します。また、サーバーでの認証には、NTLM を使用します。詳細については、「クローラの認証方法を構成する (Search Server 2008)」を参照してください。

関連項目

概念

コンテンツをクロールするための計画を立てる (Search Server 2008)
ブログ投稿を検索結果として返すように検索を構成する (Search Server 2008)
SSL サイトのクロールに使用するクライアント証明書を構成する (Search Server 2008)
Web パーツのプロパティを構成する (Search Server 2008)