コンテンツソースについて (Search Server 2008)

[アーティクル]
06/16/2015

更新日: 2009年4月

適用対象: Microsoft Search Server 2008

トピックの最終更新日: 2015-03-09

注意

別途記載のない限り、この記事の情報は Microsoft Search Server 2008 と Microsoft Search Server 2008 Express の両方に適用されます。

コンテンツは、Web ページ、Microsoft Office Word 文書、ビジネスデータ、電子メールメッセージなど、クロール可能な任意のアイテムです。コンテンツは、Web サイト、ファイル共有、SharePoint サイトなどのコンテンツリポジトリに格納されています。コンテンツソースは、コンテンツがクロールされる方法やクロールのスケジュールを定義する設定を指定します。コンテンツソースには、コンテンツリポジトリのクロールを開始する 1 つ以上のアドレス (開始アドレスとも呼ばれます) が含まれています。これらの設定は、コンテンツソース全体内のすべての開始アドレスに適用されます。

既定のコンテンツソース

組織に必要なクロールが SharePoint サイトに含まれたコンテンツのみの場合は、追加のコンテンツソースを作成する必要はありません。Search Server 2008 は、最初の展開時に既定のコンテンツソースを定義します。既定のコンテンツソースは、"ローカルの Office SharePoint Server サイト" と呼ばれます。サーバーファーム内のすべての Web アプリケーションの開始アドレスは、既定のコンテンツソースの一部として自動的に含まれます。このコンテンツソースは既定ではクロールされません。既定のコンテンツソース内のコンテンツのインデックスを作成するには、クロールを手動で開始するか、クロールを行うスケジュールを作成します。

新しいコンテンツソースを作成する

コンテンツソースの作成時、クロール対象のコンテンツの種類を定義する設定、コンテンツがクロールされるタイミング、クロールの動作 (開始アドレスの名前空間内でクロールする深さ、許可されるサーバーホップ数など) を指定します。クロールする複数の種類のコンテンツリポジトリがある場合、または一部のコンテンツリポジトリを異なるスケジュールでクロールする場合、追加のコンテンツソースを作成する必要があります。Search Server には、最大 500 個のコンテンツソースをサポートする 1 つの共有サービスプロバイダ (SSP) があります。詳細については、「コンテンツをクロールするための計画を立てる (Search Server 2008)」の「コンテンツソースを計画する」を参照してください。クロールの動作を構成する方法の詳細については、「クロールされるコンテンツの量を制限または増加させる (Search Server 2008)。」を参照してください。

コンテンツリポジトリの種類

クロールできるコンテンツの種類は、コンテンツソースごとに 1 種類のみです。つまり、SharePoint サイトの URL を含むコンテンツソースと、ファイル共有の URL を含む別のコンテンツソースを作成できますが、SharePoint サイトとファイル共有の両方の URL を含む単一のコンテンツソースを作成することはできません。

次の表に、Search Server でクロールおよびインデックス作成が可能なコンテンツの種類の一覧を示します。

コンテンツソースの種類	含まれるコンテンツの種類
SharePoint サイト	同じファーム、または別々の Microsoft Office SharePoint Server 2007 ファーム、Windows SharePoint Services 3.0 ファーム、または Search Server 2008 ファームの SharePoint サイト Microsoft Office SharePoint Portal Server 2003 ファーム、または Microsoft Windows SharePoint Services 2.0 ファームの SharePoint サイト注意 Search Server 2008 クローラは、Office SharePoint Server 2007、Windows SharePoint Services 3.0、または Search Server 2008 のサイトとサブサイトをすべて自動的にクロールできます。古いバージョンの SharePoint 製品とテクノロジはクロールできますが、クロールする各トップレベルのサイト (サイトコレクション) とサブサイトの URL を指定する必要があります。 Microsoft Office SharePoint Portal Server 2003 ファームのサイトディレクトリで指定されたサイトは、ポータルサイトのクロール時にクロールされます。サイトディレクトリの詳細については、「About the Site Directory (英語)」 (https://go.microsoft.com/fwlink/?linkid=88227&clcid=0x411) を参照してください。
Web サイト	SharePoint サイトで見つからない組織内の Web コンテンツインターネット上の Web サイトのコンテンツ注意クローラは、Web サイトと SharePoint サイトのコンテンツタイプを使用するとき、同じように動作します。異なるのは、それらのコンテンツソースの種類に対して構成できるクロール設定のみです。
ファイル共有	組織内のファイル共有のコンテンツ
Exchange パブリックフォルダ	Microsoft Exchange Server コンテンツ
Lotus Notes	Lotus Notes データベースに保存されているコンテンツ注意 Lotus Notes のコンテンツソースオプションは、インデックスサーバーを Lotus Notes と連携して動作するように構成するまで、ユーザーインターフェイスに表示されません。詳細については、「Lotus Notes をクロールするための準備をする (Search Server 2008)」を参照してください。

コンテンツの開始アドレス

各コンテンツソースは、クローラがコンテンツのリポジトリに接続するために使用する開始アドレスの一覧を維持しています。各コンテンツソースには、最大 500 個の開始アドレスを保持できます。複数のコンテンツソースを使用して同じアドレスをクロールすることはできません。たとえば、サイトコレクションとそのすべてのサブサイトをクロールするための特定のコンテンツソースを使用する場合、それらのサブサイトの 1 つをクロールする別のコンテンツソースを異なるスケジュールで使用することはできません。

コンテンツのクロール

コンテンツソースを使用して、手動でクロールを開始するか、選択したコンテンツソースをクロールするタイミングと頻度をスケジュールすることができます。コンテンツソースの一部のコンテンツを異なるスケジュールでクロールする場合は、そのコンテンツの分割コンテンツソースを作成する必要があります。パフォーマンスおよび管理上の理由から、分割するコンテンツソースの数はできるだけ少なくすることをお勧めします。手動でクロールを開始する方法またはクロールをスケジュールする方法については、「コンテンツのクロール (Search Server 2008)」を参照してください。

認証

コンテンツソースに指定されている開始アドレスにクローラがアクセスするとき、クローラはそのコンテンツをホストするサーバーの認証を受け、アクセスの許可を受ける必要があります。クローラによって使用されるユーザーアカウントには、コンテンツをクロールするために少なくとも読み取りアクセス許可が必要です。既定で、Search Server は、既定のコンテンツアクセスアカウントを使用します。また、サーバーでの認証には、NTLM を使用します。詳細については、「クローラの認証方法を構成する (Search Server 2008)」を参照してください。

コンテンツソースについて (Search Server 2008)

既定のコンテンツソース

新しいコンテンツソースを作成する

コンテンツリポジトリの種類

コンテンツの開始アドレス

コンテンツのクロール

認証

関連項目

概念

その他のリソース

コンテンツ ソースについて (Search Server 2008)

既定のコンテンツ ソース

新しいコンテンツ ソースを作成する

コンテンツ リポジトリの種類

コンテンツの開始アドレス

コンテンツのクロール

認証

関連項目

概念

その他のリソース

コンテンツソースについて (Search Server 2008)

既定のコンテンツソース

新しいコンテンツソースを作成する

コンテンツリポジトリの種類