Konfigurieren eines dedizierten Front-End-Webservers für Crawlvorgänge (Office SharePoint Server 2007)

Microsoft Office SharePoint Server 2007 verwendet standardmäßig alle Front-End-Webserver in einer Serverfarm, um Inhalte in der Farm zu crawlen. Ist eine Farm so konfiguriert, hängt das Verhalten des Crawlers von der Anzahl der Front-End-Webserver in der Farm ab. Befindet sich in der Farm nur ein einziger Front-End-Webserver, sendet der Indexserver get-Anforderungen direkt an diesen Server. Wenn die Farm mehrere Front-End-Webserver umfasst, sendet der Indexserver get-Anforderungen an das Netzwerklastenausgleich-Modul, das wiederum jede Anforderung an einen der Front-End-Webserver weiterleitet. (Sind in einer Serverfarm mehrere Front-End-Webserver vorhanden, muss die Farm ein Netzwerklastenausgleich-Modul verwenden, um Inhaltsanforderungen von Benutzern auf die Front-End-Webserver zu verteilen.) Im Laufe der Zeit verteilt das Netzwerklastenausgleich-Modul Anforderungen auf alle Front-End-Webserver. Wenn ein Front-End-Webserver eine Inhaltsanforderung erhält, ruft er den Inhalt aus den Inhaltsdatenbanken ab, die mit den gecrawlten SharePoint-Websites verknüpft sind, und gibt diesen Inhalt an den Indexserver zurück.

Inhalt dieses Artikels:

  • Leistungsprobleme durch das Verwenden aller Front-End-Webserver für das Crawlen

  • Empfohlene Lösung

  • Informationen zum Konfigurieren eines dedizierten Front-End-Webservers für das Crawlen

Leistungsprobleme durch das Verwenden aller Front-End-Webserver für das Crawlen

Für kleine bis mittlere Organisationen kann das Verwenden aller Front-End-Webserver für das Crawlen eine gut funktionierende Lösung sein. In großen Organisationen werden meist größere Mengen an Inhalten gecrawlt, manchmal im Gigabyte- oder sogar im Terabyte-Bereich. Das Crawlen von Inhalten in einer Farm kann Belastungsspitzen im Netzwerkverkehr verursachen und die Ressourcen auf den Front-End-Webservern beträchtlich belasten, z. B. Datenträger, Prozessoren und Arbeitsspeicher. Durch das Crawlen einer großen Menge an Inhalten kann auf den Front-End-Webservern der Farm mehr Netzwerkverkehr entstehen als durch alle Benutzeranforderungen zusammen. Diese Verkehrslast kann die Leistung aller Front-End-Webserver in der Farm beeinträchtigen, was wiederum längere Reaktionszeiten bei Endbenutzeranforderungen für Inhalte von SharePoint-Websites zur Folge haben kann.

Empfohlene Lösung

Es empfiehlt sich, für das Crawlen einen dedizierten Front-End-Webserver zu verwenden, besonders dann, wenn durch das Crawlen von Inhalten mehr Netzwerkverkehr auf den Front-End-Webservern verursacht wird als durch Benutzeranforderungen. Sie können einen beliebigen Front-End-Webserver in der Farm für das Crawlen reservieren. Im Hinblick auf eine optimale Leistung ist es jedoch ratsam, den Indexserver als dedizierten Front-End-Webserver für das Crawlen zu konfigurieren, sofern er über ausreichende Kapazität für beide Rollen verfügt. Wenn der gleiche Computer sowohl als Indexserver als auch als dedizierter Front-End-Webserver fungiert, braucht der Indexserver beim Crawlen von Inhalten Anforderungen nicht an einen anderen Computer zu senden. Dadurch wird der Netzwerkverkehr insgesamt verringert und die Crawlingleistung verbessert.

Darüber hinaus wird empfohlen, den dedizierten Front-End-Webserver nicht in die Netzwerklastenausgleichs-Rotation für eingehende Benutzeranforderungen für Inhalte einzubeziehen. Anderenfalls kann es sein, dass Benutzeranforderungen, die vom Netzwerklastenausgleich-Modul an den dedizierten Front-End-Webserver für das Crawlen geleitet werden, mit inkonsistenter Leistung verarbeitet werden.

Fälle, in denen kein dedizierter Front-End-Webserver für das Crawlen konfiguriert werden sollte

Konfigurieren Sie keinen dedizierten Front-End-Webserver für das Crawlen, wenn eine der folgenden Bedingungen zutrifft:

  • Auf dem Indexserver wird eine andere Anwendung ausgeführt (z. B. die Dienste für Excel-Berechnungen). Wenn Sie in diesem Fall einen dedizierten Front-End-Webserver für das Crawlen konfigurieren, kann diese Anwendung möglicherweise nicht mehr mit anderen Servern in der Farm kommunizieren.

    Wenn auf dem Indexserver andere Anwendungen ausgeführt werden, verschieben Sie diese auf einen anderen Anwendungsserver, bevor Sie einen dedizierten Front-End-Webserver für das Crawlen konfigurieren.

  • Sie möchten den Indexserver als dedizierten Front-End-Webserver für das Crawlen verwenden, und der Indexserver ist gleichzeitig als Abfrageserver konfiguriert.

  • Der NetBIOS-Name des Abfrageservers ist zugleich auch der Hostname der SharePoint-Website.

In beiden Fällen kann das Konfigurieren eines dedizierten Front-End-Webservers für das Crawlen zur Folge haben, dass der Indexserver den Index nicht mehr an einen anderen Server verteilen kann.

Informationen zum Konfigurieren eines dedizierten Front-End-Webservers für das Crawlen

Es gibt zwei Möglichkeiten, einen dedizierten Front-End-Webserver für das Crawlen zu konfigurieren:

  • Verwenden der Seite Einstellungen für den Office SharePoint Server-Suchdienst konfigurieren in der Zentraladministration.

  • Direktes Aktualisieren der Hostdatei

Bevor Sie einen dedizierten Front-End-Webserver für das Crawlen konfigurieren, sollten Sie den folgenden Abschnitt lesen, um festzustellen, welche Konfigurationsmethode am besten geeignet ist.

Auswirkung auf die Hostdatei, wenn ein dedizierter Front-End-Webserver für das Crawlen über die Benutzeroberfläche konfiguriert wird

Beim Crawlen von Inhalten liest Microsoft Office SharePoint Server 2007 die Hostdatei auf dem Indexserver, um festzustellen, ob alle Front-End-Webserver (Standard) oder ein dedizierter Front-End-Webserver für das Crawlen verwendet werden soll.

Wenn Sie die Seite Einstellungen für den Office SharePoint Server-Suchdienst konfigurieren in der Zentraladministration verwenden, um einen dedizierten Front-End-Webserver für das Crawlen auszuwählen, schreibt der SharePoint-Timerdienst die folgenden Einträge in die Hostdatei:

  • Einen Eintrag, der die IP-Adresse und den Computernamen des Front-End-Webservers angibt.

  • Einen Eintrag für jede Webanwendung auf dem Front-End-Webserver, für die Sie die Verwendung eines Hostheaders konfiguriert haben. In jedem dieser Einträge wird die IP-Adresse des Front-End-Webservers und danach der Hostheader angegeben.

Jeder Eintrag steht in der Hostdatei auf einer separaten Zeile. Im Folgenden ein Beispiel:

111.11.111.111 MyMossMachine #Added by Office SharePoint Server Search (7/15/2008 2:56 PM).

111.11.111.111 Marketing #Added by Office SharePoint Server Search (7/15/2008 2:56 PM).

111.11.111.111 Human Resources #Added by Office SharePoint Server Search (7/15/2008 2:57 PM).

Mögliche Probleme

In manchen Fällen schreibt der Timerdienst die falsche IP-Adresse in die Hostdatei. (Weitere Informationen finden Sie im Blogbeitrag unter https://go.microsoft.com/fwlink/?linkid=135698&clcid=0x407 (in englischer Sprache).) Dies kann Probleme verursachen, von der Unmöglichkeit, Inhalte zu crawlen, bis hin zur Unfähigkeit, Websites anzuzeigen, beispielsweise die Website des Anbieters von gemeinsamen Diensten (Shared Services Provider, SSP) oder die Website für die Zentraladministration. Die folgenden Situationen können zur Folge haben, dass der Hostdatei vom Timerdienst eine falsche IP-Adresse hinzugefügt wird:

  • Der Server, den Sie als dedizierten Front-End-Webserver für das Crawlen angegeben haben, verfügt über mehrere IP-Adressen, die einer oder mehreren Netzwerkkarten zugewiesen sind.

  • In der Serverfarm wird Netzwerklastenausgleich verwendet.

Wenn eine dieser Bedingungen zutrifft, wird empfohlen, die Einträge direkt zur Hostdatei hinzuzufügen, anstatt über die Benutzeroberfläche einen dedizierten Front-End-Webserver für das Crawlen anzugeben.

Wichtig

Wenn Sie die Seite Einstellungen für den Office SharePoint Server-Suchdienst konfigurieren in der Zentraladministration verwenden, um einen dedizierten Front-End-Webserver für das Crawlen anzugeben, können Sie die Hostdatei nicht manuell ändern, wenn der Timerdienst die falsche IP-Adresse hinzugefügt hat. Der Grund hierfür ist, dass die Einträge in der Hostdatei vom Timerdienst alle paar Minuten überschrieben werden. In diesem Fall geben Sie auf der Seite Einstellungen für den Office SharePoint Server-Suchdienst konfigurieren in der Zentraladministration an, dass alle Front-End-Webserver für das Crawlen verwendet werden und entfernen dann die Einträge in der Hostdatei, die vom Timerdienst hinzugefügt wurden.

Verwenden Sie eines der folgenden Verfahren, um einen dedizierten Front-End-Webserver für das Crawlen zu konfigurieren: