Planen der Durchforstung und der Sammelsuche (SharePoint Server 2010)

Artikel
03/04/2017

Gilt für: SharePoint Server 2010

Letztes Änderungsdatum des Themas: 2016-11-30

Bevor Endbenutzer die Funktion für die Suche in Unternehmen von Microsoft SharePoint Server 2010 verwenden können, müssen Sie zuerst den Inhalt, den Sie Benutzern für die Suche verfügbar machen möchten, durchsuchen oder die Sammelsuche dafür ausführen. Die Planung für das Durchsuchen oder die Sammelsuche beinhaltet die folgenden Aufgaben:

Planen von Inhaltsquellen
Planen von eingeschlossenen Dateitypen und IFilters
Planen der Authentifizierung
Planen von Konnektoren
Planen der Verwaltung von Auswirkungen des Durchforstens
Planen von Durchforstungsregeln
Planen von Sucheinstellungen, die auf Farmebene verwaltet werden
Planen der Sammelsuche

Planen von Inhaltsquellen

Bei einer Inhaltsquelle handelt es sich um bestimmte Optionen, mit denen Sie festlegen können, welcher Inhaltstyp und welche URL durchforstet werden sollen und wie tief und zu welchem Zeitpunkt die Durchforstung erfolgen soll. Die standardmäßige Inhaltsquelle ist Lokale SharePoint-Websites. Mithilfe dieser Inhaltsquelle können Sie angeben, wie sämtliche Inhalte aller einer bestimmten Suchdienstanwendung zugeordneten Webanwendungen durchforstet werden sollen. Standardmäßig wird von SharePoint Server 2010 für jede Webanwendung, die eine bestimmte Suchdienstanwendung verwendet, der Standardinhaltsquelle die Startadresse der Website auf oberster Ebene hinzugefügt.

Die Suchanforderungen einiger Organisationen können mit der Standardinhaltsquelle erfüllt werden. Viele Organisationen benötigen jedoch zusätzliche Inhaltsquellen. Planen Sie zusätzliche Inhaltsquellen ein, wenn Sie die folgenden Aufgaben ausführen müssen:

Durchforsten unterschiedlicher Inhaltstypen – z. B. SharePoint-Websites, Dateifreigaben und Geschäftsdaten
Durchforsten bestimmter Inhalte mit Zeitplänen, die sich von denen anderer Inhalte unterscheiden
Einschränken oder Erhöhen der Menge der durchforsteten Inhalte
Festlegen verschiedener Prioritäten für das Durchforsten unterschiedlicher Websites

Sie können bis zu 500 Inhaltsquellen für jede Suchdienstanwendung erstellen, und jede Inhaltsquelle kann bis zu 500 Startadressen enthalten. Zur Vereinfachung der Verwaltung sollten Sie die Anzahl der erstellten Inhaltsquellen beschränken.

Planen des Durchforstens von unterschiedlichen Inhaltstypen

Sie können nur einen Inhaltstyp pro Inhaltsquelle durchforsten. Das heißt, dass Sie eine Inhaltsquelle erstellen können, die Startadressen für SharePoint-Websites enthält, und eine weitere Inhaltsquelle, die Startadressen für Dateifreigaben enthält. Sie können jedoch keine Inhaltsquelle erstellen, die Startadressen sowohl für SharePoint-Websites als auch Dateifreigaben enthält. In der folgenden Tabelle werden die Typen von Inhaltsquellen aufgeführt, die Sie konfigurieren können.

Verwendung dieses Typs von Inhaltsquelle	Für diesen Inhalt
SharePoint-Websites	SharePoint-Websites von derselben Farm oder verschiedenen Microsoft SharePoint Server 2010-, Microsoft SharePoint Foundation 2010- oder Microsoft Search Server 2010-Farmen SharePoint-Websites von derselben Farm oder verschiedenen Microsoft Office SharePoint Server 2007-, Windows SharePoint Services 3,0- oder Microsoft Search Server 2010-Farmen SharePoint-Websites von Microsoft Office SharePoint Portal Server 2003- oder Windows SharePoint Services 2.0-Farmen Hinweis Im Gegensatz zum Durchforsten von SharePoint-Websites in SharePoint Server 2010, SharePoint Foundation 2010 oder Search Server 2010 können vom Crawler nicht automatisch alle Unterwebsites in einer Websitesammlung aus früheren Versionen der SharePoint-Produkte und -Technologien durchforstet werden. Daher müssen Sie beim Durchforsten von SharePoint-Websites aus früheren Versionen, die Startadresse jeder Website auf oberster Ebene und die URL jeder Unterwebsite angeben, die durchforstet werden sollen.
Websites	Andere Webinhalte in Ihrer Organisation, die in SharePoint-Websites nicht gefunden werden Inhalte von Websites im Internet
Dateifreigaben	Inhalte in Dateifreigaben innerhalb der Organisation
Öffentliche Exchange-Ordner	Microsoft Exchange Server-Inhalt
Lotus Notes	In Lotus Notes-Datenbanken gespeicherte E-Mail-Nachrichten Hinweis Im Gegensatz zu allen anderen Typen von Inhaltsquellen wird die Option für Lotus Notes-Inhaltsquellen erst auf der Benutzeroberfläche angezeigt, wenn Sie die entsprechende erforderliche Software installiert und konfiguriert haben. Weitere Informationen finden Sie unter Konfigurieren und Verwenden des Lotus Notes-Connectors (SharePoint Server 2010).
Geschäftsdaten	In Branchenanwendungen gespeicherte Geschäftsdaten

Planen der Inhaltsquellen für Geschäftsdaten

Für Inhaltsquellen von Geschäftsdaten müssen die Hostanwendungen der Daten zuerst in einem Anwendungsmodell in einer Business Data Connectivity-Dienstanwendung angegeben werden. Sie können eine Inhaltsquelle zum Durchforsten aller im Business Data Connectivity-Dienst registrierten Anwendungen erstellen, oder Sie können separate Inhaltsquellen zum Durchforsten einzelner Anwendungen erstellen.

Häufig sind die Personen, die die Integration von Geschäftsdaten in Websitesammlungen planen, nicht dieselben Personen, die am gesamten Inhaltsplanungsprozess beteiligt sind. Schließen Sie daher Geschäftsanwendungsadministratoren in Inhaltsplanungsteams ein, sodass diese Sie bei der Integration der Geschäftsanwendungsdaten in Inhalt und der effektiven Darstellung in den Websitesammlungen beraten können.

Durchforsten von Inhalten mit unterschiedlichen Zeitplänen

Sie müssen entscheiden, ob bestimmter Inhalt häufiger als anderer Inhalt durchforstet wird. Je mehr Inhalt Sie durchforsten, desto wahrscheinlicher ist es, dass Sie Inhalt aus unterschiedlichen Inhaltsrepositorys durchforsten. Der Inhalt ist möglicherweise nicht vom selben Typ und auf Servern mit unterschiedlicher Kapazität gespeichert. Diese Faktoren machen es wahrscheinlicher, dass Sie Inhaltsquellen hinzufügen müssen, um die unterschiedlichen Inhaltsrepositorys zu unterschiedlichen Zeiten zu durchforsten.

Im Folgenden finden Sie die Hauptgründe für das Durchforsten von Inhalten mit unterschiedlichen Zeitplänen:

Ausgleich von Downtimes und Spitzenauslastungszeiten
Häufigeres Durchforsten von Inhalten, die häufiger aktualisiert werden
Separates Durchforsten von Inhalten, die jeweils auf langsameren bzw. schnelleren Servern gespeichert sind

In vielen Fällen sind diese Informationen erst bekannt, nachdem SharePoint Server 2010 bereitgestellt und eine Weile ausgeführt wurde. In diesen Fällen müssen Sie nach der Einführung der Farm in der Produktionsumgebung Durchforstungszeitpläne angeben. Dennoch empfiehlt es sich, diese Faktoren bei der Planung zu berücksichtigen, sodass Sie die Durchforstungszeitpläne anhand der verfügbaren Informationen planen können.

Die folgenden zwei Abschnitte enthalten weitere Informationen zum Durchforsten von Inhalten mit unterschiedlichen Zeitplänen.

Überlegungen für die Planung von Durchforstungszeitplänen

Sie können Durchforstungszeitpläne für jede Inhaltsquelle unabhängig konfigurieren. Für jede Inhaltsquelle können Zeiten für vollständige Durchforstungen und separate Zeiten für inkrementelle Durchforstungen angegeben werden. Beachten Sie, dass Sie eine vollständige Durchforstung für eine bestimmte Inhaltsquelle ausführen müssen, bevor Sie eine inkrementelle Durchforstung ausführen können. Selbst wenn Sie eine inkrementelle Durchforstung für Inhalt angeben, der noch nicht durchforstet wurde, wird eine vollständige Durchforstung ausgeführt.

Hinweis

Bei einer vollständigen Durchforstung werden unabhängig davon, ob die Inhalte bereits durchforstet wurden, alle vom Crawler gefundenen Inhalte durchforstet, für die der Crawler mindestens über Lesezugriff verfügt. Daher können vollständige Durchforstungen erheblich mehr Zeit beanspruchen als inkrementelle Durchforstungen.

Es wird empfohlen, Durchforstungszeitpläne auf Grundlage von Verfügbarkeit, Leistung und Bandbreite der Durchforstungs- und Abfrageserver zu planen.

Berücksichtigen Sie bei der Planung von Durchforstungszeitplänen die folgenden bewährten Methoden:

Gruppieren Sie Startadressen in Inhaltsquellen basierend auf ähnlicher Verfügbarkeit und mit akzeptabler Gesamtverwendung der Ressourcen für die Server, auf denen die Inhalte gehostet werden.
Planen Sie inkrementelle Durchforstungen für die einzelnen Inhaltsquellen zu Zeiten, in denen die Server, die die Inhalte hosten, verfügbar sind und die Serverressourcen nur wenig beansprucht werden.
Staffeln Sie Durchforstungszeitpläne, sodass die Belastung der Server in der Serverfarm über einen Zeitraum verteilt wird.
Planen Sie vollständige Durchforstungen nur, wenn Gründe vorliegen, die im nächsten Abschnitt aufgeführt sind. Es wird empfohlen, vollständige Durchforstungsvorgänge seltener als inkrementelle Durchforstungen auszuführen.
Planen Sie die Ausführung von Verwaltungsänderungen, die eine vollständige Durchforstung erfordern, kurz vor dem geplanten Zeitpunkt für vollständige Durchforstungen. Es empfiehlt sich beispielsweise, die Erstellung der Durchforstungsregel vor der nächsten geplanten vollständigen Durchforstung vorzunehmen, sodass keine zusätzliche vollständige Durchforstung erforderlich ist.
Basieren Sie gleichzeitige Durchforstungen auf der verfügbaren Kapazität. Für eine optimale Leistung wird empfohlen, die Durchforstungszeitpläne der Inhaltsquellen zu staffeln. Sie können Durchforstungszeitpläne im Laufe der Zeit optimieren, wenn Sie mit dem typischen Zeitaufwand für das Durchforsten der einzelnen Inhaltsquellen vertraut sind.

Gründe für eine vollständige Durchforstung

Der Administrator einer Suchdienstanwendung kann aus den folgenden Gründen eine vollständige Durchforstung ausführen:

Auf Servern in der Farm wurde ein Softwareupdate oder Service Pack installiert. Weitere Informationen finden Sie in den Anweisungen für das Softwareupdate oder Service Pack.
Ein Administrator für gemeinsame Dienste von Microsoft Office SharePoint Server 2007 oder ein Administrator für die SharePoint Server 2010-Suchdienstanwendung hat eine neue verwaltete Eigenschaft hinzugefügt. Eine vollständige Durchforstung ist erforderlich, damit die neue verwaltete Eigenschaft sofort wirksam wird. Wenn die neue verwaltete Eigenschaft sofort wirksam sein soll, ist keine vollständige Durchforstung erforderlich.
Sie möchten ASPX-Seiten auf Windows SharePoint Services 3,0- oder Microsoft Office SharePoint Server 2007-Websites erneut indizieren.

Hinweis

Der Crawler kann nicht ermitteln, wann ASPX-Seiten auf Windows SharePoint Services 3,0- oder Office SharePoint Server 2007-Websites geändert wurden. Daher wird bei inkrementellen Durchforstungen keine erneute Indizierung von Ansichten oder Homepages vorgenommen, wenn einzelne Listenelemente gelöscht werden. Es wird empfohlen, regelmäßig vollständige Durchforstungen von Websites vorzunehmen, die ASPX-Dateien enthalten, um sicherzustellen, dass diese Seiten erneut indiziert werden.
Sie möchten Fehler bei aufeinander folgenden inkrementellen Durchforstungen beheben. Tritt bei einer inkrementellen Durchforstung einhundert Mal in Folge auf einer beliebigen Ebene eines Repositorys ein Fehler auf, wird der betroffene Inhalt aus dem Index entfernt.
Es wurden Durchforstungsregeln hinzugefügt, gelöscht oder geändert.
Sie möchten einen beschädigten Index reparieren.
Der Administrator der Suchdienstanwendung hat mindestens eine Servernamenszuordnung erstellt.
Die Anmeldeinformationen für das Benutzerkonto, das dem Standardkonto für den Inhaltszugriff oder einer Durchforstungsregel zugewiesen ist, wurden geändert.

Vom System wird unter folgenden Umständen selbst dann eine vollständige Durchforstung ausgeführt, wenn eine inkrementelle Durchforstung angefordert wird:

Ein Suchadministrator hat die vorherige Durchforstung beendet.
Eine Inhaltsdatenbank wurde wiederhergestellt, oder ein Farmadministrator hat eine Inhaltsdatenbank getrennt und erneut angefügt.

Hinweis

Wenn Sie Office SharePoint Server 2007 mit dem Infrastrukturupdate für Microsoft Office Server oder SharePoint Server 2010 ausführen, können Sie mit dem restore-Vorgang des Befehlszeilentools Stsadm ändern, ob durch die Wiederherstellung einer Inhaltsdatenbank eine vollständige Durchforstung verursacht wird.
In dieser Suchdienstanwendung wurde noch nie eine vollständige Durchforstung der Website ausgeführt.
Das Änderungsprotokoll enthält keine Einträge für die Adressen, die durchforstet werden. Ohne Einträge im Änderungsprotokoll für die durchforsteten Elemente können keine inkrementellen Durchforstungen erfolgen.

Sie können Zeitpläne nach der anfänglichen Bereitstellung auf Grundlage von Leistung und Kapazität der Server in der Farm und der Server, die den Inhalt hosten, anpassen.

Begrenzen oder Erhöhen des Volumens der zu durchforstenden Inhalte

Für jede Inhaltsquelle können Sie angeben, wie umfassend die Startadressen durchforstet werden sollen. Sie geben auch das Durchforstungsverhalten an, indem Sie die Durchforstungseinstellungen ändern. Die für eine bestimmte Inhaltsquelle verfügbaren Optionen hängen vom ausgewählten Inhaltsquellentyp ab. Die meisten Durchforstungsoptionen bestimmen jedoch, wie viele Ebenen der Hierarchie von jeder Startadresse aus durchforstet werden. Beachten Sie, dass dieses Verhalten auf alle Startadressen in einer bestimmten Inhaltsquelle angewendet wird. Wenn Sie einige Websites auf tieferen Ebenen durchforsten möchten, können Sie zusätzliche Inhaltsquellen erstellen, die diese Websites umfassen.

Mit den Optionen für die Durchforstungseinstellungen können Sie den Umfang des durchforsteten Inhalts einschränken oder erhöhen. Die in den Eigenschaften für jede Inhaltsquelle verfügbaren Optionen hängen vom ausgewählten Inhaltsquellentyp ab. In der folgenden Tabelle werden bewährte Methoden zum Konfigurieren der Optionen für Durchforstungseinstellungen beschrieben.

Verwendeter Inhaltsquellentyp	Situation	Zu verwendende Option der Durchforstungseinstellung
SharePoint-Websites	Sie möchten die Inhalte auf der Website selbst einschließen, aber nicht die Inhalte auf den Unterwebsites, oder Sie möchten die Inhalte auf Unterwebsites nach einem anderen Zeitplan durchforsten.	Nur die SharePoint-Website für jede Startadresse durchforsten
SharePoint-Websites	Sie möchten die Inhalte auf der Website selbst einschließen. - oder - Sie möchten sämtliche Inhalte unter der Startadresse mit demselben Zeitplan durchforsten.	Alle Websites unter dem Hostnamen für jede Startadresse durchforsten
Websites	Die auf verknüpften Websites verfügbaren Inhalte sind wahrscheinlich nicht relevant.	Nur innerhalb des Servers jeder Startadresse durchforsten
Websites	Relevante Inhalte befinden sich nur auf der ersten Seite.	Nur die erste Seite jeder Startadresse durchforsten
Websites	Sie möchten die Tiefe beschränken, mit der die Links der Startadressen durchforstet werden.	Benutzerdefiniert – Geben Sie die Seitentiefe und die Serverwechsel an Hinweis Für eine stark vernetzte Website wird empfohlen, mit einer kleinen Anzahl zu beginnen, da möglicherweise das gesamte Internet durchforstet wird, wenn eine Tiefe von mehr als drei Seiten angegeben wird oder mehr als drei Serverwechsel angegeben werden.
Dateifreigaben Öffentliche Exchange-Ordner	Die in den Unterordnern verfügbaren Inhalte sind wahrscheinlich nicht relevant.	Nur den Ordner jeder Startadresse durchforsten
Dateifreigaben Öffentliche Exchange-Ordner	Die Inhalte in den Unterordnern sind wahrscheinlich relevant.	Den Ordner und alle Unterordner jeder Startadresse durchforsten
Geschäftsdaten	Alle im BDC-Metadatenspeicher registrierten Anwendungen enthalten relevante Inhalte.	Gesamten BDC-Metadatenspeicher durchforsten
Geschäftsdaten	Alle im BDC-Metadatenspeicher registrierten Anwendungen enthalten relevante Inhalte. - oder - Sie möchten einige Anwendungen mit einem anderen Zeitplan durchforsten.	Ausgewählte Anwendungen durchforsten

Weitere Überlegungen beim Planen von Inhaltsquellen

Sie können nicht dieselben Startadressen unter Verwendung mehrerer Inhaltsquellen in derselben Suchdienstanwendung durchforsten. Wenn Sie beispielsweise eine bestimmte Inhaltsquelle verwenden, um eine Websitesammlung und alle dazugehörigen Unterwebsites zu durchforsten, können Sie keine andere Inhaltsquelle verwenden, um eine dieser Unterwebsites separat mit einem anderen Zeitplan zu durchforsten.

Neben der Berücksichtigung von Durchforstungsplänen hängt die Entscheidung, ob Startadressen in einer einzigen Inhaltsquelle gruppiert oder zusätzliche Inhaltsquellen erstellt werden sollen, weitgehend von Verwaltungsüberlegungen ab. Administratoren nehmen häufig Änderungen vor, mit denen eine bestimmte Inhaltsquelle aktualisiert wird. Das Ändern einer Inhaltsquelle erfordert eine vollständige Durchforstung des in dieser Inhaltsquelle angegebenen Inhaltsrepositorys. Organisieren Sie zum Vereinfachen der Verwaltung die Inhaltsquellen so, dass Aktualisierungen von Inhaltsquellen, Durchforstungsregeln und Durchforstungszeitplänen für die Administratoren unkompliziert sind.

Planen von eingeschlossenen Dateitypen und IFilters

Inhalt wird nur durchforstet, wenn die entsprechende Dateinamenerweiterung in der Liste der eingeschlossenen Dateitypen enthalten und ein IFilter auf dem Durchforstungsserver installiert ist, der diese Dateitypen unterstützt. Mehrere Dateitypen und IFilters sind automatisch bei der Erstinstallation enthalten. Bestimmen Sie bei der Planung von Inhaltsquellen in der Erstbereitstellung, ob für Inhalt, den Sie durchforsten möchten, nicht enthaltene Dateitypen verwendet werden. Wenn Dateitypen nicht enthalten sind, müssen Sie diese Dateitypen auf der Seite Dateitypen verwalten während der Bereitstellung hinzufügen und sicherstellen, dass ein IFilter installiert und registriert ist, um diesen Dateityp zu unterstützen.

Wenn bestimmte Dateitypen nicht durchforstet werden sollen, können Sie die Dateinamenerweiterung für diesen Dateityp aus der Liste der eingeschlossenen Dateitypen löschen. Damit werden Dateinamen mit dieser Erweiterung vom Durchforsten ausgeschlossen. Eine Liste der Dateitypen und IFilters, die standardmäßig installiert werden, finden Sie unter Referenz zu Dateitypen und IFilter (SharePoint Server 2010).

Planen der Authentifizierung

Wenn der Crawler auf die in den Inhaltsquellen aufgelisteten Startadressen zugreift, muss der Crawler von den Servern, auf denen der Inhalt gehostet wird, authentifiziert werden und Zugriff auf diese Server erhalten. Dies bedeutet, dass das vom Crawler verwendete Domänenkonto mindestens über Leseberechtigung für den Inhalt verfügen muss.

Standardmäßig wird das Standardkonto für den Inhaltszugriff verwendet. Alternativ können Sie Durchforstungsregeln verwenden, um ein anderes Konto für den Inhaltszugriff anzugeben, das beim Durchforsten von bestimmten Inhalten verwendet werden soll. Unabhängig davon, ob Sie das Standardkonto für den Inhaltszugriff oder ein anderes, durch eine Durchforstungsregel angegebenes Konto für den Inhaltszugriff verwenden, muss das verwendete Inhaltszugriffskonto über die Leseberechtigung für alle durchforsteten Inhalte verfügen. Andernfalls wird der Inhalt nicht durchforstet und nicht indiziert und ist deshalb für Abfragen nicht verfügbar.

Das Konto, das Sie als Standardkonto für den Inhaltszugriff angeben, sollte Zugriff auf den Großteil der durchforsteten Inhalte haben. Verwenden Sie andere Inhaltszugriffskonten nur dann, wenn Sicherheitsüberlegungen separate Inhaltszugriffskonten erforderlich machen.

Bestimmen Sie für jede geplante Inhaltsquelle die Startadressen, auf die nicht mit dem Standardkonto für den Inhaltszugriff zugegriffen werden kann, und planen Sie dann das Hinzufügen von Durchforstungsregeln für diese Startadressen.

Wichtig

Stellen Sie sicher, dass das Domänenkonto, das für das Standardkonto für den Inhaltszugriff oder ein beliebiges anderes Inhaltszugriffskonto verwendet wird, nicht dasselbe Domänenkonto ist, das von einem Anwendungspool verwendet wird, der einer von Ihnen durchforsteten Anwendung zugeordnet ist. Dadurch werden möglicherweise unveröffentlichte Inhalte auf SharePoint-Websites und Nebenversionen von Dateien (d. h. Verlauf) in SharePoint-Websites durchforstet und indiziert.

Ein weiterer wichtiger Aspekt ist, dass der Crawler dasselbe Authentifizierungsprotokoll wie der Hostserver verwenden muss. Standardmäßig verwendet der Crawler NTLM für die Authentifizierung. Sie können für den Crawler bei Bedarf die Verwendung eines anderen Authentifizierungsprotokolls konfigurieren.

Stellen Sie bei Verwendung der anspruchsbasierten Authentifizierung sicher, dass für jede zu durchforstende Webanwendung die Windows-Authentifizierung aktiviert ist.

Planen von Konnektoren

Für alle Inhalte, die durchforstet werden, ist die Verwendung eines Konnektors (in früheren Versionen als Protokollhandler bezeichnet) erforderlich, um Zugriff auf die Inhalte zu erhalten. SharePoint Server 2010 stellt Konnektoren für alle allgemeinen Internetprotokolle bereit. Wenn Sie jedoch Inhalte durchforsten möchten, für die ein Konnektor erforderlich ist, der nicht mit SharePoint Server 2010 installiert wird, müssen Sie vor dem Durchforsten der Inhalte den Konnektor von einem Drittanbieter oder einen benutzerdefinierten Konnektor installieren. Eine Liste der standardmäßig installierten Konnektoren finden Sie unter Standardkonnektoren (SharePoint Server 2010). Weitere Informationen zum Installieren von Konnektoren finden Sie unter Installieren von Connector-Produkten (SharePoint Server 2010).

Planen der Verwaltung von Auswirkungen des Durchforstens

Das Durchforsten von Inhalt kann die Leistung der Server, die den Inhalt hosten, erheblich beeinträchtigen. Die Auswirkungen auf einen bestimmten Server sind abhängig von der Auslastung auf dem Hostserver sowie davon, ob der Server über ausreichend Ressourcen (insbesondere CPU und RAM) verfügt, um die Vereinbarungen zum Servicelevel unter normalen Bedingungen oder bei Spitzenauslastung aufrechtzuerhalten.

Mithilfe von Regeln für Crawlerauswirkungen können Farmadministratoren die Auswirkungen des Crawlers auf die durchforsteten Server verwalten. Für jede Regel für Crawlerauswirkungen können Sie eine einzelne URL angeben oder im URL-Pfad Platzhalterzeichen verwenden, um einen Block von URLs einzuschließen, auf den die Regel angewendet wird. Sie können dann festlegen, wie viele gleichzeitige Seitenanforderungen für die angegebene URL ausgeführt werden, oder festlegen, dass immer nur je ein Dokument angefordert und eine bestimmte Anzahl von Sekunden zwischen den Anforderungen gewartet wird.

Mit Regeln für Crawlerauswirkungen wird die Rate angegeben, mit der der Crawler Inhalt von einer bestimmten Startadresse oder einem Bereich von Startadressen (auch als Websitename bezeichnet) anfordert. Eine Regel für Crawlerauswirkungen gilt für alle Inhaltsquellen in der Suchdienstanwendung, und die Abfragehäufigkeit gilt pro Durchforstungskomponente. Die folgende Tabelle enthält die Platzhalterzeichen, die Sie im Websitenamen verwenden können, wenn Sie eine Regel für Crawlerauswirkungen hinzufügen oder bearbeiten.

Dieses Platzhalterzeichen	Hat dieses Ergebnis
* als Websitename	Wendet die Regel auf alle Websites an.
. als Websitename	Wendet die Regel auf Websites mit Punkten im Namen an.
*.Websitename.com als Websitename	Wendet die Regel auf alle Websites in der Domäne Websitename.com an (z. B. *.adventure-works.com).
*.Domänenname_der_obersten_Ebene als Websitename	Wendet die Regel auf alle Websites an, die mit einem bestimmten Domänennamen der obersten Ebene enden, beispielsweise .com oder .net.
?	Ersetzt ein Zeichen in einer Regel. Beispielsweise wird .adventure-works?.com auf alle Websites in den Domänen adventure-works1.com, adventure-works2.com* usw. angewendet.

Sie können eine Regel für Crawlerauswirkungen für alle Websites in einer bestimmten übergeordneten Domäne erstellen. Beispielsweise gilt *.com für alle Internetwebsites mit Adressen, die auf .com enden. Beispielsweise könnte der Administrator einer Portalwebsite eine Inhaltsquelle für beispiele.microsoft.com hinzufügen. Die Regel für *.com gilt für diese Website, sofern Sie eine Regel für Crawlerauswirkungen speziell für beispiele.microsoft.com hinzufügen.

Mit den Administratoren von Suchsystemen, von denen Inhalte in Ihrer Organisation durchforstet werden, können Sie absprechen, die Regeln für Crawlerauswirkungen basierend auf der Leistung und der Kapazität der Server festzulegen. Für die meisten externen Websites ist diese Koordination nicht möglich. Das Anfordern von zu vielen Inhalten auf externen Servern oder zu häufige Anforderungen könnten dazu führen, dass die Administratoren dieser Websites den Zugriff beschränken, wenn von den Durchforstungen zu viele Ressourcen verwendet werden. Legen Sie bei der Erstbereitstellung die Regeln für Crawlerauswirkungen so fest, dass die Auswirkungen auf andere Server möglichst gering sind, während weiterhin genug Inhalt häufig genug durchforstet wird, um sicherzustellen, dass die Aktualität des Indexes der Vereinbarung zum Servicelevel entspricht. Wenn die Farm in der Produktionsumgebung eingeführt wurde, können Sie die Regeln für Crawlerauswirkungen basierend auf Daten aus Durchforstungsprotokollen anpassen.

Planen von Durchforstungsregeln

Durchforstungsregeln gelten für alle Inhaltsquellen in der Suchdienstanwendung. Sie können Durchforstungsregeln auf eine bestimmte URL oder auf eine Gruppe von URLs anwenden, um folgende Aktionen auszuführen:

Vermeiden des Durchforstens irrelevanten Inhalts, indem eine oder mehrere URLs ausgeschlossen werden. Dadurch werden auch die Verwendung von Serverressourcen und der Netzwerkverkehr reduziert, und die Relevanz der Suchergebnisse wird erhöht.
Durchforsten von Hyperlinks in der URL, ohne die URL selbst zu durchforsten. Diese Option ist bei Websites nützlich, die Hyperlinks mit relevantem Inhalt enthalten, wenn die ursprüngliche Seite mit den Hyperlinks keine relevanten Informationen enthält.
Aktivieren des Durchforstens komplexer URLs. Mit dieser Option werden URLs durchforstet, die einen Abfrageparameter mit einem Fragezeichen enthalten. Je nach Website schließen diese URLs möglicherweise relevanten Inhalt ein. Da komplexe URLs häufig auf irrelevante Websites umleiten, empfiehlt es sich, diese Option nur für Websites zu aktivieren, für die der Inhalt von komplexen URLs als relevant bekannt ist.
Aktivieren des Durchforstens von Inhalt auf SharePoint-Websites als HTTP-Seiten. Diese Option ermöglicht es, dass SharePoint-Websites hinter einer Firewall oder in Szenarien durchforstet werden, bei denen die durchforstete Website den Zugriff auf den vom Crawler verwendeten Webdienst beschränkt.
Angeben, ob das Standardkonto für den Inhaltszugriff, ein anderes Konto für den Inhaltszugriff oder ein Clientzertifikat zum Durchforsten der angegebenen URL verwendet werden soll.

Da das Durchforsten von Inhalt Ressourcen und Bandbreite verbraucht, empfiehlt es sich, eine kleinere Menge an Inhalt einzuschließen, dessen Relevanz Ihnen bekannt ist, als eine größere Menge an Inhalt, der möglicherweise irrelevant ist. Nach der anfänglichen Bereitstellung können Sie die Abfrage und die Durchforstungsprotokolle überprüfen sowie Inhaltsquellen und Durchforstungsregeln so anpassen, dass deren Relevanz erhöht wird und weiterer Inhalt eingeschlossen wird.

Planen von Sucheinstellungen, die auf Farmebene verwaltet werden

Verschiedene auf Farmebene verwaltete Einstellungen beeinflussen, wie Inhalt durchforstet wird. Berücksichtigen Sie beim Planen des Durchforstens die folgenden Sucheinstellungen auf Farmebene:

E-Mail-Adresse des Kontakts: Inhaltsdurchforstungen haben Auswirkungen auf die Ressourcen der Server, die durchforstet werden. Bevor Sie Inhalt durchforsten können, müssen Sie in den Konfigurationseinstellungen die E-Mail-Adresse der Person Ihrer Organisation bereitstellen, an die sich Administratoren wenden können, wenn die Durchforstung deren Server nachteilig beeinflusst. Diese E-Mail-Adresse wird in den Protokollen für die Administratoren der durchforsteten Server angezeigt, sodass diese Administratoren jemanden erreichen, wenn die Auswirkungen auf Leistung und Bandbreite zu groß sind oder andere Probleme auftreten.

Die E-Mail-Adresse des Kontakts sollte einer Person gehören, die die erforderlichen Kenntnisse und die Verfügbarkeit besitzt, um auf Anforderungen schnell zu antworten. Alternativ können Sie einen streng überwachten Verteilerlistenalias als E-Mail-Adresse des Kontakts verwenden. Unabhängig davon, ob der durchforstete Inhalt intern für die Organisation gespeichert wird, ist eine schnelle Antwort wichtig.
Proxyservereinstellungen: Sie können auswählen, ob beim Durchforsten von Inhalt ein Proxyserver verwendet werden soll. Der zu verwendende Proxyserver hängt von der Topologie der SharePoint Server 2010-Bereitstellung und der Architektur anderer Server in Ihrer Organisation ab. Sie müssen wahrscheinlich einen Proxyserver zum Durchforsten von Internetinhalt verwenden. Weitere Informationen zum Konfigurieren von Proxyservereinstellungen für die Suche finden Sie unter Konfigurieren von Proxyservereinstellungen auf Farmebene (SharePoint Server 2010) und Konfigurieren von Proxyservereinstellungen für die Suche (SharePoint Server 2010)
Timeouteinstellungen: Die Timeouteinstellungen werden zur Begrenzung der Zeit verwendet, die das Suchsystem beim Herstellen einer Verbindung mit anderen Diensten wartet.
SSL-Einstellung: Die SSL-Einstellung (Secure Sockets Layer) bestimmt, ob das SSL-Zertifikat genau übereinstimmen muss, damit Inhalte durchforstet werden können.

Planen der Sammelsuche

Bei der Sammelsuche handelt es sich um die gleichzeitige Abfrage mehrerer Webressourcen oder Datenbanken, um eine einzelne Suchergebnisseite für Endbenutzer zu erstellen. Wenn Sie einen Partnerspeicherort hinzufügen, können Endbenutzer Inhalt suchen und abrufen, der nicht von Servern im lokalen System durchforstet wurde. Mithilfe von Partnerspeicherorten können Abfragen an Remotesuchmodule und Feeds gesendet werden. Die Ergebnisse werden dann für die Endbenutzer als Teil des durchforsteten Inhalts gerendert.

In der SharePoint Server 2010 werden die folgenden Typen von Partnerspeicherorten unterstützt:

Suchindex dieses Servers. Sie können jede lokale Website oder Remotewebsite in Ihrer Organisation verwenden, die einen Server mit SharePoint Server 2010 als Partnerspeicherort aufweist. Angenommen, eine SharePoint-Website auf einem Server der Personalabteilung in Ihrem Unternehmen ist die einzige verfügbare Quelle für Mitarbeiterkontaktinformationen. Selbst wenn die Website nicht Teil des Durchforstungsbereichs ist, können Sie dafür einen Partnerspeicherort konfigurieren, damit Benutzer, die auf der Suchcenter-Website eine Suche starten, Ergebnisse zu Mitarbeiterkontaktinformationen abrufen können, die Sie anzeigen dürfen. Es gelten die folgenden Bedingungen:
1. Als Speicherort wird Suchindex dieses Servers festgelegt.
2. Es ist keine Abfragevorlage erforderlich. In SharePoint Server 2010 wird das Objektmodell zum Abfragen eines Speicherorts verwendet.
3. Die Standardserverauthentifizierung wird verwendet.
4. Erweiterte Suchabfragen werden nicht unterstützt.
OpenSearch 1.0 oder 1.1. Sie können jede öffentliche Website, die den OpenSearch-Standard unterstützt, als Partnerspeicherort verwenden. Ein Beispiel für einen solchen Speicherort ist ein Internetsuchmodul wie z. B. Bing oder eine Suchergebnisseite, die RSS- oder ATOM-Protokolle unterstützt. Angenommen, Benutzern, die Ihre internen Websites nach internen technischen Forschungsdaten durchsuchen, sollen auch verwandte Forschungsdaten von öffentlichen Websites angezeigt werden. Durch die Konfiguration eines Partnerspeicherorts für eine Bing-Suchabfrage werden automatisch Websuchergebnisse für Benutzer angezeigt. Es gelten die folgenden Bedingungen:
1. Abfragen können als URL an ein Suchmodul gesendet werden, z. B. http://www.example.com/search.aspx?q=TEST.
2. Suchergebnisse werden im RSS- oder ATOM-Format oder einem anderen strukturierten XML-Format zurückgegeben.
3. Speicherortfunktionen, Abfragevorlagen und Antwortelemente sind Teil einer OpenSearch-Beschreibungsdatei (OSDX), die dem Speicherort zugeordnet ist.
4. Mithilfe von OpenSearch-Erweiterungen speziell für SharePoint Server 2010 können Trigger eingeschlossen werden, und XSL-Code kann Suchergebnissen zugeordnet werden.
5. Welche Metadaten in den Suchergebnissen angezeigt werden, hängt vom OpenSearch-Speicherort ab.
Weitere Informationen zu OpenSearch finden Sie unter https://www.opensearch.org/.

Wenn eine Suchabfrage an einen Partnerspeicherort gesendet wird, wird sie als URL-Parameter in Form einer so genannten Abfragevorlage gesendet. Die Ergebnisse werden dann im XML-Format für Benutzer der Suchcenter-Website formatiert und gerendert. Der XML-Code wird in einem Webpart auf der Suchergebnisseite als lesbarer Text angezeigt. Sie können Webparts auf der Suchergebnisseite als Webpart für Verbundergebnisse, als Webpart für Topverbundergebnisse oder als Webpart für Kernergebnisse der Suche hinzufügen und konfigurieren. Die Suchergebnisseite enthält standardmäßig drei Webparts für Verbundergebnisse.

Berücksichtigen Sie folgende Fragen bei der Entscheidung, ob Benutzern Sammelsuchergebnisse angezeigt werden sollen:

Möchten Sie benutzerdefinierte Ergebnisse für bestimmte Suchvorgänge anzeigen? Um dazu beizutragen, dass der Partnerspeicherort Ergebnisse für bestimmte Abfragen zurückgibt, können Triggerregeln verwendet werden. Wenn Sie eine Triggerregel für einen Partnerspeicherort erstellen, werden vom dem Speicherort zugeordneten Webpart nur Ergebnisse für Benutzerabfragen angezeigt, die dem angegebenen Muster oder Präfix entsprechen.
Können Sie mit einer URL die für eine Abfrage zurückzugebenden Ergebnisse angeben? Zum Erstellen eines Partnerspeicherorts müssen Sie eine Abfragevorlage angeben. Hierbei handelt es sich um eine Kombination aus der URL und den Parametern, die zum Senden einer Suchabfrage und zum Zurückgeben der Ergebnisse im XML-Format erforderlich sind. Wenn Sie diese Informationen dem Feld Abfragevorlage auf der Seite Partnerspeicherort hinzufügen hinzufügen, müssen Sie die Zeichenfolge ordnungsgemäß formatieren (siehe das Beispiel auf der Seite Partnerspeicherort hinzufügen). Andernfalls werden vom Suchergebnisanbieter keine Ergebnisse zurückgegeben.
Können Benutzer auf die vom Partnerspeicherort bereitgestellten Links zugreifen? Wenn Ihre Organisation Internetressourcen nur eingeschränkten Zugriff gewährt, kann die Verwendung eines Internetsuchmoduls als Partnerspeicherort zur Frustration der Benutzer führen, da sie bestimmte Suchergebnisse nicht anzeigen können.
Ist die Authentifizierung erforderlich? Wenn der Partnerspeicherort die Authentifizierung erfordert, müssen Sie die richtigen Anmeldeinformationen eingeben. Viele Partnerspeicherorte, wie z. B. Internetsuchmodule, erfordern keine Anmeldeinformationen

Planen von Authentifizierungstypen für die Sammelsuche

Für die Sammelsuche sind verschiedene Arten der Benutzerauthentifizierung verfügbar, mit benutzerspezifischen und allgemeinen Anmeldeinformationen. Sie sollten jedoch beachten, dass bei der benutzerspezifischen Authentifizierung ohne Kerberos für die Erfassung von Anmeldeinformationen eine Webparterweiterung erforderlich ist. Im Abschnitt mit den Authentifizierungs- und Anmeldeinformationen der Speicherortdefinition können Sie den Authentifizierungstyp für den Partnerspeicherort angeben. Folgende Authentifizierungstypen stehen zur Auswahl:

Anonym

Zum Verbinden mit dem Partnerspeicherort sind keine Anmeldeinformationen erforderlich.
Allgemein

Für jede Verbindung mit dem Partnerspeicherort werden die gleichen Anmeldeinformationen verwendet.
Pro Benutzer

Die Anmeldeinformationen des Benutzers, der die Suchabfrage übermittelt hat, werden zum Herstellen der Verbindung mit dem Partnerspeicherort verwendet.

Für den allgemeinen und den benutzerspezifischen Authentifizierungstyp müssen Sie außerdem eines der folgenden Authentifizierungsprotokolle angeben:

Standard

Die Standardauthentifizierung ist Teil der HTTP-Spezifikation und wird von den meisten Browsern unterstützt.

Security Note
In Webbrowsern mit Standardauthentifizierung werden Kennwörter unverschlüsselt übertragen. Durch Überwachen der Kommunikation über das Netzwerk kann ein böswilliger Benutzer mithilfe von öffentlich verfügbaren Tools diese Kennwörter abfangen und entschlüsseln. Die Standardauthentifizierung wird deshalb nicht empfohlen, es sei denn, Sie sind sicher, dass die Verbindung sicher ist, wie bei einer Standleitung oder einer SSL-Verbindung (Secure Sockets Layer).

In Webbrowsern mit Standardauthentifizierung werden Kennwörter unverschlüsselt übertragen. Durch Überwachen der Kommunikation über das Netzwerk kann ein böswilliger Benutzer mithilfe von öffentlich verfügbaren Tools diese Kennwörter abfangen und entschlüsseln. Die Standardauthentifizierung wird deshalb nicht empfohlen, es sei denn, Sie sind sicher, dass die Verbindung sicher ist, wie bei einer Standleitung oder einer SSL-Verbindung (Secure Sockets Layer).

Digest

Die Digestauthentifizierung basiert auf dem HTTP 1.1-Protokoll, wie in der Spezifikation RFC 2617 auf der Website des World Wide Web Consortium (W3C) definiert. Da die Digestauthentifizierung die Kompatibilität mit HTTP 1.1 erfordert, wird sie von einigen Browsern nicht unterstützt. Wenn ein Browser, der nicht mit HTTP 1.1 kompatibel ist, bei aktivierter Digestauthentifizierung eine Datei anfordert, wird die Anforderung abgelehnt, weil die Digestauthentifizierung vom Client nicht unterstützt wird. Die Digestauthentifizierung kann nur in Windows-Domänen verwendet werden. Die Digestauthentifizierung kann nur für Windows Server 2008-, Windows Server 2003- und Microsoft Windows 2000 Server-Domänenkonten verwendet werden und erfordert möglicherweise die Speicherung von Kontokennwörtern im verschlüsselten Nur-Text-Format.
NTLM

Benutzerdatensätze werden in der Datenbank der Sicherheitskontenverwaltung (Security Accounts Manager, SAM) oder in der Active Directory-Datenbank gespeichert. Jedes Benutzerkonto ist zwei Kennwörtern zugeordnet: dem LAN-Manager-kompatiblen Kennwort und dem Windows-Kennwort. Jedes Kennwort wird verschlüsselt und in der SAM-Datenbank oder der Active Directory-Datenbank gespeichert.
Kerberos (nur benutzerspezifischer Authentifizierungstyp)

Mithilfe des Kerberos-Protokolls kann eine Partei an einem beliebigen Ende einer Netzwerkverbindung überprüfen, ob es sich bei dem Teilnehmer am anderen Ende wirklich um die angegebene Entität handelt. Obwohl Server mithilfe von NTLM die Identitäten ihrer Clients überprüfen können, ermöglicht NTLM es Clients nicht, die Identität eines Servers zu überprüfen. Ebenso wenig bietet NTLM einem Server die Möglichkeit, die Identität eines anderen Servers zu überprüfen. Die NTLM-Authentifizierung ist daher nur für Netzwerkumgebungen konzipiert, in denen Server grundsätzlich vertrauenswürdig sind.
Formularbasiert

Ein formularbasiertes Authentifizierungscookie ist lediglich ein Container für ein Authentifizierungsticket. Jede Anforderung übergibt das Ticket als Wert des Cookies, und das Ticket wird auf dem Server zum Identifizieren eines authentifizierten Benutzers verwendet. Bei der formularbasierten Authentifizierung ohne Cookies hingegen wird das Ticket in der URL in einem verschlüsselten Format übergeben. Die formularbasierte Authentifizierung ohne Cookies wird verwendet, da Clientbrowser Cookies blockieren könnten. Dieses Feature wurde in Microsoft .NET Framework 2.0 eingeführt.

Stellen Sie bei Verwendung der anspruchsbasierten Authentifizierung in Ihrer Umgebung sicher, dass auch für jede zu durchforstende Inhaltsquelle die Windows-Authentifizierung aktiviert ist. Weitere Informationen zu Authentifizierungsmethoden in SharePoint Server 2010 finden Sie unter Planen von Authentifizierungsmethoden (SharePoint Server 2010).