Planen von Durchforstung und Verbund in SharePoint Server

 

**Gilt für:**SharePoint Server 2013, SharePoint Server 2016

**Letztes Änderungsdatum des Themas:**2018-03-06

Zusammenfassung: Planung des Durchforstens oder eines Verbunds von Suchergebnissen in SharePoint Server 2016 und SharePoint Server 2013.

Bevor Benutzer Suchen in SharePoint Server durchführen können, müssen Sie die Inhalte, die sie durchsuchen können sollen, durchforsten oder für die Inhalte einen Verbund erstellen. Wenn Sie Inhalte durchforsten, erstellt der Suchdienst einen Suchindex, für den Benutzer Abfragen (Suchanforderungen) ausführen können. Sie können das Suchsystem auch so konfigurieren, dass Suchergebnisse eines externen Anbieters (z. B. Bing) zusammen mit den Ergebnissen des lokal erstellten Indexes angezeigt werden. Dieses Verfahren zum Abrufen von Suchergebnissen von einem externen Anbieter und lokalen Anzeigen von Ergebnissen wird als Verbund bezeichnet.

Inhalt dieses Artikels:

  • Planen von Inhaltsquellen

    • Planen des Durchforstens von unterschiedlichen Inhaltstypen

    • Durchforsten von Inhalten mit unterschiedlichen Zeitplänen

    • Gründe für eine vollständige Durchforstung

    • Begrenzen oder Erhöhen des Volumens der zu durchforstenden Inhalte

    • Planen von Konnektoren

    • Planen von Durchforstungsregeln zum Optimieren von Durchforstungen

    • Planen der Crawlerauthentifizierung

  • Planen der Inhaltsverarbeitung

    • Ein- oder Ausschließen von Dateitypen

    • Planen der Verwendung von (benutzerdefinierten) Ausdrucksextraktionen

  • Informationen zu Ergebnisquellen und Verbund

Planen von Inhaltsquellen

Bei einer Inhaltsquelle handelt es sich um eine Definition von Durchforstungseinstellungen. Sie legen etwa fest, welche Hosts und welche Inhaltstypen durchforstet werden (wie SharePoint-Inhalte oder -Dateifreigaben), die Tiefe der Durchforstung sowie einen Durchforstungsplan.

Wenn Sie eine Suchdienstanwendung erstellen, stellt die Dienstanwendung automatisch die vorkonfigurierte Inhaltsquelle Lokale SharePoint-Websites bereit. Mithilfe dieser Inhaltsquelle können Sie angeben, wie alle SharePoint-Inhalte in Webanwendungen der Suchdienstanwendung zugeordnet werden.

Wenn Sie nur einen Inhaltstyp verwenden (wenn z. B. der gesamte Inhalt vom Typ SharePoint-Websites oder -Dateifreigaben ist), benötigen Sie möglicherweise nur eine Inhaltsquelle. Wenn Sie jedoch mehrere verschiedene Inhaltstypen oder individuelle Anforderungen pro Host haben, sollten Sie mehrere Inhaltsquellen definieren. Planen Sie, zusätzliche Inhaltsquellen zu erstellen, wenn Sie die folgenden Aufgaben ausführen müssen:

  • Durchforsten unterschiedlicher Inhaltstypen – z. B. Dateifreigaben und Daten in Geschäftsanwendungen

  • Durchforsten bestimmter Inhalte mit Zeitplänen, die sich von denen anderer Inhalte unterscheiden

  • Begrenzen oder Erhöhen des Volumens der zu durchforstenden Inhalte

  • Festlegen verschiedener Prioritäten für das Durchforsten unterschiedlicher Websites

  • Häufigeres Aktualisieren einiger Inhaltstypen im Vergleich zu den restlichen

Sie können für jede Suchdienstanwendung eine große Anzahl von Inhaltsquellen erstellen, doch jede Inhaltsquelle bedeutet Mehraufwand. Aus diesem Grund sollten Sie so wenige Inhaltsquellen wie möglich erstellen, die Ihre weiteren betrieblichen Anforderungen erfüllen wie Unterschiede in der Priorität und Planung für die Durchforstung. Jede Inhaltsquelle kann bis zu 100 Startadressen enthalten.

Planen des Durchforstens von unterschiedlichen Inhaltstypen

Sie können pro Inhaltsquelle nur einen Inhaltstyp durchforsten. Sie können z. B. eine Inhaltsquelle erstellen, die Startadressen für SharePoint-Websites enthält, und eine weitere Inhaltsquelle, die Startadressen für Dateifreigaben enthält. Sie können jedoch keine Inhaltsquelle erstellen, die Startadressen sowohl für SharePoint-Websites als auch Dateifreigaben enthält. In der folgenden Tabelle werden die Typen von Inhaltsquellen aufgeführt, die Sie konfigurieren können.

Verwendung dieses Typs von Inhaltsquelle Inhaltstyp

SharePoint-Websites

SharePoint-Websites von derselben Farm oder verschiedenen SharePoint Server- Farmen.

SharePoint-Websites von derselben Farm oder verschiedenen SharePoint Server 2013-, SharePoint Server 2010-, SharePoint Foundation 2010- oder Microsoft Search Server 2010-Farmen.

SharePoint-Websites von derselben Farm oder verschiedenen Office SharePoint Server 2007-, Windows SharePoint Services 3,0- oder Search Server 2008-Farmen.

Websites

Andere Webinhalte in Ihrer Organisation, die sich nicht auf SharePoint-Websites befinden

Inhalte von Websites im Internet

Dateifreigaben

Inhalte in Dateifreigaben innerhalb der Organisation

SicherheitshinweisSecurity
Wenn der Suchdienst eine Dateifreigabe durchforstet und sich die Berechtigungen für eine Datei in der Freigabe von den Berechtigungen für Ordner unterscheiden, welche die Datei enthalten, haben die Berechtigungen für die Datei Vorrang und werden für Einschränkungen von Suchergebnissen verwendet. Um sicherzustellen, dass nur geeignete Elemente in den Suchergebnissen angezeigt werden, sollten Sie deshalb darauf achten, dass Dateien auf Dateifreigaben angemessene Berechtigungen aufweisen. In Fällen, in denen Dateiberechtigungen nicht angemessen sind, können Sie bestimmte Elemente aus dem Suchindex oder den Suchergebnissen löschen. Weitere Informationen finden Sie unter Delete items from the search index or from search results in SharePoint Server.

Öffentliche Exchange-Ordner

Öffentliche Exchange 2007- und Exchange Server 2010-Ordner.

Lotus Notes

In Lotus Notes-Datenbanken gespeicherte E-Mail-Nachrichten

Hinweis

Im Gegensatz zu allen anderen Typen von Inhaltsquellen wird die Option für Lotus Notes-Inhaltsquellen erst auf der Benutzeroberfläche angezeigt, wenn Sie die entsprechende erforderliche Software installiert und konfiguriert haben. Weitere Informationen finden Sie unter Configure and use the Lotus Notes connector for SharePoint Server (gilt auch für SharePoint Server).

Documentum

Inhalt aus dem EMC Documentum-System

Hinweis

Sie müssen die richtige erforderliche Software sowie den Microsoft SharePoint 2016 Indexing Connector for Documentum installieren und konfigurieren, um EMC Documentum-Inhalte durchforsten zu können. Weitere Informationen finden Sie unter Configure and use the Documentum connector in SharePoint Server (gilt auch für SharePoint Server).

Branchendaten

In Branchenanwendungen gespeicherte Geschäftsdaten

Benutzerdefiniertes Repository

Inhaltsquellen, die erst nach der Installation und Registrierung eines benutzerdefinierten Konnektor durchforstet werden können

Inhaltsquellen für Branchendaten

Bei Inhaltsquellen für Branchendaten müssen die Anwendungen, die die Daten hosten, in einem Anwendungsmodell einer Business Data Connectivity-Dienstanwendung angegeben werden. Sie können eine einzelne Inhaltsquelle erstellen, um alle im Business Data Connectivity-Dienst registrierten Anwendungen zu durchforsten, oder aber getrennte Inhaltsquellen zum Durchforsten einzelner Anwendungen erstellen. Weitere Informationen finden Sie im Artikel zum Konnektorframework der Suche in SharePoint 2013 (Dieser MSDN-Artikel gilt auch für SharePoint Server).

Häufig wird die Integration von Geschäftsdaten in Websitesammlungen von anderen Personen geplant als denen, die am allgemeinen Inhaltsplanungsprozess beteiligt sind. Daher sollten an den Inhaltsplanungsteams Administratoren für Geschäftsanwendungen beteiligt werden, um die Integration der Geschäftsanwendungsdaten in Inhalte und deren effektive Darstellung in den Websitesammlungen anzuleiten.

Durchforsten von Inhalten mit unterschiedlichen Zeitplänen

Erwägen Sie aus folgenden Gründen, Inhaltsquellen mit unterschiedlichen Zeitplänen zu definieren:

  • Berücksichtigung von Ausfallzeiten und Spitzenauslastungszeiten

  • Häufigeres Durchforsten von Inhalten, die häufiger aktualisiert werden

  • Separates Durchforsten von Inhalten, die jeweils auf langsameren bzw. schnelleren Servern gespeichert sind

  • Um eine SharePoint-Inhaltsquelle laufend zu durchforsten, um hohe Aktualitätsanforderungen zu erfüllen. Weitere Informationen finden Sie unter Manage continuous crawls in SharePoint Server.

Gründe für eine vollständige Durchforstung

Folgende Gründe sprechen für eine vollständige Durchforstung von einer oder mehreren Inhaltsquellen durch den Administrator einer Suchdienstanwendung:

  • Eine Suchdienstanwendung wurde soeben erstellt, und die vorkonfigurierte Inhaltsquelle Lokale SharePoint-Websites wurde noch nicht durchforstet.

  • Eine andere Inhaltsquelle ist neu und wurde noch nicht durchforstet.

  • Der Suchdienstanwendungs-Administrator hat eine Inhaltsquelle geändert.

  • Auf den Servern der Farm wurde ein Softwareupdate oder ein Servicepack installiert. Weitere Informationen finden Sie in den Anweisungen zum Softwareupdate bzw. Servicepack.

  • Ein Suchdienstanwendungs-Administrator Websitesammlungs-Administrator hat eine neue verwaltete Eigenschaft hinzugefügt oder geändert. Damit die neue oder geänderte verwaltete Eigenschaft wirksam wird, ist eine vollständige Durchforstung aller durchforsteten Inhaltsquellen erforderlich.

  • Sie möchten Sicherheitsänderungen ermitteln, die seit der letzten vollständigen Durchforstung einer Dateifreigabe an deren lokalen Gruppen vorgenommen wurden.

  • Sie möchten Fehler bei inkrementellen Durchforstungen beheben, die mehrmals nacheinander aufgetreten sind. Wenn bei einem bestimmten Inhalt mehrmals nacheinander Fehler auftreten, entfernt das System den betroffenen Inhalt aus dem Suchindex.

  • Durchforstungsregeln wurden hinzugefügt, gelöscht oder geändert.

  • Sie möchten einen beschädigten Suchindex ersetzen.

  • Die Berechtigungen für das Benutzerkonto, das dem Standardkonto für den Inhaltszugriff zugeordnet ist, wurden geändert.

Das System führt unter folgenden Umständen auch dann eine vollständige Durchforstung aus, wenn eine inkrementelle oder kontinuierliche Durchforstung geplant ist:

  • Die vorherige Durchforstung wurde von einem Suchadministrator gestoppt.

  • Eine Inhaltsdatenbank wurde wiederhergestellt oder ein Farmadministrator hat eine Inhaltsdatenbank getrennt und erneut angefügt.

  • Von dieser Suchdienstanwendung wurde noch nie eine vollständige Durchforstung ausgeführt.

  • Die Durchforstungsdatenbank enthält keine Einträge für die zu durchforstenden Adressen. Wenn in der Durchforstungsdatenbank für die zu durchforstenden Elemente keine Einträge vorhanden sind, können keine inkrementellen Durchforstungen ausgeführt werden.

Einschränken oder Erhöhen der Menge der durchforsteten Inhalte

Die in den Eigenschaften für jede Inhaltsquelle verfügbaren Optionen hängen vom ausgewählten Inhaltsquellentyp ab. Mit den Optionen für die Durchforstungseinstellungen können Sie den Umfang des durchforsteten Inhalts einschränken oder erhöhen. Für jede Inhaltsquelle können Sie angeben, wie umfassend die Startadressen durchforstet werden sollen. Für die meisten Typen von Inhaltsquellen können Sie angeben, wie viele Ebenen tief von jeder Startadresse aus die Inhalte durchforstet werden sollen. Dieses Verhalten wird auf alle Startadressen in einer bestimmten Inhaltsquelle angewendet. Wenn Sie einige Websites auf tieferen Ebenen durchforsten möchten, können Sie zusätzliche Inhaltsquellen erstellen, die diese Websites umfassen. In der folgenden Tabelle werden bewährte Methoden zum Konfigurieren der Optionen für Durchforstungseinstellungen beschrieben.

Verwendeter Inhaltsquellentyp Situation Zu verwendende Option der Durchforstungseinstellung

SharePoint-Websites

Sie möchten die Inhalte auf der Website selbst einschließen, aber nicht die Inhalte auf den Unterwebsites, oder Sie möchten die Inhalte auf Unterwebsites nach einem anderen Zeitplan durchforsten.

Nur die SharePoint-Website für jede Startadresse durchforsten.

SharePoint-Websites

Sie möchten die Inhalte auf der Website selbst einschließen.

- oder -

Sie möchten sämtliche Inhalte unter der Startadresse mit demselben Zeitplan durchforsten.

Alle Websites unter dem Hostnamen für jede Startadresse durchforsten.

Websites

Die auf verknüpften Websites verfügbaren Inhalte sind wahrscheinlich nicht relevant.

Nur innerhalb des Servers jeder Startadresse durchforsten.

Websites

Relevante Inhalte befinden sich nur auf der ersten Seite.

Nur die erste Seite jeder Startadresse durchforsten.

Websites

Sie möchten die Tiefe beschränken, mit der die Links der Startadressen durchforstet werden.

Benutzerdefiniert – Geben Sie die Seitentiefe und die Serverwechsel an.

Hinweis

Bei stark vernetzten Websites wird empfohlen, mit einer kleinen Anzahl zu beginnen, da möglicherweise das gesamte Internet durchforstet wird, wenn eine Tiefe von mehr als drei Seiten angegeben wird oder mehr als drei Serverwechsel angegeben werden.

Dateifreigaben

Öffentliche Exchange-Ordner

Die in den Unterordnern verfügbaren Inhalte sind wahrscheinlich nicht relevant.

Nur den Ordner jeder Startadresse durchforsten.

Dateifreigaben

Öffentliche Exchange-Ordner

Die Inhalte in den Unterordnern sind wahrscheinlich relevant.

Den Ordner und alle Unterordner jeder Startadresse durchforsten.

Geschäftsdaten

Alle im BDC (Business Data Catalog)-Metadatenspeicher registrierten Anwendungen enthalten relevante Inhalte.

Den gesamten Business Data Catalog-Metadatenspeicher durchsuchen.

Geschäftsdaten

Alle im BDC-Metadatenspeicher registrierten Anwendungen enthalten relevante Inhalte.

- oder -

Sie möchten einige Anwendungen mit einem anderen Zeitplan durchforsten.

Ausgewählte Anwendungen durchforsten.

Planen von Konnektoren

Ein Crawler verwendet Konnektoren (in früheren Versionen von SharePoint Server) als "Protokollhandler" bezeichnet), um Inhalte abzurufen und zu indizieren. SharePoint Server stellt Konnektoren für die gängigsten Protokolle zur Verfügung und verwendet die entsprechenden Konnektoren. Wenn Sie jedoch Inhalte durchforsten möchten, für die ein nicht standardmäßig bereitgestellter Konnektor erforderlich ist, müssen Sie zuerst einen Konnektor von einem Drittanbieter installieren oder einen benutzerdefinierten Konnektor erstellen. Eine Liste der standardmäßig installierten Konnektoren finden Sie unter Default connectors in SharePoint Server (gilt auch für SharePoint Server).

Weitere Überlegungen beim Planen von Inhaltsquellen

Bei Inhaltsrepositorys des gleichen Typs, wie z. B. SharePoint-Websites, hängt die Entscheidung, ob eine oder mehrere Inhaltsquellen verwendet werden, weitgehend von Verwaltungsüberlegungen ab. Organisieren Sie zum Vereinfachen der Verwaltung die Inhaltsquellen so, dass Aktualisierungen von Inhaltsquellen, Durchforstungsregeln und Durchforstungszeitplänen für die Administratoren unkompliziert sind.

  • Sie können Startadressen nicht in mehreren Inhaltsquellen in derselben Suchdienstanwendung durchforsten. Wenn Sie beispielsweise eine bestimmte Inhaltsquelle verwenden, um eine Websitesammlung und alle dazugehörigen Unterwebsites zu durchforsten, können Sie keine andere Inhaltsquelle verwenden, um eine dieser Unterwebsites separat mit einem anderen Zeitplan zu durchforsten.

  • Administratoren aktualisieren Inhaltsquellen häufig. Wird eine Inhaltsquelle geändert, ist eine vollständige Durchforstung für diese Inhaltsquelle erforderlich. Erwägen Sie daher, separate Inhaltsquellen zu erstellen, damit Sie bei Bedarf mehrere vollständige Durchforstungen gleichzeitig durchführen können und eine vollständige Durchforstung für eine Inhaltsquelle weniger Zeit beansprucht.

Planen von Durchforstungsregeln zum Optimieren von Durchforstungen

Durchforstungsregeln gelten für alle Inhaltsquellen in der Suchdienstanwendung. Sie können Durchforstungsregeln auf eine bestimmte URL oder auf eine Gruppe von URLs anwenden, um folgende Aktionen auszuführen:

  • Vermeiden des Durchforstens irrelevanten Inhalts, indem eine oder mehrere URLs ausgeschlossen werden. Dadurch werden auch die Verwendung von Serverressourcen und der Netzwerkverkehr reduziert.

  • Durchforsten von Hyperlinks in der URL, ohne die URL selbst zu durchforsten. Diese Option ist bei Websites nützlich, die Hyperlinks mit relevantem Inhalt enthalten, wenn die ursprüngliche Seite mit den Hyperlinks keine relevanten Informationen enthält.

  • Aktivieren des Durchforstens komplexer URLs. Mit dieser Option werden URLs durchforstet, die einen Abfrageparameter mit einem Fragezeichen enthalten. Je nach Website können sich diese URLs auf relevante Inhalte beziehen. Da komplexe URLs häufig auf irrelevante Websites umleiten, empfiehlt es sich, diese Option nur für Websites zu aktivieren, für die der Inhalt von komplexen URLs als relevant bekannt ist.

  • Aktivieren des Durchforstens von Inhalt auf SharePoint-Websites als HTTP-Seiten. Diese Option ermöglicht dem Suchsystem, SharePoint-Websites hinter einer Firewall oder in Szenarien zu durchforsten, bei denen die durchforstete Website den Zugriff auf den vom Crawler verwendeten Webdienst beschränkt (eine Durchforstungskomponente in der Suchtopologie).

  • Angeben, ob das Standardkonto für den Inhaltszugriff, ein anderes Konto für den Inhaltszugriff oder ein Clientzertifikat zum Durchforsten der angegebenen URL verwendet werden soll.

Da das Durchforsten von Inhalt Ressourcen und Bandbreite verbraucht, empfiehlt es sich, eine kleinere Menge an Inhalt einzuschließen, dessen Relevanz Ihnen bekannt ist, statt einer größeren Menge an Inhalt, der möglicherweise irrelevant ist. Nach der anfänglichen Bereitstellung können Sie die Abfrage und die Durchforstungsprotokolle überprüfen sowie Inhaltsquellen und Durchforstungsregeln so anpassen, dass deren Relevanz erhöht wird und weiterer Inhalt eingeschlossen wird.

Planen der Crawlerauthentifizierung

Wenn der Crawler auf die in den Inhaltsquellen aufgelisteten Startadressen zugreift, muss er von den Servern, auf denen der Inhalt gehostet wird, authentifiziert werden und Zugriff auf diese Server erhalten. Standardmäßig wird das Standardkonto für den Inhaltszugriff verwendet. Sie können auch Durchforstungsregeln verwenden, um ein anderes Konto für den Inhaltszugriff anzugeben, das beim Durchforsten von bestimmten Inhalten verwendet werden soll. Unabhängig davon, ob Sie das Standardkonto für den Inhaltszugriff oder ein anderes, durch eine Durchforstungsregel angegebenes Konto für den Inhaltszugriff verwenden, muss das verwendete Inhaltszugriffskonto zumindest über die Leseberechtigung für alle durchforsteten Inhalte verfügen. Andernfalls wird der Inhalt nicht durchforstet und nicht indiziert und ist deshalb für Abfragen nicht verfügbar.

Das Konto, das Sie als Standardkonto für den Inhaltszugriff angeben, sollte Zugriff auf den Großteil der durchforsteten Inhalte haben. Verwenden Sie andere Inhaltszugriffskonten nur dann, wenn Sicherheitsüberlegungen separate Inhaltszugriffskonten erforderlich machen.

Bestimmen Sie für jede geplante Inhaltsquelle die Startadressen, auf die nicht mit dem Standardkonto für den Inhaltszugriff zugegriffen werden kann, und planen Sie dann das Hinzufügen von Durchforstungsregeln für diese Startadressen.

Wichtig

Stellen Sie sicher, dass das Domänenkonto, das für das Standardkonto für den Inhaltszugriff oder ein beliebiges anderes Inhaltszugriffskonto verwendet wird, nicht mit dem Domänenkonto identisch ist, das von einem Anwendungspool verwendet wird, der einer von Ihnen durchforsteten Anwendung zugeordnet ist. Andernfalls werden möglicherweise unveröffentlichte Inhalte auf SharePoint-Websites und Nebenversionen von Dateien (d. h. Verlauf) in SharePoint-Websites durchforstet und indiziert.

Ein weiterer wichtiger Aspekt ist, dass der Crawler dasselbe Authentifizierungsprotokoll wie der Hostserver verwenden muss. Standardmäßig verwendet der Crawler zur Authentifizierung NTLM. Sie können für den Crawler bei Bedarf die Verwendung eines anderen Authentifizierungsprotokolls konfigurieren.

Stellen Sie bei Verwendung der anspruchsbasierten Authentifizierung sicher, dass für jede zu durchforstende Webanwendung die Windows-Authentifizierung aktiviert ist.

Planen der Inhaltsverarbeitung

Der Crawler durchforstet Inhaltsrepositorys, die von Inhaltsquellen angegeben werden, und führt dann die Inhalte und Metadaten durchforsteter Elemente der Inhaltsverarbeitungskomponente zu. Die Inhaltsverarbeitungskomponente liest und analysiert die durchforsteten Elemente und berichtet die Eigenschaften dann an die Suchverwaltungsdatenbank.

Sie können durchforstete Eigenschaften verwalteten Eigenschaften zuordnen und durch Bearbeiten des Suchschemas Eigenschaftseinstellungen konfigurieren. Die Inhaltsverarbeitungskomponente liest dieses Suchschema und verwendet es zum Ausführen der Zuordnung. Der Suchindex enthält nur verwaltete Eigenschaften. Verwaltete Eigenschaften können beispielsweise zum Erstellen von Einschränkungen verwendet werden. Weitere Informationen finden Sie unter Übersicht über das Suchschema in SharePoint Server.

Ein- oder Ausschließen von Dateitypen

In den Suchindex können Inhalte aus beliebigen Dateitypen einbezogen werden. Um Inhalte zu indizieren, müssen diese zuerst von einer Durchforstungskomponente durchforstet und dann von einer Inhaltsverarbeitungskomponente analysiert werden. Eine Durchforstungskomponente kann Dateien nur durchforsten, wenn die Dateierweiterung in der Liste der Dateinamenerweiterungen auf der Seite "Dateitypen verwalten" aufgeführt ist. Eine Inhaltsverarbeitungskomponente kann den Inhalt durchforsteter Dateien nur unter den folgenden Bedingungen analysieren:

  • Die Inhaltsverarbeitungskomponente verfügt über einen Formathandler, der das Dateiformat analysieren kann.

  • Die Inhaltsverarbeitungskomponente ist aktiviert, um Dateien mit dem betreffenden Dateiformat und der betreffenden Dateinamenerweiterung zu analysieren.

Wenn die Inhaltsverarbeitungskomponente eine Datei nicht analysieren kann, enthält der Suchindex nur Dateieigenschaften, z. B. den Dateinamen.

Standardmäßig erfüllt SharePoint Server diese Anforderungen für zahlreiche Dateitypen und kann diese daher durchforsten und analysieren, ohne dass Sie zusätzliche Formathandler installieren müssen. Eine Übersicht über die Dateitypen finden Sie unter Default crawled file name extensions and parsed file types in SharePoint Server.

Hinweis

Sie können die Liste der Dateiformate, die SharePoint Server standardmäßig analysieren kann, erweitern, indem Sie als iFormats bezeichnete filterbasierte Formathandler von Drittanbietern hinzufügen. Ein Drittanbieter-iFilter kann integrierte Formathandler überschreiben.

Wenn Sie in den Suchindex Inhalte aus Inhaltsrepositorys mit Dateitypen einbeziehen möchten, die nicht auf der Seite Dateitypen verwalten aufgeführt sind, beachten Sie Folgendes:

  • Fügen Sie den Dateityp der Seite "Dateitypen verwalten" hinzu, um ihn durchforsten zu können.

  • So analysieren Sie den Dateityp:

    • Wenn SharePoint Server für das Format keinen Formathandler aufweist, installieren Sie auf jedem Server, der eine Inhaltsverarbeitungskomponente in der Suchdienstanwendung hostet, einen filterbasierten Drittanbieter-Formathandler für das Dateiformat.

    • Aktivieren Sie auf jedem Server, der eine Inhaltsverarbeitungskomponente in der Suchdienstanwendung hostet, die Analyse des Dateiformats und der Dateinamenerweiterung.

Weitere Informationen finden Sie unter Add or remove a file type from the search index in SharePoint Server.

Planen der Verwendung von (benutzerdefinierten) Ausdrucksextraktionen

Sie können das Suchsystem so konfigurieren, dass unstrukturierter Inhalt nach "Entitäten" durchsucht wird, z. B. der Textkörper oder der Titel eines Dokuments. Bei diesen Entitäten kann es sich um Wörter oder Phrasen wie z. B. Produktnamen handeln. Sie können eigene Wörterbücher erstellen und bereitstellen, um anzugeben, nach welchen Entitäten gesucht werden soll.

Die extrahierten Entitäten werden im Suchindex als separate verwaltete Eigenschaften gespeichert, die automatisch so konfiguriert sind, dass sie auffindbar, durchsuchbar, abrufbar, sortierbar und einschränkbar sind. Sie können diese Eigenschaften z. B. in Sucheinschränkungen verwenden, um Benutzer beim Filtern ihrer Suchergebnisse zu unterstützen.

Als Unternehmen können Sie das bereits ausgefüllte, von SharePoint Server bereitgestellte Unternehmensextraktionswörterbuch verwenden.

Zudem können Sie mehrere Typen benutzerdefinierter Entitätsextraktionsfunktionen in Form von benutzerdefinierten Entitätsextraktionswörterbüchern bereitstellen. Diese Wörterbücher stellen Sie mithilfe von Microsoft PowerShell bereit. Die Einträge in diesen Wörterbüchern (einzelne oder mehrere Wörter) werden mit Wörtern oder Wortteilen im Inhalt abgeglichen, wobei die Groß-/Kleinschreibung entweder beachtet oder ignoriert wird. Weitere Informationen finden Sie unter Erstellen und Bereitstellen von benutzerdefinierten Entitätsextraktionsfunktionen in SharePoint Server.

Benutzerdefinierte Entitätsextraktionsfunktion/benutzerdefiniertes Wörterbuch Beschreibung

Wortextraktion

Ohne Berücksichtigung der Groß-/Kleinschreibung, maximal fünf Wörterbücher. Die Eingabe "anchor" erzielt z. B. die Treffer "anchor" und "Anchor", nicht jedoch "anchorage".

Wortteilextraktion

Ohne Berücksichtigung der Groß-/Kleinschreibung, maximal fünf Wörterbücher. Die Eingabe "anchor" erzielt z. B. die Treffer "anchor" und "Anchor" und "anchorage".

Exakte Wortextraktion

Berücksichtigung der Groß-/Kleinschreibung, maximal ein Wörterbuch. Die Eingabe "anchor" erzielt z. B. den Treffer "anchor", nicht jedoch "Anchor" oder "Anchorage".

Exakte Wortteilextraktion

Berücksichtigung der Groß-/Kleinschreibung, maximal ein Wörterbuch. Die Eingabe "anchor" erzielt z. B. die Treffer "anchor" und "anchorage", nicht jedoch "Anchor".

Informationen zu Ergebnisquellen und Verbund

In SharePoint Server verwenden Sie eine Ergebnisquelle zum Angeben der URL eines Anbieters, von dem Suchergebnisse abgerufen werden sollen, ein Protokoll zum Abrufen dieser Ergebnisse und andere verwandte Einstellungen. Die vorkonfigurierte Standardergebnisquelle heißt beispielsweise Lokale SharePoint-Ergebnisse.

Sie können Ergebnisquellen hinzufügen, die externe Suchanbieter angeben (wie Remotesuchmaschinen oder Feeds), von denen Suchergebnisse abgerufen werden. Dies wird als Verbund bezeichnet.

Informationen zum Verbund

Beim Arbeiten mit einem Verbund können Benutzer Inhalte suchen und abrufen, die nicht von Servern in der lokalen Farm durchforstet wurden. Der Verbund kann z. B. Suchergebnisse eines Internetsuchanbieters wie Bing oder aus einer privaten Datenmenge bereitstellen, auf die Sie keinen Durchforstungszugriff haben.

Ein Verbund ist auch eine geeignete Lösung für eine geografisch verteilte Organisation, die an ihren Standorten einen Suchzugriff bieten möchte, wenn jeder Standort über einen eigenen Suchindex verfügt. Da jeder Standort Suchergebnisse aus seinem eigenen Index bietet, muss kein zentraler Suchdienst bereitgestellt werden, der einen einzelnen, vereinheitlichten Index erstellt und darauf zugreift. In diesem Kontext bietet ein Verbund u. a. die folgenden Vorteile:

  • Niedrige Bandbreitenanforderungen ─ Eine geografisch verteilte Organisation verfügt ggf. nicht über die hohe Netzwerkbandbreite, die zum Durchforsten und Indizieren großer Mengen von Remoteinhalten erforderlich ist. Wenn eine Organisation mit einem Verbund arbeitet, bestehen die Hauptdaten, die für die Suche durch das WAN übertragen werden, nur aus einer Menge von Suchergebnissen aus jedem zum Verbund gehörenden Inhaltsrepository.

  • Aktualität von Suchergebnissen ─ Jeder Geschäftsbereich der Organisation kann den lokalen Inhalt schneller durchforsten, als dies bei einer zentralen Suchfunktionsbereitstellung zur Durchforstung aller Inhalte in der gesamten Organisation möglich wäre.

  • Geschäftsbereichsabhängige Veränderbarkeit der Suche ─ Wenn eine Organisation mit einem Verbund arbeitet, kann jeder Geschäftsbereich seine eigene Suchumgebung bereitstellen und steuern. Die Geschäftsbereiche können die Suche an ihre Anforderungen und Vorlieben anpassen, z. B. mit einer eigenen Suchumgebung und eigenen Suchconnectors. Dies wäre bei einem zentralen Suchportal nicht möglich.

  • Begrenzte Größe von Suchindizes ─ Eine große, geografisch verteilte Organisation kann über Millionen von Dokumenten verfügen. Ein zentraler, vereinheitlichter Suchindex wäre für die Organisation ggf. aufgrund der Infrastruktur nicht praktikabel, die zur Unterstützung eines solch großen Indexes erforderlich wäre. Der Verbund ermöglicht Benutzern in allen Geschäftsbereichen die Ausführung einzelner Suchvorgänge zum Finden relevanter Inhalte, die auf mehrere kleinere Suchindizes in der Organisation verteilt sind.

Verwenden von Ergebnisquellen für den Verbund

Zum Arbeiten mit einem Verbund in SharePoint Server wählen Sie auf der Seite Ergebnisquelle im Abschnitt Protokoll eines der folgenden Protokolle:

Protokoll Abruf von Suchergebnissen von dieser Art von Suchanbieter

Remote SharePoint

Der Index eines in einer anderen SharePoint Server-Farm gehosteten Suchdiensts

OpenSearch 1.0/1.1

Eine externe Suchmaschine oder ein Feed, die/der das OpenSearch-Protokoll verwendet, z. B. Bing

Exchange

Exchange Server 2013

Hinweis

Wenn Sie eines der Protokolle in der vorherigen Tabelle auswählen, müssen Sie auf der Seite Ergebnisquelle hinzufügen/bearbeiten auch andere verwandte Felder ausfüllen, um die Ergebnisquelle vollständig anzugeben.

See also

Grundlegendes zu Ergebnisquellen für die Suche in SharePoint Server
Konfigurieren der Ergebnisquellen für die Suche in SharePoint Server
Manage crawling in SharePoint Server
Default connectors in SharePoint Server
Default crawled file name extensions and parsed file types in SharePoint Server

Konnektorframework der Suche in SharePoint 2013