Verwalten von Crawlregeln (Office SharePoint Server)

Sie können eine Crawlregel hinzufügen, um beim Crawlen von Inhalten bestimmte Pfade ein- oder auszuschließen. Wenn Sie einen Pfad einschließen, können Sie optional alternative Kontoanmeldeinformationen für das Crawlen des Pfads bereitstellen. Sie können nicht nur neue Crawlregeln hinzufügen, sondern auch vorhandene Crawlregeln testen, bearbeiten, löschen oder neu anordnen.

Crawlregeln werden in der Reihenfolge anwendet, in der sie aufgeführt sind.

Zum Verwalten von Crawlregeln müssen Sie zuerst die Seite Crawlregeln verwalten öffnen:

  1. Öffnen Sie die Verwaltungsseite für den Anbieter für gemeinsame Dienste (Shared Services Provider, SSP).

    Führen Sie die folgenden Schritte aus, um die Verwaltungsseite für den SSP zu öffnen:

    1. Klicken Sie auf der oberen Navigationsleiste auf Anwendungsverwaltung.

    2. Klicken Sie auf der Seite Anwendungsverwaltung im Abschnitt Gemeinsame Dienste von Office SharePoint Server auf Gemeinsame Dienste dieser Farm erstellen oder konfigurieren.

    3. Klicken Sie auf der Seite Gemeinsame Dienste dieser Farm verwalten auf den SSP, dessen Verwaltungsseite Sie öffnen möchten.

  2. Klicken Sie auf der Homepage der Verwaltung der gemeinsamen Dienste im Abschnitt Suchen auf Sucheinstellungen.

  3. Klicken Sie auf der Seite Sucheinstellungen konfigurieren im Abschnitt Crawleinstellungen auf Crawlregeln.

Was möchten Sie tun?

  • Hinzufügen einer Crawlregel

  • Testen von Crawlregeln für eine URL

  • Bearbeiten einer Crawlregel

  • Löschen einer Crawlregel

  • Neuanordnen von Crawlregeln

Hinzufügen einer Crawlregel

  1. Klicken Sie auf der Seite Crawlregeln verwalten auf Neue Crawlregel.

  2. Geben Sie auf der Seite Crawlregel hinzufügen im Abschnitt Pfad im gleichnamigen Feld den Pfad ein, für den die Regel gilt. Sie können im Pfad standardmäßige Platzhalterzeichen verwenden. Beispiele:

    • http://server1/ordner* schließt alle Webressourcen mit einer URL ein, die mit http://server1/ordner beginnt.

    • *://*.txt schließt alle Dokumente mit der Erweiterung TXT ein.

  3. Wählen Sie im Abschnitt Crawlkonfiguration eine der folgenden Optionen aus:

    • Alle Einträge in diesem Pfad ausschließen. Wählen Sie diese Option aus, wenn alle Elemente im angegebenen Pfad von dem Crawlvorgang ausgeschlossen werden sollen.

    • Alle Einträge in diesem Pfad einschließen. Wählen Sie diese Option aus, wenn alle Elemente im Pfad gecrawlt werden sollen. Wenn Sie diese Option auswählen, können Sie die Inklusion weiter verfeinern, indem Sie die folgenden Optionen in beliebiger Kombination auswählen:

    • Hyperlinks für die URL folgen, ohne die URL selbst zu crawlen. Wählen Sie diese Option aus, wenn in der URL enthaltene Links gecrawlt werden sollen, nicht aber die URL selbst.

    • Komplexe URLs (URLs mit Fragezeichen (?)) crawlen. Wählen Sie diese Option aus, wenn URLs mit Parametern in der Schreibweise mit Fragezeichen (?) gecrawlt werden sollen.

    • SharePoint-Inhalt als HTTP-Seiten crawlen. Normalerweise wird zum Crawlen von SharePoint-Inhalten ein spezielles Protokoll verwendet. Wählen Sie diese Option aus, wenn SharePoint-Inhalte stattdessen als HTTP-Seiten gecrawlt werden sollen. Wenn Inhalte mit HTTP gecrawlt werden, werden Elementberechtigungen nicht gespeichert.

  4. Führen Sie im Abschnitt Authentifizierung angeben eine der folgenden Aktionen aus:

    • Wählen Sie Standardkonto für den Inhaltszugriff ('NT-AUTORITÄT\LOKALER DIENST') verwenden aus, um das Standardkonto für den Inhaltszugriff zu verwenden.

    • Wenn Sie ein anderes Konto verwenden möchten, wählen Sie Geben Sie ein anderes Konto für den Inhaltszugriff an aus, und führen Sie dann die folgenden Schritte aus:

    1. Geben Sie im Feld Konto den Namen des Kontos ein, das über Zugriff auf die in dieser Crawlregel definierten Pfade verfügt. Beispiele: Benutzername und DOMÄNE\Benutzername.

    2. Geben Sie in die Felder Kennwort und Kennwort bestätigen das Kennwort für dieses Konto ein.

    3. Damit nicht die Standardauthentifizierung verwendet wird, aktivieren Sie das Kontrollkästchen Standardauthentifizierung nicht zulassen. Der Server versucht, die NTLM-Authentifizierung von Windows zu verwenden. Wenn die NTLM-Authentifizierung nicht erfolgreich ist, versucht der Server, die Standardauthentifizierung zu verwenden, sofern das Kontrollkästchen Standardauthentifizierung nicht zulassen nicht aktiviert ist.

    • Wählen Sie Clientzertifikat angeben aus, und klicken Sie dann auf ein Zertifikat im Menü Zertifikat, um ein Clientzertifikat für die Authentifizierung zu verwenden.
  5. Klicken Sie auf OK.

Testen von Crawlregeln für eine URL

Sie können Crawlregeln für eine URL testen, um zu ermitteln, welche Regeln beim Crawlen der URL angewendet werden und wie sich diese Regeln auswirken (entweder Einschluss oder Ausschluss von Inhalten). Beim Testen von Crawlregeln für eine URL wird die URL jedoch nicht tatsächlich gecrawlt.

  1. Geben Sie auf der Seite Crawlregeln verwalten im Feld Geben Sie eine URL ein, und klicken Sie auf 'Testen', um zu ermitteln, ob sie eine Regel erfüllt die URL ein, die Sie testen möchten.

  2. Klicken Sie auf Testen.

  3. Das Ergebnis des Tests wird unter dem Feld Geben Sie eine URL ein, und klicken Sie auf 'Testen', um zu ermitteln, ob sie eine Regel erfüllt aufgeführt.

Bearbeiten einer Crawlregel

Wenn Sie eine Crawlregel bearbeiten, werden die Änderungen erst nach Beginn des nächsten vollständigen Crawls wirksam.

  • Klicken Sie auf der Seite Crawlregeln verwalten in der Liste der Crawlregeln im Menü der Crawlregel, die Sie bearbeiten möchten, auf Bearbeiten.

    Informationen zu den Einstellungen für Crawlregeln finden Sie im Abschnitt "Hinzufügen einer Crawlregel".

Löschen einer Crawlregel

Wenn Sie eine Crawlregel löschen, wird die Löschung erst nach Beginn des nächsten vollständigen Crawls wirksam.

  1. Klicken Sie auf der Seite Crawlregeln verwalten in der Liste der Crawlregeln im Menü der Crawlregel, die Sie löschen möchten, auf Löschen.

  2. Klicken Sie in dem Meldungsfeld, in dem Sie gefragt werden, ob Sie die Crawlregel wirklich löschen möchten, auf OK.

Neuanordnen von Crawlregeln

  • Wählen Sie auf der Seite Crawlregeln verwalten in der Liste der Crawlregeln in der Reihenfolge-Spalte einen Wert in der Dropdownliste aus, um die gewünschte Position der Regel anzugeben. Andere Werte werden entsprechend verschoben.

    Crawlregeln werden in der Reihenfolge anwendet, in der sie aufgeführt sind. Wenn zwei Regeln die gleichen oder sich überschneidende Inhalte betreffen, wird die zuerst aufgelistete Regel angewendet.

    Sie können auch eine globale Ausschlussregel verwenden, die unabhängig von der Reihenfolge angewendet wird, in der sie aufgelistet ist. Weitere Informationen zum Verwalten von Crawlregeln finden Sie im Abschnitt zum Verwalten von Crawlregeln in der folgenden Ressource: Book Excerpt - Chapter 16 Enterprise search and indexing architecture and administration (in englischer Sprache).