Bewährte Methoden für die Verwendung von Durchforstungsprotokollen (Search Server 2010)

 

Gilt für: Search Server 2010

Letztes Änderungsdatum des Themas: 2015-03-09

In den Durchforstungsprotokollen werden Informationen zum Status der durchforsteten Inhalte nachverfolgt. Anhand des Protokolls können Sie feststellen, ob ein durchforsteter Inhalt erfolgreich dem Index hinzugefügt wurde, ob er aufgrund einer Durchforstungsregel ausgeschlossen wurde oder ob bei der Indizierung ein Fehler aufgetreten ist. Darüber hinaus enthält das Durchforstungsprotokoll weitere Informationen zum durchforsteten Inhalt, z. B. die Zeit der letzten erfolgreichen Durchforstung, die Inhaltsquellen und ob Durchforstungsregeln angewendet wurden. Das Durchforstungsprotokoll ist hilfreich bei der Diagnose von Problemen mit der Suche.

Inhalt dieses Artikels:

  • So zeigen Sie das Durchforstungsprotokoll an

  • Ansichten des Durchforstungsprotokolls

  • Zeitgeberauftrag für das Durchforstungsprotokoll

  • Behandeln häufig auftretender Probleme

So zeigen Sie das Durchforstungsprotokoll an

  1. Stellen Sie sicher, dass das Benutzerkonto, mit dem dieser Vorgang durchgeführt wird, ein Administratorkonto für die Suchdienstanwendung ist.

  2. Klicken Sie in der Zentraladministration auf der Schnellstartleiste auf Anwendungsverwaltung.

  3. Klicken Sie auf der Seite Anwendungsverwaltung unter Dienstanwendungen auf Dienstanwendungen verwalten.

  4. Klicken Sie auf der Seite Dienstanwendungen in der Liste der Dienstanwendungen auf die gewünschte Suchdienstanwendung.

  5. Klicken Sie auf der Seite Suchverwaltung auf der Schnellstartleiste unter Durchforstung wird ausgeführt auf Durchforstungsprotokoll.

  6. Klicken Sie auf der Seite Durchforstungsprotokoll – Inhaltsquelle auf die gewünschte Ansicht.

Ansichten des Durchforstungsprotokolls

In der folgenden Tabelle sind die verschiedenen Ansichten aufgeführt, die Sie zum Anzeigen des Status durchforsteter Inhalte auswählen können.

Ansicht Beschreibung

Inhaltsquelle

Fasst die durchforsteten Elemente pro Inhaltsquelle zusammen. Zeigt Erfolge, Warnungen, Fehler, Fehler auf höchster Ebene und Löschungen an. Die Daten in dieser Ansicht stellen den aktuellen Status von Elementen dar, die bereits im Index pro Inhaltsquelle vorhanden sind. Die Daten für diese Ansicht werden vom Objektmodell bereitgestellt.

Hostname

Fasst die durchforsteten Elemente pro Host zusammen. Zeigt Erfolge, Warnungen, Fehler, Löschungen, Fehler auf höchster Ebene und Gesamtanzahl an. Die Daten in dieser Ansicht stellen den aktuellen Status von Elementen dar, die bereits im Index pro Host vorhanden sind. Wenn die Umgebung mehrere Durchforstungsdatenbanken umfasst, werden die Daten pro Durchforstungsdatenbank angezeigt. Die Daten für diese Ansicht werden von der Suchverwaltungsdatenbank bereitgestellt. Sie können die Ergebnisse filtern, indem Sie im Feld URLs suchen, die mit dem folgenden Hostnamen/Pfad beginnen eine URL eingeben.

URL

Ermöglicht das Durchsuchen der Durchforstungsprotokolle nach Inhaltsquelle, URL oder Hostname und das Anzeigen von Details aller Elemente im Index. Die Daten für die Ansicht werden von der MSSCrawlURLReport-Tabelle in der Durchforstungsdatenbank bereitgestellt. Sie können die Ergebnisse filtern, indem Sie die Felder Status, Meldung, Startzeit und Endzeit festlegen.

Durchforstungsverlauf

Fasst die Durchforstungstransaktionen während einer Durchforstung zusammen. Eine Durchforstung kann mehrere Transaktionen pro Element umfassen, daher kann die Anzahl der Transaktionen die Gesamtanzahl der Elemente übersteigen. Diese Ansicht zeigt Daten für drei Arten der Durchforstung an:

  • Vollständig. Durchforstet alle Elemente in einer Inhaltsquelle.

  • Inkrementell. Durchforstet Elemente, die seit der letzten vollständigen oder inkrementellen Durchforstung geändert wurden. Diese Art der Durchforstung wird nur ausgeführt, wenn sie geplant wird.

  • Löschen. Wenn Startadressen aus einer Inhaltsquelle entfernt werden, werden Elemente, die der gelöschten Startadresse zugeordnet sind, vor einer vollständigen oder inkrementellen Durchforstung durch eine Löschungsdurchforstung aus dem Index entfernt. Diese Art der Durchforstung kann nicht geplant werden.

Die Daten für diese Ansicht werden von der Suchverwaltungsdatenbank bereitgestellt. Sie können die Ergebnisse nach Inhaltsquelle filtern.

Fehlermeldung

Enthält Aggregate von Fehlern pro Inhaltsquelle oder Hostname. Die Daten für die Ansicht werden von der MSSCrawlURLReport-Tabelle in der Durchforstungsdatenbank bereitgestellt. Sie können nach Inhaltsquelle oder Host filtern.

Hinweis

Das Dropdownfeld zum Filtern enthält nur Inhaltsquellen, bei denen Fehler aufgetreten sind. Ist ein Fehler für ein Element aufgetreten, das nicht im Index enthalten ist, wird der Fehler in dieser Ansicht nicht angezeigt.

Die Ansichten Inhaltsquelle, Hostname und Durchforstungsverlauf enthalten Daten in folgenden Spalten:

  • Erfolge. Elemente, die erfolgreich durchforstet wurden und durchsuchbar sind.

  • Warnungen. Elemente, die möglicherweise nicht erfolgreich durchforstet wurden und möglicherweise nicht durchsuchbar sind.

  • Fehler. Elemente, die nicht erfolgreich durchforstet wurden und möglicherweise nicht durchsuchbar sind.

  • Löschungen. Elemente, die aus dem Index entfernt wurden und nicht mehr durchsuchbar sind.

  • Fehler auf höchster Ebene. Fehler in Dokumenten der obersten Ebene, wie z. B. Startadressen, virtuelle Server und Inhaltsdatenbanken. Jeder Fehler auf höchster Ebene zählt als Fehler, aber nicht alle Fehler zählen als Fehler auf höchster Ebene. Da die Spalte Fehler die Zählung aus der Spalte Fehler auf höchster Ebene enthält, werden Fehler auf höchster Ebene in der Ansicht Hostname nicht erneut gezählt.

  • Nicht geändert. Elemente, die zwischen Durchforstungen nicht geändert wurden.

  • Sicherheitsupdates. Elemente, deren Sicherheitseinstellungen durchforstet wurden, weil sie geändert wurden.

Zeitgeberauftrag für das Durchforstungsprotokoll

Die Daten für jede Ansicht im Durchforstungsprotokoll werden standardmäßig alle 5 Minuten vom Zeitgeberauftrag Durchforstungsprotokollbericht für die Suchanwendung <Name der Suchdienstanwendung> aktualisiert. Sie können die Aktualisierungsrate ändern, im Allgemeinen sollte die Einstellung jedoch unverändert übernommen werden.

Tipp

Wenn Sie den Eindruck haben, dass das Durchforstungsprotokoll nicht die aktuellen Daten zeigt, stellen Sie sicher, dass der Zeitgeberauftrag nicht angehalten wurde und kürzlich ausgeführt wurde.

So überprüfen Sie den Status des Zeitgeberauftrags für das Durchforstungsprotokoll

  1. Vergewissern Sie sich, dass das Benutzerkonto, mit dem dieses Verfahren ausgeführt wird, Mitglied der SharePoint-Gruppe Farmadministratoren ist.

  2. Klicken Sie in der Zentraladministration im Abschnitt Überwachung auf Auftragsstatus überprüfen.

  3. Klicken Sie auf der Seite Status des Zeitgeberauftrags auf Auftragsverlauf.

  4. Suchen Sie auf der Seite Auftragsverlauf nach Durchforstungsprotokollbericht für die Suchanwendung <Name der Suchdienstanwendung> für die gewünschte Suchdienstanwendung, und überprüfen Sie den Status.

So ändern Sie die Aktualisierungsrate des Zeitgeberauftrags für das Durchforstungsprotokoll

  1. Vergewissern Sie sich, dass das Benutzerkonto, mit dem dieses Verfahren ausgeführt wird, Mitglied der SharePoint-Gruppe Farmadministratoren ist.

  2. Klicken Sie in der Zentraladministration im Abschnitt Überwachung auf Auftragsstatus überprüfen.

  3. Klicken Sie auf der Seite Status des Zeitgeberauftrags auf Auftragsverlauf.

  4. Klicken Sie auf der Seite Auftragsverlauf auf Durchforstungsprotokollbericht für die Suchanwendung <Name der Suchdienstanwendung> für die gewünschte Suchdienstanwendung.

  5. Ändern Sie auf der Seite Zeitgeberauftrag bearbeiten im Abschnitt Zeitplanserie den Zeitplan für den Zeitgeberauftrag in das gewünschte Intervall.

  6. Klicken Sie auf OK.

Behandeln häufig auftretender Probleme

Dieser Abschnitt enthält Informationen zu häufig auftretenden Fehlern im Durchforstungsprotokoll, zum Crawlerverhalten und zu Maßnahmen für die Erhaltung einer fehlerfreien Durchforstungsumgebung.

Wenn ein Element aus dem Index gelöscht wird

Wenn ein im Index vorhandenes Element vom Crawler nicht gefunden wird, weil die URL veraltet ist oder aufgrund eines Netzwerkausfalls nicht darauf zugegriffen werden kann, meldet der Crawler in dieser Durchforstung einen Fehler für das Element. Bleibt dieser bei den nächsten drei Durchforstungen bestehen, wird das Element aus dem Index gelöscht. Bei Dateifreigabe-Inhaltsquellen werden Elemente sofort aus dem Index gelöscht, wenn sie in der Dateifreigabe gelöscht werden.

Fehler "Das Element kann nicht gefunden werden" für eine Dateifreigabe

Dieser Fehler kann von einer durchforsteten Dateifreigabe-Inhaltsquelle verursacht werden, die einen gültigen Hostnamen, aber einen ungültigen Dateinamen enthält. Wenn beispielsweise bei einem Host- und Dateinamen \\GültigerHost\Dateien\Datei1 zwar \\GültigerHost vorhanden ist, die Datei Datei1 jedoch nicht, wird vom Crawler der Fehler "Das Element kann nicht gefunden werden" gemeldet. Außerdem wird das Element aus dem Index gelöscht. Die Ansicht Durchforstungsverlauf zeigt Folgendes:

  • Fehler: 1

  • Löschungen: 1

  • Fehler auf höchster Ebene: 1 (\\GültigerHost\Dateien\Datei1 wird als Fehler auf höchster Ebene angezeigt, da es eine Startadresse darstellt)

Die Ansicht Inhaltsquelle zeigt Folgendes:

  • Fehler: 0

  • Löschungen: 0

  • Fehler auf höchster Ebene: 0

In der Ansicht Inhaltsquelle wird für alle Fehler Null angezeigt, da nur der Status von im Index vorhandenen Elementen berücksichtigt wird und diese Startadresse nicht in den Index eingetragen wurde. In der Ansicht Durchforstungsverlauf werden jedoch alle Durchforstungstransaktionen angezeigt, unabhängig von ihrer Eintragung in den Index.

Fehler "Der Netzwerkpfad für ein Element konnte nicht aufgelöst werden" für eine Dateifreigabe

Dieser Fehler kann von einer durchforsteten Dateifreigabe-Inhaltsquelle verursacht werden, die einen ungültigen Hostnamen und einen ungültigen Dateinamen enthält. Wenn beispielsweise bei einem Host- und Dateinamen \\UngültigerHost\Dateien\Datei1 sowohl \\UngültigerHost als auch die Datei Datei1 nicht vorhanden sind, wird vom Crawler der Fehler "Der Netzwerkpfad für ein Element konnte nicht aufgelöst werden" gemeldet. Das Element wird nicht aus dem Index gelöscht. Die Ansicht Durchforstungsverlauf zeigt Folgendes:

  • Fehler: 1

  • Löschungen: 0

  • Fehler auf höchster Ebene: 1 (\\UngültigerHost\Dateien\Datei1 wird als Fehler auf höchster Ebene angezeigt, da es eine Startadresse darstellt)

Die Ansicht Inhaltsquelle zeigt Folgendes:

  • Fehler: 0

  • Löschungen: 0

  • Fehler auf höchster Ebene: 0

Das Element wird nicht aus dem Index gelöscht, da vom Crawler nicht unterschieden werden kann, ob das Element tatsächlich nicht vorhanden ist oder ob der Zugriff darauf durch einen Netzwerkausfall verhindert wird.

Veraltete Startadressen

Das Durchforstungsprotokoll enthält Fehler auf höchster Ebene für Dokumente der obersten Ebene oder Startadressen. Um fehlerfreie Inhaltsquellen sicherzustellen, sollten Sie folgende Aktionen ausführen:

  • Untersuchen Sie alle Fehler der höchsten Ebene, die nicht gleich Null sind.

  • Untersuchen Sie alle Fehler der höchsten Ebene, die ständig im Durchforstungsprotokoll auftreten.

  • Ansonsten wird empfohlen, veraltete Startadressen alle zwei Wochen zu löschen, nachdem Sie den Besitzer der Website informiert haben.

So behandeln Sie Probleme mit veralteten Startadressen und löschen diese

  1. Stellen Sie sicher, dass das Benutzerkonto, mit dem dieser Vorgang durchgeführt wird, ein Administratorkonto für die Suchdienstanwendung ist.

  2. Wenn Sie bemerkt haben, dass eine Startadresse möglicherweise veraltet ist, überprüfen Sie zunächst ihr Vorhandensein, indem Sie Ping für die Website ausführen. Erhalten Sie eine Antwort, bestimmen Sie, welche der folgenden Ursachen zutrifft:

    • Wenn Sie von einem Browser auf die URL zugreifen können, konnte die Startadresse vom Crawler nicht durchforstet werden, weil Probleme mit der Netzwerkverbindung bestehen.

    • Wenn die URL von einem Browser umgeleitet wird, sollten Sie die Startadresse in die neue Adresse ändern.

    • Wenn die URL in einem Browser einen Fehler empfängt, versuchen Sie es später erneut. Bleibt der Fehler nach mehreren Versuchen bestehen, erkundigen Sie sich beim Websitebesitzer, ob die Website noch verfügbar ist.

  3. Wenn Sie auf den Ping für die Website keine Antwort erhalten, ist die Website nicht vorhanden und sollte gelöscht werden. Lassen Sie sich dies vom Websitebesitzer bestätigen, bevor Sie die Website löschen.

Zugriff verweigert

Wenn im Durchforstungsprotokoll ständig ein Fehler "Zugriff verweigert" für eine Startadresse gemeldet wird, verfügt das Inhaltszugriffskonto möglicherweise nicht über die Leseberechtigung zum Durchforsten der Website. Falls Sie die URL mit einem Administratorkonto anzeigen können, besteht u. U. ein Problem mit der Aktualisierung der Berechtigungen. In diesem Fall sollten Sie Berechtigungen beim Websitebesitzer beantragen. Informationen zum Festlegen von Berechtigungen für einen Crawler finden Sie unter Verwalten von Durchforstungsregeln (Search Server 2010).

Zahlen in der Ansicht "Inhaltsquelle" werden bei der Hostverteilung auf Null gesetzt

Bei einer Hostverteilung werden die Zahlen in allen Spalten der Ansicht Inhaltsquelle auf Null gesetzt. Der Grund ist, dass die Zahlen in der Ansicht Inhaltsquelle direkt aus den Tabellen der Durchforstungsdatenbanken entnommen werden. Bei einer Hostverteilung werden die Daten aus diesen Tabellen verschoben, daher bleiben die Werte für die Dauer der Hostverteilung Null.

Führen Sie nach Abschluss der Hostverteilung eine inkrementelle Durchforstung der Inhaltsquellen aus, um die ursprünglichen Zahlen wiederherzustellen.

Anzeigen der Löschungen in Dateifreigaben in der Ansicht "Inhaltsquelle"

Wenn Dokumente aus einer erfolgreich durchforsteten Dateifreigabe-Inhaltsquelle gelöscht werden, werden sie bei der nächsten vollständigen oder inkrementellen Durchforstung sofort aus dem Index gelöscht. Diese Elemente werden in der Ansicht Inhaltsquelle des Durchforstungsprotokolls als Fehler angezeigt, in anderen Ansichten jedoch als Löschungen.

Das Anhalten oder Neustarten des SharePoint Server-Suchdiensts verursacht Diskrepanzen bei den Transaktionen im Durchforstungsprotokoll

Der SharePoint Server-Suchdienst (OSearch14) wird möglicherweise aufgrund von Verwaltungsvorgängen oder Serverfunktionen zurückgesetzt oder neu gestartet. In diesem Fall können Diskrepanzen bei der Durchforstungsverlaufsansicht des Durchforstungsprotokolls auftreten. Sie bemerken eventuell einen Unterschied zwischen der pro Durchforstung gemeldeten Anzahl von Transaktionen und der pro Durchforstung tatsächlich ausgeführten Anzahl von Transaktionen. Dies ist darauf zurückzuführen, dass der OSearch14-Dienst aktive Transaktionen im Arbeitsspeicher speichert und diese Transaktionen nach deren Abschluss schreibt. Wenn der OSearch14-Dienst beendet, zurückgesetzt oder neu gestartet wird, bevor die Transaktionen im Arbeitsspeicher in die Durchforstungsprotokoll-Datenbank geschrieben wurden, wird die Anzahl der Transaktionen pro Durchforstung nicht korrekt angezeigt.