Planen von Metadateneigenschaften für die Suche (Search Server 2010)

 

Gilt für: Search Server 2010

Letztes Änderungsdatum des Themas: 2011-04-25

In diesem Artikel wird beschrieben, wie Sie Metadateneigenschaften für die Suche in Microsoft Search Server 2010 planen. Wenn Inhalte durchsucht werden, durchsucht der Crawler auch die Metadaten, die dem jeweiligen Inhalt zugeordnet sind, wie z. B. Informationen zum Autor und Titel oder eine E-Mail-Adresse. Das Suchsystem speichert diese Informationen als durchforstete Eigenschaften und als verwaltete Eigenschaften. Durchforstete Eigenschaften sind Eigenschaften (z. B. Autor, Titel oder Betreff), die bei Durchforstungsvorgängen aus Dokumenten extrahiert wurden. Verwaltete Eigenschaften sind durchforstete Eigenschaften, die in optimierten und in erweiterten Suchvorgängen verwendet werden können. Wenn Benutzer eine allgemeine Suche ausführen, werden die Elemente im Ergebnis aus durchforsteten Eigenschaften erzeugt. Um den Benutzern optimierte Suchvorgänge bereitzustellen, müssen Sie verwaltete Eigenschaften planen und definieren. Da diese Eigenschaften in optimierten Suchvorgängen erscheinen können, erhalten Benutzer bei Abfragen bessere und aussagekräftigere Ergebnisse, wenn verwaltete Eigenschaften verfügbar sind. Search Server 2010 stellt einen Standardsatz von verwalteten Eigenschaften bereit. Sie können aber auch neue verwaltete Eigenschaften erstellen und den verwalteten Eigenschaften, die in Suchergebnissen angezeigt werden, durchforstete Eigenschaften zuordnen.

Optimierte Suchvorgänge können nur für verwaltete Eigenschaften durchgeführt werden, nicht für durchforstete Eigenschaften. Um eine durchforstete Eigenschaft für optimierte Suchabfragen verfügbar zu machen, müssen Sie sie einer verwalteten Eigenschaft zuordnen. Sie können mehrere durchforstete Eigenschaften einer einzelnen verwalteten Eigenschaft oder eine einzelne durchforstete Eigenschaft mehreren verwalteten Eigenschaften zuordnen. Wenn einer verwalteten Eigenschaft mehrere durchforstete Eigenschaften zugeordnet sind und ein Dokument Werte für mehrere durchforstete Eigenschaften enthält, bestimmen die Reihenfolge in der Zuordnung und die Prioritäten der Eigenschaften den Wert der verwalteten Eigenschaft.

Beispielsweise können drei verschiedene Dokumenttypen unterschiedliche Namen für die Eigenschaft zur Angabe des Autors aufweisen. In einem Dokumenttyp kann diese Eigenschaft als "Autor" bezeichnet werden, im zweiten als "Verfasser" und im dritten als "Eigenschaft3". Obwohl alle drei durchforstete Eigenschaften sind, werden nur die Dokumente mit der Eigenschaft "Autor" in den Suchergebnissen angezeigt, wenn ein Benutzer eine Abfrage nach dem Autor ausführt (z. B. durch Eingabe von Autor:Johann Schmidt im Suchfeld). Um sicherzustellen, dass Dokumente mit anderen Namen für diese Eigenschaft in den Suchergebnissen angezeigt werden, müssen Sie jede der durchforsteten Eigenschaften der verwalteten Eigenschaft "Autor" zuordnen.

Inhalt dieses Artikels:


  • Informationen zu verwalteten Eigenschaften


  • Reduzieren doppelter verwalteter Eigenschaften


  • Hinzufügen von Eigenschaften für Schlüsselkonzepte in der Informationsarchitektur


  • Szenario

Informationen zu verwalteten Eigenschaften

Um einen sinnvollen Satz von verwalteten Eigenschaften erstellen zu können, müssen Sie die wichtigsten Inhalte ermitteln und Metadaten in den Inhalten bestimmen, die Sie verwalteten Eigenschaften zuordnen können.

Es ist schwierig, Eigenschaften in den Inhalten zu ermitteln, wenn zuvor kein Durchforstungsvorgang ausgeführt wurde. Daher wird empfohlen, dass Sie mit der Planung der verwalteten Eigenschaften warten, bis Sie wissen, welche Inhalte in den einzelnen Websitesammlungen vorhanden sind. Anschließend können Sie unter Verwendung eines Testservers einen Durchforstungsvorgang für den gesamten Inhalt durchführen. Nach dem Durchforstungsvorgang steht Ihnen eine Liste durchforsteter Eigenschaften zur Verfügung, die Sie mit der Informationsarchitektur vergleichen können, wenn Sie verwaltete Eigenschaften erstellen. Auch nach dem Durchforstungsvorgang kann die Zuordnung von Eigenschaften Probleme bereiten, da es oftmals schwierig ist, den Inhaltstyp oder die für eine bestimmte Eigenschaft zu verwendende Anwendung zu ermitteln. Wenn Sie sich bei einer bestimmten Eigenschaft nicht sicher sind, können Sie die Zuordnung in einer Testumgebung erstellen und Suchvorgänge zum Testen der Eigenschaft ausführen.

Viele häufig verwendete und sinnvolle verwaltete Eigenschaften werden bereits automatisch bei der Installation von Search Server 2010 erstellt. Verwenden Sie diese verwalteten Eigenschaften als Ausgangspunkt für die Planung weiterer verwalteter Eigenschaften. Die folgenden verwalteten Eigenschaften werden automatisch erstellt:

  • Autor

  • Beschreibung

  • Name der Website

  • Typ

  • Dateigröße

  • Zuletzt geändert am

  • URL

  • Titel

Beachten Sie, dass den durchforsteten Eigenschaften zunächst Werte zugewiesen werden müssen, damit die Suche anhand von Eigenschaften effektiv ist. Wenn Sie z. B. ein Microsoft Word 2010-Dokument mit der Eigenschaft "Autor" (die einer verwalteten Eigenschaft mit der Bezeichnung "Autor" zugeordnet ist) vorliegen haben und der Eigenschaft "Autor" für dieses Dokument noch kein Wert zugewiesen wurde, wird das Dokument nicht in den Suchergebnissen angezeigt, wenn Benutzer eine Abfrage nach dem Autor durchführen. Um sicherzustellen, dass optimierte Suchvorgänge die bestmöglichen Ergebnisse zurückliefern, sollten Sie in Erwägung ziehen, im Unternehmen eine Inhaltsverwaltung zu implementieren, die Möglichkeiten zur Planung von Metadaten beinhaltet. Weitere Informationen zur Planung von Dokumentmetadaten finden Sie unter Planen verwalteter Metadaten (SharePoint Server 2010) und Planen von Inhaltstypen und Workflows (SharePoint Server 2010). Informationen zur Planung einer Inhaltsverwaltungslösung für ein Unternehmen finden Sie unter Enterprise Content Management-Planung (SharePoint Server 2010).

Weitere Information zum Verwalten von Metadateneigenschaften finden Sie unter Verwalten von Metadateneigenschaften (Search Server 2010)

Reduzieren doppelter verwalteter Eigenschaften

Einige grundlegende Eigenschaften werden in verschiedenen Inhaltstypen möglicherweise durch unterschiedliche durchforstete Eigenschaften wiedergegeben. Beispielsweise sind die durchforsteten Eigenschaften "Besitzer", Verfasser" oder "Erstellt von" alle Synonyme für den Autor. Ein sehr wichtiger Schritt bei der Planung ist daher das Reduzieren doppelter Eigenschaften. Planen Sie einen definierten Satz verwalteter Eigenschaften, und ordnen Sie anschließend durchforstete Eigenschaften mit derselben Bedeutung den entsprechenden verwalteten Eigenschaften zu. In diesem Fall können "Besitzer", Verfasser" und "Erstellt von" alle der verwalteten Eigenschaft "Autor" zugeordnet werden.

Sie können Prioritäten für mehrere durchforstete Eigenschaften festlegen. Wenn bei einem Durchforstungsvorgang mehr als eine dieser Eigenschaften gefunden wird, wird nur der Wert der Eigenschaft mit der höchsten Priorität für Abfragen mit verwalteten Eigenschaften verwendet. Wenn Sie keine Prioritäten für durchforstete Eigenschaften festlegen, werden die Werte aller durchforsteten Eigenschaften, die einer verwalteten Eigenschaft zugeordnet sind, in Abfragen berücksichtigt. Die verwaltete Eigenschaft ist dann "mehrwertig". Das heißt, dass eine Abfrage Ergebnisse für alle Inhalte zurückgibt, die übereinstimmende Werte für eine der zugeordneten Eigenschaften in der Abfrage enthalten. Ein sinnvoller Ansatz für eine Eigenschaft mit nur einem Wert ist die Auswahl der am häufigsten vorkommenden durchforsteten Eigenschaft als verwaltete Eigenschaft. Anschließend werden die zugeordneten Eigenschaften nach ihrer Häufigkeit priorisiert. Es ist jedoch nicht immer einfach, die am häufigsten vorkommende durchforstete Eigenschaft zu bestimmen. Daher ist eine mögliche Strategie, sich bei der Priorisierung von Eigenschaften an der Bezeichnung dieser Eigenschaften in häufig verwendeten Anwendungen zu orientieren. Zum Beispiel wird in Microsoft Office 2010-Dokumenten ein Standardsatz von Eigenschaften verwendet: Autor, Titel, Firma, Typ usw. Wenn ein Großteil der Benutzer mit Microsoft Office 2010 arbeitet, der Inhaltssatz aber auch Dokumente umfasst, die mit anderen Anwendungen erstellt wurden, können Sie die Eigenschaften der Dokumente aus anderen Anwendungen den Eigenschaften in Office 2010-Dokumenten zuordnen. Wenn ein Dokument, das mit einer anderen Anwendung erstellt wurde, eine Eigenschaft mit dem Namen Verfasser enthält, ordnen Sie diese z. B. der verwalteten Eigenschaft mit dem Namen Autor zu.

Achten Sie genau darauf, welche Eigenschaften Sie zuordnen, um eine versehentliche Zuordnung irrelevanter oder schlecht definierter Eigenschaften zu vermeiden. Ungenaue Zuordnungen können die Relevanz zurückgegebener Suchergebnisse beeinträchtigen. Wenn z. B. eine Eigenschaft mit der Bezeichnung Zuletzt gespeichert von der verwalteten Eigenschaft Autor zugeordnet wird, führt dies zu ungenauen bzw. falschen Suchergebnissen. Testen Sie, wenn möglich, die Suche nach verwalteten Eigenschaften vor der endgültigen Bereitstellung, und planen Sie eine Prüfung der Verwendungsdaten für Suchabfragen im normalen Betrieb, um die für Eigenschaften definierten Zuordnungen weiter optimieren zu können. Weitere Informationen zur Prüfung von Verwendungsdaten für Suchabfragen finden Sie unter Anzeigen von Web Analytics-Berichten (SharePoint Server 2010).

Hinzufügen von Eigenschaften für Schlüsselkonzepte in der Informationsarchitektur

Zusätzlich zu durchforsteten Eigenschaften, die verwalteten Eigenschaften standardmäßig zugeordnet sind, lassen sich ggf. auch andere durchforstete Eigenschaften eindeutig bestimmten Konzepten in der Informationsarchitektur zuordnen, die durch die bereits vorhandenen verwalteten Eigenschaften definiert wird. Beispielsweise kann in einem Unternehmen der Kundenservice als zentraler Geschäftsprozess definiert sein. Als Schlüsselkonzepte der Informationsarchitektur im Zusammenhang mit dem Kundenservice sind z. B. Kunden, Kundendienstmitarbeiter und Kudendienstregionen denkbar.

Stellen Sie sich für jedes Konzept in der Informationsarchitektur die Frage, ob eine durchforstete Eigenschaft vorhanden ist, die dieses Konzept wiedergibt und die einer verwalteten Eigenschaft zugeordnet werden kann. Ist dies der Fall, definieren Sie die Eigenschaft als verwaltete Eigenschaft.

Szenario

In einer Branchenanwendung werden Kunden- und Mitarbeiterdaten verwaltet. Die Eigenschaften dieser Daten sind sehr wahrscheinlich geeignet für die Definition als verwaltete Eigenschaften, sobald sie im Geschäftsdatenkatalog registriert sind und als Teil einer Inhaltsquelle für Geschäftsdaten durch einen Durchforstungsvorgang erfasst wurden. Möglicherweise werden weitere durchforstete Eigenschaften von Anwendungen ermittelt, die diesen verwalteten Eigenschaften zugeordnet werden können, z. B. eine Eigenschaft mit dem eindeutigen Bezeichner (ID) für Kundendienstmitarbeiter, die aus einer separaten Anwendung stammt, oder eine Autor-Eigenschaft für einen Anwendungstyp, der ausschließlich von Kundendienstmitarbeitern verwendet wird. Eine Suchabfrage, die diese Eigenschaft oder einen der Eigenschaft zugeordneten Begriff verwendet, liefert dann Suchergebnisse für alle Elemente, die eine der durchforsteten Eigenschaften enthalten, die der verwalteten Eigenschaft für die ID des Kundendienstmitarbeiters zugeordnet wurden.

Für jeden primären Geschäftsprozess, der in der Informationsarchitektur definiert ist, kann i. d. R. ein Satz zugehöriger Dateitypen oder Geschäftsdatenanwendungen bestimmt werden, über den sich geeignete verwaltete Eigenschaften bestimmen lassen.

Viele Konzepte in der Informationsarchitektur werden nicht eindeutig durch Eigenschaften wiedergegeben. Beachten Sie, dass diese Konzepte dennoch von großer Bedeutung für die Planung der Websitestruktur und die Implementierung anderer Suchfunktionen sein können. In der Informationsarchitektur sind möglicherweise auch verwaltete Eigenschaften definiert, die Sie übersehen haben. Gleichermaßen muss nicht zwingend für jedes Konzept, das in der Informationsarchitektur aufgeführt wird, eine verwaltete Eigenschaft vorhanden sein.