Einschätzen von Leistungs- und Kapazitätsanforderungen bei Suchumgebungen

Inhalt dieses Artikels:

  • Hauptmerkmale

  • Testumgebung

  • Empfehlungen

Dieses Szenario zur Leistungs- und Kapazitätsplanung umfasst eine einzelne Microsoft Office SharePoint Server 2007-Farm, die zum Durchsuchen und Indizieren von Office SharePoint Server-Inhalten in einer Unternehmensumgebung verwendet wird.

Wichtig

Die Orientierungshilfen in diesem Artikel wurden zum Teil für Office SharePoint Server 2007 mit SP1 aktualisiert. Eine vollständige Liste aller Aktualisierungen für Office SharePoint Server 2007 mit SP1 finden Sie unter Buch zum Herunterladen: "Planen und Bereitstellen von Service Pack 1 für Office SharePoint Server 2007 in einer Umgebung mit mehreren Servern".

Hauptmerkmale

Hauptmerkmale beschreiben Umgebungsfaktoren, Verwendungsmerkmale und andere Überlegungen, die für Bereitstellungen im Rahmen dieses Szenarios wahrscheinlich eine Rolle spielen.

Dieses Szenario ist durch folgende Hauptmerkmale gekennzeichnet:

  • Benutzerantwortzeiten Zielvorgaben für Benutzerantwortzeiten für allgemeine, nicht allgemeine, seltene Vorgänge und Vorgänge mit langer Laufzeit finden Sie in der Tabelle Benutzerantwortzeit unter Planen der Softwaregrenzen (Office SharePoint Server). Einige Unternehmen gestatten möglicherweise langsamere Benutzerantwortzeiten oder erfordern schnellere Benutzerantwortzeiten. Die erwartete Benutzerantwortzeit ist ein wichtiger Faktor, der allgemeine Durchsatzziele bestimmt. Der Durchsatz definiert die Anzahl der Abfragen, die eine Serverfarm pro Sekunde verarbeiten kann. Bei einer größeren Anzahl von Benutzern ist ein höheres Durchsatzziel erforderlich, um die gleiche Benutzerantwortzeit zu erreichen.

  • Benutzerparallelität Es wird von einem Parallelitätssatz von 10 Prozent ausgegangen, wobei 1 Prozent der gleichzeitig zugreifenden Benutzer zu einem bestimmten Zeitpunkt Abfragen ausführen. Bei 10.000 Benutzern heißt das beispielsweise, dass 1.000 Benutzer die Lösung gleichzeitig aktiv verwenden, während 100 Benutzer aktiv Abfragen ausführen.

  • Zeitintensive asynchrone Aufgaben Aufgaben wie das Crawlen von Inhalt und das Sichern von Datenbanken erhöhen die Auslastung der Serverfarm. Bei den allgemeinen Leistungsmerkmalen von Beispieltopologien wird davon ausgegangen, dass diese Aufgaben in Zeiten mit geringer Auslastung ausgeführt werden, z. B. über Nacht. Aus diesem Grund sind die Benutzerantwortraten während der Geschäftszeit nicht betroffen.

Testumgebung

Die Tests in diesem Szenario sollen dabei helfen, Schätzwerte dafür zu ermitteln, wie unterschiedliche Farmkonfigurationen auf Änderungen zahlreicher Faktoren reagieren. Dazu zählen beispielsweise die folgenden Faktoren:

  • Die Anzahl der gleichzeitigen Benutzer des Systems

  • Die Art der ausgeführten Benutzervorgänge

  • Die Anzahl der Dokumente im abgefragten Index

Es sollte beachtet werden, dass die speziellen Kapazitäts- und Leistungsangaben in diesem Abschnitt von den Zahlen in realen Umgebungen abweichen werden, obwohl bestimmte Schlüsse aus den Testergebnissen gezogen werden können. Die Zahlen in diesem Artikel sollen einen Ausgangspunkt für die Entwicklung einer angemessen skalierten Umgebung bilden. Nachdem Sie Ihren ersten Systementwurf erstellt haben, testen Sie die Konfiguration, um zu ermitteln, ob das System die Faktoren in Ihrer Umgebung unterstützt.

Hinweis

Diese Tests wurden ausgeführt, um eine Unternehmensumgebung mit Millionen von Dokumenten und einer großen Anzahl von Benutzern zu simulieren. Die in dieser Testumgebung verwendete Hardware wurde mit stabilen Prozessoren und einer große Menge Arbeitsspeicher und Festplattenkapazität konfiguriert. Hardwareempfehlungen zu Einsteigersystemen finden Sie im Abschnitt Empfehlungen in diesem Artikel.

Weitere Informationen zum Testen der Bereitstellung finden Sie unter Tools für die Leistungs- und Kapazitätsplanung (Office SharePoint Server).

Annahmen

  • 64-Bit-Architektur In der Testumgebung wurden ausschließlich Server mit 64 Bit verwendet. Obwohl Microsoft Office SharePoint Server 2007 auf 32-Bit-Servern bereitgestellt werden kann, wird in Microsoft Office SharePoint Server 2007-Farmbereitstellungen die Verwendung von 64-Bit-Servern empfohlen. Weitere Informationen dazu finden Sie im Abschnitt 64 Bit und 32 Bit unter Informationen zur Leistungs- und Kapazitätsplanung (Office SharePoint Server).

  • Datenträgerbasiertes Zwischenspeichern aktiviert Aufgrund des datenträgerbasierten Zwischenspeicherns ist es nicht mehr notwendig, mehrfach in der Datenbank nach Codefragmenten oder großen Binärdateien zu suchen (z. B. Audio- und Videodateien). Durch das Aktivieren des datenträgerbasierten Zwischenspeicherns wird die Leistung der gesamten Bereitstellung gesteigert. Beachten Sie, dass das datenträgerbasierte Zwischenspeichern standardmäßig nicht aktiviert ist. Informationen zum Aktivieren des datenträgerbasierten Zwischenspeicherns finden Sie unter Datenträgerbasiertes Zwischenspeichern großer Binärobjekte (in englischer Sprache) (https://go.microsoft.com/fwlink/?linkid=82617&clcid=0x407).

Testtopologie

Eine Reihe von Serverfarmkonfigurationen, die aus ein bis acht Abfrageservern, einem Indexserver, einem SSP und einem Datenbankservercomputer mit Microsoft SQL Server 2005 bestehen, wurde für die Tests verwendet. Alle Servercomputer wurden mit der Standardkonfiguration von Microsoft Office SharePoint Server 2007 Enterprise Edition unter Microsoft Windows Server 2003 mit Service Pack 1 (SP1) Enterprise x64 Edition ausgeführt.

In der folgenden Tabelle wird die in den Tests verwendete spezifische Hardware aufgelistet.

Computerrolle Hardware Datenträgerkapazität

Abfrageserver

Vier Dual-Core-Intel Xeon-Prozessoren mit 2,66 GHz

32 GB RAM

40 GB für das Betriebssystem (RAID 5 [Redundant Array of Independent Disks])

956 GB für den Inhaltsindex und die Auslagerungsdatei des Betriebssystems (RAID 10)

Indexserver

Vier Dual-Core-Intel Xeon-Prozessoren mit 2,66 GHz

32 GB RAM

40 GB für das Betriebssystem (RAID 5)

956 GB für den Inhaltsindex und die Auslagerungsdatei des Betriebssystems (RAID 10)

Datenbankserver

Vier Dual-Core-Intel Xeon-Prozessoren mit 2,66 GHz

32 GB RAM

40 GB für das Betriebssystem (RAID 5)

956 GB für die SharedServices_Search_DB-Datenbank mit dediziertem SCSI-Controller (Small Computer System Interface, RAID 10)

Für die folgenden Datenträger wurde ein gemeinsamer SCSI-Controller verwendet:

273 GB für die SharedServices_DB-Datenbank (RAID 10)

273 GB für die TempDb-Datenbank (RAID 10)

273 GB für Protokolldateien (RAID 10)

136 GB für die SharePoint_Config-Datenbank (RAID 10)

In der Testumgebung wurde ein Gigabit-Netzwerk (1 Milliarde Bit/s) verwendet. Zur Sicherstellung einer angemessenen Netzwerkbandbreite wird zwischen den Servern in einer Office SharePoint Server-Farm die Verwendung eines Gigabit-Netzwerks empfohlen.

Verwendungsprofil

In der folgenden Tabelle werden die Verwendungsprofile für die Microsoft Office SharePoint Server 2007-Suchtestumgebung aufgeführt.

Hinweis

Zum Testen dieses Szenarios wurden nur Benutzerabfragevorgänge verwendet, um die Systemleistung zu ermitteln.

Etwa 50 Millionen Elemente wurden zu Testzwecken gecrawlt. In der folgenden Tabelle sind der Typ und die Anzahl der gecrawlten Elemente aufgeführt. Die Elemente waren zwischen 10 KB (Kilobyte) und 100 KB groß und enthielten Listenelemente, Webseiten und verschiedene Dokumenttypen.

Elementtyp Anzahl der Elemente

Inhalt auf SharePoint-Websites

10 Millionen Elemente, darunter:

  • 420 Websitesammlungen

  • 4.000 Websites

  • 24.200 Listen

  • 47.780 Dokumentbibliotheken

Inhalt in Dateifreigaben

15 Millionen Elemente

HTTP-Inhalt

15 Millionen Elemente

Personenprofile

2,5 Millionen

Stitch (speicherinternes Testtool, das Dokumente im Arbeitsspeicher generiert)

7,5 Millionen

Eigenschaften (Metadaten)

1 Million

In der folgenden Tabelle wird die Speicherplatzverwendung aufgeführt.

Verwendungstyp Volumen

Indexgröße auf Abfrageserver

100 GB*

Indexgröße auf Indexserver

100 GB*

Größe der Suchdatenbank

600 GB

Hinweis

Die getesteten Indexgrößen sind kleiner als die in Produktionsumgebungen üblichen Indexgrößen. In dem für Testzwecke generierten Korpus ist die Anzahl eindeutiger Wörter begrenzt und wird häufig wiederholt.

Die Zeit zum Ausführen eines vollständigen Crawls in der Testphase lag bei 35 Tagen (ca. 15 Dokumente pro Sekunde). Beachten Sie, dass diese Testergebnisse in einer Produktionsumgebung erzielt wurden, bei der sich die Netzwerklatenz und die Reaktionsgeschwindigkeit der gecrawlten Repositorys auf die Crawlgeschwindigkeit auswirkten. Die Crawlgeschwindigkeit in Dokumenten pro Sekunde kann in einer reinen Testumgebung oder in Umgebungen mit größerer Bandbreite und schnellerer Reaktionsgeschwindigkeit der gecrawlten Repositorys deutlich höher liegen.

Wenn sich zwei Prozent eines Korpus mit der in der Testumgebung verwendeten Größe ändern, dauert ein inkrementeller Crawl zum Feststellen der Änderungen – abhängig von der Latenz und der Reaktionsgeschwindigkeit der gecrawlten Websites – ca. 8 bis 12 Stunden. Beachten Sie, dass die Verarbeitung von Änderungen an den Metadaten und ausgehenden Hyperlinks länger dauert als die Verarbeitung von Änderungen des Inhalts von Dokumenten.

Empfehlungen

Dieser Abschnitt enthält allgemeine Empfehlungen zur Leistung und Kapazität. Verwenden Sie diese Empfehlungen, um die Kapazitäts- und Leistungsmerkmale der Anfangstopologie zu ermitteln, die Sie in Planen von Redundanz (Office SharePoint Server) erstellt haben, und um festzustellen, ob Sie die Anfangstopologie horizontal oder vertikal skalieren müssen.

Hinweis

*Horizontale Skalierung* bedeutet, dass weitere Server in einer bestimmten Rolle hinzugefügt werden, während *Vertikale Skalierung* bedeutet, dass die Leistung oder Kapazität eines bestimmten Servers durch zusätzlichen Arbeitsspeicher, Festplattenspeicher oder Prozessorgeschwindigkeit gesteigert wird.

Hardwareempfehlungen

In der folgenden Tabelle wird die empfohlene Hardware für Webserver, Indexserver und Datenbankserver aufgeführt.

Hinweis

Die Arbeitsspeicheranforderungen für Webserver, Indexserver und Datenbankserver hängen von der Größe der Farm, von der Anzahl gleichzeitiger Benutzerzugriffe und von der Komplexität der Features und Seiten in der Farm ab. Die Speicherempfehlungen in der folgenden Tabelle sind möglicherweise für eine kleine Farm oder für eine Farm mit geringfügiger Verwendung ausreichend. Die Speicherauslastung sollte jedoch aufmerksam überwacht werden, um bestimmen zu können, ob zusätzlicher Arbeitsspeicher hinzugefügt werden muss.

Serverrolle Empfohlene Hardware

Webserver (Abfrage)

Zwei Prozessoren mit jeweils mindestens 2,5 GHz (mindestens 3 GHz werden empfohlen)

2 GB RAM mindestens empfohlen

3 GB verfügbarer Speicherplatz

DVD-Laufwerk, lokal oder über das Netzwerk zugänglich

Indexserver

Zwei Prozessoren mit jeweils mindestens 2,5 GHz (mindestens 3 GHz werden empfohlen)

4 GB RAM mindestens empfohlen

3 GB verfügbarer Speicherplatz

DVD-Laufwerk, lokal oder über das Netzwerk zugänglich

Datenbankserver

Zwei Prozessoren mit jeweils mindestens 2,5 GHz (mindestens 3 GHz werden empfohlen)

4 GB RAM mindestens empfohlen

Der für die Inhaltsdatenbank benötigte Festplattenspeicher basiert auf dem Verhältnis von 1:1,2 der Inhaltsgröße zur Datenbankkapazität. Wenn Sie beispielsweise 100 GB Inhalt planen, ist mindestens 120 GB verfügbarer Festplattenspeicher für die Inhaltsdatenbank sowie weiterer Speicherplatz für Transaktionsprotokolle erforderlich.

Der für die Suchdatenbank benötigte Festplattenspeicher basiert auf dem Verhältnis von 1:4 der Indexgröße zu Datenbankkapazität. Bei einem Index mit einer Größe von 100 GB sind mindestens 400 GB verfügbarer Festplattenspeicher für die Suchdatenbank sowie weiterer Speicherplatz für Transaktionsprotokolle erforderlich.

DVD-Laufwerk, lokal oder über das Netzwerk zugänglich

Hinweis

Der für die Transaktionsprotokolle des Datenbankservers erforderliche Festplattenspeicher ist von den Protokolleinstellungen abhängig. Weitere Informationen finden Sie unter Verstehen und Verwalten von Transaktionsprotokollen (https://go.microsoft.com/fwlink/?linkid=82925&clcid=0x407).

Weitere Informationen zu den minimalen und empfohlenen Systemanforderungen finden Sie unter Determine hardware and software requirements (Search Server 2008).

Ausgangstopologien

Sie können die Leistung Ihrer Anfangstopologie einschätzen, indem Sie Ihre Topologie mit den Anfangstopologien unter Planen von Redundanz (Office SharePoint Server) vergleichen. Somit können Sie auf schnelle Weise bestimmen, ob Ihre Anfangstopologie horizontal oder vertikal skaliert werden muss, um die Leistungs- und Kapazitätsziele umzusetzen.

Kapazität und Leistung der vertikal und horizontal skalierten Topologien

Wenn Sie die Kapazität und Leistung einer der Anfangstopologien erhöhen möchten, skalieren Sie vertikal, indem Sie Servercomputer mit größerer Kapazität implementieren, oder skalieren Sie horizontal, indem Sie der Topologie Server hinzufügen. In diesem Szenario werden die allgemeinen Leistungsmerkmale verschiedener Topologien mit vertikaler und horizontaler Skalierung beschrieben. In den Beispieltopologien spiegeln sich die folgenden herkömmlichen Methoden zum vertikalen oder horizontalen Skalieren einer Topologie in einer Suchumgebung wider:

  • Zum Kompensieren größerer Benutzerauslastungen sollten Sie Abfrageservercomputer hinzufügen. Sie können auch Indexserver und dedizierte Abfrageserver hinzufügen, um die Verarbeitungslast der Webserver zu verringern.

  • Zum Ermöglichen einer größeren Datenlast steigern Sie die Kapazität der Datenbankserverrolle, indem Sie die Kapazität eines einzelnen (gruppierten oder gespiegelten) Servers erhöhen, ein Update auf einen 64-Bit-Server ausführen oder gruppierte bzw. gespiegelte Server hinzufügen.

  • Behalten Sie zwischen Abfrageservercomputern und (gruppierten oder gespiegelten) Datenbankservercomputern ein Verhältnis von maximal 8:1 bei. In unserer Testumgebung stellte sich das Verhältnis von 7x1x1 als optimal heraus (sieben Abfrageserver zu einem Indexserver und einem Datenbankserver).

Schätzen von Durchsatzzielen

Dieser Abschnitt enthält Testdaten, die den Serverfarmdurchsatz für eine wachsende Anzahl von Abfrageservern und weitere Benutzerverbindungen aufzeigen.

Da für die Bereitstellung und Konfiguration von Microsoft Office SharePoint Server 2007 zahlreiche Methoden angewendet werden können, steht keine einfache Möglichkeit zum Einschätzen der Benutzeranzahl zur Verfügung, die durch eine bestimmte Anzahl von Servern unterstützt werden kann. Daher ist es wichtig, dass Sie vor der Bereitstellung von Microsoft Office SharePoint Server 2007 in einer Produktionsumgebung Tests in Ihrer eigenen Umgebung ausführen.

Es sind zahlreiche Faktoren vorhanden, die Auswirkungen auf den Durchsatz haben, darunter die Anzahl der Benutzer, die Komplexität und Häufigkeit von Benutzervorgängen sowie das Zwischenspeichern und Anpassen von Seiten und Webparts. Alle diese Faktoren können sich erheblich auf den Farmdurchsatz auswirken. Bei der Planung Ihrer Bereitstellung sollten Sie alle diese Faktoren berücksichtigen.

Weitere Informationen zum Zwischenspeichern in Microsoft Office SharePoint Server 2007 finden Sie hier:

Wenn Ihr Unternehmen über eine vorhandene Suchlösung verfügt, können Sie die Protokolle der Internetinformationsdienste (Internet Information Services, IIS) anzeigen, um die Verwendungsmuster und Trends in der aktuellen Umgebung zu ermitteln. Weitere Informationen zum Analysieren von IIS-Protokollen finden Sie unter Analysieren von Protokolldateien (IIS 6.0) (in englischer Sprache) (https://go.microsoft.com/fwlink/?linkid=78825&clcid=0x407).

Wenn Ihr Unternehmen die Bereitstellung einer neuen Suchlösung plant, schätzen Sie Ihre Verwendungsmuster anhand der Informationen im folgenden Abschnitt ein.

Testergebnisse: Durchsatz nach Serverfarmkonfiguration

Die Tabelle in diesem Abschnitt zeigt anhand der Hardware- und Verwendungsprofile, die unter Testumgebung weiter oben in diesem Artikel aufgeführt sind, die Testergebnisse für eine Vielzahl von Benutzervorgangsprofilen. Beachten Sie, dass bei jeder Serverfarmkonfiguration ein bis acht Server zusammen mit einem Indexserver und einem Datenbankserver getestet wurden. Daher deutet eine 3x1x1-Serverfarmkonfiguration auf drei Abfrageserver, einen Indexserver und einen Datenbankserver hin. Die Tests wurden nicht auf Serverfarmen mit mehreren Index- oder Datenbankservern vorgenommen.

Die folgende Tabelle zeigt Testergebnisse für Benutzervorgänge im Zusammenhang mit der Suche.

Farmgröße RPS Abfrageserver: CPU-Auslastung in Prozent Indexserver: CPU-Auslastung in Prozent Datenbankserver: CPU-Auslastung in Prozent Datenbankserver: Schreibvorgänge/Sek. (Durchschnitt)

1x1x1

24,01

99,49

1,98

7,23

6,11

2x1x1

48,04

96,98

3,95

13,02

2,66

3x1x1

71,07

94,73

5,61

20,56

2,29

4x1x1

93,11

91,77

8,81

29,21

2,41

5x1x1

114,95

90,50

10,27

39,38

2,45

6x1x1

133,34

87,29

11,91

52,94

2,83

7x1x1

148,52

80,20

15,24

63,72

3,14

8x1x1

146,94

65,65

15,15

69,15

2,87

Im folgenden Diagramm werden Änderungen am Durchsatz für Suchvorgänge gezeigt, wenn sich die Anzahl der Abfrageserver ändert.

Anfragen pro Sekunde im Vergleich zu Abfrageservern

Geschätzte Crawldauer

In einer Microsoft Office SharePoint Server 2007-Suchumgebung ist das Crawlen von Inhalt üblicherweise der Vorgang mit der längsten Dauer, der nicht von Benutzern initiiert wurde. Sie müssen in Ihrer Umgebung durch Tests den Zeitbedarf für das Crawlen von Inhalt einer bestimmten Inhaltsquelle ermitteln und feststellen, ob sich das Crawlen dieses Inhalts auf die angestrebten Benutzerantwortzeiten auswirkt. Im Normalfall sollten Sie feststellen, dass das Crawlen einer bestimmten Inhaltsquelle über Nacht innerhalb einer Zeitspanne von 12 Stunden ausgeführt werden kann.

Geschätzte Speicherplatzanforderungen

Anhand der folgenden Informationen können Sie die Speicherplatzanforderungen für die Indexserver, Abfrageserver und Datenbankserver in Ihrer Umgebung planen.

Speicherplatzanforderungen für Indexserver und Abfrageserver

Orientieren Sie sich an den folgenden Informationen, um die Speicherplatzanforderungen für die Indexserver und Abfrageserver in Ihrer Serverfarm zu planen.

Hinweis

Der Inhaltsindex ist in der Regel kleiner als der Korpus, da alle Füllwörter entfernt werden, bevor der Inhalt indiziert wird.

Hinweis

Wenn die Abfrageserverrolle auf einem anderen Server als dem Indexserver bereitgestellt ist, wird der Index automatisch an diese Abfrageserver weitergegeben. Damit eine Kopie des Inhaltsindexes im Dateisystem auf einem Abfrageserver gespeichert werden kann, muss auf jedem Abfrageserver die gleiche Menge an Speicherplatz verfügbar sein, wie der Indexserver für den Inhaltsindex verwendet. Weitere Informationen hierzu finden Sie unter Planen von Redundanz (Office SharePoint Server).

So schätzen Sie die Speicherplatzanforderungen für die Festplatte, die den Inhaltsindex enthält

  1. Schätzen Sie das Volumen des Inhalts, der gecrawlt werden soll, und die durchschnittliche Größe der einzelnen Dateien. Falls Ihnen die durchschnittliche Größe der Dateien im Korpus nicht bekannt ist, nehmen Sie als Ausgangswert 10 KB pro Dokument an.

    Berechnen Sie anhand der folgenden Formel, wie viel Speicherplatz Sie benötigen, um den Inhaltsindex zu speichern:

    GB benötigter Speicherplatz = Korpusgröße insgesamt (in GB) x Dateigrößenmodifikator x 2,85

    wobei der Dateigrößenmodifikator eine Zahl im folgenden Bereich ist, je nach der Durchschnittsgröße der Dateien in dem Korpus:

    • 1,0, wenn der Korpus sehr kleine Dateien enthält (durchschn. Dateigröße = 1 KB)

    • 0,12, wenn der Korpus mittelgroße Dateien enthält (durchschn. Dateigröße = 10 KB)

    • 0,05, wenn der Korpus große Dateien enthält (durchschn. Dateigröße = 100 KB oder mehr)

Hinweis

Diese Gleichung dient nur zur Ermittlung einer Ausgangsschätzung. In der Praxis können die Ergebnisse stark variieren, je nach Größe und Art der Dokumente und der Menge der Metadaten, die während eines Crawlvorgangs indiziert werden.

In dieser Gleichung multiplizieren Sie die Korpusgröße insgesamt (in GB) mit dem Dateigrößenmodifikator, um die geschätzte Größe der Indexdatei zu berechnen. Diesen Wert multiplizieren Sie dann mit 2,85, um den Aufwand für Hauptzusammenführungen beim Zusammenführen von gecrawlten Daten mit dem Index zu berücksichtigen. Das Endergebnis ist der geschätzte Speicherplatzbedarf.

Beispiel: Ein Korpus der Größe 1 GB enthält überwiegend Dateien mit einer durchschnittlichen Größe von 10 KB. In diesem Fall berechnen Sie die geschätzte Größe der Indexdatei anhand der folgenden Werte:

1 GB x 0,12 = 0,12 GB

Gemäß dieser Berechnung beträgt die geschätzte Größe der Indexdatei 120 MB.

Jetzt multiplizieren Sie die geschätzte Größe der Indexdatei mit 2,85:

120 MB x 2,85 = 342 MB

Der für die Indexdatei und die Indizierungsvorgänge benötigte Speicherplatz beträgt also 342 MB oder 0,342 GB.

Hinweis

Das Volumen der gecrawlten Daten kann unterschiedlich sein, je nach dem Inhalt, der gecrawlt wird. Eine Inhaltsquelle ist eine Gruppe von Optionen, anhand von denen Sie angeben können, welches Protokoll beim Crawlen verwendet werden soll, bei welchen URLs der Crawlvorgang beginnen soll, wie viele Ebenen tief und wann gecrawlt werden soll.

  1. Wenn Ihre Berechnung ergibt, dass der auf den Index- und Abfrageservern verfügbare Speicherplatz für den Inhaltsindex ausreicht, gehen Sie zu Schritt 3. Andernfalls fügen Sie Speicherplatz hinzu oder überprüfen Ihre Berechnung in Schritt 1 noch einmal, bevor Sie mit Schritt 3 fortfahren.

  2. Crawlen Sie einen Teil des Inhalts.

  3. Werten Sie die Größe des Inhaltsindexes und die Anzahl der Dateien aus, die gecrawlt wurden. Nutzen Sie diese Erkenntnisse, um die Genauigkeit der in Schritt 1 durchgeführten Berechnung zu erhöhen.

  4. Wenn der verbleibende Speicherplatz auf der Festplatte angemessen ist, crawlen Sie mehr Inhalt. Andernfalls fügen Sie je nach Bedarf Speicherplatz hinzu oder überprüfen noch einmal, wie viel Inhalt gecrawlt werden soll.

  5. Wiederholen Sie die Schritte 3 bis 5, bis der gesamte Inhalt gecrawlt ist.

    Nachdem Sie den gesamten Korpus gecrawlt haben, empfiehlt es sich, die Größe des Inhaltsindexes und der Suchdatenbank für jeden Crawl zu notieren, damit Sie eine mittlere Zuwachsrate ermitteln können. Da ein Korpus im Laufe der Zeit meist anwächst, weil der Farm neuer Inhalt hinzugefügt wird, sollten Sie den verfügbaren Speicherplatz auf der Festplatte überwachen, um sicherzustellen, dass stets ausreichend Kapazität für Indizierungsvorgänge vorhanden ist.

Speicherplatzanforderungen für die Suchdatenbank

Die Suchdatenbank, in der Metadaten und Crawlerverlaufsdaten für das Suchsystem gespeichert werden, beansprucht typischerweise mehr Speicherplatz als der Index. Dies gilt besonders dann, wenn überwiegend SharePoint-Websites gecrawlt werden, die sehr metadatenlastig sind.

Hinweis

Sowohl die Metadaten für den gesamten indizierten Inhalt als auch der Crawlerverlauf werden in der Suchdatenbank gespeichert. Aus diesem Grund beansprucht die Suchdatenbank mehr Speicherplatz als der Inhaltsindex.

Berechnen Sie anhand der folgenden Formel, wie viel Speicherplatz Sie für die Suchdatenbank benötigen:

GB benötigter Speicherplatz = Korpusgröße insgesamt (in GB) x Dateigrößenmodifikator x 4

wobei der Dateigrößenmodifikator eine Zahl im folgenden Bereich ist, je nach der Durchschnittsgröße der Dateien in dem Korpus:

  • 1,0, wenn der Korpus sehr kleine Dateien enthält (durchschn. Dateigröße = 1 KB)

  • 0,12, wenn der Korpus mittelgroße Dateien enthält (durchschn. Dateigröße = 10 KB)

  • 0,05, wenn der Korpus große Dateien enthält (durchschn. Dateigröße = 100 KB oder mehr)

Beispiel: Ein Korpus mit einer Größe von 1 GB enthält überwiegend Dateien mit einer Durchschnittsgröße von 10 KB. In diesem Fall setzen Sie die folgenden Werte in die Gleichung ein, um die geschätzte Größe der Indexdatei zu berechnen:

1 GB x 0,12 = 0,12 GB oder 120 MB

Jetzt multiplizieren Sie die geschätzte Größe der Indexdatei mit 4:

120 MB x 4 = 480 MB

Der für die Suchdatenbank benötigte Speicherplatz beträgt also 480 MB oder 0,48 GB.

Ermitteln der Spezifikationen für die Index-, Abfrage- und Datenbankserver

In Microsoft Office SharePoint Server 2007 ist die Suche ein gemeinsamer Dienst, der auf der SSP-Ebene verfügbar ist. Das Microsoft Office SharePoint Server 2007-Suchsystem besteht aus zwei Hauptserverrollen: dem Indexserver und dem Abfrageserver.

Das Crawlen und Indizieren sind ressourcenintensive Vorgänge. Beim Crawlen von Inhalt greift das System auf diesen Inhalt und seine Eigenschaften zu und analysiert ihn, um einen Inhaltsindex zu erstellen, mit dem Suchabfragen bedient werden. Das Crawlen belegt Verarbeitungs- und Speicherressourcen auf dem Indexserver, dem Abfrageserver oder den Servern, die die Crawlvorgänge ausführen sowie dem Server oder den Servern mit dem gecrawlten Inhaltsrepository und dem Datenbankserver, der die Microsoft Office SharePoint Server 2007-Farm bedient.

Crawls wirken sich auf die Leistung des Systems und direkt auf die Benutzerantwortzeit und die Leistung anderer gemeinsamer Dienste in der Serverfarm aus, ebenso auf den Webdienst auf dem Abfrageserver, der die Crawlvorgänge ausführt. Sie können einen Abfrageserver für Crawlvorgänge zuweisen, um die Auslastung der anderen Server der Serverfarm zu verringern.

Die Indizierung des gecrawlten Inhalts kann sich auch auf die Gesamtleistung des Systems auswirken, wenn die Crawlvorgänge nicht von einem dedizierten Abfrageserver ausgeführt werden. Wenn suchbezogene Vorgänge einen bedeutenden Anteil der Serverfarmvorgänge darstellen, sollten Sie einen dedizierten Abfrageserver bereitstellen. Weitere Informationen finden Sie im Abschnitt Dedizierter Abfrageserver zum Crawlen in diesem Artikel.

Ermitteln der Spezifikationen für Indexserver

Anhand der Informationen in diesem Abschnitt können Sie die Anforderungen für Indexserver in Ihrer Microsoft Office SharePoint Server 2007-Serverfarm festlegen.

Indexserver-CPU

Die Prozessorgeschwindigkeit des Indexservers beeinflusst die Crawlgeschwindigkeit und die Anzahl der Crawlthreads, die instanziiert werden können. Obwohl keine festgelegte Anzahl an Prozessoren empfohlen wird, sollten Sie den Umfang des zu crawlenden Inhalts berücksichtigen, wenn Sie die Anforderungen für Indexserver ermitteln. In einer Unternehmensumgebung sollte der Indexserver über mehrere Prozessoren verfügen, um große Indizierungsvorgänge zu verarbeiten.

In der folgenden wird Tabelle gezeigt, wie die Crawlgeschwindigkeit steigt, wenn die Anzahl der Prozessoren des Indexservers erhöht wird.

Anzahl der Prozessoren Prozentsatz der Verbesserung der Crawlgeschwindigkeit

1

0,00

2

10,89

4

19,77

8

30,77

Arbeitsspeicher auf dem Indexserver

Auf dem Indexserver werden Dokumente für die Verarbeitung vom Crawlermodul in Puffer geladen. In einer Serverfarm mit einem Korpus von ca. 1 Million Dokumenten benötigt der Indexserver ca. 1,5 GB Arbeitsspeicher. Nachdem ein Dokument im Arbeitsspeicher verarbeitet wurde, wird es auf den Datenträger geschrieben. Je größer die Kapazität des Arbeitsspeichers, umso mehr Dokumente können gleichzeitig vom Crawler verarbeitet werden, wodurch sich die Crawlgeschwindigkeit verbessert.

Ein Indexserver sollte zum Crawlen eines Korpus mit mehr als 1 Million Dokumenten über mindestens 4 GB RAM verfügen.

Datenträgergeschwindigkeit des Indexservers

Sie sollten RAID 10 mit 2 Millisekunden (ms) Zugriffszeit und mehr als 150 MB/s Schreibgeschwindigkeit für schnelles Schreiben auf den Datenträger festlegen.

Einzelner Index und Relevanz

In SharePoint Portal Server 2003: sollte der Inhaltsindex auf mehrere Server aufgeteilt werden, um Teilmengen des indizierten Inhalts zu erstellen und wachsenden Umfang besser auszugleichen. Obwohl die Verwendung mehrerer Indexserver zum horizontalen Skalieren in Microsoft Office SharePoint Server 2007 unterstützt wird, erfordert jeder Indexserver einen eigenen SSP, und es ist nicht möglich, die einzelnen Indizes zu kombinieren.

Anzahl der Indexserver

Wenn eine vollständige Isolation zwischen den SSPs erforderlich ist oder Sie das System horizontal skalieren möchten, können Sie mehrere Indexserver in einer Serverfarm bereitstellen. Obwohl die Anzahl der Indexserver in einer Serverfarm nicht begrenzt ist, wurden die Tests mit maximal 4 Indexservern in einer einzelnen Serverfarm ausgeführt.

Die Anzahl der Indexserver, die Sie in einer Serverfarm einsetzen, ist vom gewünschten Suchverhalten abhängig. Wenn es zum Erreichen des gewünschten Suchverhaltens erforderlich ist, dass der gecrawlte Inhalt in einem einzelnen Ergebnissatz enthalten sein muss, sollten Sie einen SSP mit einem einzelnen Indexserver bereitstellen. In den meisten Unternehmen soll der gesamte gecrawlte Inhalt von Benutzern durchsuchbar sein. Aus diesem Grund sind keine mehrfachen Suchbereiche erforderlich.

Wenn das Suchverhalten in mehrere unterschiedliche Bereiche unterteilt werden kann, um mehrere unterschiedliche Suchergebnissätze über unterschiedliche Inhaltsrepositorys sicherzustellen, können mehrere SSPs und Indexserver verwendet werden. Ein Beispiel für ein Szenario, in dem unterschiedliche Suchbereiche erwünscht sind, ist ein Unternehmen mit einer Abteilung, die vertrauliche Unterlagen bearbeitet. Diese Dokumente sollten nur von einer bestimmten Benutzergruppe durchsuchbar sein.

Abhängig von Ihren Anforderungen an die Skalierung und Sicherheit können Sie alle Ihre SSPs einem einzelnen Indexserver zuordnen oder jeden SSP einem einzelnen Indexserver zuordnen.

Hinweis

Das Abfragen über mehrere SSPs zum Abrufen eines einzelnen relevanten Ergebnissatzes wird in Microsoft Office SharePoint Server 2007 nicht unterstützt.

Ein einzelner Indexserver mit einer robusten Hardwarekonfiguration unterstützt bis zu 50 Millionen Dokumente. Wenn Sie einen einzelnen Index mit dieser Größe erstellen, sollten Sie höchstens einen Indexserver in einer Serverfarm verwenden, da der Index an alle Abfrageserver in der Serverfarm weitergegeben wird. Wenn ein zweiter Indexserver hinzugefügt wird, werden die Indizes vom zweiten Indexserver ebenfalls an alle Abfrageserver in der Serverfarm weitergegeben, wodurch die Auslastung der Abfrageserver steigt.

Zum Erhöhen der Suchkapazität durch das Hinzufügen von SSPs müssen Sie außerdem horizontal skalieren. Sie sollten zumindest einen weiteren Indexserver, einen Datenbankserver und einen dedizierten Webserver hinzufügen. Wenn Ihre Hardware aktuell die Indizierung von 10 Millionen Dokumenten in einem einzelnen SSP unterstützt, können Sie die Skalierung heraufsetzen, indem Sie mit der gleichen Hardware 20 SSPs hosten.

Hinweis

In Microsoft Office SharePoint Server 2007 for Search können Sie nur einen SSP verwenden.

Dadurch können Sie ca. 2 Millionen Dokumente pro SSP bei einer Gesamtmenge von ca. 40 Millionen Dokumenten indizieren.

Hinweis

Ein SSP ist stets nur einem einzelnen Indexserver zugeordnet. Ein Indexserver kann jedoch mehrere SSPs bedienen.

Dedizierter Abfrageserver zum Crawlen

Es wird empfohlen, einen Abfrageserver für Crawlvorgänge zu reservieren.

In einer durchsuchbaren Serverfarm führen alle Abfrageserver dieser Farm standardmäßig Crawlvorgänge aus. Wenn ein Crawlvorgang ausgeführt wird, sendet der Indexserver eine Anforderung an die Abfrageserver, die wiederum den zu crawlenden Inhalt abruft und an den Indexserver übermittelt. Bei hoher Benutzerlast kann ein Crawlvorgang die Reaktionsgeschwindigkeit des Systems in Bezug auf Benutzeranforderungen verringern.

Zum Verringern der Auswirkungen von Crawlvorgängen auf die Leistung der Serverfarm können Sie einen dedizierten Abfrageserver zum Crawlen konfigurieren. Das Reservieren eines Abfrageservers zum Crawlen führt dazu, dass alle Crawlvorgänge von diesem dedizierten Server ausgeführt werden, während alle anderen Abfrageserver in der Serverfarm die Benutzeranforderungen verarbeiten. Diese Konfiguration ist vor allem in Umgebungen sinnvoll, bei denen die Crawlvorgänge nicht auf die Nacht beschränkt werden können, oder bei geografisch verteilten Umgebungen, in denen die Benutzer rund um die Uhr Abfragen ausführen.

Weitere Informationen zum Reservieren eines Abfrageservers für das Crawlen finden Sie unter Konfigurieren eines dedizierten Front-End-Webservers für Crawlvorgänge (Office SharePoint Server 2007).

Hinweis

Das Reservieren eines Abfrageservers zum Crawlen kann sich auf andere Dienste auswirken, die auf dem Server ausgeführt werden. Für einen für diesen Zweck eingesetzten Abfrageserver ist kein Lastenausgleich möglich, außerdem kann er keine Endbenutzeranforderungen verarbeiten.

Leistungsoptimierung auf dem Indexserver

Indizierungsvorgänge erhöhen die Belastungen des Datenbankservers und können die Reaktionsgeschwindigkeit der Serverfarm verringern. Indizierungsvorgänge können sich außerdem auf andere gemeinsame Dienste auf dem Anwendungsserver mit dem Suchindizierungsdienst auswirken. Sie können die Leistungsebene der Indizierung für jeden Indexserver auf einen der folgenden drei Werte anpassen:

  • Reduziert

  • Teilweise reduziert

  • Maximum

Die Standardeinstellung lautet Reduziert. Sie können diese Einstellung nur für einen bestimmten Indexserver konfigurieren, jedoch nicht für den SSP.

Crawlvorgänge wirken sich auf die Leistung des Datenbankservers aus, da der Office SharePoint Server-Suchdienst alle Metadaten der gecrawlten Dokumente in Datenbanktabellen schreibt. Es ist möglich, dass der oder die Indexserver so schnell Daten generieren, dass der Datenbankserver davon überladen wird.

Sie sollten eigene Tests ausführen, um die Crawlgeschwindigkeit, Netzwerklatenz, Datenbankauslastung und die Auslastung der gecrawlten Inhaltsrepositorys anzupassen.

In der folgenden Tabelle wird die Beziehung zwischen der Leistungsebeneneinstellung und der CPU-Auslastung auf den Index- und Datenbankservern während der Tests gezeigt.

Leistungsebeneneinstellung Indexserver: CPU-Auslastung in Prozent Datenbankserver: CPU-Auslastung in Prozent

Reduziert

20

20

Teilweise reduziert

24

24

Maximum

25

26

Berücksichtigen Sie die Szenarien und Empfehlungen für die Leistungsebeneneinstellung in der folgenden Liste:

  • Wenn der Indexserver und die Datenbankserver nur für den Office SharePoint Server-Suchdienst verwendet werden, können Sie die Ebene auf den Maximalwert festlegen. Die maximale Steigerung der CPU-Auslastung des Datenbankservers im Vergleich zur Indexserverauslastung sollte jedoch nicht höher als 30 Prozent sein. Wenn die Steigerung der CPU-Auslastung des Datenbankservers 30 Prozent überschreitet, wenn die Leistungsebene auf den Maximalwert festgelegt wird, sollten Sie die Leistungsebene auf die nächstniedrigere Einstellung festlegen.

  • Wenn der Anwendungsserver und der Datenbankserver gemeinsam von mehreren gemeinsamen Diensten verwendet werden (z. B. Office SharePoint Server-Suchdienst und Dienste für Excel-Berechnungen), sollten Sie eine niedrigere Leistungsebeneneinstellung auswählen. Die Verringerung der maximal zulässigen Indizierungsgeschwindigkeit verringert die Indizierungsgeschwindigkeit von Elementen. Das kann dazu führen, dass Suchergebnisse veraltet sind. Überwachen Sie die lokale Serverleistung, um die optimale Indexserver-Leistungsebene zu ermitteln.

Gehen Sie wie folgt vor, um die Leistungsebeneneinstellung für den Indexserver festzulegen.

Anpassen der Indexserverleistung

  1. Klicken Sie auf Start, zeigen Sie auf Alle Programme, Microsoft Office Server, und klicken Sie dann auf SharePoint 3.0-Zentraladministration.

  2. Klicken Sie auf der Homepage der Website für die Zentraladministration auf Vorgänge.

  3. Klicken Sie auf der Seite Vorgänge im Abschnitt Topologie und Dienste auf Dienste auf dem Server.

  4. Wählen Sie auf der Seite Dienste auf dem Server im Menü Server den zu verwaltenden Indexserver aus.

  5. Klicken Sie im Abschnitt Dienste in der folgenden Tabelle starten auf Office SharePoint Server-Suchdienst.

  6. Wählen Sie auf der Seite Einstellungen für den Office SharePoint Server-Suchdienst konfigurieren im Abschnitt Indexerstellungsleistung die anzuwendende Leistungsebene aus.

  7. Klicken Sie auf OK, um die Änderungen zu speichern.

Regeln für Crawlerauswirkungen

Bei den Regeln für Crawlerauswirkungen handelt es sich um Suchkonfigurationseinstellungen auf Serverfarmebene, die die Anzahl der gleichzeitigen vom Office SharePoint Server-Suchdienst generierten Abfragen angeben, wenn dieser eine festgelegte Inhaltsquelle crawlt. Je größer die Anzahl der gleichzeitigen Abfragen, desto höher ist die Crawlgeschwindigkeit. Beachten Sie, dass sich die in einer Regel für Crawlerauswirkungen angegebene Abfragehäufigkeit direkt auf die Auslastung des Datenbankservers sowie des Servers mit dem gecrawlten Inhalt auswirkt. Wenn Sie die Abfragehäufigkeit für eine bestimmte Website erhöhen, sollten Sie die gecrawlten Server überwachen, um festzustellen, ob die höhere Auslastung akzeptabel ist.

Der Standardwert entspricht der Anzahl der Prozesse auf dem Indexserver. Bei einem Computer mit Vierfachprozessor liegt der Standardwert daher bei 8. Sie sollten den Wert anpassen und die Auslastung auf dem Zielserver messen, um die optimale Anzahl gleichzeitiger Abfragen zu ermitteln. Sie können die Anzahl der gleichzeitigen Abfragen wie folgt festlegen: 1, 2, 4, 8, 16, 32, 64.

Sie können auch eine Regel zum Anfordern jeweils eines Dokuments erstellen und eine Wartezeit mit einer festgelegten Anzahl von Sekunden zwischen den Abfragen angeben. Eine solche Regel kann sinnvoll sein, um eine Website mit einer konstanten Benutzerauslastung zu crawlen.

In der folgenden Tabelle wird die Beziehung zwischen der Anzahl gleichzeitiger Abfragen und der CPU-Auslastung auf Indexservern und Datenbankservern gezeigt.

Anzahl von Crawlthreads Indexserver: CPU-Auslastung in Prozent Datenbankserver: CPU-Auslastung in Prozent

4

35

12

8

40

15

12

45

15

16

60

20

Gehen Sie wie folgt vor, um eine Regel für Crawlerauswirkungen zu erstellen.

Erstellen einer Regel für Crawlerauswirkungen

  1. Klicken Sie auf Start, zeigen Sie auf Alle Programme, Microsoft Office Server, und klicken Sie dann auf SharePoint 3.0-Zentraladministration.

  2. Klicken Sie auf der Homepage der Zentraladministration auf Anwendungsverwaltung.

  3. Klicken Sie auf der Seite Anwendungsverwaltung im Abschnitt Suchen auf Suchdienst verwalten.

  4. Klicken Sie auf der Seite Suchdienst verwalten im Abschnitt Sucheinstellungen auf Farmebene auf Regeln für Crawlerauswirkungen.

  5. Klicken Sie auf der Seite Regeln für Crawlerauswirkungen auf Regel hinzufügen.

  6. Geben Sie auf der Seite Crawlerauswirkungsregel hinzufügen im Abschnitt Website den Namen der Website ein, für die Sie eine Regel erstellen möchten. Das Protokoll darf nicht eingegeben werden (z. B. http://).

  7. Geben Sie im Abschnitt Abfragehäufigkeit an, wie der Crawler Dokumente von dieser Website anfordern soll.

    1. Wählen Sie zum gleichzeitigen Anfordern mehrerer Dokumente Bis zur angegebenen Anzahl von Dokumenten gleichzeitig anfordern und nach den Anforderungen nicht warten aus und anschließend den gewünschten Wert aus der Liste Gleichzeitige Anforderungen.

    2. Wählen Sie zum Anfordern von jeweils nur einem Dokument Jeweils nur ein Dokument anfordern und nach jeder Anforderung eine bestimmte Zeit warten aus, und geben im Feld Wartezeit in Sekunden die Wartezeit zwischen den Abfragen in Sekunden an.

  8. Klicken Sie auf OK, um die Regel zu erstellen.

Ermitteln der Spezifikationen für Abfrageserver

Ermitteln Sie anhand der Informationen in diesem Abschnitt die Spezifikationen für Abfrageserver in Ihrer Microsoft Office SharePoint Server 2007-Serverfarm.

Arbeitsspeicher auf dem Abfrageserver

Je größer der verfügbare Arbeitsspeicher ist, desto seltener muss der Office SharePoint Server-Suchdienst auf die Festplatte zugreifen, um eine bestimmte Abfrage auszuführen. Eine ausreichende Menge Arbeitsspeicher ermöglicht auch effektiveres Zwischenspeichern. Im Idealfall sollte auf dem Abfrageserver eine für den gesamten Index ausreichende Menge an Arbeitsspeicher vorhanden sein.

In der folgenden Abbildung wird die Beziehung zwischen der Größe des Indexes auf den Abfrageservern und der Benutzerantwortzeit pro Abfrage gezeigt.

Leistungs- und Kapazitätsanalyse für die Suche

Datenträgergeschwindigkeit des Abfrageservers

Für schnelle Schreibvorgänge sollten Sie RAID 10 verwenden.

Anzahl der Abfrageserver

Sie können mehrere Abfrageserver in der Serverfarm bereitstellen, um Redundanz und Lastenausgleich zu erreichen. Die Anzahl der verwendeten Abfrageserver hängt davon ab, wie viele Benutzer in der Serverfarm vorhanden sind und welche Auslastung Sie in Spitzenzeiten erwarten. Bei den hier gezeigten Tests wurden bis zu acht Abfrageserver pro Serverfarm verwendet.

In der folgenden Abbildung werden der Abfragedurchsatz, die CPU-Auslastung des Datenbankservers in Prozent für die Suchdatenbank sowie die CPU-Auslastung des Abfrageservers gezeigt, während der Serverfarm Abfrageserver hinzugefügt werden. In dem Test, bei dem diese Daten generiert wurden, wurde der verwendete Datenbankserver für die Inhaltsdatenbanken und die Dienstdatenbanken freigegeben.

Grafik zur Suchserverleistung

Remoteserverwartezeit

Die Serverwartezeit ist ein wichtiger Faktor, der sich auf die Crawlleistung auswirkt. Die Leistung zwischen den Farmservern muss ausgeglichen sein, damit die Crawlgesamtleistung ihr Optimum erreichen kann. Beispielsweise kann ein leistungsfähiger Indexserver mit 25 % seiner Kapazität arbeiten, wenn der gecrawlte Datenbankserver nicht schnell genug reagieren kann. In einem solchen Fall sollten Sie den Datenbankserver vertikal skalieren, wodurch sich die Crawlgeschwindigkeit in der gesamten Serverfarm verbessert.

Sie sollten selbst Tests ausführen, um die Reaktionsgeschwindigkeit der Server in Ihrer Umgebung zu ermitteln. Bei schlechter Crawlleistung ist oft der Datenbankserver der Serverfarm für die Engpässe verantwortlich. Sie können die Crawlleistung auf folgende Weise erhöhen:

  • Skalieren Sie die Hardware des Datenbankservers vertikal, indem Sie weitere oder schnellere Prozessoren hinzufügen, Arbeitsspeicher hinzufügen und die Festplatten durch Modelle mit höherer Zugriffs- und Schreibgeschwindigkeit ersetzen.

  • Erhöhen Sie den Arbeitsspeicher auf den Abfrageservern in der Serverfarm.

  • Führen Sie Crawls in Zeiten mit geringer Auslastung aus, damit der gecrawlte Datenbankserver den Benutzerdatenverkehr tagsüber bedienen kann und auf Crawls außerhalb von Zeiten mit hoher Auslastung reagieren kann.

Ermitteln der Spezifikationen für Datenbankserver

Das Microsoft Office SharePoint Server 2007-Suchsystem crawlt Textdaten ebenso wie die dem Inhalt zugeordneten Metadaten. In Office SharePoint Portal Server 2003 wurden alle Metadaten, die vom Indizierungssystem abgerufen wurden, in einem JET-Datenbankeigenschaftsspeicher gespeichert. In Microsoft Office SharePoint Server 2007 wird der invertierte Volltextindex auf dem Indexserver gespeichert, während die Metadaten in der Suchdatenbank gespeichert werden. Der Indexserver schreibt Metadaten in die Datenbank, und die Abfrageserver lesen diese Daten, um eigenschaftsbasierte Benutzerabfragen zu verarbeiten.

Ermitteln Sie anhand der Informationen in diesem Abschnitt die Spezifikationen für Datenbankserver in Ihrer Microsoft Office SharePoint Server 2007-Serverfarm.

Datenbankdurchsatz

Der Datenbank-Metadatenspeicher wird für den Indexserver und alle Abfrageserver in der Serverfarm freigegeben. Der Indexserver schreibt alle Metadaten, während die Abfrageserver diese Daten lesen, um Suchanfragen zu verarbeiten. Der Abfragedurchsatz hängt hauptsächlich von der Reaktionsgeschwindigkeit des Metadatenspeichers ab.

Wenn die Anzahl der Abfrageserver in einer Serverfarm erhöht wird, steigt auch die Auslastung des Datenbankservers und wirkt sich auf den gesamten Abfragedurchsatz aus. Wenn Sie der Serverfarm Indexserver oder Abfrageserver hinzufügen, sollten Sie den Datenbankserver überwachen, um eine ausreichende Datenbankleistung sicherzustellen.

Festplattenverteilung auf dem Datenbankserver

Da der Office SharePoint Server-Suchdienst während der Crawlvorgänge eine große Menge an Daten in die Suchdatenbank schreibt, sollten Sie für höhere Leistung in Szenarien mit Indizes von mehr als 5 Millionen Dokumenten getrennte Spindles für die Datenbanken SharedServices_Search_Db, SharedServices_Db und TempDb verwenden.

Datenträgergeschwindigkeit des Datenbankservers

Für schnelle Schreibvorgänge sollten Sie RAID 10 verwenden.

Herunterladen dieses Buchs

Dieses Thema wurde zum leichteren Lesen und Ausdrucken in das folgende Buch zum Herunterladen aufgenommen:

Die vollständige Liste der verfügbaren Bücher finden Sie unter Bücher zum Herunterladen für Office SharePoint Server 2007.

Siehe auch

Konzepte

Konfigurieren eines dedizierten Front-End-Webservers für Crawlvorgänge (Office SharePoint Server 2007)