Abschätzen der Leistungs- und Kapazitätsanforderungen für Search Server 2008

Inhalt dieses Artikels:

  • Wichtige Merkmale

  • Testumgebung

    • Annahmen

    • Testtopologien

    • Verwendungsprofil

  • Schätzen von Durchsatzzielen

    • Durchsatz und Wartezeit nach Farmkonfiguration

    • Datentrends

  • Empfehlungen

    • Hardware- und Softwareempfehlungen

    • Anfangstopologien

    • Geschätzte Crawldauer

    • Geschätzte Speicherplatzanforderungen

    • Bestimmen der Spezifikationen für die Index-, Abfrage- und Datenbankserver

  • Richtlinien für annehmbare Leistung

Dieser Artikel enthält Testergebnisse und Empfehlungen für Microsoft Search Server 2008 und Microsoft Search Server 2008 Express. Verwenden Sie diesen Artikel, um die erforderlichen Hardware- und Konfigurationsdetails für die Bereitstellung zu bestimmen.

Dieses Szenario zur Leistungs- und Kapazitätsplanung umfasst eine einzelne Search Server 2008-Farm bzw. einen Computer mit Search Server 2008 Express zum Durchsuchen und Indizieren von Inhalten in einer Unternehmensumgebung. Die Leistungs- und Kapazitätsmerkmale von Umgebungen mit mehreren Farmen werden in diesem Thema nicht behandelt.

Der einzige wesentliche Unterschied zwischen Search Server 2008 und Search Server 2008 Express besteht darin, dass eine Search Server 2008 Express-Bereitstellung nur einen Anwendungsserver enthalten kann. In Search Server 2008 und Search Server 2008 Express kann entweder Microsoft SQL Server 2005 Express Edition oder Microsoft SQL Server 2005 verwendet werden, und die Datenbankserversoftware kann sich entweder auf dem Server mit Search Server 2008 Express oder Search Server 2008 befinden oder auf einem separaten Server. In jeder anderen Hinsicht sind Search Server 2008 und Search Server 2008 Express gleich funktionsfähig und werden auf dieselbe Art und Weise verwaltet.

Die Informationen in diesem Artikel können Ihnen dabei helfen, die beste Architektur für die Bereitstellung von Search Server 2008 oder Search Server 2008 Express zu bestimmen.

Vor diesem Thema sollten Sie das Kapitel Informationen zur Leistungs- und Kapazitätsplanung (Search Server 2008) lesen.

Wichtige Merkmale

Wichtige Merkmale beschreiben Umgebungsfaktoren, Verwendungsmerkmale und andere Überlegungen, die für Bereitstellungen im Rahmen dieses Szenarios wahrscheinlich eine Rolle spielen.

Dieses Szenario weist folgende wichtige Merkmale auf:

  • Bearbeitungsdauer für Benutzerabfragen. In einigen Organisationen werden möglicherweise langsamere Antwortzeiten toleriert, es können jedoch auch kürzere Antwortzeiten erforderlich sein. Die erwartete Antwortzeit ist ein wichtiger Faktor, der allgemeine Durchsatzziele beeinflusst. Der Durchsatz definiert die Anzahl der Abfragen, die eine Serverfarm pro Sekunde verarbeiten kann. Bei einer größeren Anzahl von Benutzern benötigen Sie einen höheren Durchsatz, um die gleichen Antwortzeiten zu erreichen.

  • Benutzerparallelität. Es wird eine Parallelitätsrate von 10 % zugrunde gelegt, wobei 1 % der Benutzer zu einem bestimmten Zeitpunkt gleichzeitig eine Anfrage auslösen. Bei 10.000 Benutzern verwenden beispielsweise 1.000 gleichzeitig aktiv die Lösung, und 100 Benutzer lösen eine Anfrage aus.

  • Zeitintensive asynchrone Aufgaben. Aufgaben wie das Crawlen von Inhalten und das Sichern von Datenbanken erhöhen die Auslastung der Serverfarm. Bei den allgemeinen Leistungsmerkmalen von Beispieltopologien für Search Server 2008 und Search Server 2008 Express wird angenommen, dass diese Aufgaben in Spitzenzeiten ausgeführt werden und daher die Gesamtleistung der Farm beeinträchtigen können.

  • Faktoren der horizontalen Skalierung. Unterschiedliche Skalierungsoptionen wurden getestet, um die effektivste Topologie für die Umgebung zu bestimmen. Informationen zu den getesteten Topologien finden Sie im Abschnitt Testtopologien.

Testumgebung

Die Tests in diesem Szenario sollen dabei helfen, Schätzwerte dafür zu ermitteln, wie unterschiedliche Farmkonfigurationen auf Änderungen zahlreicher Faktoren reagieren. Dazu zählen beispielsweise die folgenden Faktoren:

  • Die Anzahl der in der Farm bereitgestellten Abfrageserver

  • Die Anzahl der gleichzeitig gecrawlten Inhaltsquellen

  • Die Anzahl der Elemente im abgefragten Index

Beachten Sie, dass die speziellen Kapazitäts- und Leistungsangaben in diesem Artikel von den Zahlen in realen Umgebungen abweichen können, obwohl bestimmte Schlüsse aus den Testergebnissen gezogen werden können. Die Zahlen in diesem Artikel sollen einen Ausgangspunkt für den Entwurf einer angemessen skalierten Umgebung bilden. Nachdem Sie Ihren ersten Systementwurf erstellt haben, testen Sie die Konfiguration, um zu bestimmen, ob das System die Anforderungen der Umgebung erfüllt.

Annahmen

64-Bit-Architektur. In der Testumgebung wurden nur 64-Bit-Server verwendet. Obwohl Search Server 2008 auf 32-Bit-Servern bereitgestellt werden kann, wird in Farmbereitstellungen von Search Server 2008 und Search Server 2008 Express die Verwendung von 64-Bit-Servern empfohlen.

Die Anweisungen in diesem Handbuch basieren auf Tests mit 64-Bit-Servern. Wenn Sie 32-Bit-Server bereitstellen möchten, sollten Sie deshalb zusätzliche Tests auf 32-Bit-Servern in der Umgebung ausführen. Die bewährten Methoden und Leistungstrends in diesem Handbuch gelten im Allgemeinen für 32-Bit-Umgebungen. Die tatsächlichen Ergebnisse können jedoch abweichen.

Die 64-Bit-Systemarchitektur besitzt die folgenden Eigenschaften, die zu einer besseren Serverskalierbarkeit und Leistung beitragen:

  • Adressierbarkeit des Arbeitsspeichers. Ein 32-Bit-System kann nur einen 4-GB-Adressbereich (Gigabyte) direkt adressieren. Wenn Windows Server 2003 mit Service Pack 1 (SP1) auf einer 64-Bit-Systemarchitektur ausgeführt wird, werden bis zu 1.024 GB physikalischer Arbeitsspeicher unterstützt.

  • Mehr Prozessoren und linearere Skalierbarkeit pro Prozessor. Aufgrund von Verbesserungen bei der parallelen Verarbeitung und bei Busarchitekturen unterstützen 64-Bit-Plattformen mehr Prozessoren (bis zu 64) und bieten gleichzeitig mit jedem zusätzlichen Prozessor eine nahezu lineare Skalierbarkeit. Serverplattformen mit mehr als 32 CPUs sind ausschließlich für die 64-Bit-Architektur verfügbar.

  • Verbesserte Busarchitektur. Der Front Side Bus auf aktuellen 64-Bit-Chipsätzen ist schneller als der früherer Generationen und verfügt über höhere Bandbreite. Mehr Daten werden schneller an den Cache und den Prozessor übertragen.

Testtopologien

Die Farmkonfigurationen für die Tests sind in der folgenden Tabelle beschrieben. Auf allen Servercomputern wurde Search Server 2008 Enterprise Edition oder Microsoft Search Server 2008 Express unter dem Betriebssystem Microsoft Windows Server 2008 mit Service Pack 1 (SP1) Enterprise x64 Edition ausgeführt.

In diesem Artikel werden die Richtlinien durch die Leistung bestimmt. Mit anderen Worten, Sie können die Richtlinien überschreiten, aber wenn Sie die Skalierung erhöhen, wird möglicherweise eine geringere Leistung erzielt.

Beachten Sie, dass viele Faktoren die Leistung in einer bestimmten Umgebung beeinflussen können und jeder dieser Faktoren die Leistung in verschiedenen Bereichen beeinträchtigen kann. Einige Testergebnisse und Empfehlungen in diesem Artikel beziehen sich möglicherweise auf Features oder Benutzervorgänge, die in der Umgebung nicht vorhanden sind, und gelten daher nicht für Ihre Lösung. Nur durch gründliche Tests erhalten Sie genaue Daten mit Bezug auf Ihre Umgebung.

In der folgenden Tabelle sind die in den Tests verwendeten speziellen Hardware- und Softwarekonfigurationen aufgelistet.

Konfiguration A: Search Server 2008 Express und SQL Server 2005 Express Edition auf einem einzelnen Server

Computerrolle Hardware Datenträgerkapazität

Einzelserver

Intel Dualcore-Prozessor mit 2,4 Gigahertz (GHz)

4 GB (Gigabyte) RAM

500 GB SATA

Konfiguration B: Search Server 2008 und SQL Server 2005 auf einem einzelnen Server

Computerrolle Hardware Datenträgerkapazität

Einzelserver

Intel Dualcore-Prozessor mit 2,4 GHz

4 GB RAM

500 GB SATA

Konfiguration C: Search Server 2008 auf einem Server und SQL Server 2005 auf einem separaten Server

Computerrolle Hardware Datenträgerkapazität

Anwendungsserver

Intel Dualcore-Prozessor mit 2,4 GHz

4 GB RAM

500 GB SATA

Datenbankserver

Intel Quadcore-Prozessor mit 3,4 GHz

8 GB RAM

750 GB SAS

Konfiguration D: Search Server 2008 auf zwei Servern und SQL Server 2005 auf einem separaten Server

Computerrolle Hardware Datenträgerkapazität

Abfrageserver

Intel Dualcore-Prozessor mit 2,4 GHz

4 GB Arbeitsspeicher

500 GB SATA

Indexserver

Intel Dualcore-Prozessor mit 2,4 GHz

4 GB Arbeitsspeicher

500 GB SATA

Datenbankserver

Intel Quadcore-Prozessor mit 3,4 GHz

8 GB RAM

750 GB SAS

In der Testumgebung wurde ein Gigabit-Netzwerk (1 Milliarde Bit/s) verwendet. Zur Sicherstellung einer angemessenen Netzwerkbandbreite wird zwischen den Servern in einer Search Server 2008-Farm die Verwendung eines Gigabit-Netzwerks empfohlen.

Verwendungsprofil

In den folgenden Tabellen ist das Verwendungsprofil für die Search Server 2008-Suchtestumgebung aufgeführt.

Tipp

In diesen Szenarien wurden nur Abfragevorgänge verwendet, um die Systemleistung zu bestimmen.

Für die verschiedenen Tests wurden zwischen 1,5 Millionen und 6,5 Millionen Elementen gecrawlt. In der folgenden Tabelle sind der Typ und die Anzahl der gecrawlten Elemente aufgeführt. Die Elemente waren zwischen 10 KB (Kilobyte) und 100 KB groß und enthielten Listenelemente, Webseiten und verschiedene Dokumenttypen.

Elementtyp Anzahl der Elemente

Inhalt auf SharePoint-Websites

4,5 Millionen Elemente, darunter:

  • Websitesammlungen

  • Websites

  • Listen

  • Dateien in Dateifreigaben

Inhalt in Dateifreigaben

3,5 Millionen

HTTP-Inhalt

Zwischen 1,5 Millionen und 6,5 Millionen

In der folgenden Tabelle wird die Speicherplatzverwendung aufgeführt.

Verwendungstyp Volumen

Indexgröße auf Abfrageserver

100 GB*

Indexgröße auf Indexserver

100 GB*

Größe der Suchdatenbank

600 GB

Tipp

Die getesteten Indexgrößen sind kleiner als die in Produktionsumgebungen üblichen Indexgrößen. Dies liegt daran, dass in dem für Testzwecke generierten Korpus die Anzahl eindeutiger Wörter kleiner ist.

Schätzen von Durchsatzzielen

Dieser Abschnitt enthält Testdaten, die den Farmdurchsatz für eine wachsende Anzahl von Abfrageservern und weitere Inhaltsquellen für Search Server 2008 aufzeigen. Die Testdaten für die Konfigurationen B, C und D in diesem Abschnitt gelten nicht für Search Server 2008 Express.

Da für die Bereitstellung und Konfiguration von Search Server 2008 zahlreiche Methoden angewendet werden können, steht keine einfache Möglichkeit zum Abschätzen der Benutzeranzahl zur Verfügung, die durch eine bestimmte Anzahl von Servern unterstützt werden kann. Daher ist es wichtig, dass Sie vor der Bereitstellung von Search Server 2008 in einer Produktionsumgebung Tests in Ihrer eigenen Umgebung ausführen.

Der Durchsatz kann von mehreren Faktoren beeinflusst werden. Dazu gehören die Anzahl der Benutzer, die Komplexität und die Häufigkeit der Benutzervorgänge sowie die Typen der gecrawlten Inhalte. Jeder dieser Faktoren kann sich entscheidend auf den Durchsatz in der Search Server 2008-Farm auswirken. Sie sollten diese Faktoren bei der Planung der Bereitstellung sorgfältig abwägen.

Wenn in der Organisation eine Lösung für die Suche vorhanden ist, können Sie die Webserverprotokolle anzeigen und die Verwendungsmuster und -trends in der aktuellen Umgebung bestimmen.

Wenn die Organisation die Bereitstellung einer neuen Suchlösung plant, schätzen Sie die Verwendungsmuster anhand der Informationen im folgenden Abschnitt ein.

Durchsatz und Wartezeit nach Farmkonfiguration

Die Tabelle in diesem Abschnitt zeigt anhand der Hardware- und Verwendungsprofile, die unter Testumgebung weiter oben in diesem Artikel aufgeführt sind, die Testergebnisse für eine Vielzahl von Benutzervorgangsprofilen. Dabei wurde für jede Farmkonfiguration ein Bereich von einem bis zu acht Abfrageservern in Verbindung mit einem Indexserver und einem Datenbankserver getestet.

Die folgende Tabelle zeigt Testergebnisse für Abfrage- und Crawlvorgänge.

Serverfarmkonfiguration Anzahl der Inhaltsquellen Mittlere Crawlgeschwindigkeit in Elementen pro Sekunde Abfragewartezeit Abfragewartezeit beim Crawlen Abfragedurchsatz (RPS) Abfragedurchsatz beim Crawlen

Konfiguration A:

Search Server 2008 Express auf einem einzelnen Server mit SQL Server 2005 Express Edition

1

24,27

0,5738

1,0028

33,01

26,36

Konfiguration B:

Search Server 2008 auf einem einzelnen Server mit SQL Server 2005

1

19,18

0,7433

nicht verfügbar

20,53

nicht verfügbar

2

16,54

0,8404

1,62

17,65

15,54

3

13,04

0,8844

2,4429

12,46

11,51

4

11,9

0,9226

2,5011

10,45

10,94

5

10,85

1,1112

3,4106

8,59

9,82

Konfiguration C:

Search Server 2008 auf einem Server und SQL Server 2005 auf einem separaten Server

1

19,3

0,7821

nicht verfügbar

20,83

nicht verfügbar

2

16,54

0,8561

0,868

18,61

17,17

3

17,11

0,8998

1,0274

18,56

12,21

4

17,28

0,8882

1,0833

15,37

11,93

5

16,12

1,0929

1,0985

12,77

11,16

6

14,81

1,3025

1,3909

10,89

7,74

Konfiguration D:

Search Server 2008 auf zwei Servern und SQL Server 2005 auf einem separaten Server

1

19,47

0,6578

nicht verfügbar

27,5

nicht verfügbar

2

17,19

0,8467

0,7148

18,49

21,47

3

17,79

0,8536

0,8493

18,48

18,26

4

18,47

0,8855

0,9387

18,37

15,21

5

15,34

1,0562

0,9891

12,84

14,61

6

15,6

1,2461

1,209

10,92

11,13

Datentrends

In den folgenden Diagrammen werden Trends zwischen den Konfigurationen B, C und D bei steigender Anzahl von gecrawlten Elementen verglichen. Konfiguration A ist nicht dargestellt, da Search Server 2008 Express mit SQL Server 2005 Express Edition eine maximale Datenbankgröße von 4 GB aufweist, wodurch die Anzahl gecrawlter Elemente effektiv auf 500.000 beschränkt ist.

Das folgende Diagramm zeigt den Unterschied der mittleren Crawlgeschwindigkeit in Elementen pro Sekunde zwischen den Konfigurationen B, C und D.

Durchschnittliche Crawlgeschwindigkeit

Wenn die Anzahl der gecrawlten Elemente 1.000.000 übersteigt, sind die Konfigurationen C und D, beide mit separaten Index- und Datenbankservern, bis zur maximalen Anzahl gecrawlter Elemente gleichbleibend leistungsfähig, während die Leistung von Konfiguration B nachlässt. Daher sollten Sie die Bereitstellung eines separaten Datenbankservers erwägen, wenn die Anzahl der zu crawlenden Elemente in der Umgebung 1.000.000 übersteigt.

Das folgende Diagramm zeigt den Unterschied der Abfragewartezeit beim Crawlen von Inhalten zwischen den Konfigurationen B, C und D.

Abfragewartezeit beim Crawlen

In diesem Diagramm ist zu erkennen, dass die Wartezeit beim Crawlen für die Konfiguration B wesentlich höher ist als für die Konfigurationen C und D. Wenn in der Organisation niedrige Wartezeiten für Benutzerabfragen beim Crawlen erforderlich sind, sollten Sie die Bereitstellung eines separaten Datenbankservers erwägen.

Das folgende Diagramm zeigt den Unterschied des Abfragedurchsatzes in Abfragen pro Sekunde (Requests per Second, RPS) zwischen den Konfigurationen B, C und D.

Abfragedurchsatz beim Crawlen

Während die Konfigurationen C und D eine ähnliche Leistung bezüglich der Wartezeit beim Crawlen aufweisen, zeigt die Konfiguration D eine wesentlich bessere Leistung als die Konfigurationen B und C im Abfragedurchsatz bei einem Crawlvorgang. Wenn die Benutzeranforderungen kein normales Crawlfenster zulassen, in dem Crawls stattfinden können, ohne die Leistung der Abfrageantwort zu beeinträchtigen, sollten Sie eine Bereitstellungsarchitektur mit mindestens einem separaten Abfrageserver sowie separaten Index- und Datenbankservern in Betracht ziehen.

Empfehlungen

Dieser Abschnitt enthält allgemeine Empfehlungen zur Leistung und Kapazität. Verwenden Sie diese Empfehlungen, um die Kapazitäts- und Leistungsmerkmale der Anfangstopologie zu ermitteln, die Sie in Bestimmen der Hardware- und Softwareanforderungen (Search Server 2008) erstellt haben, und um festzustellen, ob Sie die Anfangstopologie horizontal oder vertikal skalieren müssen.

Tipp

Horizontale Skalierung bedeutet, dass weitere Server in einer bestimmten Rolle hinzugefügt werden, während Vertikale Skalierung bedeutet, dass die Leistung oder Kapazität eines bestimmten Servers durch zusätzlichen Arbeitsspeicher, Festplattenspeicher oder höhere Prozessorgeschwindigkeit gesteigert wird.

Hardware- und Softwareanforderungen

Die Arbeitsspeicheranforderungen für Webserver, Indexserver und Datenbankserver hängen von der Größe der Farm, von der Anzahl gleichzeitiger Benutzerzugriffe und von der Komplexität der Features und Seiten in der Farm ab. Die Speicherempfehlungen in der folgenden Tabelle sind möglicherweise für eine kleine Farm oder für eine Farm mit geringfügiger Verwendung ausreichend. Die Speicherauslastung sollte dennoch aufmerksam überwacht werden, um bestimmen zu können, ob zusätzlicher Arbeitsspeicher hinzugefügt werden muss.

Informationen zu den minimalen und empfohlenen Systemanforderungen finden Sie unter Bestimmen der Hardware- und Softwareanforderungen (Search Server 2008).

Anfangstopologien

Sie können die Leistung der Anfangstopologie einschätzen, indem Sie die Topologie mit den Anfangstopologien unter Planen der Bereitstellung von Search Server 2008 oder Search Server 2008 Express vergleichen. So können Sie auf schnelle Weise bestimmen, ob die Anfangstopologie horizontal oder vertikal skaliert werden muss, um die Leistungs- und Kapazitätsziele umzusetzen.

Kapazität und Leistung der vertikal und horizontal skalierten Topologien

Wenn Sie die Kapazität und Leistung einer der Anfangstopologien erhöhen möchten, skalieren Sie vertikal, indem Sie Servercomputer mit größerer Kapazität implementieren, oder skalieren Sie horizontal, indem Sie der Topologie Server hinzufügen. In diesem Abschnitt werden die allgemeinen Leistungsmerkmale verschiedener Topologien mit vertikaler und horizontaler Skalierung beschrieben. In den Beispieltopologien spiegeln sich die folgenden herkömmlichen Methoden zum vertikalen oder horizontalen Skalieren einer Topologie in einer Suchumgebung wider:

  • Zum Kompensieren einer größeren Benutzerauslastung sollten Sie Abfrageservercomputer hinzufügen. Sie können auch dedizierte Abfrageserver hinzufügen, um die Verarbeitungslast der Webserver zu verringern.

  • Zum Ermöglichen einer größeren Datenlast steigern Sie die Kapazität des Indexservers, oder fügen Sie der Datenbankserverrolle Kapazität hinzu, indem Sie die Kapazität eines einzelnen (gruppierten oder gespiegelten) Servers erhöhen, ein Upgrade auf einen 64-Bit-Server ausführen oder gruppierte bzw. gespiegelte Server hinzufügen.

  • Behalten Sie zwischen Abfrageservercomputern und (gruppierten oder gespiegelten) Datenbankservercomputern ein Verhältnis von maximal 8:1 bei.

Geschätzte Crawldauer

In einer Suchumgebung mit Search Server 2008 oder Search Server 2008 Express ist das Crawlen von Inhalten der zeitintensivste Vorgang, der nicht von Benutzern initiiert wurde. Sie müssen in Ihrer Umgebung durch Tests den Zeitbedarf für das Crawlen von Inhalten einer bestimmten Inhaltsquelle ermitteln und feststellen, ob sich das Crawlen dieses Inhalts auf die angestrebten Benutzerantwortzeiten auswirkt. Sie sollten möglichst inkrementelle Crawls verwenden, um die Auswirkungen des Crawlens auf die Farmleistung zu reduzieren.

Geschätzte Speicherplatzanforderungen

Anhand der folgenden Informationen können Sie die Speicherplatzanforderungen für den Indexserver, die Abfrageserver und Datenbankserver in der Umgebung planen.

Speicherplatzanforderungen für Indexserver und Abfrageserver

Orientieren Sie sich an den folgenden Informationen, um die Speicherplatzanforderungen für den Indexserver und die Abfrageserver in der Serverfarm zu planen.

Tipp

Der Inhaltsindex ist in der Regel kleiner als der Korpus, da alle Füllwörter entfernt werden, bevor der Inhalt indiziert wird.

Tipp

Wenn die Abfrageserverrolle auf einem anderen Server als dem Indexserver aktiviert wird, wird der Index automatisch an diese Abfrageserver weitergegeben. Damit eine Kopie des Inhaltsindexes im Dateisystem auf einem Abfrageserver gespeichert werden kann, muss auf jedem Abfrageserver die gleiche Menge an Speicherplatz verfügbar sein, wie der Indexserver für den Inhaltsindex verwendet.

So schätzen Sie die Speicherplatzanforderungen für die Festplatte, die den Inhaltsindex enthält

  1. Schätzen Sie das Volumen des Inhalts, der gecrawlt werden soll, und die durchschnittliche Größe der einzelnen Dateien. Falls Ihnen die durchschnittliche Größe der Dateien im Korpus nicht bekannt ist, nehmen Sie als Ausgangswert 10 KB pro Dokument an.

    Berechnen Sie anhand der folgenden Formel, wie viel Speicherplatz Sie benötigen, um den Inhaltsindex zu speichern:

    GB benötigter Speicherplatz = Korpusgröße insgesamt (in GB) x Dateigrößenmodifikator x 2,85

    Dabei ist der Dateigrößenmodifikator eine Zahl im folgenden Bereich, je nach der Durchschnittsgröße der Dateien im Korpus:

    • 1,0, wenn der Korpus sehr kleine Dateien enthält (durchschn. Dateigröße = 1 KB)

    • 0,12, wenn der Korpus mittelgroße Dateien enthält (durchschn. Dateigröße = 10 KB)

    • 0,05, wenn der Korpus große Dateien enthält (durchschn. Dateigröße = 100 KB oder mehr)

Tipp

Diese Gleichung dient nur zur Ermittlung einer Ausgangsschätzung. In der Praxis können die Ergebnisse stark variieren, je nach Größe und Art der Dokumente und der Menge der Metadaten, die bei einem Crawlvorgang indiziert werden.

In dieser Gleichung multiplizieren Sie die Korpusgröße insgesamt (in GB) mit dem Dateigrößenmodifikator, um die geschätzte Größe der Indexdatei zu berechnen. Diesen Wert multiplizieren Sie dann mit 2,85, um den Aufwand für Hauptzusammenführungen beim Zusammenführen von gecrawlten Daten mit dem Index zu berücksichtigen. Das Endergebnis ist der geschätzte Speicherplatzbedarf.

Beispiel: Ein Korpus der Größe 1 GB enthält überwiegend Dateien mit einer durchschnittlichen Größe von 10 KB. In diesem Fall berechnen Sie die geschätzte Größe der Indexdatei anhand der folgenden Werte:

1 GB x 0,12 = 0,12 GB

Gemäß dieser Berechnung beträgt die geschätzte Größe der Indexdatei 120 MB.

Jetzt multiplizieren Sie die geschätzte Größe der Indexdatei mit 2,85:

120 MB x 2,85 = 342 MB

Der für die Indexdatei und die Indizierungsvorgänge benötigte Speicherplatz beträgt also 342 MB oder 0,342 GB.

Tipp

Das Volumen der gecrawlten Daten kann unterschiedlich sein, je nach dem Inhalt, der gecrawlt wird.

  1. Wenn die Berechnung ergibt, dass der auf den Index- und Abfrageservern verfügbare Speicherplatz für den Inhaltsindex ausreicht, gehen Sie zu Schritt 3. Andernfalls fügen Sie Speicherplatz hinzu oder überprüfen die Berechnung in Schritt 1 noch einmal, bevor Sie mit Schritt 3 fortfahren.

  2. Crawlen Sie einen Teil des Inhalts.

  3. Werten Sie die Größe des Inhaltsindexes und die Anzahl der Dateien aus, die gecrawlt wurden. Nutzen Sie diese Erkenntnisse, um die Genauigkeit der in Schritt 1 ausgeführten Berechnung zu erhöhen.

  4. Wenn der verbleibende Speicherplatz auf der Festplatte angemessen ist, crawlen Sie mehr Inhalt. Andernfalls fügen Sie je nach Bedarf Speicherplatz hinzu oder überprüfen noch einmal, wie viel Inhalt gecrawlt werden soll.

  5. Wiederholen Sie die Schritte 3 bis 5, bis der gesamte Inhalt gecrawlt ist.

    Nachdem Sie den gesamten Korpus gecrawlt haben, empfiehlt es sich, die Größe des Inhaltsindexes und der Suchdatenbank für jeden Crawl zu notieren, damit Sie eine mittlere Zuwachsrate ermitteln können. Ein Korpus wächst im Laufe der Zeit meist an, weil der Farm neuer Inhalt hinzugefügt wird. Daher sollten Sie den verfügbaren Speicherplatz auf der Festplatte überwachen, um sicherzustellen, dass stets ausreichend Kapazität für Indizierungsvorgänge vorhanden ist.

Speicherplatzanforderungen für die Suchdatenbank

Die Suchdatenbank, in der Metadaten und Crawlerverlaufsdaten für das Suchsystem gespeichert werden, beansprucht typischerweise mehr Speicherplatz als der Index. Dies gilt besonders dann, wenn überwiegend SharePoint-Websites gecrawlt werden, die sehr metadatenlastig sind.

Tipp

Sowohl die Metadaten für den gesamten indizierten Inhalt als auch der Crawlerverlauf werden in der Suchdatenbank gespeichert. Aus diesem Grund beansprucht die Suchdatenbank mehr Speicherplatz als der Inhaltsindex.

Berechnen Sie anhand der folgenden Formel, wie viel Speicherplatz Sie für die Suchdatenbank benötigen:

GB benötigter Speicherplatz = Korpusgröße insgesamt (in GB) x Dateigrößenmodifikator x 4

Dabei ist der Dateigrößenmodifikator eine Zahl im folgenden Bereich, je nach der Durchschnittsgröße der Dateien im Korpus:

  • 1,0, wenn der Korpus sehr kleine Dateien enthält (durchschn. Dateigröße = 1 KB)

  • 0,12, wenn der Korpus mittelgroße Dateien enthält (durchschn. Dateigröße = 10 KB)

  • 0,05, wenn der Korpus große Dateien enthält (durchschn. Dateigröße = 100 KB oder mehr)

Beispiel: Ein Korpus mit einer Größe von 1 GB enthält überwiegend Dateien mit einer Durchschnittsgröße von 10 KB. In diesem Fall setzen Sie die folgenden Werte in die Gleichung ein, um die geschätzte Größe der Indexdatei zu berechnen:

1 GB x 0,12 = 0,12 GB oder 120 MB

Jetzt multiplizieren Sie die geschätzte Größe der Indexdatei mit 4:

120 MB x 4 = 480 MB

Der für die Suchdatenbank benötigte Speicherplatz beträgt also 480 MB oder 0,48 GB.

Bestimmen der Spezifikationen für die Index-, Abfrage- und Datenbankserver

In Search Server 2008 ist die Suche ein gemeinsamer Dienst, der auf der SSP-Ebene (Shared Services Provider, Anbieter für gemeinsame Dienste) verfügbar ist. Das Search Server 2008-Suchsystem besteht aus zwei Hauptserverrollen: dem Indexserver und dem Abfrageserver.

Das Crawlen und Indizieren sind ressourcenintensive Vorgänge. Beim Crawlen von Inhalt greift das System auf diesen Inhalt und seine Eigenschaften zu und analysiert ihn, um einen Inhaltsindex zu erstellen, mit dem Suchabfragen bedient werden. Das Crawlen belegt Verarbeitungs- und Speicherressourcen auf dem Indexserver, dem Abfrageserver oder den Abfrageservern, die die Crawlvorgänge ausführen, sowie dem Server oder den Servern mit dem gecrawlten Inhaltsrepository und dem Datenbankserver, der die Search Server 2008-Farm bedient.

Crawls wirken sich auf die Leistung des Systems und direkt auf die Benutzerantwortzeit und die Leistung anderer gemeinsamer Dienste in der Serverfarm aus. Ebenso wirken sich Crawls auf den Webdienst auf dem Abfrageserver aus, der die Crawlvorgänge ausführt. Sie können einen Abfrageserver für Crawlvorgänge zuweisen, um die Auslastung der anderen Server in der Farm zu verringern.

Die Indizierung des gecrawlten Inhalts kann sich auch auf die Gesamtleistung des Systems auswirken, wenn die Crawlvorgänge nicht von einem dedizierten Abfrageserver ausgeführt werden. Wenn suchbezogene Vorgänge einen bedeutenden Anteil der Serverfarmvorgänge darstellen, sollten Sie einen dedizierten Abfrageserver bereitstellen.

Bestimmen der Spezifikationen für die Indexserver

Anhand der Informationen in diesem Abschnitt können Sie die Anforderungen für die Indexserver in einer Search Server 2008-Farm festlegen.

Indexserver-CPU

Die Prozessorgeschwindigkeit des Indexservers beeinflusst die Crawlgeschwindigkeit und die Anzahl der Crawlthreads, die instanziiert werden können. Obwohl keine bestimmte Anzahl an Prozessoren empfohlen wird, sollten Sie den Umfang des zu crawlenden Inhalts berücksichtigen, wenn Sie die Anforderungen für Indexserver ermitteln. In einer Unternehmensumgebung sollte der Indexserver über mehrere Prozessoren verfügen, um eine große Indizierungslast zu verarbeiten.

In der folgenden Tabelle wird gezeigt, wie die Crawlgeschwindigkeit steigt, wenn die Anzahl der Prozessoren des Indexservers erhöht wird.

Anzahl der Prozessoren Prozentsatz der Verbesserung der Crawlgeschwindigkeit

1

0,00

2

10,89

4

19,77

8

30,77

Arbeitsspeicher auf dem Indexserver

Auf dem Indexserver werden Elemente für die Verarbeitung vom Crawlermodul in Puffer geladen. In einer Serverfarm mit einem Korpus von ca. 1 Million Elementen benötigt der Indexserver ca. 1,5 GB Arbeitsspeicher. Nachdem ein Element im Arbeitsspeicher verarbeitet wurde, wird es auf den Datenträger geschrieben. Je größer die Kapazität des Arbeitsspeichers, umso mehr Elemente können gleichzeitig vom Crawler verarbeitet werden, wodurch sich die Crawlgeschwindigkeit verbessert.

Es wird ein Minimum von 4 GB RAM auf dem Indexserver empfohlen.

Datenträgergeschwindigkeit des Indexservers

Sie sollten RAID 10 (Redundant Array of Independent Disks) mit 2 Millisekunden (ms) Zugriffszeit und mehr als 150 MB/s Schreibgeschwindigkeit für schnelles Schreiben auf den Datenträger festlegen.

Einzelner Index und Relevanz

In Search Server 2008 wird die Verwendung mehrerer Indexserver für dezentrales Skalieren nicht unterstützt, da jeder Indexserver einen separaten SSP benötigt und nur ein SSP in einer Search Server 2008-Farm vorhanden sein kann.

Leistungsoptimierung auf dem Indexserver

Indizierungsvorgänge erhöhen die Auslastung des Datenbankservers und können die Reaktionsgeschwindigkeit der Serverfarm verringern. Indizierungsvorgänge können sich außerdem auf andere gemeinsame Dienste auf dem Anwendungsserver mit dem Indizierungsdienst auswirken. Sie können die Leistungsebene der Indizierung für jeden Indexserver auf einen der folgenden drei Werte anpassen:

  • Reduziert

  • Teilweise reduziert

  • Maximum

Die Standardeinstellung ist Teilweise reduziert.

Crawlvorgänge wirken sich auf die Leistung des Datenbankservers aus, da der Search Server 2008-Suchdienst alle Metadaten der gecrawlten Elemente in Datenbanktabellen schreibt. Es ist möglich, dass der Indexserver so schnell Daten generiert, dass der Datenbankserver davon überladen wird.

Sie sollten eigene Tests ausführen, um die Crawlgeschwindigkeit, Netzwerklatenz, Datenbankauslastung und die Auslastung der gecrawlten Inhaltsrepositorys anzupassen.

In der folgenden Tabelle wird die Beziehung zwischen der Leistungsebeneneinstellung und der CPU-Auslastung auf den Index- und Datenbankservern während der Tests gezeigt.

Leistungsebeneneinstellung Indexserver: CPU-Auslastung in Prozent Datenbankserver: CPU-Auslastung in Prozent

Reduziert

20

20

Teilweise reduziert

24

24

Maximum

25

26

Tipp

Wenn der Indexserver und die Datenbankserver nur für den Search Server 2008-Suchdienst verwendet werden, können Sie die Ebene auf den Maximalwert festlegen. Die maximale Steigerung der CPU-Auslastung des Datenbankservers im Vergleich zur Indexserverauslastung sollte jedoch nicht höher als 30 Prozent sein. Wenn die Steigerung der CPU-Auslastung des Datenbankservers 30 Prozent überschreitet, wenn die Leistungsebene auf den Maximalwert festgelegt wird, sollten Sie die Leistungsebene auf die nächstniedrigere Einstellung festlegen.

Regeln für Crawlerauswirkungen

Bei den Regeln für Crawlerauswirkungen handelt es sich um Suchkonfigurationseinstellungen auf Serverfarmebene, die die Anzahl der gleichzeitigen vom Search Server 2008-Suchdienst generierten Abfragen angeben, wenn dieser eine festgelegte Inhaltsquelle crawlt. Je größer die Anzahl der gleichzeitigen Abfragen, desto höher ist die Crawlgeschwindigkeit. Beachten Sie, dass sich die in einer Regel für Crawlerauswirkungen angegebene Abfragehäufigkeit direkt auf die Auslastung des Datenbankservers sowie des Servers mit dem gecrawlten Inhalt auswirkt. Wenn Sie die Abfragehäufigkeit für eine bestimmte Website erhöhen, sollten Sie die gecrawlten Server überwachen, um festzustellen, ob die höhere Auslastung akzeptabel ist.

Der Standardwert entspricht der Anzahl der Prozesse auf dem Indexserver. Bei einem Computer mit Vierfachprozessor liegt der Standardwert daher bei 8. Sie sollten den Wert anpassen und die Auslastung auf dem Zielserver messen, um die optimale Anzahl gleichzeitiger Abfragen zu ermitteln. Sie können die Anzahl der gleichzeitigen Abfragen auf einen der folgenden Werte festlegen: 1, 2, 4, 8, 16, 32, 64.

Sie können auch eine Regel zum Anfordern jeweils eines Dokuments erstellen und eine Wartezeit mit einer festgelegten Anzahl von Sekunden zwischen den Abfragen angeben. Eine solche Regel kann sinnvoll sein, um eine Website mit einer konstanten Benutzerauslastung zu crawlen.

In der folgenden Tabelle wird die Beziehung zwischen der Anzahl gleichzeitiger Abfragen und der CPU-Auslastung auf dem Indexserver und den Datenbankservern gezeigt.

Anzahl von Crawlthreads Indexserver: CPU-Auslastung in Prozent Datenbankserver: CPU-Auslastung in Prozent

4

35

12

8

40

15

12

45

15

16

60

20

Bestimmen der Spezifikationen für Abfrageserver

Bestimmen Sie anhand der Informationen in diesem Abschnitt die Spezifikationen für Abfrageserver in der Search Server 2008-Farm.

Arbeitsspeicher auf dem Abfrageserver

Je größer der verfügbare Arbeitsspeicher ist, desto seltener muss der Search Server 2008-Suchdienst auf die Festplatte zugreifen, um eine bestimmte Abfrage auszuführen. Eine ausreichende Menge Arbeitsspeicher ermöglicht auch effektiveres Zwischenspeichern. Im Idealfall sollte auf den Abfrageservern eine für den gesamten Index ausreichende Menge an Arbeitsspeicher vorhanden sein.

Datenträgergeschwindigkeit des Abfrageservers

Für schnelle Schreibvorgänge sollten Sie RAID 10 verwenden.

Anzahl der Abfrageserver

Sie können mehrere Abfrageserver in der Serverfarm bereitstellen, um Redundanz und Lastenausgleich zu erreichen. Die Anzahl der verwendeten Abfrageserver hängt davon ab, wie viele Benutzer in der Serverfarm vorhanden sind und welche Auslastung Sie in Spitzenzeiten erwarten. Bei den hier gezeigten Tests wurden bis zu acht Abfrageserver pro Serverfarm verwendet.

Remoteserverwartezeit

Die Serverwartezeit ist ein wichtiger Faktor, der sich auf die Crawlleistung auswirkt. Die Leistung zwischen den Farmservern muss ausgeglichen sein, damit die Crawlgesamtleistung ihr Optimum erreichen kann. Beispielsweise kann ein leistungsfähiger Indexserver mit 25 % seiner Kapazität arbeiten, wenn der Datenbankserver der gecrawlten Farm nicht schnell genug antworten kann. In einem solchen Fall sollten Sie den Datenbankserver vertikal skalieren, wodurch sich die Crawlgeschwindigkeit in der gesamten Serverfarm verbessert.

Sie sollten selbst Tests ausführen, um die Reaktionsgeschwindigkeit der Server in der Umgebung zu ermitteln. Bei schlechter Crawlleistung ist oft der Datenbankserver der Zielfarm für die Engpässe verantwortlich. Sie können die Crawlleistung auf folgende Weise erhöhen:

  • Skalieren Sie die Hardware des Datenbankservers vertikal, indem Sie weitere oder schnellere Prozessoren hinzufügen, Arbeitsspeicher hinzufügen und die Festplatten durch Modelle mit höherer Zugriffs- und Schreibgeschwindigkeit ersetzen.

  • Erhöhen Sie den Arbeitsspeicher auf den Abfrageservern in der Serverfarm.

  • Führen Sie Crawls in Zeiten mit geringer Auslastung aus, damit der gecrawlte Datenbankserver den Benutzerdatenverkehr tagsüber bedienen kann und auf Crawls außerhalb von Zeiten mit hoher Auslastung reagieren kann.

Bestimmen der Spezifikationen für Datenbankserver

Das Search Server 2008-Suchsystem crawlt Textdaten ebenso wie die dem Inhalt zugeordneten Metadaten. In Search Server 2008 wird der invertierte Volltextindex auf dem Indexserver gespeichert, während die Metadaten in der Suchdatenbank gespeichert werden. Der Indexserver schreibt Metadaten in die Datenbank, und die Abfrageserver lesen diese Daten, um eigenschaftsbasierte Benutzerabfragen zu verarbeiten.

Bestimmen Sie anhand der Informationen in diesem Abschnitt die Spezifikationen für Datenbankserver in einer Search Server 2008-Farm.

Datenbankdurchsatz

Der Datenbank-Metadatenspeicher wird für den Indexserver und alle Abfrageserver in der Serverfarm freigegeben. Der Indexserver schreibt alle Metadaten, während die Abfrageserver diese Daten lesen, um Suchanfragen zu verarbeiten. Der Abfragedurchsatz hängt hauptsächlich von der Reaktionsgeschwindigkeit des Metadatenspeichers ab.

Wenn die Anzahl der Abfrageserver in einer Serverfarm erhöht wird, steigt auch die Auslastung des Datenbankservers und wirkt sich auf den gesamten Abfragedurchsatz aus. Wenn Sie der Serverfarm Abfrageserver hinzufügen, sollten Sie den Datenbankserver überwachen, um eine ausreichende Datenbankleistung sicherzustellen.

Festplattenverteilung auf dem Datenbankserver

Da der Search Server 2008-Suchdienst bei Crawlvorgängen eine große Menge an Daten in die Suchdatenbank schreibt, sollten Sie für höhere Leistung in Szenarien mit Indizes von mehr als 5 Millionen Elementen getrennte Festplatten für die Datenbanken SharedServices_Search_Db, SharedServices_Db und TempDb verwenden.

Datenträgergeschwindigkeit des Datenbankservers

Für schnelle Schreibvorgänge sollten Sie RAID 10 verwenden.

Richtlinien für annehmbare Leistung

Die Kapazität wird direkt von der Skalierbarkeit beeinflusst. In diesem Abschnitt sind die Objekte aufgelistet, aus denen eine Lösung bestehen kann, und für jede Art von Objekt sind Richtlinien für eine annehmbare Leistung angegeben. Grenzwertdaten werden zusammen mit Hinweisen bereitgestellt, die die Bedingungen beschreiben, unter denen die Grenzwerte erreicht werden. Ggf. sind Links zu weiteren Informationen angegeben. Verwenden Sie die Richtlinien in diesem Artikel zum Überprüfen der gesamten Pläne für Ihre Lösung.

Wenn die Lösungspläne die empfohlenen Richtlinien für ein oder mehrere Objekte überschreiten, führen Sie eine oder mehrere der folgenden Aktionen aus:

  • Auswerten der Lösung, um sicherzustellen, dass ein Ausgleich in anderen Bereichen erfolgt.

  • Kennzeichnen dieser Bereiche für Tests und Überwachung beim Erstellen und Bereitstellen der Lösung.

  • Ändern des Entwurfs der Lösung, um sicherzustellen, dass die Kapazitätsrichtlinien nicht überschritten werden.

In den folgenden Tabellen sind die Objekte nach Kategorie aufgelistet und empfohlene Richtlinien für annehmbare Leistung angegeben. Annehmbare Leistung bedeutet, dass das System, wie getestet, diese Anzahl von Objekten unterstützen kann. Die Anzahl kann jedoch nicht ohne eine gewisse Abnahme der Leistung überschritten werden. Ein Sternchen (*) zeigt eine feste Grenze an, ein Wert ohne Sternchen zeigt eine getestete oder unterstützte Grenze an.

Search Server 2008 wird in der Regel als Suchlösung in einer Umgebung bereitgestellt, die bereits Websites oder andere Datenquellen enthält. Möglicherweise möchten Sie eine Search Server 2008-Farm zum Hosten von Windows SharePoint Services 3.0-Websites neben dem Suchcenter verwenden.

Informationen zu empfohlenen Richtlinien für Websiteobjekten und Personenobjekten in Search Server 2008 und Search Server 2008 Express finden Sie unter Planen von Softwaregrenzen (Windows SharePoint Services).

Die folgende Tabelle enthält die empfohlenen Richtlinien für Suchobjekte.

Suchobjekt Richtlinien für annehmbare Leistung Hinweis

Suchindizes

1 pro Search Server 2008- oder Search Server 2008 Express-Farm

Indiziertes Dokument

50 Millionen pro Suchindex

50 Millionen Elemente pro Indexserver und ein Suchindex pro Indexserver werden unterstützt. Dies bedeutet, dass der effektive Grenzwert von Elementen pro Indexserver 50 Millionen beträgt.

Die folgende Tabelle enthält die empfohlenen Richtlinien für Objekte der logischen Architektur.

Logisches Architekturobjekt Richtlinien für annehmbare Leistung Hinweis

Anbieter für gemeinsame Dienste (Shared Services Provider, SSP)

Search Server 2008: 3 pro Farm (maximal 20 pro Farm)

Search Server 2008 Express: maximal 1

 

IIS-Anwendungspool (Internet Information Services, Internetinformationsdienste)

8 pro Webserver

Die maximale Anzahl wird durch Hardwarefunktionen bestimmt.

Für Search Server 2008 sind keine weiteren Anwendungspools erforderlich, wenn die Farm keine weiteren Windows SharePoint Services 3.0-Websites hosten soll.

Websitesammlung

50.000 pro Webanwendung

Inhaltsdatenbank

100 pro Webanwendung

Websitesammlung

50.000 pro Datenbank

Die folgende Tabelle enthält die empfohlenen Richtlinien für physikalische Objekte.

Physikalisches Objekt Richtlinien für annehmbare Leistung Hinweis

Indexserver

1 pro SSP*

 

Abfrageserver

Kein fester Grenzwert, empfohlen maximal 8

Beachten Sie, dass dieser Grenzwert nur für Search Server 2008-Bereitstellungen gilt. In einer Search Server 2008 Express-Bereitstellung kann nur ein Anwendungsserver verwendet werden.

Verhältnis Abfrageserver/Domänencontroller

3 Abfrageserver pro Domänencontroller

Abhängig vom Umfang des generierten Authentifizierungsdatenverkehrs unterstützt die Umgebung möglicherweise eine größere Anzahl von Abfrageservern pro Domänencontroller.

Siehe auch

Konzepte

Bestimmen der Hardware- und Softwareanforderungen (Search Server 2008)
Planen der Verfügbarkeit (Search Server 2008)
Planen der Redundanz (Search Server 2008)

Andere Quellen

Konfigurieren eines dedizierten Front-End-Webservers für Crawlvorgänge (Office SharePoint Server 2007)
Planen der Leistung und Kapazität (Windows SharePoint Services)