Stimare i requisiti di prestazioni e capacità per Search Server 2008

Aggiornato: 2008-09-11

Contenuto dell'articolo:

  • Caratteristiche chiave

  • Ambiente di testing

    • Presupposti

    • Topologie di laboratorio

    • Profilo di utilizzo

  • Stima degli obiettivi di velocità effettiva

    • Velocità effettiva e latenza in base alla configurazione della farm

    • Tendenze dei dati

  • Suggerimenti

    • Requisiti hardware e software

    • Topologie di partenza

    • Stima dell'intervallo della ricerca per indicizzazione

    • Stima dei requisiti di spazio su disco

    • Determinazione delle specifiche per i server di indicizzazione, di query e database

  • Linee guida per ottenere prestazioni accettabili

Questo articolo contiene i risultati dei test e suggerimenti sia per Server di ricerca 2008 Microsoft che per Server di ricerca 2008 Express Microsoft. Utilizzare l'articolo per determinare l'hardware e i dettagli di configurazione necessari per la distribuzione.

Questo scenario per la pianificazione di prestazioni e capacità include una singola farm di Server di ricerca 2008 o un computer che esegue Server di ricerca 2008 Express, utilizzato per eseguire ricerche e indicizzazioni del contenuto in un ambiente aziendale. Le caratteristiche relative a prestazioni e capacità di ambienti con più farm non sono trattate in questo argomento.

Si noti che l'unica differenza sostanziale tra Server di ricerca 2008 e Server di ricerca 2008 Express è che in una distribuzione di Server di ricerca 2008 Express può essere presente un solo server applicazioni. Sia in Server di ricerca 2008 che in Server di ricerca 2008 Express è possibile utilizzare Microsoft SQL Server 2005 Express Edition o Microsoft SQL Server 2005 e il software del server database può risiedere nello stesso server o in un server separato dai computer che eseguono Server di ricerca 2008 Express o Server di ricerca 2008. In tutti gli altri aspetti, Server di ricerca 2008 e Server di ricerca 2008 Express funzionano e sono gestiti nello stesso modo.

Utilizzare le informazioni contenute in questo articolo per determinare l'architettura migliore per la distribuzione di Server di ricerca 2008 o Server di ricerca 2008 Express.

Prima di leggere questo argomento, è consigliabile leggere Informazioni sulla pianificazione di prestazioni e capacità (Search Server 2008).

Caratteristiche chiave

Le caratteristiche chiave descrivono i fattori ambientali, le caratteristiche di utilizzo e altre considerazioni che è probabile trovare nelle distribuzioni basate su questo scenario.

Le caratteristiche chiave di questo scenario includono:

  • Tempo per completare le query degli utenti. Alcune organizzazioni possono tollerare tempi di risposta utente più lunghi o richiedere tempi più brevi. Il tempo di risposta previsto è un fattore chiave che influenza gli obiettivi globali di velocità effettiva. La velocità effettiva è data dal numero di richieste che la server farm è in grado di elaborare in un secondo. Quando sono presenti più utenti, per ottenere lo stesso tempo di risposta è necessaria una velocità effettiva superiore.

  • Concorrenza degli utenti. Viene presupposta una percentuale di concorrenza del 10% e si suppone che l'1% degli utenti effettui una richiesta nello stesso momento. Se ad esempio l'ambiente include 10.000 utenti, in un dato momento sono presenti 1.000 utenti che utilizzano attivamente la soluzione e 100 di essi stanno effettuando una richiesta proprio in quel momento.

  • Attività asincrone di lunga durata. Attività quali la ricerca per indicizzazione del contenuto e il backup dei database aggiungono un ulteriore carico alle prestazioni della server farm. Le caratteristiche generali delle prestazioni nelle topologie di esempio di Server di ricerca 2008 e di Server di ricerca 2008 Express presuppongono che tali attività possano essere eseguite durante le ore di punta e pertanto causare un maggiore impatto sulle prestazioni complessive della farm.

  • Fattori di scalabilità orizzontale. Sono state testate diverse opzioni di scalabilità per individuare la topologia più efficace per l'ambiente. Vedere la sezione Topologie di laboratorio per informazioni sulle topologie testate.

Ambiente di testing

I test per questo scenario sono stati progettati per stimare la risposta di configurazioni di farm diverse alla modifica di un'ampia gamma di fattori, quali:

  • Numero di server di query distribuiti nella farm.

  • Numero di origini di contenuto sottoposte a ricerca per indicizzazione simultaneamente.

  • Numero di elementi inclusi nell'indice in cui viene eseguita la ricerca.

Si noti che, sebbene i risultati dei test consentano di trarre alcune conclusioni, i valori effettivi di capacità e prestazioni riportati in questo articolo potrebbero essere diversi da quelli ottenuti negli ambienti reali. Le cifre riportate in questo articolo hanno lo scopo di fornire un punto di partenza per la progettazione di un ambiente con dimensioni appropriate. Dopo aver completato il progetto iniziale del sistema, testare la configurazione per determinare se il sistema è in grado di soddisfare i requisiti dell'ambiente.

Presupposti

Architettura a 64 bit. Nell'ambiente di testing sono stati utilizzati solo server a 64 bit. Sebbene Server di ricerca 2008 possa essere distribuito in server a 32 bit, è consigliabile utilizzare server a 64 bit nelle distribuzioni di farm di Server di ricerca 2008 e Server di ricerca 2008 Express.

Le informazioni aggiuntive disponibili in questa guida si basano su test eseguiti su server a 64 bit. Se si prevede di eseguire la distribuzione in server a 32 bit, sarà pertanto necessario eseguire ulteriori test sui server a 32 bit nell'ambiente. Le procedure consigliate e le indicazioni relative alle prestazioni disponibili in questa guida saranno in genere applicabili ad ambienti a 32 bit, ma i risultati effettivi possono variare.

L'architettura di sistema a 64 bit presenta le caratteristiche seguenti che contribuiscono a scalabilità e prestazioni superiori dei server:

  • Indirizzabilità della memoria. Un sistema a 32 bit può indirizzare direttamente solo uno spazio degli indirizzi di 4 gigabyte (GB). Windows Server 2003 con Service Pack 1 (SP1) in esecuzione in un'architettura di sistema a 64 bit supporta fino a 1.024 GB di memoria fisica.

  • Numero elevato di processori e maggiore scalabilità lineare per processore. Grazie ai miglioramenti apportati alla elaborazione in parallelo e alle architetture bus, le piattaforme a 64 bit sono in grado di supportare più processori, fino a 64, pur offrendo una scalabilità quasi lineare con ogni processore aggiuntivo. Le piattaforme server che offrono più di 32 CPU sono disponibili esclusivamente in architetture a 64 bit.

  • Architettura bus migliorata. Il Front Side Bus nei chipset a 64 bit correnti è più veloce rispetto a quelli di generazione precedente e dispone inoltre di una larghezza di banda più ampia, consentendo di passare più dati alla cache e al processore più velocemente.

Topologie di laboratorio

Le configurazioni della farm utilizzate per i test sono descritte nella tabella seguente. Tutti i computer server eseguivano Server di ricerca 2008 Enterprise Edition o Server di ricerca 2008 Express Microsoft nel sistema operativo Microsoft Windows Server 2008 con Service Pack 1 (SP1), Enterprise x64 Edition.

Le linee guida riportate in questo articolo hanno lo scopo di ottimizzare le prestazioni. Possono essere pertanto ignorate, ma in tal caso un eventuale aumento delle dimensioni del sistema determinerà un calo di prestazioni.

Esistono molti fattori che, in aree diverse, influiscono sulle prestazioni in un determinato ambiente. Alcuni dei consigli e dei risultati dei test forniti in questo articolo potrebbero essere correlati a caratteristiche o operazioni degli utenti che non riguardano l'ambiente in uso e pertanto non si applicano alla soluzione specifica. Per ottenere dati precisi relativi all'ambiente in uso, è in ogni caso fondamentale effettuare test accurati.

Nella tabella seguente sono elencate le configurazioni hardware e software specifiche per il testing.

Configurazione A: Search Server 2008 Express e SQL Server 2005 Express Edition in un server singolo

Ruolo computer Hardware Capacità disco rigido

Server singolo

Processore Intel dual core da 2,4 gigahertz (GHz)

4 gigabyte (GB) di RAM

Disco SATA da 500 GB

Configurazione B: Search Server 2008 e SQL Server 2005 in un server singolo

Ruolo computer Hardware Capacità disco rigido

Server singolo

Processore Intel dual core da 2,4 GHz

4 GB di RAM

Disco SATA da 500 GB

Configurazione C: Search Server 2008 in un server e SQL Server 2005 in un server separato

Ruolo computer Hardware Capacità disco rigido

Server applicazioni

Processore Intel dual core da 2,4 GHz

4 GB di RAM

Disco SATA da 500 GB

Server database

Processore Intel quad core da 3,4 GHz

8 GB di RAM

Disco SAS da 750 GB

Configurazione D: Search Server 2008 in due server e SQL Server 2005 in un server separato

Ruolo computer Hardware Capacità disco rigido

Server di query

Processore Intel dual core da 2,4 GHz

4 gigabyte (GB) di RAM

Disco SATA da 500 GB

Server di indicizzazione

Processore Intel dual core da 2,4 GHz

4 gigabyte (GB) di RAM

Disco SATA da 500 GB

Server database

Processore Intel quad core da 3,4 GHz

8 GB di RAM

Disco SAS da 750 GB

Nell'ambiente di testing è stata utilizzata una rete da un gigabit (un miliardo di bit al secondo). È consigliabile utilizzare una rete da un gigabit tra i server di una farm di Server di ricerca 2008 per garantire una larghezza di banda adeguata.

Profilo di utilizzo

Nelle tabelle seguenti sono riportate le impostazioni del profilo di utilizzo dell'ambiente di testing utilizzato per le ricerche in Server di ricerca 2008.

Nota

Per determinare le prestazioni del sistema in questi scenari sono state utilizzate solo operazioni di query.

Durante il testing sono stati sottoposti a ricerca per indicizzazione da 1,5 a 6,5 milioni di elementi. Nella tabella seguente sono riportati il tipo e il numero degli elementi sottoposti a ricerca per indicizzazione. Tali elementi avevano dimensioni variabili da 10 a 100 kilobyte (KB) e includevano elementi di elenchi, pagine Web e vari tipi di documenti.

Tipo di elemento Numero di elementi

Contenuto dei siti di SharePoint

4,5 milioni di elementi, inclusi i seguenti:

  • raccolte siti

  • siti

  • elenchi

  • file in condivisioni file

Contenuto delle condivisioni file

3,5 milioni

Contenuto HTTP

Fra 1,5 e 6,5 milioni

Nella tabella seguente è riportato l'utilizzo dello spazio su disco.

Tipo di utilizzo Volume

Dimensione dell'indice sul server di query

100 GB*

Dimensione dell'indice sul server di indicizzazione

100 GB*

Dimensione del database di ricerca

600 GB

Nota

Le dimensioni degli indici testati sono inferiori rispetto a un ambiente di produzione, in quanto nel corpo generato per il test è presente un numero limitato di parole univoche.

Stima degli obiettivi di velocità effettiva

In questa sezione vengono presentati i dati dei test che indicano la velocità effettiva della farm per un numero crescente di server di query e più origini di contenuto per Server di ricerca 2008. I dati di test per le configurazioni B, C e D in questa sezione non si applicano a Server di ricerca 2008 Express.

Poiché è possibile distribuire e configurare Server di ricerca 2008 in molti modi diversi, non esiste un metodo semplice per stimare il numero massimo di utenti supportato da un determinato numero di server. Di conseguenza, prima di procedere alla distribuzione di Server di ricerca 2008 in un ambiente di produzione è importante eseguire un testing nell'ambiente di lavoro.

La velocità effettiva può essere influenzata da numerosi fattori, tra cui il numero di utenti, la complessità e la frequenza delle operazioni degli utenti e i tipi di contenuto sottoposto a ricerca per indicizzazione. Ognuno di questi fattori può avere un effetto determinante sulla velocità effettiva della farm di Server di ricerca 2008. Durante la pianificazione della distribuzione è consigliabile valutare attentamente ognuno di questi fattori.

Se nell'organizzazione esiste già una soluzione di ricerca, è possibile prendere visione dei registri dei server Web per determinare le tendenze e i modelli di utilizzo nell'ambiente corrente.

Se nell'organizzazione è prevista la distribuzione di una nuova soluzione di ricerca, utilizzare le informazioni contenute nella sezione seguente per valutare i modelli di utilizzo.

Velocità effettiva e latenza in base alla configurazione della farm

Nella tabella disponibile in questa sezione sono riportati i risultati dei test per un'ampia gamma di profili di operazioni utente che utilizzano l'hardware e il profilo di utilizzo illustrati nella sezione Ambiente di testing di questo articolo. Per ogni configurazione di farm, sono state testati da uno a otto server di query insieme a un server di indicizzazione e a un server database.

Nella tabella seguente sono riportati i risultati dei test per le operazioni di query e ricerca per indicizzazione.

Configurazione farm Numero di origini di contenuto Velocità media al secondo della ricerca per indicizzazione degli elementi Latenza query Latenza query durante la ricerca per indicizzazione Velocità effettiva query (RPS) Velocità effettiva query durante la ricerca per indicizzazione

Configurazione A:

Server di ricerca 2008 Express in un server singolo con Microsoft SQL Server 2005 Express Edition

1

24,27

0,5738

1,0028

33,01

26,36

Configurazione B:

Server di ricerca 2008 in un server singolo con SQL Server 2005

1

19,18

0,7433

n/d

20,53

n/d

2

16,54

0,8404

1,62

17,65

15,54

3

13,04

0,8844

2,4429

12,46

11,51

4

11,9

0,9226

2,5011

10,45

10,94

5

10,85

1,1112

3,4106

8,59

9,82

Configurazione C:

Server di ricerca 2008 in un server singolo e SQL Server 2005 in un server separato

1

19,3

0,7821

n/d

20,83

n/d

2

16,54

0,8561

0,868

18,61

17,17

3

17,11

0,8998

1,0274

18,56

12,21

4

17,28

0,8882

1,0833

15,37

11,93

5

16,12

1,0929

1,0985

12,77

11,16

6

14,81

1,3025

1,3909

10,89

7,74

Configurazione D:

Server di ricerca 2008 in due server e SQL Server 2005 in un server separato

1

19,47

0,6578

n/d

27,5

n/d

2

17,19

0,8467

0,7148

18,49

21,47

3

17,79

0,8536

0,8493

18,48

18,26

4

18,47

0,8855

0,9387

18,37

15,21

5

15,34

1,0562

0,9891

12,84

14,61

6

15,6

1,2461

1,209

10,92

11,13

Tendenze dei dati

Nei grafici seguenti vengono confrontate le tendenze tra le configurazioni B, C e D con l'aumentare del volume degli elementi sottoposti a ricerca per indicizzazione. La configurazione A non è rappresentata perché Server di ricerca 2008 Express che esegue Microsoft SQL Server 2005 Express Edition presenta una dimensione massima del database di 4 GB, che limita a 500.000 il numero di elementi sottoposti a ricerca per indicizzazione.

Il grafico seguente illustra la differenza di velocità media al secondo della ricerca per indicizzazione degli elementi fra le configurazioni B, C e D.

Velocità media delle ricerche per indicizzazione

Quando il numero di elementi sottoposti a ricerca per indicizzazione supera il 1.000.000 di unità, le prestazioni delle configurazioni C e D, che hanno entrambe server di indicizzazione e server database separati, continuano ad essere soddisfacenti fino al numero massimo di elementi sottoposti a ricerca per indicizzazione, mentre le prestazioni della configurazione B iniziano a deteriorarsi. Pertanto, se il numero di elementi da sottoporre a ricerca per indicizzazione nell'ambiente supera il 1.000.000 di unità, è consigliabile distribuire un server database separato.

Il grafico seguente illustra la differenza della latenza di query durante la ricerca per indicizzazione del contenuto fra le configurazioni B, C e D.

Latenza query durante la ricerca per indicizzazione

In questo grafico è possibile osservare che la latenza durante la ricerca per indicizzazione è sostanzialmente più alta per la configurazione B rispetto alle configurazioni C e D. Se l'organizzazione necessita di una latenza bassa per le richieste degli utenti durante la ricerca per indicizzazione, è consigliabile distribuire un server database separato.

Il grafico seguente illustra la differenza della velocità effettiva di query in richieste per secondo (RPS) fra le configurazioni B, C e D.

Velocità effettiva query durante la ricerca per indicizzazione

Mentre le configurazioni C e D offrono prestazioni simili in termini di latenza durante la ricerca per indicizzazione, le prestazioni della configurazione D sono sostanzialmente migliori rispetto alle configurazioni B e C nella velocità effettiva di query durante una ricerca per indicizzazione. Se i requisiti degli utenti non consentono un intervallo regolare in cui la ricerca per indicizzazione può avvenire senza interferire con le prestazioni di risposta a query, è consigliabile prendere in considerazione un'architettura di distribuzione che includa almeno un server di query separato e server di indicizzazione e database separati.

Suggerimenti

In questa sezione sono disponibili suggerimenti generali relativi a prestazioni e capacità, che aiutano a determinare le caratteristiche di prestazioni e capacità della topologia di partenza creata in Determinare i requisiti hardware e software (Search Server 2008) e a stabilire se per tale tipologia debba essere realizzata una scalabilità orizzontale o verticale.

Nota

L'espressione scalabilità orizzontale indica la possibilità di aggiungere ulteriori server con un ruolo specifico, mentre scalabilità verticale indica la possibilità di aumentare le prestazioni o la capacità di un determinato server aggiungendo memoria oppure aumentando la capacità dei dischi rigidi o la velocità del processore.

Requisiti hardware e software

I requisiti di memoria per i server database, di indicizzazione e Web dipendono dalle dimensioni della farm, dal numero di utenti simultanei e dalla complessità di caratteristiche e pagine presenti nella farm. I valori consigliati per la memoria indicati nella tabella seguente possono essere adeguati per una farm di piccole dimensioni o con un utilizzo limitato, tuttavia è consigliabile monitorare attentamente l'utilizzo della memoria per determinare se sia necessario aumentarla.

Per informazioni sui requisiti di sistema minimi e consigliati, vedere Determinare i requisiti hardware e software (Search Server 2008).

Topologie di partenza

Per stimare le prestazioni della topologia di partenza, è possibile confrontare tale topologia con quelle illustrate in Pianificare la distribuzione di Search Server 2008 o Search Server 2008 Express. In tal modo è possibile determinare rapidamente se, per raggiungere gli obiettivi di capacità e prestazioni prefissati, è necessario realizzare una scalabilità orizzontale o verticale per la topologia di partenza.

Capacità e prestazioni di topologie con scalabilità orizzontale e verticale

Per aumentare la capacità e le prestazioni di una delle topologie di partenza, è possibile implementare la scalabilità verticale, utilizzando computer server con capacità superiore, o la scalabilità orizzontale, aggiungendo ulteriori server alla topologia. In questa sezione sono illustrate le caratteristiche di prestazioni generali di numerose topologie con scalabilità orizzontale e verticale. Le topologie di esempio utilizzate corrispondono ai seguenti modi comuni di implementare la scalabilità orizzontale o verticale in una topologia per un ambiente di ricerca:

  • Per supportare un maggiore carico utente, aggiungere ulteriori computer server di query. È inoltre possibile aggiungere server di query dedicati per alleviare il carico di elaborazione nei server Web.

  • Per supportare un maggiore carico di dati, aumentare la capacità del server di indicizzazione o aggiungere capacità al ruolo del server database aumentando la capacità di un singolo server (in cluster o con mirroring), eseguendo l'aggiornamento a un server a 64 bit oppure aggiungendo server in cluster o con mirroring.

  • Non superare il rapporto di otto computer server di query per ogni computer server database (in cluster o con mirroring).

Stima dell'intervallo della ricerca per indicizzazione

In un ambiente Server di ricerca 2008 o Server di ricerca 2008 Express la ricerca per indicizzazione del contenuto è l'operazione di più lunga durata non avviata dagli utenti. È necessario eseguire alcuni test nell'ambiente per determinare la quantità di tempo necessaria per eseguire la ricerca per indicizzazione del contenuto utilizzando una determinata origine di contenuto e stabilire se la velocità effettiva impiegata dalla ricerca per indicizzazione di tale contenuto interferisca con i tempi di risposta previsti per gli utenti. È consigliabile utilizzare ricerche per indicizzazioni incrementali quando possibile per ridurre l'impatto della ricerca per indicizzazione sulle prestazioni della farm.

Stima dei requisiti di spazio su disco

Utilizzare le informazioni seguenti per pianificare i requisiti di spazio su disco per i server di indicizzazione, i server di query e i server database nell'ambiente.

Requisiti di spazio su disco per i server di indicizzazione e di query

Utilizzare le informazioni seguenti per pianificare i requisiti di spazio su disco per il server di indicizzazione e i server di query nella server farm.

Nota

Le dimensioni dell'indice di contenuto sono in genere minori di quelle del corpo, perché prima dell'indicizzazione del contenuto vengono rimosse tutte le parole non significative.

Nota

Se il ruolo di server di query è attivato in un server diverso dal server di indicizzazione, l'indice verrà automaticamente propagato a tale server di query. Per archiviare una copia dell'indice del contenuto nel file system di un server di query, è necessario che in ogni server di query sia disponibile la stessa quantità di spazio su disco utilizzata dal server di indicizzazione per l'indice del contenuto.

Per stimare i requisiti di spazio per il disco rigido in cui si trova l'indice del contenuto:

  1. Stimare la quantità di contenuto che si prevede di sottoporre a ricerca per indicizzazione e le dimensioni medie di ogni file. Se non si conoscono le dimensioni medie dei file del corpo, per iniziare utilizzare 10 KB per documento.

    Per calcolare la quantità di spazio su disco necessaria per archiviare l'indice del contenuto, utilizzare la formula seguente:

    Quantità di spazio su disco necessaria (in GB) = dimensioni_totali_corpo (in GB) x modificatore_dimensioni_file x 2,85

    dove modificatore_dimensioni_file è un numero compreso nell'intervallo seguente, a seconda delle dimensioni medie dei file nel corpo:

    • 1,0 se il corpo contiene file con dimensioni molto piccole (dimensioni medie dei file = 1 KB).

    • 0,12 se il corpo contiene file con dimensioni intermedie (dimensioni medie dei file = 10 KB).

    • 0,05 se il corpo contiene file di grandi dimensioni (dimensioni medie dei file = 100 KB o più).

Nota

La formula precedente consente di ottenere solo una stima iniziale. I risultati reali possono essere molto diversi, in base alle dimensioni e ai tipi di elementi indicizzati e alla quantità di metadati indicizzata durante un'operazione di ricerca per indicizzazione.

Con questa formula moltiplicando dimensioni_totali_corpo (in GB) per il valore di modificatore_dimensioni_file si ottengono le dimensioni stimate del file di indice. Il risultato viene quindi moltiplicato per 2,85, per tenere conto del sovraccarico dovuto alle unioni master eseguite quando i dati sottoposti a ricerca per indicizzazione vengono uniti all'indice. Il risultato finale indica i requisiti stimati di spazio su disco.

Se ad esempio il corpo ha dimensioni pari a 1 GB e contiene principalmente file con dimensioni medie di 10 KB, per calcolare le dimensioni stimate del file di indice sarà necessario utilizzare i valori seguenti:

1 GB x 0,12 = 0,12 GB

In base a tale calcolo, il file di indice ha dimensioni stimate di 120 MB.

Ora è necessario moltiplicare le dimensioni stimate del file di indice per 2,85:

120 MB x 2,85 = 342 MB

Lo spazio su disco necessario per il file di indice e per l'esecuzione delle operazioni di indicizzazione è pertanto pari a 342 MB, ovvero 0,342 GB.

Nota

Il volume dei dati sottoposti a ricerca per indicizzazione può variare in base al tipo di contenuto.

  1. Se, in base alle stime effettuate, sui dischi dei server di indicizzazione e di query è disponibile spazio sufficiente per l'indice del contenuto, continuare con il passaggio 3, altrimenti aggiungere spazio su disco o ripetere il passaggio 1 prima di continuare con il passaggio 3.

  2. Eseguire una ricerca per indicizzazione su parte del contenuto.

  3. Valutare le dimensioni dell'indice del contenuto e il numero dei file sottoposti a ricerca per indicizzazione, quindi utilizzare tali informazioni per ripetere il calcolo indicato nel passaggio 1, in modo da ottenere un risultato più preciso.

  4. Se lo spazio rimanente sul disco rigido è sufficiente, sottoporre a ricerca per indicizzazione una maggiore quantità di contenuto, altrimenti aggiungere lo spazio su disco necessario o ricalcolare la quantità di contenuto da sottoporre a ricerca per indicizzazione.

  5. Ripetere i passaggi da 3 a 5 fino a eseguire la ricerca per indicizzazione su tutto il contenuto.

    Dopo avere eseguito la ricerca per indicizzazione su tutto il corpo, è consigliabile mantenere una registrazione delle dimensioni dell'indice del contenuto e del database di ricerca per ogni ricerca per indicizzazione, in modo da poter calcolare il tasso medio di crescita. Le dimensioni del corpo tendono ad aumentare nel tempo, man mano che viene aggiunto nuovo contenuto alla farm. È pertanto consigliabile monitorare lo spazio su disco rimanente per garantire che sia sempre disponibile una capacità adeguata per le operazioni di indicizzazione.

Requisiti di spazio su disco per il database di ricerca

Per il database di ricerca, in cui vengono archiviati i metadati e le informazioni della cronologia del crawler per il sistema di ricerca, è in genere necessaria una quantità di spazio su disco maggiore rispetto all'indice. Ciò vale soprattutto se le ricerche per indicizzazione vengono eseguite principalmente in siti di SharePoint, che contengono molti metadati.

Nota

In tale database sono archiviati sia i metadati di tutto il contenuto indicizzato che la cronologia del crawler. Per tale motivo, per il database di ricerca è necessaria una quantità di spazio su disco maggiore rispetto all'indice del contenuto.

Per calcolare la quantità di spazio su disco necessaria per il database di ricerca, utilizzare la formula seguente:

Quantità di spazio su disco necessaria (in GB) = dimensioni_totali_corpo (in GB) x modificatore_dimensioni_file x 4

dove modificatore_dimensioni_file è un numero compreso nell'intervallo seguente, a seconda delle dimensioni medie dei file nel corpo:

  • 1,0 se il corpo contiene file con dimensioni molto piccole (dimensioni medie dei file = 1 KB).

  • 0,12 se il corpo contiene file con dimensioni intermedie (dimensioni medie dei file = 10 KB).

  • 0,05 se il corpo contiene file di grandi dimensioni (dimensioni medie dei file = 100 KB o più).

Se ad esempio il corpo ha dimensioni pari a 1 GB e contiene principalmente file con dimensioni medie di 10 KB, per calcolare le dimensioni stimate del file di indice sarà necessario sostituire i valori seguenti nella formula:

1 GB x 0,12 = 0,12 GB o 120 MB

È quindi necessario moltiplicare per 4 le dimensioni stimate del file di indice:

120 MB x 4 = 480 MB

Lo spazio su disco necessario per il database di ricerca è pertanto di 480 MB ovvero 0,48 GB.

Determinazione delle specifiche per i server di indicizzazione, di query e database

In Server di ricerca 2008 la ricerca è un servizio condiviso disponibile a livello di provider di servizi condivisi. Il sistema di ricerca di Server di ricerca 2008 è composto da due ruoli del server principali, ovvero il server di indicizzazione e il server di query.

La ricerca per indicizzazione e l'indicizzazione sono operazioni che comportano un utilizzo intensivo delle risorse. La ricerca per indicizzazione del contenuto è un processo durante il quale il sistema accede al contenuto e alle relative proprietà e li analizza, allo scopo di generare un indice di contenuto da utilizzare per l'esecuzione delle query di ricerca. Durante la ricerca per indicizzazione vengono utilizzate risorse di memoria ed elaborazione nel server di indicizzazione, nei server di query che eseguono le operazioni di ricerca per indicizzazione, nei server che ospitano l'archivio contenuti in cui viene eseguita la ricerca per indicizzazione e nel server database utilizzato dalla farm di Server di ricerca 2008.

La ricerca per indicizzazione influisce sulle prestazioni generali del sistema, sui tempi di risposta utente e sulle prestazioni degli altri servizi condivisi nella farm. La ricerca per indicizzazione influisce inoltre sul servizio Web nel server di query che esegue le operazioni di ricerca per indicizzazione. Per ridurre il carico sugli altri server della farm, è possibile utilizzare un server di query dedicato per le operazioni di ricerca per indicizzazione.

Anche l'indicizzazione del contenuto sottoposto a ricerca per indicizzazione può influire sulle prestazioni generali del sistema, se per tali operazioni non viene utilizzato un server di query dedicato. Se le operazioni correlate alla ricerca costituiscono una porzione significativa delle operazioni della farm, è consigliabile distribuire un server di query dedicato.

Determinazione delle specifiche per il server di indicizzazione

Utilizzare le informazioni contenute in questa sezione per specificare i requisiti del server di indicizzazione in una farm di Server di ricerca 2008.

CPU del server di indicizzazione

La velocità del processore del server di indicizzazione determina la velocità della ricerca per indicizzazione e il numero di thread di ricerca per indicizzazione di cui è possibile creare un'istanza. Sebbene non esista un tipo o un numero di processori consigliato, per determinare i requisiti del server di indicizzazione è consigliabile valutare la quantità di contenuto che verrà sottoposta a ricerca per indicizzazione. In un ambiente aziendale il server di indicizzazione dovrebbe avere più processori per gestire un carico di indicizzazione molto elevato.

Nella tabella seguente è possibile osservare come aumenta la velocità della ricerca per indicizzazione all'aumentare del numero di processori nel server di indicizzazione.

Numero di processori Percentuale di miglioramento della velocità della ricerca per indicizzazione

1

0,00

2

10,89

4

19,77

8

30,77

Memoria del server di indicizzazione

Nel server di indicizzazione gli elementi vengono caricati in buffer per consentirne l'elaborazione da parte del motore del crawler. In una farm con un corpo di circa un milione di elementi, il server di indicizzazione richiede approssimativamente 1,5 GB di memoria. Dopo l'elaborazione in memoria, ogni documento viene scritto sul disco. Maggiore è la capacità di memoria, maggiore sarà anche il numero di elementi che il crawler è in grado di elaborare in parallelo, con un conseguente aumento della velocità della ricerca per indicizzazione.

Nel server di indicizzazione è consigliabile utilizzare come minimo 4 GB di RAM.

Velocità del disco del server di indicizzazione

È consigliabile specificare dischi RAID (Redundant Array of Independent Disks) 10 con tempi di accesso di 2 millisecondi (ms) e velocità di scrittura superiore a 150 MB al secondo, per garantire operazioni di scrittura su disco veloci.

Indice singolo e pertinenza

Server di ricerca 2008 non supporta l'utilizzo di più server di indicizzazione per la scalabilità orizzontale, in quanto ogni server di indicizzazione richiede un provider di servizi condivisi separato e in una farm di Server di ricerca 2008 può esistere un solo provider di servizi condivisi.

Ottimizzazione delle prestazioni del server di indicizzazione

Le operazioni di indicizzazione aumentano il carico sul server database e possono ridurre la velocità di risposta della farm. Possono inoltre influire su altri servizi condivisi nel server applicazioni che esegue il servizio di indicizzazione. Per ogni server di indicizzazione è possibile regolare il livello delle prestazioni di indicizzazione su uno dei tre valori seguenti:

  • Ridotte

  • Parzialmente ridotte

  • Massime

L'impostazione predefinita è Parzialmente ridotte.

Le ricerche per indicizzazione influiscono sulle prestazioni del server database, perché il servizio di ricerca di Server di ricerca 2008 scrive in tabelle di database tutti i metadati raccolti dagli elementi sottoposti a ricerca per indicizzazione. È possibile che il server di indicizzazione generi dati a una velocità tale da sovraccaricare il server database.

È consigliabile condurre un testing nel proprio ambiente per bilanciare velocità di ricerca per indicizzazione, latenza di rete, carico del database e carico degli archivi contenuti sottoposti a ricerca per indicizzazione.

Nella tabella seguente è illustrata la relazione tra l'impostazione relativa al livello di prestazioni e l'utilizzo della CPU per i server di indicizzazione e database, in base ai risultati del testing.

Impostazione relativa al livello di prestazioni Percentuale di utilizzo della CPU del server di indicizzazione Percentuale di utilizzo della CPU del server database

Ridotte

20

20

Parzialmente ridotte

24

24

Massime

25

26

SuggerimentoSuggerimento:

Se il server di indicizzazione e i server database vengono utilizzati solo per il servizio di ricerca di Server di ricerca 2008, è possibile impostare il livello su Massime. L'aumento massimo dell'utilizzo della CPU nel server database in relazione all'attività del server di indicizzazione non deve tuttavia superare il 30%. Se, quando il livello di prestazioni è impostato su Massime, l'aumento dell'utilizzo della CPU nel server database supera il 30%, è consigliabile passare al livello di prestazioni inferiore.

Regole di impatto del crawler

Le regole di impatto del crawler sono impostazioni di configurazione della ricerca a livello di farm che specificano il numero di richieste simultanee generate dal servizio di ricerca di Server di ricerca 2008 quando esegue la ricerca per indicizzazione utilizzando un'origine di contenuto specificata. Maggiore è il numero delle richieste simultanee, più veloce sarà la ricerca per indicizzazione. Si noti che la frequenza delle richieste specificata in una regola di impatto del crawler influisce direttamente sul carico del server database e su quello del server che ospita il contenuto sottoposto a ricerca per indicizzazione. Se si aumenta la frequenza delle richieste per un sito specifico, è consigliabile monitorare attentamente i server sottoposti a ricerca per indicizzazione per stabilire se l'aumento del carico è accettabile.

Il valore predefinito è il numero di processi nel server di indicizzazione. Per un computer con quattro processori, il valore predefinito sarà pertanto 8. È consigliabile modificare tale valore e misurare il carico sul server di destinazione per determinare il numero ottimale di richieste simultanee, che può essere uno dei valori seguenti: 1, 2, 4, 8, 16, 32, 64.

È inoltre possibile creare una regola per richiedere un documento alla volta e attendere un numero di secondi specificato tra le richieste. Tale regola può essere utile per eseguire ricerche per indicizzazione in un sito con un carico utente costante.

Nella tabella seguente è illustrata la relazione tra il numero di richieste simultanee e l'utilizzo della CPU nel server di indicizzazione e nei server database.

Numero di thread di ricerca per indicizzazione Percentuale di utilizzo della CPU del server di indicizzazione Percentuale di utilizzo della CPU del server database

4

35

12

8

40

15

12

45

15

16

60

20

Determinazione delle specifiche per i server di query

Utilizzare le informazioni contenute in questa sezione per determinare le specifiche per i server di query nella farm di Server di ricerca 2008.

Memoria dei server di query

Maggiore è la quantità di memoria disponibile, minore sarà il numero di accessi al disco rigido che dovranno essere effettuati dal servizio di ricerca di Server di ricerca 2008 per eseguire una determinata query. Una quantità di memoria adeguata consente inoltre di memorizzare dati nella cache in modo più efficiente. Se possibile, nei server di query dovrebbe essere installata una quantità di memoria sufficiente a contenere l'intero indice.

Velocità del disco dei server di query

È consigliabile utilizzare RAID 10 per operazioni di scrittura su disco veloci.

Numero di server di query

È possibile distribuire più server di query nella farm per garantire ridondanza e bilanciamento del carico. Il numero di server di query da utilizzare dipende dal numero di utenti presenti nella farm e dal carico previsto per le ore di punta. Per il testing sono stati utilizzati fino a otto server di query per farm.

Latenza dei server remoti

La latenza dei server è uno dei fattori che influiscono maggiormente sulle prestazioni della ricerca per indicizzazione. Le prestazioni dei server della farm devono essere bilanciate in modo da consentire di raggiungere globalmente le prestazioni di ricerca per indicizzazione potenziali. Un server di indicizzazione potente può ad esempio funzionare al 25% della sua capacità, se il server database della farm in cui viene eseguita la ricerca per indicizzazione non è in grado di rispondere in modo sufficientemente rapido. In questo caso, è possibile aumentare la scalabilità verticale del server database, in modo da incrementare la velocità della ricerca per indicizzazione nell'intera farm.

È consigliabile condurre un testing autonomo per valutare i tempi di risposta dei server nell'ambiente. Quando le prestazioni della ricerca per indicizzazione sono scarse, il collo di bottiglia è spesso costituito dal server database utilizzato nella farm di destinazione. Per migliorare le prestazioni della ricerca per indicizzazione è possibile:

  • Aumentare la scalabilità verticale dell'hardware del server database, aggiungendo o aggiornando i processori, aggiungendo memoria e sostituendo i dischi rigidi con dischi con velocità di ricerca e scrittura superiori.

  • Aumentare la memoria nei server di query della farm.

  • Eseguire le ricerche per indicizzazione nelle ore non di punta, in modo che il server database utilizzato possa gestire il traffico generato dagli utenti durante il giorno e rispondere alle richieste di ricerca per indicizzazione durante le ore di minor traffico.

Determinazione delle specifiche per i server database

Il sistema di ricerca di Server di ricerca 2008 esegue la ricerca per indicizzazione sia sui dati di testo che sui metadati associati al contenuto. In Server di ricerca 2008 l'indice full-text per la ricerca inversa è archiviato nel server di indicizzazione, mentre i metadati sono archiviati nel database di ricerca. Il server di indicizzazione scrive i metadati nel database e i server di query leggono tali dati per elaborare le query basate sulle proprietà immesse dagli utenti.

Utilizzare le informazioni in questa sezione per determinare le specifiche per i server database in una farm di Server di ricerca 2008.

Velocità effettiva del database

L'archivio dei metadati del database è condiviso tra il server di indicizzazione e tutti i server di query della farm. Il server di indicizzazione scrive tutti i metadati e i server di query leggono tali dati per elaborare le richieste di ricerca. La velocità effettiva delle query dipende in modo determinante dalla velocità di risposta dell'archivio dei metadati.

Man mano che aumenta il numero dei server di query nella farm, aumenta anche il carico sul server database e ciò influisce sulla velocità effettiva complessiva delle query. Quando si aggiungono server di query alla farm è consigliabile monitorare attentamente il server database, per verificare che il database mantenga un livello di prestazioni soddisfacente.

Distribuzione dei dischi rigidi nel server database

Poiché durante le ricerche per indicizzazione il servizio di ricerca di Server di ricerca 2008 scrive grandi quantità di dati nel database di ricerca, è consigliabile utilizzare dischi rigidi separati per i database SharedServices_Search_Db, SharedServices_Db e TempDb, al fine di migliorare le prestazioni negli scenari in cui l'indice contiene più di 5 milioni di elementi.

Velocità dei dischi del server database

È consigliabile utilizzare RAID 10 per operazioni di scrittura su disco veloci.

Linee guida per ottenere prestazioni accettabili

La capacità è direttamente dipendente dalla scalabilità. In questa sezione vengono elencati gli oggetti che possono comporre una soluzione e vengono fornite indicazioni per ottenere prestazioni accettabili per ogni tipo di oggetto. Sono disponibili dati sui limiti insieme a note che descrivono le condizioni nelle quali tali limiti vengono raggiunti. Sono inoltre inclusi collegamenti a informazioni aggiuntive, quando disponibili. Utilizzare le linee guida in questo articolo per verificare i piani generali per la soluzione.

Se i piani per la soluzione non rispettano le linee guida consigliate per uno o più oggetti, eseguire una o più delle operazioni seguenti:

  • Valutare la soluzione per assicurarsi che siano previste compensazioni in altre aree.

  • Contrassegnare tali aree per il testing e il monitoraggio durante la creazione e la distribuzione della soluzione.

  • Riprogettare la soluzione per garantire che vengano rispettate le linee guida relative alla capacità.

Nelle tabelle seguenti sono elencati gli oggetti suddivisi per categoria e sono incluse le linee guida consigliate per ottenere prestazioni accettabili. Per prestazioni accettabili si intende una situazione in cui il sistema testato può supportare il numero di oggetti indicato ma il superamento di tale numero comporta una riduzione delle prestazioni. Un asterisco (*) indica un limite fisso. Se l'asterisco non è presente, si tratta di un limite supportato o testato.

Server di ricerca 2008 viene generalmente distribuito come soluzione di ricerca in un ambiente che contiene già siti o altre origini dati. Potrebbe essere consigliabile utilizzare una farm di Server di ricerca 2008 per ospitare siti di Microsoft Windows SharePoint Services 3.0 oltre al Centro ricerche.

Per informazioni sulle linee guida consigliate per gli oggetti siti e utenti di Server di ricerca 2008 e Server di ricerca 2008 Express, vedere Plan for software boundaries (Windows SharePoint Services).

Nella tabella seguente sono riportate le linee guida consigliate per gli oggetti di ricerca.

Oggetto di ricerca Linee guida per ottenere prestazioni accettabili Note

Indici di ricerca

1 per farm di Server di ricerca 2008 o di Server di ricerca 2008 Express

Documento indicizzato

50 milioni per indice di ricerca

Sono supportati 50 milioni di elementi per server di indicizzazione e un indice di ricerca per server di indicizzazione. Ciò significa che il limite effettivo di elementi per server di indicizzazione è di 50 milioni.

Nella tabella seguente sono riportate le linee guida consigliate per gli oggetti di architettura logica.

Oggetto dell'architettura logica Linee guida per ottenere prestazioni accettabili Note

Provider di servizi condivisi

Server di ricerca 2008: 3 per farm (massimo 20 per farm)

Server di ricerca 2008 Express: massimo 1

 

Pool di applicazioni di Internet Information Services (IIS)

8 per server Web

Il numero massimo è determinato dalle capacità hardware.

Server di ricerca 2008 non richiede pool di applicazioni aggiuntivi a meno che non si decida di utilizzare la farm per ospitare siti di Microsoft Windows SharePoint Services 3.0 aggiuntivi.

Raccolta siti

50.000 per applicazione Web

Database del contenuto

100 per applicazione Web

Raccolta siti

50.000 per database

Nella tabella seguente sono riportate le linee guida consigliate per gli oggetti fisici.

Oggetto fisico Linee guida per ottenere prestazioni accettabili Note

Server di indicizzazione

1 per provider di servizi condivisi*

 

Server di query

Nessun limite fisso, è consigliato un massimo di 8

Si noti che questo limite si applica solo alle distribuzioni di Server di ricerca 2008. In una distribuzione di Server di ricerca 2008 Express può essere presente un solo server applicazioni.

Rapporto server di query/controller di dominio

3 server di query per ogni controller di dominio

A seconda della quantità di traffico di autenticazione generato, l'ambiente potrebbe supportare un maggior numero di server di query per ogni controller di dominio.

Vedere anche

Determinare i requisiti hardware e software (Search Server 2008)
Pianificare la disponibilità (Search Server 2008)
Pianificare la ridondanza (Search Server 2008)

Altre risorse

Configurare un server Web front-end dedicato per la ricerca per indicizzazione (Office SharePoint Server 2007)
Pianificare le prestazioni e le capacità (Windows SharePoint Services)