Procedure consigliate per la ricerca in Office SharePoint Server

Questo articolo fa parte di una serie di articoli sulle procedure consigliate per Microsoft Office SharePoint Server 2007. In questo articolo vengono descritte le procedure consigliate per Ricerca contenuti organizzazione. Se non specificato altrimenti, questo articolo si applica sia a Microsoft Office SharePoint Server 2007 che a Server di ricerca 2008 Microsoft. Per ulteriori articoli della serie, vedere Procedure consigliate. Per ulteriori informazioni e risorse relative alle procedure consigliate per Microsoft Office SharePoint Server 2007, vedere il Centro Risorse procedure consigliate(informazioni in lingua inglese) (https://go.microsoft.com/fwlink/?linkid=125981&clcid=0x410).

1. Pianificare la distribuzione

  • Pianificare per la reperibilità. Perché una tecnologia di ricerca sia utile agli utenti finali, questi ultimi devono essere in grado di trovare ciò che stanno cercando con un impegno minimo. Per una interessante trattazione della reperibilità, vedere “Capitolo 15: Implementazione di una topologia di ricerca e reperibilità ottimale” in Procedure consigliate per Microsoft Office SharePoint Server 2007(informazioni in lingua inglese) di Ben Curry e Bill English (Microsoft Press, Redmond, WA, 2008).

  • Utilizzare proprietà gestite. Questa caratteristica consente agli amministratori della ricerca di creare un mapping uno a molti di proprietà correlate. Questo processo consente di ridurre il numero di nomi di proprietà che gli utenti devono utilizzare quando eseguono ricerche avanzate. Ad esempio, un amministratore della ricerca può eseguire il mapping della proprietà denominata “author” alle proprietà “writer” e “author2”, in modo che gli utenti che includono la proprietà “author” nelle proprie query possano inoltre ottenere risultati di ricerca per le proprietà “writer” e “author2”. Per ulteriori informazioni sulle proprietà gestite, vedere Pianificare l'esperienza di ricerca dell'utente finale (Office SharePoint Server) e Plan the end-user search experience (Search Server 2008).

  • Creare contratti di servizio. Assicurarsi che i contratti di servizio per la ricerca per indicizzazione di contenuti vengano accettati prima della distribuzione.

2. Iniziare con un'infrastruttura configurata correttamente

3. Gestire l'accesso tramite gruppi di protezione di Windows

È consigliabile aggiungere utenti a gruppi di protezione di Windows anziché a gruppi di SharePoint per i motivi seguenti:

  • Le modifiche ai gruppi di protezione di Windows non influiscono direttamente sulle voci di controllo di accesso (ACE, Access Control Entry) dei siti di SharePoint. Non è quindi necessario ripetere la ricerca per indicizzazione quando gli account utente all'interno di tali gruppi di protezione di Windows vengono modificati.

  • Durante il processo di indicizzazione, il sistema archivia le voci ACE di ogni utente aggiunto a un gruppo di SharePoint anziché le voci ACE del gruppo di SharePoint stesso. Questo processo supporta circa 1000 utenti per elenco di controllo di accesso (ACL, Access Control List). Se il numero di utenti è maggiore, non è possibile eseguire la ricerca per indicizzazione e viene visualizzato l'errore "Parametro non corretto".

4. Deframmentare il database di ricerca

Il database di ricerca contiene metadati e ACL di contenuto sottoposto a ricerca per indicizzazione. Dopo una serie di ricerche per indicizzazione, il database di ricerca può presentare una certa frammentazione. Per migliorare le prestazioni delle ricerche per indicizzazione e delle query, deframmentare periodicamente il database di ricerca. Per ulteriori informazioni, vedere Gestione dei database per Office SharePoint Server 2007 (white paper).

Importante

Se per i computer che eseguono SQL Server è attivo il mirroring, disattivare il mirroring prima di eseguire la deframmentazione del database e riattivarlo dopo che la deframmentazione è stata completata.

5. Mantenere sempre aggiornato il sistema

Dopo aver eseguito il test degli aggiornamenti nell'ambiente di testing, installare gli aggiornamenti software più recenti per Microsoft Office SharePoint Server 2007, Server di ricerca 2008 e SQL Server al più presto. Per informazioni aggiuntive generali su come distribuire aggiornamenti software, vedere Distribuire aggiornamenti software per Office SharePoint Server 2007.

6. Eseguire il monitoraggio della latenza di SQL Server

La ricerca è impegnativa dal punto di vista dell'I/O per SQL Server ed è sensibile alla latenza di I/O dei database temporaneo e di ricerca. Per l'hosting della ricerca e del contenuto il database temporaneo viene utilizzato intensamente. È consigliabile mantenere il database di ricerca, il database del provider di servizi condivisi, il database temporaneo, i database dei contenuti e i relativi file di registro su perni separati. In tale modo è possibile ottimizzare ogni file a seconda delle esigenze specifiche. Per server farm di notevoli dimensioni è inoltre consigliabile separare i database dei contenuti in computer che eseguono SQL Server diversi. In tale modo i database di ricerca e del provider di servizi condivisi dispongono di un database temporaneo e di un'istanza di SQL Server diversa rispetto ai database dei contenuti. Per ottenere le prestazioni migliori, è consigliabile mantenere le latenze seguenti:

  • 10 ms o meno per il database temporaneo

  • 10 ms o meno per il database di ricerca

  • 20 ms o meno per il file di registro del database

Seguire gli altri consigli presenti nel post di blog Monitoraggio e I/O di SQL(informazioni in lingua inglese) (https://go.microsoft.com/fwlink/?linkid=123950&clcid=0x410) nel blog dedicato a Microsoft Ricerca contenuti organizzazione. Per ulteriori informazioni sulla risoluzione dei problemi di prestazioni di SQL Server, vedere la sezione relativa ai colli di bottiglia I/O dell'articolo tecnico su SQL Server seguente: Risoluzione dei problemi di prestazioni in SQL Server 2005(informazioni in lingua inglese) (https://go.microsoft.com/fwlink/?linkid=123952&clcid=0x410).

7. Eseguire il monitoraggio per evitare l'interruzione della ricerca

L'interruzione della ricerca si verifica se il crawler non è in grado di allocare un altro thread per recuperare il documento successivo nella coda di ricerca per indicizzazione. L'interruzione può essere causata da:

  • Contesa di risorse di I/O nel computer che esegue SQL Server.

  • Ricerca per indicizzazione in corso in troppi host contemporaneamente.

  • Host ** che non rilasciano rapidamente un thread. Sono da considerare host di questo tipo i seguenti:

    • Host lenti. Un host sottoposto a ricerca per indicizzazione non è in grado di soddisfare tutte le richieste inviate dal crawler.

    • Host che richiedono ulteriori attività per ricerche per indicizzazione incrementali. Le ricerche per indicizzazione HTTP di base sono comprese in parte in questa categoria, poiché ogni documento richiede un round trip verso il server ma la data di modifica viene controllata prima del download del documento.

    • Host e contenuto con molte proprietà. Questo caso è più frequente con i tipi di archivio contenuto seguenti: Catalogo dati business, importazione utenti e ricerche per indicizzazione utenti.

  • Le ricerche per indicizzazione vengono sospese durante l'esecuzione dei backup.

Per ulteriori informazioni, vedere il post di blog seguente: Creazione di pianificazioni e interruzioni delle ricerche per indicizzazione. Come rilevarle e ridurle al minimo(informazioni in lingua inglese) (https://go.microsoft.com/fwlink/?linkid=123794&clcid=0x410) nel blog dedicato a Microsoft Ricerca contenuti organizzazione.

8. Eseguire il monitoraggio del sistema per comprendere i colli di bottiglia delle query

9. Convalidare le impostazioni di visibilità della ricerca per ogni sito sottoposto a ricerca per indicizzazione

Le procedure consigliate standard per l'ottimizzazione di siti e pagine per i motori di ricerca sono altrettanto pertinenti per i siti di gestione dei contenuti Web all'interno delle distribuzioni di SharePoint. Un sito o una pagina ottimizzata per i motori di ricerca viene visualizzata in una posizione superiore nei risultati di ricerca e contribuisce ad aumentare il traffico verso il sito. Per ulteriori informazioni, vedere Come ottimizzare i siti di gestione dei contenuti Web di SharePoint Server 2007 per i motori di ricerca(informazioni in lingua inglese) (https://go.microsoft.com/fwlink/?linkid=123956&clcid=0x410).

10. Sospendere manualmente le ricerche per indicizzazione prima di inizializzare un server di query o eseguire il backup di una farm

Prima di eseguire il backup di un provider di servizi condivisi per la ricerca o di inizializzare server di query, è consigliabile sospendere tutte le ricerche per indicizzazione. Al termine del backup è necessario riprendere manualmente le ricerche per indicizzazione sospese. Per ulteriori informazioni, vedere Sospendere e riprendere una ricerca per indicizzazione (Office Sharepoint Server 2007).

11. Eseguire il testing dei sottosistemi di ricerca per indicizzazione e query dopo qualsiasi modifica di configurazione

È consigliabile eseguire il testing della funzionalità di ricerca per indicizzazione e query della server farm dopo l'esecuzione di modifiche di configurazione. Un modo semplice per eseguire questa attività prevede la creazione di un'origine di contenuto temporanea, utilizzata solo a questo scopo. Per il testing è consigliabile sottoporre a ricerca per indicizzazione 10 elementi, ad esempio file con estensione txt in una condivisione di file, e quindi eseguire query di ricerca su questi elementi. Assicurarsi che tali elementi non siano presenti nell'indice. Può essere utile che gli elementi contengano parole univoche che verranno visualizzate nelle posizioni superiori della pagina dei risultati di ricerca quando vengono eseguite le query. Al termine del testing, è consigliabile eliminare l'origine di contenuto creata. In tale modo gli elementi sottoposti a ricerca per indicizzazione verranno rimossi dall'indice. È pertanto possibile sottoporli di nuovo a ricerca per indicizzazione quando si desidera eseguire il testing e non visualizzarli nei risultati di ricerca dopo la conclusione del testing. Per informazioni sulla ricerca per indicizzazione di contenuto, vedere Eseguire la ricerca per indicizzazione del contenuto (Office SharePoint Server 2007) o How to crawl content (Search Server 2008).

12. Rivedere i criteri relativi all'antivirus per gli oggetti sottoposti a ricerca per indicizzazione

Se si utilizzano determinati programmi software antivirus a livello di file in Microsoft Windows SharePoint Services 3.0, Microsoft Office SharePoint Server 2007 o , è consigliabile escludere alcune cartelle dalla ricerca di virus. Se tali cartelle non vengono escluse, potrebbero verificarsi molti problemi imprevisti. Per ulteriori informazioni, vedere l'articolo della Microsoft Knowledge Base 952167 Può essere necessario escludere alcune cartelle dalla ricerca antivirus quando si utilizza un programma antivirus a livello di file in Windows SharePoint Services 3.0 o in SharePoint Server 2007 (https://go.microsoft.com/fwlink/?linkid=123963&clcid=0x410).

13. Se si dispone di query personalizzate, contrassegnare le proprietà appropriate come “in ambito” dall'interfaccia utente delle proprietà sottoposte a ricerca per indicizzazione, in modo da evitare l'esecuzione di query SQL particolarmente impegnative

Ringraziamenti

Il team addetto alla pubblicazione di contenuto per Microsoft Office SharePoint Server 2007 ringrazia le persone seguenti che hanno contribuito all'articolo:

  • Luca Bandinelli, Microsoft SharePoint Customer Advisory Team

  • Dan Blood, Microsoft Search Server

  • Sid Shah, Microsoft Search Server

  • Richard Riley, Microsoft SharePoint Marketing

  • Mitch Prince, Microsoft Consulting Services

  • Larry Kuhn, Microsoft Consulting Services

Vedere anche

Concetti

Procedure consigliate per ottimizzare le prestazioni di ricerca (Office SharePoint Server 2007)