Limitare o aumentare la quantità di contenuto sottoposto a ricerca per indicizzazione (Search Server 2008)

Aggiornato: 2008-10-23

Nota

Salvo quanto altrimenti previsto, le informazioni contenute in questo articolo si applicano al Server di ricerca 2008 Microsoft e al Server di ricerca 2008 Express Microsoft.

Durante le operazioni è spesso necessario modificare la quantità di contenuto sottoposta a ricerca per indicizzazione, ad esempio per:

  • Interrompere la ricerca per indicizzazione di alcuni siti in un determinato spazio dei nomi definito da un'origine di contenuto esistente.

  • Eseguire ricerche per indicizzazione di siti che si trovano a un livello diverso.

  • Modificare il numero di tipi di file da sottoporre a ricerca per indicizzazione, ad esempio iniziando a eseguire la ricerca per indicizzazione di file in cui non era mai stata eseguita in precedenza e/o interrompendola per determinati tipi di file in cui è attualmente in corso.

A mano a mano che le esigenze dell'organizzazione cambiano, può essere necessario sottoporre a ricerca per indicizzazione origini di contenuto completamente nuove. Per ulteriori informazioni sull'esecuzione della ricerca per indicizzazione di origini di contenuto completamente nuove, vedere Informazioni sulle origini di contenuto (Search Server 2008).

Per aumentare o limitare la quantità di contenuto sottoposta a ricerca per indicizzazione, è possibile utilizzare:

  • Impostazioni della ricerca per indicizzazione nelle origini di contenuto   È ad esempio possibile specificare di sottoporre a ricerca per indicizzazione solo gli indirizzi iniziali indicati in una determinata origine di contenuto oppure specificare il numero di sottolivelli dello spazio dei nomi da sottoporre a ricerca per indicizzazione, a partire dagli indirizzi iniziali indicati, e il numero di passaggi tra server consentito. Si noti che le opzioni disponibili nell'ambito di un'origine di contenuto per specificare la quantità di contenuto sottoposta a ricerca per indicizzazione variano in base al tipo dell'origine di contenuto.

  • Inclusioni di tipi di file   È possibile scegliere i tipi di file da sottoporre a ricerca per indicizzazione.

  • Regole di ricerca per indicizzazione   È possibile utilizzare regole di ricerca per indicizzazione per escludere dalla ricerca tutti gli elementi in un determinato percorso. In questo modo è possibile garantire che i siti secondari che non si desidera indicizzare non verranno sottoposti a ricerca per indicizzazione insieme al sito padre. È inoltre possibile utilizzare le regole di ricerca per indicizzazione per aumentare la quantità di contenuto sottoposto a ricerca per indicizzazione, ad esempio eseguendo la ricerca per indicizzazione di URL complessi per un determinato percorso.

Impostazioni della ricerca per indicizzazione

Per ogni origine di contenuto è possibile specificare il numero di sottolivelli degli indirizzi iniziali a cui estendere la ricerca per indicizzazione, nonché il comportamento della ricerca per indicizzazione. Tali aspetti vengono a volte denominati impostazioni di ricerca per indicizzazione. Le opzioni disponibili per una determinata origine di contenuto variano in base al tipo di origine di contenuto selezionato. La maggior parte delle opzioni determina tuttavia il numero di sottolivelli della gerarchia da sottoporre a ricerca per indicizzazione, a partire da ogni indirizzo iniziale elencato per l'origine di contenuto. Si noti che tale comportamento viene applicato a tutti gli indirizzi iniziali dell'origine di contenuto specificata.

Le opzioni disponibili nelle proprietà di ogni origine di contenuto variano in base al tipo di origine di contenuto selezionato. Nella tabella seguente sono descritte le impostazioni della ricerca per indicizzazione per ogni tipo di origine di contenuto.

Tipo di origine di contenuto Impostazioni della ricerca per indicizzazione

Siti di SharePoint

  • Tutto il contenuto nel nome host per ogni indirizzo iniziale

  • Solo il sito di SharePoint di ogni indirizzo iniziale

Siti Web

  • Solo nel server di ogni indirizzo iniziale

  • Solo la prima pagina di ogni indirizzo iniziale

  • Personalizzata - specificare il livello di pagine e i passaggi tra server

    NotaNota:
    L'impostazione predefinita di questa opzione prevede livelli di pagine e passaggi tra server illimitati.

Condivisioni di file

  • La cartella e tutte le sottocartelle di ogni indirizzo iniziale

  • Solo la cartella di ogni indirizzo iniziale

Cartelle pubbliche di Exchange

  • La cartella e tutte le sottocartelle di ogni indirizzo iniziale

  • Solo la cartella di ogni indirizzo iniziale

Come illustrato nella tabella precedente, gli amministratori dei servizi di ricerca possono utilizzare le impostazioni della ricerca per indicizzazione per limitare o aumentare la quantità di contenuto sottoposto a ricerca per indicizzazione.

Nella tabella seguente sono descritte le procedure consigliate durante la configurazione delle impostazioni della ricerca per indicizzazione.

Tipo di origine di contenuto Obiettivo Impostazione della ricerca per indicizzazione da utilizzare

Siti di SharePoint

Si desidera sottoporre a ricerca per indicizzazione il contenuto di una raccolta siti specifica in base a una pianificazione diversa da quella utilizzata per le altre raccolte siti.

Solo il sito di SharePoint di ogni indirizzo iniziale

NotaNota:
Per questa opzione è possibile specificare qualsiasi URL, ma la ricerca per indicizzazione inizierà comunque dal sito principale della raccolta siti identificata dall'URL immesso. Se ad esempio si immette http://contoso/sites/sales/car ma il sito principale della raccolta siti è http://contoso/sites/sales, la ricerca per indicizzazione verrà eseguita nella raccolta siti http://contoso/sites/sales e in tutti i relativi siti secondari.

Siti di SharePoint

Si desidera sottoporre a ricerca per indicizzazione tutto il contenuto di tutte le raccolte siti in una determinata applicazione Web, in base alla stessa pianificazione.

Tutto il contenuto nel nome host per ogni indirizzo iniziale

NotaNota:
Questa opzione accetta solo nomi host come indirizzi iniziali, ad esempio http://contoso. Quando si utilizza questa opzione non è possibile immettere l'URL di un sito secondario, ad esempio http://contoso/sites/sales.

Siti Web

Il contenuto del sito è pertinente.

-oppure-

Il contenuto disponibile nei siti collegati probabilmente non è pertinente.

Solo nel server di ogni indirizzo iniziale

Siti Web

Il contenuto pertinente si trova solo nella prima pagina.

Solo la prima pagina di ogni indirizzo iniziale

Siti Web

Si desidera limitare l'estensione della ricerca per indicizzazione dei collegamenti negli indirizzi iniziali.

Personalizzata - specificare il livello di pagine e i passaggi tra server

NotaNota:
È consigliabile iniziare con un numero ridotto in un sito molto ben connesso. Specificare più di tre livelli di pagine o più di tre passaggi tra server significherebbe eseguire una ricerca per indicizzazione in tutta Internet.
NotaNota:
È inoltre possibile utilizzare una o più regole di ricerca per indicizzazione per specificare il contenuto da sottoporre a ricerca per indicizzazione. Per ulteriori informazioni, vedere Definire il contenuto da sottoporre a ricerca per indicizzazione tramite l'utilizzo di regole (Search Server 2008).

Condivisioni di file

Cartelle pubbliche di Exchange

Il contenuto disponibile nelle sottocartelle non è probabilmente pertinente.

Solo la cartella di ogni indirizzo iniziale

Condivisioni di file

Cartelle pubbliche di Exchange

Il contenuto nelle sottocartelle è probabilmente pertinente.

La cartella e tutte le sottocartelle di ogni indirizzo iniziale

Inclusioni di tipi di file e filtri IFilter

Un file di contenuto viene sottoposto a ricerca per indicizzazione solo se l'estensione corrispondente è specificata nell'elenco delle inclusioni dei tipi di file e nel server di indicizzazione è installato un filtro IFilter che supporta tale tipo di file. Durante l'installazione iniziale vengono automaticamente inclusi numerosi tipi di file. Analizzando i registri delle query è possibile individuare i tipi di file in cui è memorizzato il contenuto su cui gli utenti finali desiderano eseguire le query ed eventualmente determinare se è necessario includere anche tipi di file che non vengono attualmente sottoposti a ricerca per indicizzazione oppure escludere determinati tipi di file dalla ricerca.

Quando si aggiungono tipi di file all'elenco delle inclusioni è inoltre necessario verificare la disponibilità di un filtro IFilter da utilizzare per analizzare tale tipo di file durante la ricerca per indicizzazione. Se il filtro IFilter necessario non è installato, il contenuto dei file del tipo specificato non verrà indicizzato e non potrà essere incluso nelle ricerche. I metadati dei file del tipo specificato verranno tuttavia sottoposti a ricerca per indicizzazione e potranno essere inclusi nelle ricerche. Se ad esempio si aggiunge l'estensione PDF all'elenco delle inclusioni dei tipi di file ma non si installa un filtro IFilter per i file PDF, il contenuto dei file PDF non verrà indicizzato, ma i metadati dei file PDF sì.

In Server di ricerca 2008 Microsoft sono inclusi diversi filtri IFilter e altri ancora sono disponibili presso Microsoft e fornitori di terze parti. Se necessario, gli sviluppatori di software possono creare filtri IFilter per nuovi tipi di file. Per installare e registrare filtri IFilter aggiuntivi provati da Microsoft con Server di ricerca 2008, vedere Come registrare Microsoft Filter Pack con Sharepoint Server 2007 e con Search Server 2008 (https://go.microsoft.com/fwlink/?linkid=110532&clcid=0x410). Per ulteriori informazioni sui filtri IFilter, inclusi quelli disponibili presso fornitori di terze parti, vedere Filter Central (informazioni in lingua inglese) (https://go.microsoft.com/fwlink/?linkid=131255&clcid=0x410) (informazioni in lingua inglese) .

Per un elenco dei tipi di file supportati dai filtri IFilter installati per impostazione predefinita e dei tipi di file per cui la ricerca per indicizzazione è attivata per impostazione predefinita, vedere Eseguire la ricerca per indicizzazione di più tipi di file installando filtri IFilter (Search Server 2008).

Limitare o escludere contenuto utilizzando le regole della ricerca per indicizzazione

È possibile modificare le regole di ricerca per indicizzazione esistenti o crearne di nuove per escludere tutti gli elementi o includere elementi specifici per un determinato percorso.

Nota

Quando si aggiunge un indirizzo iniziale a un'origine di contenuto e si accetta il comportamento predefinito, tutte le cartelle o i siti secondari di tale indirizzo iniziale vengono sottoposti a ricerca per indicizzazione, a meno che vengano esclusi utilizzando una o più regole di ricerca per indicizzazione.

Le regole di ricerca per indicizzazione vengono applicate a un URL specifico o a un insieme di URL rappresentato tramite caratteri jolly. Tale URL è anche il percorso interessato dalla regola. È possibile utilizzare regole di ricerca per indicizzazione allo scopo di:

  • Evitare di sottoporre a ricerca per indicizzazione il contenuto meno pertinente, escludendo uno o più URL. Ciò consente inoltre di limitare il traffico di rete e l'utilizzo delle risorse del server, oltre che di aumentare la pertinenza dei risultati delle ricerche.

  • Sottoporre a ricerca per indicizzazione i collegamenti nell'URL senza sottoporre a ricerca per indicizzazione l'URL stesso. Questa opzione è utile per i siti con collegamenti a contenuto pertinente, quando la pagina che include i collegamenti non contiene informazioni pertinenti o non deve essere esposta agli utenti finali nelle pagine dei risultati di ricerca.

  • Sottoporre a ricerca per indicizzazione anche URL complessi. Questa opzione consente di sottoporre a ricerca per indicizzazione anche URL che contengono un parametro di query specificato da un punto interrogativo. A seconda del sito, tali URL possono includere o meno contenuto pertinente. Poiché gli URL complessi spesso reindirizzano gli utenti a siti meno pertinenti, è consigliabile attivare questa opzione solo per i siti il cui contenuto accessibile tramite URL complessi è sicuramente pertinente.

    Nota

    Questa opzione non ha effetto sulla ricerca per indicizzazione dei siti di SharePoint, perché in tal caso Server di ricerca 2008 enumera tutto il contenuto.

Nota

Tali regole vengono applicate contemporaneamente a tutte le origini di contenuto.

Accade spesso che, oltre al contenuto pertinente, all'indirizzo di un determinato sito corrisponda anche un sito secondario o un insieme di siti di livello inferiore che non include contenuto pertinente. Selezionando una combinazione mirata di URL per cui creare regole di ricerca per indicizzazione che escludono gli elementi non necessari, gli amministratori dei servizi condivisi hanno la possibilità di ottimizzare il livello di pertinenza del contenuto incluso nell'indice, limitando il più possibile l'effetto sulle prestazioni della ricerca per indicizzazione e le dimensioni dei database di ricerca. La creazione di regole di ricerca per indicizzazione per l'esclusione di determinati URL è utile soprattutto durante la pianificazione degli indirizzi iniziali per il contenuto esterno, perché i membri dell'organizzazione non possono controllare l'impatto sull'utilizzo delle risorse.

Quando si crea una regola di ricerca per indicizzazione, è possibile utilizzare caratteri jolly standard nel percorso, ad esempio:

  • http://server1/cartella* contiene tutte le risorse Web con un URL che inizia con http://server1/cartella.

  • *://*.txt include ogni documento con l'estensione del nome di file TXT.

Poiché la ricerca per indicizzazione nel contenuto utilizza risorse e larghezza di banda, è consigliabile includere una minore quantità di contenuto sicuramente pertinente. Dopo la distribuzione iniziale sarà possibile riesaminare la query e i registri di ricerca per indicizzazione, nonché modificare le origini di contenuto e le regole affinché restituiscano risultati più pertinenti e includano una maggiore quantità di contenuto.

Per limitare o aumentare la quantità di contenuto sottoposto a ricerca per indicizzazione, è possibile eseguire le procedure seguenti: