Condividi tramite


Filtri IFilter e gestori di protocollo (Search Server 2008)

Aggiornato: 2009-04-16

Nota

Salvo quanto altrimenti previsto, le informazioni contenute in questo articolo si applicano al Server di ricerca 2008 Microsoft e al Server di ricerca 2008 Express Microsoft.

In Server di ricerca 2008 il crawler utilizza i gestori di protocollo per accedere al contenuto e quindi alcuni filtri IFilter per estrarre contenuto dai file sottoposti a ricerca per indicizzazione. I filtri IFilter consentono di rimuovere la formattazione specifica dell'applicazione prima che il motore indicizzi il contenuto di un documento. Vengono sottoposti a ricerca per indicizzazione in Server di ricerca solo i tipi di file per i quali sono installati un gestore di protocollo e un filtro IFilter.

In questa sezione vengono descritti i filtri IFilter e i gestori di protocollo inclusi per impostazione predefinita in un'installazione di Server di ricerca. Viene inoltre spiegato come installare e registrare filtri IFilter e gestori di protocolli aggiuntivi.

Il crawler utilizza i gestori di protocollo e i filtri IFilter nel modo seguente.

  1. Il crawler recupera gli indirizzi iniziali delle origini di contenuto e chiama il gestore di protocollo in base al prefisso dell'URL.

  2. Il gestore di protocollo si connette all'origine di contenuto, quindi estrae i metadati a livello di sistema e le informazioni relative agli elenchi di controllo di accesso.

  3. Il gestore di protocollo identifica il tipo di file di ogni elemento di contenuto, in base all'estensione del file, e chiama il filtro IFilter appropriato associato a tale tipo di file.

  4. Il filtro IFilter estrae il contenuto, rimuovendo l'eventuale formattazione incorporata, e quindi recupera i metadati dell'elemento di contenuto.

  5. Il contenuto viene prima analizzato tramite uno o più word breaker appropriati in base al linguaggio e quindi aggiunto all'indice full-text, denominato indice di contenuto. I metadati e gli elenchi di controllo di accesso vengono aggiunti al database di ricerca.

Contenuto della sezione:

Vedere anche

Aggiungere origini di contenuto (Search Server 2008)