Pianificare le proprietà dei metadati per la ricerca (Search Server 2010)

 

Si applica a: Search Server 2010

Ultima modifica dell'argomento: 2011-04-25

In questo articolo viene illustrato come pianificare le proprietà dei metadati per la ricerca in Microsoft Search Server 2010. Quando il contenuto viene sottoposto a ricerca per indicizzazione, il crawler esegue anche la ricerca per indicizzazione dei metadati associati a tale contenuto, ad esempio informazioni come l'autore, il titolo e l'indirizzo di posta elettronica. Il sistema di ricerca archivia queste informazioni come proprietà sottoposte a ricerca per indicizzazione e proprietà gestite. Le prime includono tutte le proprietà (ad esempio autore, titolo o oggetto) estratte dai documenti durante le ricerche per indicizzazione. Le proprietà gestite sono invece proprietà sottoposte a ricerca per indicizzazione che possono venire visualizzate nelle ricerche perfezionate o avanzate. Quando gli utenti eseguono una ricerca standard, nei risultati vengono inclusi gli elementi con qualsiasi proprietà sottoposta a ricerca per indicizzazione. Per consentire agli utenti di eseguire ricerche perfezionate, è tuttavia necessario effettuare la pianificazione per le proprietà gestite. Poiché possono venire visualizzate nelle ricerche perfezionate, le proprietà gestite sono utili agli utenti per eseguire query più corrette e pertinenti. Search Server 2010 offre un set predefinito di proprietà gestite, ma è possibile crearne di nuove e mappare le proprietà sottoposte a ricerca per indicizzazione alle proprietà gestite che verranno visualizzate nei risultati di ricerca.

Le ricerche perfezionate possono essere eseguite solo su proprietà gestite e non su proprietà sottoposte a ricerca per indicizzazione. Per rendere una proprietà sottoposta a ricerca per indicizzazione disponibile per le query di ricerca perfezionate, è necessario mappare tale proprietà a una proprietà gestita. È possibile mappare più proprietà sottoposte a ricerca per indicizzazione a una singola proprietà gestita oppure mappare una singola proprietà sottoposta a ricerca per indicizzazione a più proprietà gestite. Se a una proprietà gestita sono mappate più proprietà sottoposte a ricerca per indicizzazione e in un documento sono presenti valori per più di una proprietà sottoposta a ricerca per indicizzazione, il valore della proprietà gestita sarà determinato dall'ordine in cui le proprietà sono state mappate e dalla priorità delle stesse.

Tre tipi di documento diversi ad esempio possono avere nomi diversi per la proprietà che identifica l'autore. In un tipo di documento la proprietà può essere denominata Autore, in un altro Creatore e nel terzo Proprietà3. Benché tutte e tre siano proprietà sottoposte a ricerca per indicizzazione, solo i documenti con la proprietà Autore verranno visualizzati nei risultati di ricerca se un utente esegue una ricerca in base all'autore (ad esempio, digitando autore:Davide Ruspini nella casella di ricerca). Per essere certi che i documenti con gli altri nomi della proprietà vengano visualizzati nei risultati di ricerche perfezionate, è necessario mappare ognuna di queste proprietà sottoposte a ricerca per indicizzazione alla proprietà gestita Autore.

Contenuto dell'articolo:


  • Informazioni sulle proprietà gestite


  • Riduzione delle proprietà gestite duplicate


  • Aggiunta di proprietà per i concetti chiave nell'architettura delle informazioni


  • Scenario

Informazioni sulle proprietà gestite

Per creare un set di proprietà gestite utile, è necessario analizzare il contenuto più importante allo scopo di individuare i metadati che è possibile mappare a proprietà gestite.

È difficile rilevare le proprietà del contenuto senza prima eseguire una ricerca per indicizzazione del contenuto. È pertanto consigliabile pianificare le proprietà gestite solo quando si è certi del contenuto presente in ogni raccolta siti. È quindi possibile eseguire la ricerca per indicizzazione di tutto il contenuto utilizzando un server di testing. Dopo la ricerca per indicizzazione, si disporrà di un elenco delle proprietà sottoposte a ricerca per indicizzazione da confrontare con l'architettura delle informazioni durante la creazione delle proprietà gestite. Può essere complicato mappare le proprietà anche dopo l'esecuzione della ricerca per indicizzazione da parte del sistema. Ciò è dovuto alla difficoltà di identificare il tipo di contenuto o l'applicazione che utilizza la proprietà. In caso di dubbi su una determinata proprietà, impostare un mapping in un ambiente di testing e provare a eseguire ricerche in base a tale proprietà.

Molte delle proprietà gestite più utili vengono create automaticamente durante l'installazione di Search Server 2010. Utilizzare tali proprietà gestite come punto di partenza per la pianificazione delle altre proprietà gestite. Fra le proprietà create automaticamente sono incluse le seguenti:

  • Autore

  • Descrizione

  • Nome sito

  • Tipo

  • Dimensioni file

  • Data ultima modifica

  • URL

  • Titolo

Tenere presente che, per eseguire in modo efficace le ricerche utilizzando le proprietà, è necessario prima assegnare valori alle proprietà sottoposte a ricerca per indicizzazione. Se ad esempio si dispone di un documento di Microsoft Word 2010 con la proprietà Autore (mappata a una proprietà gestita denominata Autore) e alla proprietà Autore non è assegnato alcun valore in quel documento, quest'ultimo non verrà visualizzato nei risultati di ricerca quando gli utenti eseguiranno una query utilizzando la proprietà Autore. Per risultati ottimali durante le ricerche perfezionate, considerare la possibilità di implementare una soluzione di gestione del contenuto aziendale che includa la pianificazione dei metadati dei documenti. Per ulteriori informazioni su tale pianificazione, vedere Pianificare metadati gestiti (SharePoint Server 2010) e Pianificare i tipi di contenuto e i flussi di lavoro (SharePoint Server 2010). Per ulteriori informazioni sulla pianificazione di una soluzione di gestione del contenuto aziendale, vedere Pianificazione della gestione del contenuto aziendale (SharePoint Server 2010).

Per informazioni sulla gestione delle proprietà dei metadati, vedere Manage metadata properties for search (Search Server 2010).

Riduzione delle proprietà gestite duplicate

Alcune proprietà di base possono venire visualizzate come proprietà sottoposte a ricerca per indicizzazione diverse in tipi di contenuto diversi. Ad esempio, le proprietà sottoposte a ricerca per indicizzazione potrebbero essere Proprietario, Creato e Creato da, che sono tutte sinonimi di Autore. L'attività più importante da eseguire è pianificare la riduzione della duplicazione, ovvero pianificare la creazione di un set di proprietà gestite e il mapping delle proprietà sottoposte a ricerca per indicizzazione con lo stesso significato alle proprietà gestite. In questo caso, sarà necessario mappare Proprietario, Creatore e Creato da alla proprietà gestita Autore.

È possibile assegnare una priorità a più proprietà sottoposte a ricerca per indicizzazione. In questo modo, se durante la ricerca per indicizzazione vengono trovate più proprietà, verrà utilizzato solo il valore della proprietà con la priorità più alta per le query basate sulle proprietà gestite. Se non si assegna una priorità alle proprietà sottoposte a ricerca per indicizzazione, per le query verranno utilizzati i valori di tutte le proprietà sottoposte a ricerca per indicizzazione mappate alla proprietà gestita. In questo caso, la proprietà gestita diventa una proprietà multivalore, pertanto una query restituirà risultati per tutto il contenuto in cui siano presenti valori per una qualsiasi proprietà mappata corrispondente alla query stessa. Nel caso di una proprietà a valore singolo, è opportuno scegliere la proprietà sottoposta a ricerca per indicizzazione più comune come proprietà gestita e quindi assegnare una priorità alle proprietà mappate in base alla frequenza con cui vengono rilevate. Non è sempre facile determinare quale proprietà viene sottoposta più spesso a ricerca per indicizzazione, ma una strategia utile è quella di assegnare una priorità alle proprietà sicuramente associate alle applicazioni utilizzate più comunemente. Ad esempio, nei documenti di Microsoft Office 2010 è incluso un set predefinito di proprietà, tra cui Autore, Titolo, Società e Tipo. Se la maggior parte degli utenti si avvale di Microsoft Office 2010 e nel proprio set di contenuti vi sono documenti creati anche in altre applicazioni, considerare la possibilità di mappare le proprietà dei documenti creati nelle altre applicazioni alle proprietà presenti nei documenti di Office 2010. Se in un documento creato con un'altra applicazione è contenuta una proprietà denominata Creatore, considerare la possibilità di mapparla alla proprietà gestita denominata Autore.

Durante il mapping delle proprietà, prestare attenzione a non associare proprietà poco comuni o non rilevanti, in quanto mapping non precisi possono dare luogo a risultati di ricerca meno pertinenti. Se ad esempio si mappa una proprietà denominata Autore ultimo salvataggio alla proprietà gestita denominata Autore, i risultati di ricerca possono essere meno significativi. Se possibile, provare a eseguire ricerche di proprietà gestite prima della distribuzione iniziale e pianificare una verifica dei dati di utilizzo per le query di ricerca durante le normale operazioni in modo da ottimizzare le proprietà mappate. Per ulteriori informazioni sulla verifica dei dati di utilizzo per le query di ricerca, vedere Visualizzare report Web Analytics (SharePoint Server 2010).

Aggiunta di proprietà per i concetti chiave nell'architettura delle informazioni

Oltre alle proprietà sottoposte a ricerca per indicizzazione mappate a proprietà gestite per impostazione predefinita, altre proprietà sottoposte a ricerca per indicizzazione potrebbero chiaramente associarsi a concetti dell'architettura delle informazioni acquisiti da proprietà gestite esistenti. Un'organizzazione ad esempio potrebbe identificare il servizio di assistenza clienti come un processo aziendale chiave nella propria architettura delle informazioni. I concetti chiave associati al servizio di assistenza clienti nell'architettura delle informazioni potrebbero includere i clienti, gli addetti all'assistenza clienti e le aree del servizio di assistenza clienti.

Per ogni concetto incluso nell'architettura delle informazioni, chiedersi se vi sia una proprietà sottoposta a ricerca per indicizzazione che rappresenti tale concetto e che possa essere mappata a una proprietà gestita. In caso affermativo, convertire la proprietà in una proprietà gestita.

Scenario

Un'applicazione line-of-business tiene traccia dei dati relativi ai clienti e ai dipendenti e le proprietà di tali dati possono probabilmente diventare proprietà gestite dopo essere state registrate nel Catalogo dati business e sottoposte a ricerca per indicizzazione come parte di un'origine di contenuto per dati business. È inoltre possibile trovare proprietà sottoposte a ricerca per indicizzazione per le applicazioni da mappare a tali proprietà gestite, ad esempio una proprietà ID (identificatore) addetto al servizio di assistenza clienti in un'applicazione dati separata oppure una proprietà Autore per un tipo di applicazione utilizzato esclusivamente dagli addetti al servizio di assistenza clienti. Una query di ricerca che utilizza tale proprietà o un termine associato alla proprietà includerà risultati di ricerca per tutti gli elementi contenenti qualsiasi proprietà sottoposta a ricerca per indicizzazione mappata alla proprietà gestita ID addetto al servizio di assistenza clienti.

Ogni processo aziendale importante identificato nell'architettura delle informazioni avrà un set di tipi di file associati o di applicazioni dei dati business utilizzabili per rilevare probabili proprietà gestite.

Anche se molti concetti inclusi nell'architettura delle informazioni non sono rappresentati da proprietà, tali concetti sono utili durante la pianificazione della struttura dei siti e l'implementazione di altre funzionalità di ricerca. L'architettura delle informazioni può identificare proprietà gestite che sono state ignorate. Se un concetto è elencato nell'architettura delle informazioni, non significa tuttavia che debba esistere una proprietà gestita per tale concetto.