Pianificazione dell'archiviazione di contenuto aziendale (SharePoint Server 2010)

 

Si applica a: SharePoint Server 2010

Ultima modifica dell'argomento: 2015-03-09

In questo articolo viene descritto come pianificare una soluzione di archiviazione di contenuto aziendale basata su Microsoft SharePoint Server 2010. Benché gli esempi contenuti in questo articolo siano pertinenti principalmente per soluzioni basate su SharePoint Server 2010, le informazioni e le indicazioni fornite si applicano sia a SharePoint Server 2010 che a SharePoint Foundation 2010, a meno che non venga specificato diversamente.

Le informazioni e le indicazioni contenute in questo argomento rappresentano un'introduzione ai concetti di archiviazione di contenuto aziendale. Alcune informazioni derivano da altri documenti più dettagliati relativi ai test delle prestazioni e della capacità effettuati presso Microsoft, nonché da altri articoli in cui vengono fornite informazioni dettagliate su concetti specifici. È consigliabile utilizzare tutte queste risorse quando si pianifica una soluzione di archiviazione di contenuto aziendale. Per ulteriori informazioni e collegamenti, vedere Risorse aggiuntive più avanti in questo articolo.

Contenuto dell'articolo:

  • Informazioni sull'archiviazione di contenuto aziendale

  • Scenari tipici di gestione di contenuto su larga scala

  • Livelli di archiviazione: vantaggi e considerazioni relativi all'archiviazione di contenuto

  • Distribuzione e archiviazione di contenuto aziendale in base ai metadati

  • Esplorazione e filtro di contenuto aziendale tramite metadati

  • Visualizzazioni elenco

  • Risorse aggiuntive

Informazioni sull'archiviazione di contenuto aziendale

Una soluzione per la gestione di documenti non si limita a fornire un'ubicazione per i documenti. Una soluzione di questo tipo a livello aziendale completa gestisce l'archiviazione di documenti a più livelli, inclusa l'archiviazione in raccolte siti, siti, raccolte e cartelle. Consente inoltre alle aziende di gestire in modo efficiente ed efficace volumi crescenti di documenti aziendali garantendo la conservazione di versioni di documenti in ogni fase del ciclo di vita per riferimento o per motivi legali.

SharePoint Server 2010 supporta un'elevata capacità di archiviazione dei documenti. Una raccolta documenti può contenere milioni di documenti. In base alla modalità di utilizzo del contenuto tuttavia le prestazioni dei siti contenenti un numero elevato di documenti possono peggiorare. Le indicazioni incluse in questo articolo possono aiutare a progettare soluzioni di gestione del contenuto su larga scala in grado di soddisfare i requisiti dell'azienda e di offrire nel contempo agli utenti della soluzione un ambiente a prestazioni elevate in cui creare e utilizzare i documenti.

Per prendere decisioni relative alla capacità di raccolte siti, siti e raccolte, è necessario considerare non solo i vincoli di archiviazione fisici imposti dall'ambiente, ma anche i modelli di visualizzazione e utilizzo del contenuto da parte degli utenti. Se ad esempio gli utenti visualizzano o eseguono query su un gruppo di documenti di una raccolta contenente migliaia di documenti, le prestazioni possono peggiorare se il sito non è configurato correttamente. Se un contratto di servizio richiede l'esecuzione del backup del contenuto due volte al giorno, in caso di volumi troppo elevati di contenuto potrebbe non essere possibile garantire un servizio soddisfacente.

Scenari tipici di gestione di contenuto su larga scala

Gli scenari di gestione di contenuto su larga scala possono essere ricondotti in genere ai casi seguenti:

  • Ambiente di creazione e modifica su larga scala

  • Archivio di contenuto su larga scala

  • Archivio di contenuto su scala estremamente ampia

Gli scenari descritti di seguito sono finalizzati a chiarire il significato di soluzioni su larga scala e a offrire esempi di livello elevato che riflettano gli obiettivi della gestione di contenuto. Queste descrizioni ovviamente non includono tutti gli aspetti di un particolare scenario. Esistono centinaia di aspetti univoci di un determinato scenario che esulano dallo scopo di questo articolo.

Ambiente di creazione e modifica su larga scala

In un ambiente di creazione e modifica su larga scala ad esempio un sito può contenere una raccolta in cui gli utenti modificano 50.000 o più documenti inclusi in 500 o più cartelle. Il controllo delle versioni è abilitato e in genere sono presenti più versioni di ogni documento. I documenti vengono archiviati ed estratti frequentemente e vengono utilizzati i flussi di lavoro per controllarne i cicli di vita. In un database tipico per questo tipo di sito sono contenuti circa 150 gigabyte (GB) di dati. È possibile utilizzare impostazioni di raccolte per limitare il numero di versioni salvate, riducendo così l'utilizzo dei database. Si noti che ogni versione di un documento viene archiviata separatamente nel database. In un ambiente di creazione e modifica su larga scala in genere l'80% degli utenti del sito è costituito da autori che possono accedere alla versione principale e a quelle secondarie dei documenti, mentre il 20% degli utenti del sito dispone di autorizzazioni di sola lettura e può visualizzare solo le versioni principali del contenuto.

Un sito di un ambiente di creazione e modifica su larga scala può essere basato sul modello di sito Centro documenti di SharePoint Server 2010 che include una singola raccolta documenti di grandi dimensioni ottimizzata per la creazione e la modifica su larga scala.

Archivio di contenuto su larga scala

Un archivio di contenuto su larga scala è un archivio di documenti utilizzato dagli utenti per visualizzare i documenti o caricarne dei nuovi. Le attività di creazione e modifica nel sito sono minime o completamente assenti. Vi sono due scenari principali di utilizzo di un archivio di contenuto su larga scala, ovvero knowledge base e gestione dei record.

In un sito di knowledge base è presente solo una versione della maggior parte dei documenti, pertanto il sito può arrivare a contenere senza problemi milioni di documenti (il valore massimo consigliato è di 30.000.000 di documenti). Il contenuto in genere viene archiviato in un unico database, con dimensioni che possono raggiungere 1 terabyte. In uno scenario tipico, ad esempio il centro di supporto tecnico di un'azienda, è possibile che 10.000 utenti accedano al contenuto, principalmente per leggerlo, e che una parte di tali utenti (3.000 - 4.000) carichi nuovo contenuto nel sito. Un sito di knowledge base può essere basato sul modello di sito Centro documenti.

Un altro tipo di archivio su larga scala è un centro record, basato sul modello di sito Centro record. L'utilizzo del modello di sito Centro record è consigliato per siti contenenti milioni di documenti. Questo modello di sito contiene caratteristiche che è possibile utilizzare per gestire la conservazione e l'eliminazione dei record (documenti che servono come prova di attività o transazioni eseguite dall'organizzazione e che devono essere conservate per un determinato periodo di tempo). Analogamente a un sito di knowledge base, un centro record contiene una sola versione di ogni documento e in genere può includere milioni di documenti. In un centro record sono molti più gli utenti che inviano contenuto di quelli che lo visualizzano o lo leggono.

Archivio di contenuto su scala estremamente ampia

Un archivio di contenuto su scala estremamente ampia può essere utilizzato come raccolta di riferimento o archivio di contenuti. Per estendersi su una scala ancora più ampia rispetto all'archivio di contenuto su larga scala, un archivio di contenuto di questo tipo può contenere oltre 50.000.000 di documenti distribuiti in più raccolte siti. Il contenuto di ogni raccolta siti può essere archiviato come dati BLOB (Binary Large Object, oggetto binario di grandi dimensioni) in più database del contenuto oppure tramite Archiviazione BLOB remoti. Quest'ultima caratteristica consente l'archiviazione di dati all'esterno di SQL Server in modo da utilizzare opzioni di archiviazione che consumano meno risorse e ridurre le dimensioni dei database del contenuto. Per trovare il contenuto in più raccolte siti viene utilizzato il servizio di ricerca SharePoint oppure FAST Search Server for SharePoint.

Livelli di archiviazione: vantaggi e considerazioni relativi all'archiviazione di contenuto

Raccolte siti

Una raccolta siti è un insieme di siti Web con lo stesso proprietario e con le stesse impostazioni di amministrazione. Ogni raccolta siti include un sito Web principale ed eventualmente uno o più siti secondari. Una raccolta siti prevede in genere una struttura del sito condivisa.

I siti di una raccolta siti sono in genere correlati in base allo scopo. Per ottimizzare l'usabilità della soluzione, archiviare tutti i dati e il contenuto correlati in un'unica raccolta siti. I vantaggi di questa operazione sono i seguenti:

  • Le colonne e i tipi di contenuto gestiti in una raccolta siti possono essere condivisi tra tutti i siti della raccolta. È possibile utilizzare il servizio metadati gestiti può essere utilizzato per diffondere su diversi canali tipi di contenuto e definizioni di colonne tra più raccolte siti.

  • I criteri di gestione delle informazioni utilizzati nella raccolta siti possono essere resi disponibili per il contenuto di tutti i siti della raccolta.

  • È possibile utilizzare il servizio di ricerca per il contenuto di più raccolte siti.

  • Alcune visualizzazioni consentono di visualizzare un elenco di documenti di più siti di un'unica raccolta siti, ad esempio enumerando tutte le attività assegnate a un utente in una raccolta siti. Gli sviluppatori possono inoltre creare query su database intersito in una raccolta siti, ma tali query non sono supportate in più raccolte siti.

  • Le quote di contenuto e altre quote possono essere gestite solo a livello di raccolta siti.

Quando si pianifica la modalità di allocazione del contenuto in una o più raccolte siti, tenere presenti i limiti seguenti:

  • Tutti i siti di una raccolta condividono le stesse risorse back-end. In particolare, tutto il contenuto di una raccolta siti deve essere archiviato nello stesso database del contenuto. Per questo motivo, le prestazioni delle operazioni sul database, ad esempio il backup e il ripristino del contenuto, dipendono dalla quantità di contenuto nell'intera raccolta siti, dalle dimensioni del database, dalla velocità dei server che ospitano il database e da altri fattori. In base alla quantità di contenuto e alla configurazione del database, potrebbe essere necessario suddividere una raccolta siti in più raccolte per soddisfare requisiti di contratti di servizio quali il backup e il ripristino, la velocità effettiva o altro. Le indicazioni sulla gestione delle dimensioni e delle prestazioni dei database esulano dall'ambito di questo articolo.

  • In particolare, mantenere i siti più attivi in raccolte siti distinte. Un sito di knowledge base in Internet che consente l'esplorazione anonima ad esempio può generare un'intensa attività nel database. Se altri siti utilizzano lo stesso database, le relative prestazioni possono risentirne. Inserendo il sito di knowledge base in una raccolta siti distinta con un proprio database, è possibile liberare risorse per altri siti che non devono più contendersi con tale sito le risorse del database.

Nota

In SharePoint Foundation e SharePoint Server 2010 sono disponibili diverse caratteristiche che consentono di ridurre la necessità di ricorrere al reparto IT per ripristinare il contenuto. Il Cestino e il Cestino della raccolta siti offrono un doppio meccanismo di sicurezza per il ripristino di elementi eliminati accidentalmente. Il controllo delle versioni dei documenti offre un ulteriore livello di protezione dalla perdita di documenti, poiché mantiene le versioni precedenti di ogni documento. Per garantire ulteriormente la disponibilità delle versioni precedenti, un amministratore può rimuovere l'autorizzazione Eliminazione versioni dai privilegi degli autori. In questo modo è possibile garantire la disponibilità delle versioni precedenti del contenuto senza doverle ripristinare dal database.

Siti

Un sito Web è il mezzo principale per l'organizzazione di contenuto correlato in SharePoint Server 2010 e SharePoint Foundation.

L'archiviazione di contenuto nello stesso sito presenta i vantaggi seguenti:

  • È più semplice creare pagine contenenti visualizzazioni di più raccolte ed elenchi quando si trovano nello stesso sito.

  • È possibile utilizzare il modello di sito Centro documenti per creare un sito ottimizzato per la creazione e l'utilizzo di più documenti.

  • L'interfaccia utente della struttura di spostamento nel sito è ottimizzata per semplificare l'individuazione di raccolte nello stesso sito.

  • È possibile definire un insieme di tipi di contenuto e di colonne del sito da utilizzare in un sito.

Raccolte

L'archiviazione di contenuto nella stessa raccolta presenta i vantaggi seguenti:

  • Per gli utenti è più semplice aggiungere nuovi documenti o trovare documenti esistenti in una singola raccolta.

  • Numerose impostazioni di gestione dei documenti, ad esempio autorizzazioni, controllo delle versioni del contenuto e approvazione, vengono applicate a livello di raccolta.

  • Le visualizzazioni create utilizzando l'interfaccia utente sono associate a una determinata raccolta.

  • I criteri di gestione delle informazioni, ad esempio le impostazioni di controllo e conservazione del contenuto, possono essere applicati a una raccolta. Per alcune raccolte possono essere utilizzati solo i criteri di conservazione.

Qualora si pianifichi l'organizzazione del contenuto nella stessa raccolta, prendere in considerazione i limiti seguenti:

  • Impostazioni quali le estrazioni o il controllo delle versioni vengono specificate a livello di raccolta documenti. Per applicare impostazioni diverse ad altri documenti, è necessario inserire tali documenti in un'altra raccolta con le impostazioni specifiche desiderate.

  • Visualizzazioni contenenti colonne utilizzate solo per un tipo di contenuto possono non essere utili, poiché non verranno visualizzati valori di metadati per gli elementi di altri tipi di contenuto.

  • Si verifica un rallentamento delle prestazioni delle visualizzazioni quando il numero di elementi visualizzati supera il valore di soglia di 5.000 elementi (impostazione predefinita). Vengono bloccate inoltre le query quando superano la soglia delle visualizzazioni elenco. Organizzare il contenuto della raccolta in cartelle contenenti un massimo di 5.000 elementi oppure creare visualizzazioni in cui viene utilizzato lo spostamento basato su metadati o le colonne indicizzate per restituire gruppi composti da un massimo di 5.000 elementi.

Cartelle

Una cartella è una suddivisione denominata del contenuto in una raccolta simile alle cartelle di un file system. Lo scopo principale delle cartelle è quello di organizzare il contenuto in modo logico in base alle funzionalità previste della raccolta. Se ad esempio lo scopo di una raccolta è quello di fornire le specifiche dei prodotti, è possibile denominare l'insieme di cartelle nella raccolta in base a ogni area di caratteristiche del prodotto o in base a ogni membro del team che scrive le specifiche.

Se si suddivide il contenuto in più cartelle, ognuna delle quali contiene al massimo 5.000 elementi (valore di soglia predefinito per le visualizzazioni elenco), le visualizzazioni nelle cartelle garantiscono buone prestazioni. Si noti che per trarre vantaggio da questo aspetto le visualizzazioni disponibili nelle cartelle devono essere configurate per visualizzare solo gli elementi inclusi nelle cartelle (questa caratteristica è disponibile nell'interfaccia predefinita di creazione delle visualizzazioni). Si noti inoltre che se le cartelle contengono un massimo di 5.000 elementi, non è necessario filtrare le visualizzazioni nelle cartelle utilizzando colonne indicizzate. Per le cartelle contenenti più di 5.000 elementi, è possibile migliorare le prestazioni utilizzando lo spostamento basato su metadati e/o le colonne indicizzate e quindi filtrando le visualizzazioni per restituire meno di 5.000 elementi.

Valutare la possibilità di creare cartelle nell'ambito di una soluzione di distribuzione e archiviazione di contenuto basata su metadati. Utilizzando Content Organizer, è possibile configurare impostazioni per la creazione automatica di cartelle quando le dimensioni di una cartella di destinazione si estendono eccessivamente oppure per la creazione automatica di cartelle per ogni valore di proprietà di metadati. Per ulteriori informazioni, vedere la sezione successiva di questo articolo Distribuzione e archiviazione di contenuto aziendale in base ai metadati.

Distribuzione e archiviazione di contenuto aziendale in base ai metadati

In SharePoint Server 2010 è stata introdotta la caratteristica di distribuzione e archiviazione di metadati tramite Content Organizer. Utilizzando Content Organizer nuove caratteristiche a livello di sito consentono agli amministratori e agli utenti di classificare, distribuire e archiviare più facilmente il contenuto tramite regole basate su metadati.

In base ai metadati di un documento, Content Organizer può distribuire un documento in una cartella specifica oppure creare automaticamente una nuova cartella. Possono essere create cartelle figlio della cartella di destinazione se il numero di elementi contenuti nella cartella di destinazione supera un limite specificato oppure possono essere create nuove cartelle per ogni nuovo valore di un campo. Le nuove cartelle erediteranno le impostazioni dalla cartella padre. Le nuove cartelle potranno inoltre essere associate a ulteriori regole che definiscono ulteriori parametri quali le autorizzazioni, i metadati aggiuntivi, i criteri di conservazione e i flussi di lavoro che i documenti in esse contenuti erediteranno.

Per ulteriori informazioni, vedere Panoramica sull'archiviazione e sul routing basati su metadati (SharePoint Server 2010).

Esplorazione e filtro di contenuto aziendale tramite metadati

Filtro e spostamento basato su metadati è una nuova caratteristica di SharePoint Server 2010 che consente agli utenti di filtrare e trovare contenuto utilizzando i metadati. Questa caratteristica include un'interfaccia utente semplice basata sul controllo gerarchico della visualizzazione albero di SharePoint combinato con un nuovo controllo Filtri chiave per fornire agli utenti uno strumento avanzato per la ricerca di contenuto in base ai metadati.

I proprietari degli elenchi possono configurare le impostazioni di spostamento basato su metadati che innalzano i campi di un elenco al livello di campi di spostamento chiave. Gli utenti che visualizzano tali elenchi possono filtrare ulteriormente la visualizzazione elenco corrente in modo da mostrare solo gli elementi con i valori desiderati in tali campi.

Le caratteristiche di indicizzazione automatica consentono di creare automaticamente indici di elenchi in base ai campi il cui livello è stato innalzato a campi di spostamento per l'elenco. L'indicizzazione automatica può migliorare i risultati delle query e le prestazioni.

Per ulteriori informazioni su come integrare lo spostamento basato su metadati in una soluzione di archiviazione di contenuto aziendale, vedere Panoramica dello spostamento basato su metadati (SharePoint Server 2010).

Visualizzazioni elenco

La base di ogni soluzione di gestione di contenuto aziendale è costituita dalla possibilità per gli utenti di cercare e trovare senza difficoltà il contenuto desiderato. Quando ci si sposta nell'ambito di una raccolta o di una cartella, le visualizzazioni albero ed elenco forniscono un'interfaccia semplice che consente agli utenti di esplorare graficamente la tassonomia dell'archiviazione del contenuto. Se tuttavia in una raccolta o in una cartella è contenuto un numero eccessivo di elementi, è possibile che per eseguire query e visualizzare rapidamente i risultati l'elenco utilizzi molte risorse del sistema. In SharePoint Server 2010 è possibile ottimizzare le prestazioni delle visualizzazioni elenco riducendo al minimo l'utilizzo delle risorse del sistema tramite Limitazione risorse. Le proprietà di Limitazione risorse vengono impostate per un'applicazione Web in Impostazioni generali in Amministrazione centrale e influiscono sulle risorse allocate per l'esecuzione di query e la visualizzazione di elenchi nell'ambito dell'applicazione Web.

Configurando l'archiviazione in modo che durante la visualizzazione del contenuto di una raccolta o di una cartella non venga superato il limite delle visualizzazioni elenco è possibile evitare un consumo eccessivo di risorse e ottimizzare le prestazioni delle visualizzazioni elenco.

Limitazione risorse include le proprietà seguenti correlate alle prestazioni delle visualizzazioni elenco:

Proprietà Descrizione Valore predefinito

Soglia visualizzazione elenco

Numero massimo di elementi di elenco o di raccolta che possono essere elaborati contemporaneamente da un'operazione di database, ad esempio una query, al di fuori dell'arco temporale giornaliero definito dall'amministratore in cui non vengono applicati limiti al numero di query. È consigliabile non modificare l'impostazione di questa proprietà.

5000

Ignora modello a oggetti

Consente di specificare che gli utenti con autorizzazioni speciali possono ignorare a livello di programmazione il valore di Soglia visualizzazione elenco per query specifiche.

Soglia visualizzazione elenco per controllori e amministratori

Numero massimo di elementi di elenco o di raccolta che possono essere elaborati contemporaneamente da un'operazione di database, ad esempio una query, quando l'operazione viene eseguita da un controllore o da un amministratore con autorizzazioni appropriate. Questa impostazione è correlata a Ignora modello a oggetti.

20.000

Soglia ricerca visualizzazione elenco

Numero massimo di join consentiti per query, ad esempio quelli basati sulle colonne di ricerca, Utente/gruppo o stato del flusso di lavoro. Se nella query vengono utilizzati più di otto join, l'operazione verrà bloccata. Questa restrizione non si applica a operazioni con elementi singoli. Quando si utilizza la visualizzazione massima tramite il modello a oggetti (senza specificare tuttavia alcun campo della visualizzazione), in SharePoint vengono restituite le prime otto ricerche. È consigliabile non modificare l'impostazione di questa proprietà.

8

Periodo di tempo durante la giornata per query con numerosi elementi

Periodo di tempo in cui è possibile eseguire query estese. Questo periodo di tempo deve essere impostato al di fuori delle normali ore lavorative, poiché query estese possono comportare un sovraccarico del server.

Disabilitata

Risorse aggiuntive

Oltre alle informazioni contenute in questo articolo, le risorse seguenti possono facilitare la comprensione e la pianificazione di una soluzione di archiviazione di contenuto aziendale.