Pianificare l'archiviazione del contenuto aziendale

Le informazioni incluse in questo articolo offrono supporto ai responsabili della pianificazione e ai progettisti di soluzioni per pianificare e configurare correttamente una soluzione di gestione del contenuto aziendale di grandi dimensioni basata su Microsoft Office SharePoint Server 2007 in modo che offra buone prestazioni e le caratteristiche necessarie per gli utenti del sito. Microsoft Office SharePoint Server 2007 offre grande capacità di archiviazione dei documenti. Una raccolta documenti può contenere fino a 5 milioni di documenti. In base alla modalità di utilizzo del contenuto, tuttavia, le prestazioni dei siti che contengono un numero molto elevato di documenti potrebbero peggiorare. Le indicazioni incluse in questo articolo possono aiutare a progettare soluzioni di gestione del contenuto di grandi dimensioni in grado di soddisfare i requisiti dell'azienda e di offrire, nel contempo, agli utenti della soluzione un ambiente a prestazioni elevate in cui creare e utilizzare i documenti.

Per prendere decisioni relative alla capacità di raccolte siti, siti e raccolte in Microsoft Office SharePoint Server 2007 è necessario considerare non solo i vincoli di archiviazione fisici imposti dall'ambiente di Microsoft Office SharePoint Server 2007, ma anche i modelli di visualizzazione e utilizzo del contenuto da parte degli utenti. Se, ad esempio, gli utenti visualizzano o eseguono query su un gruppo di documenti di una raccolta contenente migliaia di documenti, le prestazioni possono peggiorare se il sito non è configurato correttamente. Se un contratto di servizio richiede che il backup del contenuto venga eseguito due volte al giorno, in caso di volumi troppo elevati di contenuto potrebbe non essere possibile garantire un servizio soddisfacente. In questo articolo vengono illustrate le tecniche che è possibile utilizzare per offrire funzionalità di gestione del contenuto garantendo prestazioni accettabili.

In questo argomento vengono illustrati quattro livelli di archiviazione del contenuto:

  • Raccolta siti

  • Sito

  • Raccolta

  • Cartella

Per ogni livello di archiviazione vengono descritti i vantaggi che è possibile ottenere organizzando il contenuto a tale livello, viene illustrato in che modo le prestazioni peggiorano con l'aumentare del numero di documenti archiviati e vengono offerti consigli che consentono di migliorare le prestazioni in caso di utilizzo di volumi di contenuto elevati.

Contenuto dell'articolo:

  • Scenari tipici di gestione del contenuto di grandi dimensioni

  • Raccolte siti: limitazioni e vantaggi relativi all'archiviazione del contenuto

  • Siti: limitazioni e vantaggi relativi all'archiviazione del contenuto

  • Raccolte: limitazioni e vantaggi relativi all'archiviazione del contenuto

  • Cartelle: considerazioni e vantaggi relativi all'archiviazione del contenuto

  • Riepilogo dei consigli

Nota

Sebbene gli esempi inclusi in questo articolo siano pertinenti principalmente per le soluzioni basate su Microsoft Office SharePoint Server 2007, le indicazioni fornite si applicano sia a Microsoft Office SharePoint Server 2007 che a Microsoft Windows SharePoint Services 3.0.

Scenari tipici di gestione del contenuto di grandi dimensioni

In genere, gli scenari di gestione del contenuto di grandi dimensioni possono essere ricondotti ai casi seguenti:

  • Ambiente di creazione e modifica di grandi dimensioni

  • Archivio di contenuto di grandi dimensioni

  • Archivio di contenuto di dimensioni estremamente elevate

Gli scenari descritti di seguito sono finalizzati a chiarire il significato di soluzioni di grandi dimensioni e a offrire esempi che riflettano gli obiettivi di gestione del contenuto.

Ambiente di creazione e modifica di grandi dimensioni

In un ambiente di creazione e modifica di grandi dimensioni un sito può contenere una raccolta in cui gli utenti modificano 50.000 o più documenti inclusi in 500 o più cartelle. Il controllo delle versioni è abilitato e in genere sono presenti 10 o più versioni di ogni documento. I documenti vengono archiviati ed estratti frequentemente e i flussi di lavoro vengono utilizzati per controllarne i cicli di vita. Potrebbero venire utilizzati venti o più tipi di contenuto. Un database tipico per questo tipo di sito contiene circa 150 gigabyte (GB) di dati. Si noti che ogni versione di un documento viene archiviata separatamente nel database. In genere, in un ambiente di creazione e modifica di grandi dimensioni l'80% degli utenti del sito è costituito da autori che possono accedere alla versione principale e a quelle secondarie di un documento, mentre il 20% degli utenti del sito dispone di autorizzazioni di sola lettura e può visualizzare solo le versioni principali del contenuto.

Un sito di un ambiente di creazione e modifica di grandi dimensioni può essere basato sul modello di sito Centro documenti di Microsoft Office SharePoint Server 2007, che include una singola raccolta documenti di grandi dimensioni e che è ottimizzato per la creazione e la modifica su vasta scala. Vedere la sezione Sito Centro documenti.

Archivio di contenuto di grandi dimensioni

Un archivio di contenuto di grandi dimensioni è un archivio di documenti utilizzato dagli utenti per visualizzare i documenti o caricarne di nuovi. Le attività di creazione e modifica nel sito sono minime o completamente assenti. Vi sono due scenari principali di utilizzo di un archivio di grandi dimensioni, ovvero knowledge base e gestione dei record.

In un sito di knowledge base è presente una singola versione della maggior parte dei documenti, pertanto il sito può arrivare a contenere senza problemi un milione o più di documenti. Il contenuto viene in genere archiviato in un unico database, con dimensioni che possono raggiungere i 400 GB. In uno scenario tipico, ad esempio un centro di supporto tecnico di un'azienda, 10.000 utenti potrebbero accedere al contenuto, principalmente per leggerlo, Una parte di tali utenti (3.000 - 4.000) carica nuovo contenuto nel sito. Un sito di knowledge base può essere basato sul modello di sito Centro documenti.

Un altro tipo di archivio di grandi dimensioni è un centro record, basato sul modello di sito Centro record. Questo modello di sito contiene caratteristiche che è possibile utilizzare per gestire la conservazione e l'eliminazione dei record (documenti che servono come prova di attività o transazioni eseguite dall'organizzazione e che devono essere conservati per un determinato periodo di tempo). Analogamente a un sito di knowledge base, un centro record contiene una singola versione di ogni documento e in genere può contenere un milione o più di documenti. In un centro record sono molti più gli utenti che inviano contenuto di quelli che lo visualizzano o lo leggono.

Archivio di contenuto di dimensioni estremamente elevate

Se l'interfaccia utente di un sito è personalizzata per rimuovere le operazioni che richiedono l'utilizzo di un'elevata quantità di risorse, come le query di visualizzazione complesse, è possibile utilizzare un archivio di contenuto di dimensioni estremamente elevate come archivio contenuti o raccolta di riferimento. Un archivio di dimensioni estremamente elevate può contenere più di 10 milioni di documenti distribuiti in 5000 o più cartelle. Le dimensioni del database possono superare i 3 terabyte (TB).

In un archivio di dimensioni estremamente elevate gli utenti, che possono essere anche più di 50.000, eseguono principalmente ricerche nel contenuto. Il contenuto viene inviato tramite un modulo di invio personalizzato.

Raccolte siti: limitazioni e vantaggi relativi all'archiviazione del contenuto

Una raccolta siti è un insieme di siti Web che hanno lo stesso proprietario e condividono le impostazioni di amministrazione. Ogni raccolta siti contiene un sito Web principale e può contenere uno o più siti secondari. Una raccolta siti prevede in genere una struttura del sito condivisa.

Vantaggi dell'archiviazione del contenuto nella stessa raccolta siti

I siti di una raccolta siti sono in genere correlati in base allo scopo. Per ottimizzare l'usabilità della soluzione, archiviare tutti i dati e il contenuto correlati in un'unica raccolta siti. I vantaggi di questa operazione sono i seguenti:

  • Le colonne e i tipi di contenuto gestiti in una raccolta siti possono essere condivisi tra tutti i siti della raccolta. Non è invece disponibile un meccanismo di propagazione dei tipi di contenuto e delle definizioni di colonne tra più raccolte siti.

  • I criteri di gestione delle informazioni utilizzati nella raccolta siti possono essere resi disponibili per il contenuto di tutti i siti della raccolta.

  • In Microsoft Office SharePoint Server 2007 vengono aggiornati automaticamente i collegamenti ai file rinominati o spostati all'interno di una raccolta siti per riflettere il nuovo nome o la nuova posizione. I collegamenti ai documenti in altre raccolte siti non vengono invece aggiornati.

  • Se la raccolta siti è in un server che esegue Microsoft Windows SharePoint Services 3.0, è possibile eseguire ricerche solo nel contenuto di tale raccolta siti. Se la raccolta siti è in un server che esegue Microsoft Office SharePoint Server 2007, è possibile eseguire ricerche in più raccolte siti.

  • Alcune visualizzazioni in Microsoft Windows SharePoint Services 3.0 e Microsoft Office SharePoint Server 2007 consentono di visualizzare un elenco di documenti di più siti in un'unica raccolta siti, ad esempio una visualizzazione che enumera tutte le attività assegnate a un utente in una raccolta siti. Gli sviluppatori possono inoltre creare query su database intersito in una raccolta siti, ma tali query non sono supportate in più raccolte siti.

  • Le quote di contenuto e altre quote possono essere gestite solo a livello di raccolta siti.

Limiti dell'archiviazione del contenuto nella stessa raccolta siti

Quando si pianifica la modalità di allocazione del contenuto in una o più raccolte siti, tenere presenti i limiti seguenti:

  • La creazione di un numero eccessivo di siti secondari di un determinato sito in una raccolta siti potrebbe influire sulle prestazioni e sull'usabilità. Non creare più di 2000 siti secondari per un determinato sito.

  • Tutti i siti di una raccolta condividono le stesse risorse back-end. In particolare, tutto il contenuto di una raccolta siti deve essere archiviato nello stesso database del contenuto. Per questo motivo, le prestazioni delle operazioni sul database, ad esempio il backup e il ripristino del contenuto, dipendono dalla quantità del contenuto nell'intera raccolta siti, dalle dimensioni del database, dalla velocità dei server che ospitano il database e da altri fattori. In base alla quantità del contenuto e alla configurazione del database, potrebbe essere necessario suddividere una raccolta siti in più raccolte per soddisfare i contratti di servizio relativi al backup e al ripristino, la velocità effettiva e altri requisiti. Le indicazioni sulla gestione delle dimensioni e delle prestazioni dei database esulano dall'ambito di questo articolo. Per ulteriori informazioni sulla pianificazione della capacità, vedere Pianificare le prestazioni e la capacità (Office SharePoint Server).

  • In particolare, mantenere i siti particolarmente attivi in raccolte siti distinte. Un sito di knowledge base in Internet che consente l'esplorazione può generare un'elevata quantità di attività nel database. Se altri siti utilizzano lo stesso database, le relative prestazioni possono risentirne. Inserendo il sito di knowledge base in una raccolta siti distinta con il proprio database, è possibile liberare risorse per altri siti che non devono più contendere con tale sito per le risorse del database.

Si noti che in Microsoft Windows SharePoint Services 3.0 e Microsoft Office SharePoint Server 2007 sono disponibili diverse caratteristiche che riducono la necessità di ripristinare il contenuto da parte del reparto IT. Il Cestino e il Cestino raccolta siti offrono un doppio meccanismo di sicurezza per il ripristino di elementi eliminati inavvertitamente. Il controllo delle versioni dei documenti offre un ulteriore livello di protezione dalla perdita di documenti, in quanto sono disponibili le versioni precedenti di ogni documento. Per garantire ulteriormente la disponibilità delle versioni precedenti, un amministratore può rimuovere l'autorizzazione di eliminazione delle versioni dalle autorizzazioni degli autori. In questo modo, è possibile garantire che le versioni precedenti del contenuto siano disponibili senza doverle ripristinare dal database.

Siti: limitazioni e vantaggi relativi all'archiviazione del contenuto

Un sito Web è il mezzo principale per l'organizzazione di contenuto correlato in Microsoft Office SharePoint Server 2007 e Microsoft Windows SharePoint Services 3.0.

Vantaggi dell'archiviazione del contenuto nello stesso sito

  • È più semplice creare pagine contenenti visualizzazioni di più raccolte ed elenchi quando si trovano nello stesso sito.

  • L'interfaccia utente di spostamento nel sito è ottimizzata per semplificare lo spostamento nelle raccolte e la loro individuazione quando le raccolte si trovano nello stesso sito.

  • Le autorizzazioni vengono definite e assegnate ai gruppi a livello di sito.

  • È possibile definire un insieme di tipi di contenuto e di colonne del sito da utilizzare in un sito.

Sito Centro documenti

Microsoft Office SharePoint Server 2007 include un modello di sito Centro documenti. Utilizzare questo modello per creare un sito ottimizzato per la creazione e l'utilizzo di un numero elevato di documenti.

Per consentire l'adozione delle procedure consigliate per la gestione dei documenti, nei siti basati sul modello di sito Centro documenti sono abilitate per impostazione predefinita le caratteristiche di gestione dei documenti, che includono le seguenti:

  • Caratteristiche di spostamento che semplificano l'individuazione del contenuto da parte degli autori.

  • Controllo delle versioni principali e secondarie abilitato.

  • Obbligo di archiviazione ed estrazione dei documenti.

  • Possibilità di presenza di più tipi di contenuto.

  • Una web part Documenti pertinenti che genera una visualizzazione personale dei documenti estratti, creati o modificati l'ultima volta dall'utente corrente. È possibile configurare la web part per l'utilizzo di più di un criterio.

  • Una web part Attività in programma che genera una visualizzazione personale delle attività correlate al documento assegnate all'utente corrente.

L'indicizzazione delle colonne è una tecnica che contribuisce a garantire che una visualizzazione o una query restituisca un elenco di elementi inclusi nell'intervallo consigliato di 2000 o meno elementi. Utilizzare la tabella seguente per determinare le colonne da indicizzare per ogni query supportata dalla web part Documenti pertinenti:

Attività per cui è configurata la web part Documenti pertinenti Colonna da indicizzare nella raccolta Documenti condivisi

Includere documenti a cui l'utente ha apportato l'ultima modifica

Modificato da

Includere documenti creati dall'utente

Autore

Includere documenti estratti dall'utente

Estratto da

Oltre a indicizzare le colonne per migliorare le prestazioni della web part Documenti pertinenti, verificare che la casella di controllo Mostra elementi dall'intera raccolta siti non sia selezionata quando si configura la web part in un ambiente di gestione dei documenti di grandi dimensioni.

Limiti dell'archiviazione del contenuto nello stesso sito

  • La presenza di più di 2000 raccolte ed elenchi in un unico sito comporta un peggioramento delle prestazioni.

  • I test di usabilità indicano che la presenza di più di 50 elenchi e raccolte nella struttura del sito rende complessa l'esplorazione del contenuto tramite l'interfaccia utente.

Raccolte: limitazioni e vantaggi relativi all'archiviazione del contenuto

Una raccolta documenti è una posizione in un sito contenente file di uno o più tipi di contenuto. Le raccolte documenti sono progettate per la gestione e l'archiviazione di documenti correlati e per consentire agli utenti di creare nuovi documenti dei tipi appropriati.

Vantaggi dell'archiviazione del contenuto nella stessa raccolta

  • Per gli utenti è più semplice aggiungere nuovi documenti o trovare i documenti esistenti in una singola raccolta.

  • Numerose impostazioni di gestione dei documenti, ad esempio autorizzazioni, controllo delle versioni del contenuto e approvazione, vengono applicate a livello di raccolta.

  • Le visualizzazioni create utilizzando l'interfaccia utente sono associate a una determinata raccolta.

  • I criteri di gestione delle informazioni, ad esempio le impostazioni di controllo e conservazione del contenuto, possono essere applicati a una raccolta.

Limiti dell'archiviazione del contenuto nella stessa raccolta

  • La dimensione massima consigliata per una raccolta è di 10 milioni di documenti.

  • Per applicare impostazioni univoche di gestione dei documenti al contenuto, ad esempio per quanto riguarda la necessità di estrazione o controllo delle versioni, il contenuto deve essere archiviato in una raccolta separata.

  • Se in una raccolta vengono utilizzati più tipi di contenuto e ogni tipo include una o più colonne di metadati che si applicano solo a tale tipo, le visualizzazioni possono risultare poco chiare. Per ovviare a questo problema, è possibile associare a ogni tipo di contenuto una raccolta separata.

  • Le prestazioni delle visualizzazioni del contenuto peggiorano quando vengono visualizzati più di 2000 elementi. Per ovviare a questa limitazione è possibile organizzare il contenuto della raccolta in cartelle, ognuna delle quali può contenere un massimo di 2000 elementi, oppure creare visualizzazioni in cui vengono utilizzate le colonne indicizzate per restituire gruppi composti da un massimo di 2000 elementi. Per informazioni sull'utilizzo delle colonne indicizzate nelle visualizzazioni, vedere più avanti.

Nota

Tutto il contenuto della pagina Web in un sito viene archiviato in una singola raccolta Pagine in tale sito, che contiene tutte le pagine di contenuto Web del sito. Il limite consigliato di 2000 elementi per ogni visualizzazione o query si applica anche alle raccolte Pagina oltre che alle raccolte documenti.

Utilizzo di colonne indicizzate per migliorare le prestazioni di visualizzazione

Come illustrato in precedenza, le prestazioni delle visualizzazioni peggiorano se vengono visualizzati più di 2000 elementi. Una tecnica utile per limitare il numero di elementi in una visualizzazione consiste nell'indicizzare una colonna utilizzata nella visualizzazione e quindi nel filtrare la visualizzazione in base a tale colonna, in modo che vengano visualizzati al massimo 2000 elementi. Una colonna indicizzata è una colonna di cui viene mantenuto un record in Microsoft Office SharePoint Server 2007 per migliorare l'efficienza delle query correlate alla visualizzazione.

Se, ad esempio, è improbabile che in una raccolta vengano modificati più di 2000 elementi in un periodo di sette giorni, è possibile indicizzare la colonna Data modifica di una raccolta e quindi filtrare una visualizzazione in modo che vengano visualizzati solo gli elementi modificati negli ultimi sette giorni. A tale scopo, specificare che la colonna Data modifica è minore di Oggi-7. Oppure, se è ad esempio probabile che un autore crei meno di 2000 elementi, è possibile indicizzare la colonna Autore e quindi filtrare una visualizzazione in modo che gli autori possano visualizzare solo i documenti creati personalmente. A tale scopo, specificare che la colonna Autore è uguale a Me.

Di seguito sono illustrati i tipi di colonna che è possibile indicizzare e utilizzare per filtrare le visualizzazioni:

  • Una riga di testo

  • Più righe di testo

  • Numero

  • Valuta

  • Scelta

  • Data e ora

  • Ricerca

  • Sì/No

  • Utente o gruppo

  • Valore calcolato

Di seguito sono riportate altre considerazioni relative alla creazione di visualizzazioni filtrate in base a colonne indicizzate:

  • In una visualizzazione è possibile utilizzare un'unica colonna indicizzata.

  • Non creare i filtri utilizzando l'operatore "OR" per specificare più criteri quando si utilizza una colonna indicizzata per filtrare una visualizzazione.

  • L'utilizzo della caratteristica Limite elementi per la modifica di una visualizzazione non consente di migliorare le prestazioni della visualizzazione.

Nota

Se un utente tenta di creare una visualizzazione per la quale potrebbe essere utile l'utilizzo di una colonna indicizzata, in Microsoft Office SharePoint Server 2007 viene visualizzato un messaggio di avviso in cui viene consigliato questo tipo di approccio.

Cartelle: considerazioni e vantaggi relativi all'archiviazione del contenuto

Una cartella è una suddivisione denominata del contenuto in una raccolta simile alle cartelle di un file system. Lo scopo principale delle cartelle è quello di organizzare il contenuto in base alle funzionalità previste della raccolta. Se, ad esempio, lo scopo di una raccolta è quello di fornire le specifiche dei prodotti, è possibile denominare l'insieme di cartelle nella raccolta per ogni area di caratteristiche del prodotto o per ogni membro del team che scrive le specifiche.

È possibile utilizzare le cartelle per migliorare le prestazioni delle raccolte. Se si suddivide il contenuto in più cartelle, ognuna delle quali contiene al massimo 2000 elementi, le visualizzazioni nelle cartelle garantiscono buone prestazioni. Si noti che, per trarre vantaggio da questo aspetto, le visualizzazioni disponibili nelle cartelle devono essere configurate per visualizzare solo gli elementi inclusi nelle cartelle (questa caratteristica è disponibile nell'interfaccia predefinita di creazione delle visualizzazioni di Microsoft Office SharePoint Server 2007). Si noti inoltre che, se le cartelle non contengono più di 2000 elementi, non è necessario filtrare le visualizzazioni nelle cartelle utilizzando colonne indicizzate.

Riepilogo dei consigli

Di seguito è riportato un riepilogo dei consigli utili per migliorare le prestazioni a ogni livello di archiviazione quando vengono archiviati volumi elevati di contenuto:

Livello Limiti delle prestazioni

Raccolta siti

Il limite consigliato è di 2000 siti secondari per qualsiasi sito.

Lo stesso database del contenuto viene utilizzato per un'intera raccolta siti. Questo potrebbe influire sulle prestazioni nelle operazioni come il backup e il ripristino.

Sito

Il limite consigliato è di 2000 raccolte ed elenchi.

Raccolta

Il limite consigliato è di 10 milioni di documenti.

Il limite consigliato è di 2000 elementi per visualizzazione.

Cartella

Il limite consigliato è di 2000 elementi per cartella.

Scaricare il manuale

Questo argomento è incluso nel manuale seguente, che può essere scaricato per una lettura e una stampa più agevoli:

Per un elenco completo dei manuali disponibili che è possibile scaricare per Office SharePoint Server 2007, vedere Downloadable content for Office SharePoint Server 2007 (informazioni in lingua inglese).

Vedere anche

Concetti

Pianificare le prestazioni e la capacità (Office SharePoint Server)
Pianificare la gestione dei record