Planifier le stockage de contenu d’entreprise

Mise à jour : 2009-02-26

Cet article contient des informations pour aider les planificateurs et concepteurs de solutions à correctement planifier et configurer une solution de gestion de contenu d'entreprise à grande échelle basée sur Microsoft Office SharePoint Server 2007 de sorte qu'elle fonctionne bien tout en fournissant les fonctionnalités requises par les utilisateurs du site. Office SharePoint Server 2007 prend en charge un stockage de documents de grande capacité ; une bibliothèque de documents peut contenir jusqu'à 5 millions de documents. Cependant, selon le mode d'utilisation du contenu, les performances des sites contenant un très grand nombre de documents peuvent se dégrader. Les instructions fournies dans cet article vous aideront à créer des solutions de gestion de contenu à grande échelle qui s'adaptent aux besoins de votre entreprise tout en fournissant aux utilisateurs de votre solution un environnement performant pour créer et utiliser des documents.

Les choix que vous effectuez sur les capacités de collections de sites, de sites et de bibliothèques dans Office SharePoint Server 2007 doivent non seulement prendre en compte les contraintes de stockage physique de votre environnement Office SharePoint Server 2007 mais aussi les modèles d'utilisation et d'affichage de contenu de vos utilisateurs. Par exemple, si les utilisateurs affichent ou interrogent un ensemble de documents dans une bibliothèque de documents contenant des milliers de documents, les performances peuvent se dégrader si le site n'est pas correctement configuré. Ou si un contrat de niveau de service impose que ce contenu soit sauvegardé deux fois par jour, le service peut ne pas être assuré de façon satisfaisante si l'ensemble du contenu est trop volumineux. Cet article présente les techniques que vous pouvez utiliser pour fournir les fonctionnalités de gestion de contenu nécessaires tout en maintenant des performances acceptables.

Dans cette rubrique, quatre niveaux de stockage de contenu sont abordés :

  • Collection de sites

  • Site

  • Bibliothèque

  • Dossier

Pour chaque niveau de stockage, cet article décrit les avantages de l'organisation du contenu à ce niveau, indique comment les performances peuvent diminuer lorsque le nombre de documents stockés augmente et fournit des recommandations pour améliorer les performances en présence de volumes élevés de contenu.

Dans cet article :

  • Scénarios courants de gestion de contenu à grande échelle

  • Collections de sites : avantages et restrictions du stockage de contenu

  • Sites : avantages et restrictions du stockage de contenu

  • Bibliothèques : avantages et restrictions du stockage de contenu

  • Dossiers : avantages et restrictions du stockage de contenu

  • Résumé des recommandations

NoteRemarque :

Bien que les exemples de cet article concernent principalement des solutions basées sur Office SharePoint Server 2007, les instructions fournies ici s'appliquent à la fois à Office SharePoint Server 2007 et à Windows SharePoint Services 3.0.

Scénarios courants de gestion de contenu à grande échelle

En général, les scénarios de gestion de contenu à grande échelle sont des variantes de l'un des scénarios suivants :

  • Environnement de création à grande échelle

  • Archive de contenu à grande échelle

  • Archive de contenu à très grande échelle

Les descriptions de scénarios fournies ici sont destinées à clarifier notre notion de solutions à grande échelle et à fournir des exemples qui devraient refléter vos objectifs de gestion de contenu.

Environnement de création à grande échelle

Dans un environnement de création à grande échelle, un site peut contenir une bibliothèque dans laquelle les utilisateurs modifient activement 50 000 documents ou plus dans 500 dossiers ou plus. La gestion des versions est activée, et il existe généralement 10 versions précédentes ou plus de chaque document. Les documents sont archivés et extraits fréquemment et des flux de travail sont utilisés pour contrôler leurs cycles de vie. Vingt types de contenus ou plus peuvent être en cours d'utilisation. Une base de données classique pour ce type de site contient environ 150 gigaoctets (Go) de données. Notez que chaque version d'un document est stockée séparément dans la base de données. En général, dans un environnement de création à grande échelle, 80 % des utilisateurs du site sont des auteurs qui ont accès aux versions majeure et mineure de documents, tandis que 20 % des utilisateurs du site ont des autorisations en lecture seule et peuvent uniquement afficher les versions principales du contenu.

Un site d'environnement de création à grande échelle peut être basé sur le modèle du site Centre de documents Office SharePoint Server 2007, qui inclut une grande bibliothèque de documents et qui est optimisé pour une création à grande échelle. Voir le site Centre de documents.

Archive de contenu à grande échelle

Une archive à grande échelle est un référentiel de documents dans lequel les utilisateurs affichent des documents ou en téléchargent de nouveaux. Peu ou pas de création est effectuée dans le site. Il existe deux principaux scénarios d'archivage à grande échelle : base de connaissances et de gestion des enregistrements.

Dans un site de base de connaissances, il n'existe qu'une seule version de la plupart des documents, ainsi le site peut facilement contenir 1 000 000 de documents ou plus. Le contenu est généralement stocké dans une base de données d'une capacité pouvant atteindre 400 Go. Dans un scénario classique, comme celui d'un centre de support technique d'une entreprise, 10 000 utilisateurs pourraient accéder au contenu, principalement pour le lire. Un sous-ensemble d'utilisateurs (3 000 à 4 000) transfère du nouveau contenu sur le site. Un site de base de connaissances peut être basé sur le modèle du site du Centre de documents.

Un autre type d'archive à grande échelle est un Centre des enregistrements, basé sur le modèle de site du Centre des enregistrements. Ce modèle de site contient des fonctionnalités que vous pouvez utiliser pour gérer la conservation et la disposition d'enregistrements (documents qui servent comme preuve d'activités ou de transactions effectuées par l'organisation et qui doivent être conservés pendant une certaine période). Similaire à un site de base de connaissances, un Centre des enregistrements contient une version unique de chaque document et peut généralement recevoir 1 000 000 de documents ou plus. Les utilisateurs qui envoient des documents sont bien plus nombreux que ceux qui en affichent ou en lisent.

Archive de contenu à très grande échelle

Si l'interface utilisateur d'un site est personnalisée pour supprimer les opérations d'interface utilisateur à usage intensif de ressources, telles que des requêtes complexes d'affichage, une archive de contenu à très grande échelle peut être utilisée en tant que bibliothèque de référence ou référentiel de contenu. Une archive à très grande échelle peut contenir jusqu'à 10 000 000 de documents distribués dans 5 000 dossiers ou plus. La taille de la base de données peut atteindre trois téraoctets (To).

Dans une archive à très grande échelle, les utilisateurs (50 000 ou plus) effectuent des recherches de contenu. Le contenu est envoyé à l'aide d'un formulaire d'envoi personnalisé.

Collections de sites : avantages et restrictions du stockage de contenu

Une collection de sites est un ensemble de sites Web ayant le même propriétaire et partageant des paramètres d'administration. Chaque collection de sites contient un site Web de niveau supérieur et peut contenir un ou plusieurs sous-sites. Une collection de sites possède généralement une structure de navigation partagée.

Avantages du stockage de contenu dans la même collection de sites

Les sites d'une collection de sites sont généralement associés selon leur finalité. Pour optimiser la facilité d'utilisation de votre solution, stockez toutes les données et tout le contenu associés au sein d'une collection de sites unique. Cette mesure offre notamment les avantages suivants :

  • Les types de contenu et les colonnes managées dans une collection de sites peuvent être partagés sur tous les sites dans la collection de sites. À l'inverse, aucun mécanisme automatique n'assure la propagation des types de contenu et de définitions de colonnes entre plusieurs collections de sites.

  • Les stratégies de gestion des informations managées dans la collection de sites peuvent être rendues disponibles au contenu de tous les sites dans la collection de sites.

  • Office SharePoint Server 2007 met automatiquement à jour les liens vers des fichiers renommés ou déplacés dans une collection de sites pour refléter les nouveaux noms ou emplacements. À l'inverse, les liens vers des documents situés dans d'autres collections de sites ne sont pas mis à jour.

  • Si la collection de sites se trouve sur un serveur qui exécute Windows SharePoint Services 3.0, la recherche ne peut porter que sur le contenu se trouvant dans cette collection de sites. Si la collection de sites se trouve sur un serveur qui exécute Office SharePoint Server 2007, une recherche de contenu peut porter sur plusieurs collections de sites.

  • Certains affichages dans Windows SharePoint Services 3.0 et Office SharePoint Server 2007 répertorient des documents provenant de plusieurs sites dans une collection de sites unique (par exemple, un affichage répertoriant toutes les tâches affectées à un utilisateur dans une collection de sites). Les développeurs peuvent également créer des requêtes de base de données sur plusieurs sites dans une collection de sites, mais ces requêtes ne peuvent pas porter sur plusieurs collections de sites.

  • Les quotas de contenu et autres quotas ne peuvent être gérés qu'au niveau de la collection de sites.

Limites sur le stockage de contenu dans la même collection de sites

Gardez les limites suivantes à l'esprit lors de la planification de l'affectation de votre contenu sur une ou plusieurs collections de sites :

  • La création d'un trop grand nombre de sous-sites d'un site dans une collection de sites peut compromettre les performances et la souplesse d'utilisation. Limitez le nombre de sous-sites d'un site à 2 000 au maximum.

  • Tous les sites d'une collection de sites partagent les mêmes ressources principales. En particulier, tout le contenu d'une collection de sites doit être stocké dans la même base de données de contenu. Pour cette raison, les performances des opérations de base de données, par exemple la sauvegarde et la restauration de contenu, dépendent du volume de contenu dans l'ensemble de la collection de sites, de la taille de la base de données, de la vitesse des serveurs hébergeant la base de données et d'autres facteurs. Selon le volume du contenu et la configuration de la base de données, vous devrez éventuellement segmenter une collection de sites en plusieurs collections de sites pour satisfaire les contrats de niveau de service pour la sauvegarde et la restauration, le débit ou autres exigences. Il n'entre pas dans le cadre de cet article de fournir des instructions sur la gestion de la taille et des performances des bases de données. Pour plus d'informations sur la planification de la capacité, voir Planifier les performances et la capacité (Office SharePoint Server).

  • En particulier, conservez les sites extrêmement actifs dans des collections de sites distinctes. Par exemple, un site de base de connaissances sur Internet autorisant un accès anonyme peut générer beaucoup d'activité de base de données. Si d'autres sites utilisent la même base de données, leurs performances pourraient être compromises. En plaçant le site de base de connaissances dans une collection de sites distincte avec sa propre base de données, vous pouvez libérer les ressources d'autres sites et éliminer les problèmes de concurrence d'accès à des ressources de base de données.

Notez que Windows SharePoint Services 3.0 et Office SharePoint Server 2007 disposent d'un nombre de fonctionnalités qui réduisent le risque de devoir demander à votre service informatique de restaurer du contenu. La corbeille et la corbeille de la collection de sites fournissent un double mécanisme de sécurité pour la restauration d'éléments supprimés par inadvertance. Le contrôle des versions des documents apporte également un filet de sécurité pour les documents perdus parce que leurs versions précédentes demeurent disponibles. Pour mieux garantir la disponibilité des versions précédentes, un administrateur peut retirer aux auteurs l'autorisation de suppression des versions ; cela permet de garantir la disponibilité des versions précédentes de contenu sans devoir les restaurer à partir de la base de données.

Sites : avantages et restrictions du stockage de contenu

Un site Web est le principal moyen d'organiser du contenu associé dans Office SharePoint Server 2007 et Windows SharePoint Services 3.0.

Avantages du stockage de contenu dans le même site

  • Il est plus facile de créer des pages qui affichent des vues de plusieurs bibliothèques et de plusieurs listes lorsqu'elles se trouvent dans le même site.

  • L'interface utilisateur de navigation dans les sites est optimisée pour faciliter la recherche et la navigation dans des bibliothèques comprises dans le même site.

  • Vous définissez et octroyez des autorisations à des groupes au niveau d'un site.

  • Vous pouvez définir un ensemble de types de contenu et de colonnes de site à utiliser dans un site.

Le site du Centre de documents

Office SharePoint Server 2007 inclut un modèle de site du Centre de documents. Utilisez ce modèle pour créer un site optimisé pour la création et l'utilisation d'un grand nombre de documents.

Pour favoriser l'application des méthodes conseillées de gestion de documents, les sites basés sur le modèle de site du Centre de documents comportent des fonctions de gestion de documents recommandées activées par défaut, notamment :

  • Fonctions de navigation pour aider les auteurs à rechercher leur contenu.

  • Contrôle des versions majeures/mineures activé.

  • Archivage et extraction de documents obligatoires.

  • Plusieurs types de contenu activés.

  • Un composant WebPart Documents applicables qui génère un affichage personnalisé des documents extraits par, créés par, ou modifiés pour la dernière fois par l'utilisateur actuel. Vous pouvez configurer le composant WebPart pour utiliser plusieurs critères.

  • Un composant WebPart Tâches à venir qui génère un affichage personnalisé de tâches liées aux documents affectées à l'utilisateur actuel.

L'indexation de colonnes est une technique qui permet de garantir qu'une vue ou une requête retourne une liste d'éléments dans la plage recommandée de 2 000 éléments ou moins. Utilisez le tableau suivant pour déterminer le nombre approprié de colonnes à indexer pour chaque requête que le composant WebPart Documents applicables prend en charge :

Si vous configurez le composant WebPart Documents applicables pour... Dans la bibliothèque Documents partagés, indexez la colonne suivante :

Inclure les documents modifiés par moi la dernière fois

Modifiés par

Inclure les documents créés par moi

Créés par

Inclure les documents extraits par moi

Extraits par

Outre l'indexation des colonnes pour améliorer les performances du composant WebPart Documents applicables, assurez-vous que la case à cocher Affiche les éléments de toute la collection de sites n'est pas activée lors de la configuration du composant WebPart dans un environnement de gestion de documents à grande échelle.

Limites sur le stockage de contenu dans le même site

  • Les performances se dégradent en présence de plus de 2 000 bibliothèques et listes.

  • Les tests d'utilisation montrent que la présence de plus de 50 listes et bibliothèques dans la structure de navigation du site compromet l'efficacité de la navigation dans le contenu à l'aide de l'interface utilisateur.

Bibliothèques : avantages et restrictions du stockage de contenu

Une bibliothèque de documents est un emplacement dans un site contenant des fichiers d'un ou plusieurs types de contenus. Les bibliothèques de documents sont conçues pour gérer et stocker des documents associés et permettre aux utilisateurs de créer de nouveaux documents des types appropriés.

Avantages du stockage du contenu dans la même bibliothèque

  • Il est plus facile pour les utilisateurs d'ajouter de nouveaux documents ou de rechercher des documents existants dans une seule bibliothèque.

  • De nombreux paramètres de gestion de documents (comme les autorisations, le contrôle des versions du contenu et l'approbation) sont appliqués au niveau de la bibliothèque.

  • Les affichages créés à l'aide de l'interface utilisateur sont liés à une bibliothèque particulière.

  • Les stratégies de gestion des informations, telles que les paramètres d'audit et de conservation de contenu, peuvent être appliquées à une bibliothèque.

Limites sur le stockage de contenu dans la même bibliothèque

  • La taille maximale recommandée d'une bibliothèque est de 10 000 000 de documents.

  • Pour appliquer des paramètres de gestion de documents uniques à du contenu, tels que des extractions requises ou le contrôle des versions, le contenu doit être stocké dans une bibliothèque distincte.

  • Si plusieurs types de contenus sont utilisés dans une bibliothèque et que chaque type de contenu a une ou plusieurs colonnes de métadonnées qui s'appliquent uniquement à ce type de contenu, les affichages peuvent prêter à confusion. Pour atténuer ce problème, vous pouvez associer chaque type de contenu à une bibliothèque distincte.

  • Les performances des affichages de contenu se dégradent lorsque le nombre d'éléments affichés est supérieur à 2 000. Pour résoudre cette restriction, il convient d'organiser le contenu de la bibliothèque en dossiers contenant chacun 2 000 éléments ou moins, ou de créer des vues qui tirent parti des colonnes indexées pour retourner des ensembles de 2 000 éléments ou moins (voir ci-dessous une description de l'utilisation des colonnes indexées dans les vues).

NoteRemarque :

Tout le contenu des pages Web d'un site est stocké dans une bibliothèque de pages unique dans ce site, qui contient toutes les pages de contenu de ce site Web. La limite recommandée de 2 000 éléments ou moins par vue ou requête s'applique aux bibliothèques de pages et non seulement aux bibliothèques de documents.

Utilisation des colonnes indexées pour améliorer les performances d'affichage

Comme mentionné ci-dessus, les performances des affichages se dégradent si le nombre d'éléments affichés est supérieur à 2 000. Une technique utile pour limiter le nombre d'éléments à afficher dans une vue consiste à indexer une colonne utilisée dans l'affichage, puis de filtrer la vue sur cette colonne de façon à ce que 2 000 éléments ou moins s'affichent. Une colonne indexée est une colonne dont Office SharePoint Server 2007 conserve un enregistrement pour améliorer l'efficacité des requêtes associées aux vues.

Par exemple, s'il est peu probable que plus de 2 000 éléments dans une bibliothèque soient modifiés dans une période de sept jours, vous pouvez indexer la colonne Modifié d'une bibliothèque, puis filtrer une vue de sorte que seuls les éléments modifiés au cours des sept derniers jours soient affichés. Pour cela, spécifiez que la colonne Modifié est inférieure à Aujourd'hui -7. Autre exemple, s'il est probable que chaque auteur créera moins de 2 000 éléments, vous pouvez indexer la colonne Créé par, puis filtrer une vue de telle sorte que les auteurs voient uniquement les documents qu'ils ont créés. Pour cela, spécifiez que la colonne Créé par est égale à Me.)

Les types de colonnes suivants peuvent être indexés et utilisés pour filtrer les vues :

  • Ligne unique de texte

  • Plusieurs lignes de texte

  • Nombre

  • Devise

  • Choix

  • Date et heure

  • Recherche

  • Oui/Non

  • Personne ou groupe

  • Calculé

Voici d'autres problèmes lors de la création de vues filtrées par colonnes indexées :

  • Une seule colonne indexée peut être utilisée dans un affichage.

  • Évitez de créer des filtres à l'aide de « Ou » pour fournir plusieurs critères lors de l'utilisation d'une colonne indexée pour filtrer une vue.

  • L'utilisation de la fonctionnalité Limitation des éléments pour modifier une vue n'améliore pas les performances de la vue.

NoteRemarque :

Si un utilisateur tente de créer une vue qui peut tirer parti de l'utilisation d'une colonne indexée, Office SharePoint Server 2007 affiche un message d'avertissement recommandant cette approche.

Dossiers : avantages et restrictions du stockage de contenu

Un dossier est une sous-division nommée du contenu dans une bibliothèque similaire aux dossiers dans un système de fichiers. L'objectif principal des dossiers est d'organiser le contenu de façon à ce qu'il corresponde à la fonctionnalité attendue de la bibliothèque. Par exemple, si une bibliothèque est destinée à fournir des spécifications de produit, l'ensemble des dossiers dans la bibliothèque peut être nommé selon chaque domaine de fonctionnalité du produit ou selon chaque membre de l'équipe qui écrit les spécifications des produits.

Des dossiers peuvent être utilisés pour améliorer les performances d'une bibliothèque. En divisant le contenu en plusieurs dossiers, chacun contenant 2 000 éléments ou moins, les vues sur les dossiers offrent de bonnes performances. Notez que pour tirer parti de cette mesure, les affichages disponibles dans les dossiers doivent être configurés pour afficher uniquement les éléments à l'intérieur des dossiers (cette fonctionnalité est disponible dans l'interface de création de vues par défaut d'Office SharePoint Server 2007). Notez également que, si les dossiers contiennent 2 000 éléments ou moins, les vues dans les dossiers ne doivent pas être filtrées à l'aide de colonnes indexées.

Résumé des recommandations

Voici un résumé des recommandations pour l'amélioration des performances à chaque niveau de stockage lorsque d'importants volumes de contenu sont stockés :

Niveau Limites de performances

Collection de sites

La limite recommandée est de 2 000 sous-sites de tout site.

La même base de données de contenu est utilisée pour l'ensemble d'une collection de sites. Cela peut affecter les performances dans des opérations telles que la sauvegarde et la restauration.

Site

La limite recommandée est de 2 000 bibliothèques et listes.

Bibliothèque

La limite recommandée est de 10 000 000 de documents.

La limite recommandée est de 2 000 éléments par vue.

Dossier

La limite recommandée est de 2 000 éléments par dossier.

Télécharger ce livre

Cette rubrique est incluse dans le livre à télécharger suivant pour une lecture et une impression plus faciles :

Vous trouverez la liste complète des livres disponibles sur Livres à télécharger pour Office SharePoint Server 2007.

Voir aussi

Concepts

Planifier les performances et la capacité (Office SharePoint Server)
Planifier la gestion des enregistrements