Planification du stockage de contenu d’entreprise (SharePoint Server 2010)

 

S’applique à : SharePoint Server 2010

Dernière rubrique modifiée : 2015-03-09

Cet article décrit comment planifier une solution de stockage de contenu d’entreprise utilisant Microsoft SharePoint Server 2010. Bien que les exemples de cet article concernent principalement des solutions basées sur SharePoint Server 2010, les informations des directives fournies ici s’appliquent à la fois à SharePoint Server 2010 et à SharePoint Foundation 2010, sauf mention contraire.

Les informations et les directives de cette rubrique sont destinées à servir d’introduction aux concepts du stockage de contenu d’entreprise. Certaines informations de cette rubrique sont dérivées d’autres documents plus détaillés sur les tests de performance et de capacité effectués par Microsoft, ainsi que d’autres articles contenant des directives détaillées sur des concepts particuliers. Il est fortement recommandé d’utiliser toutes ces autres ressources lors de la planification de votre solution de stockage de contenu d’entreprise. Pour plus d’informations et de liens, voir Ressources supplémentaires plus loin dans cet article.

Dans cet article :

  • Comprendre le stockage de contenu d’entreprise

  • Scénarios classiques de gestion de contenu à grande échelle

  • Niveaux de stockage : avantages et considérations sur le stockage de contenu

  • Routage et stockage de contenu d'entreprise sur la base des métadonnées

  • Navigation et filtrage de contenu d'entreprise sur la base des métadonnées

  • Affichages de liste

  • Ressources supplémentaires

Comprendre le stockage de contenu d’entreprise

Une solution de gestion de documents est bien plus que simplement fournir un emplacement pour des documents. Une solution complète de gestion de documents au niveau d’une entreprise répond aux besoins de stockage de documents à plusieurs niveaux : dans des collections de sites, dans des sites, dans des bibliothèques et dans des dossiers. Elle permet également aux sociétés de gérer efficacement leurs volumes croissants de documents d’entreprise et de garantir que les versions des documents à chacune des étapes de leur cycle de vie sont conservées pour référence ou pour des raisons légales.

SharePoint Server 2010 prend en charge le stockage de documents à haute capacité. Une bibliothèque de documents peut contenir des millions de documents. Cependant, selon la façon dont le contenu est utilisé, la performance des sites contenant de nombreux documents peut diminuer. Les directives fournies dans cet article peuvent vous aider à concevoir des solutions de gestion de contenu à grande échelle qui s’adaptent aux besoins de votre entreprise tout en fournissant aux utilisateurs de votre solution un environnement à hautes performances où ils peuvent créer et utiliser des documents.

Les décisions que vous prenez à propos des capacités des collections de sites, des sites et des bibliothèques doivent non seulement intégrer les contraintes physiques de votre environnement mais aussi l’utilisation et les types d’affichage du contenu par les utilisateurs. Par exemple, si les utilisateurs affichent ou font une requête sur un ensemble de documents dans une bibliothèque de documents contenant des milliers de documents, la performance peut diminuer si le site n’est pas configuré correctement. De même, si un accord de niveau de service requiert que le contenu soit sauvegardé deux fois par jour, le service peut ne pas fonctionner de façon satisfaisante si l’ensemble du contenu est d’une taille trop importante.

Scénarios classiques de gestion de contenu à grande échelle

En général, les scénarios de gestion de contenu à grande échelle sont des variantes de l’un des scénarios suivants :

  • Environnement de création à grande échelle

  • Archive de contenu à grande échelle

  • Archive de contenu à très grande échelle

Les descriptions de scénarios fournies ici sont destinées à clarifier ce que signifient des solutions à grande échelle et à fournir des exemples de haut niveau reflétant vos objectifs de gestion de contenus. Bien sûr, ces descriptions n’incluent pas tous les aspects d’un scénario particulier. Il existe des dizaines voire des centaines d’aspects spécifiques d’un scénario particulier qui sont au-delà de la portée de cet article.

Environnement de création à grande échelle

Dans un environnement de création à grande échelle, un site peut par exemple contenir une bibliothèque dans laquelle les utilisateurs peuvent modifier 50 000 documents ou plus, dans 500 dossiers ou plus. La gestion des versions est activée et il existe généralement plusieurs versions de chaque document. Les documents sont extraits et archivés fréquemment, et des flux de travail sont utilisés pour contrôler leur cycle de vie. Une base de données classique pour ce type de site contient approximativement 150 Go de données. Des paramètres de la bibliothèque peuvent être utilisés pour limiter le nombre de versions enregistrées, ce qui réduit la consommation de la base de données. (Notez que chaque version d’un document est stockée séparément dans la base de données.) En général, dans un environnement de création à grande échelle, 80 pour cent des utilisateurs du site sont des auteurs qui ont accès aux versions majeures et mineures des documents, alors que les autres 20 pour cent ont des autorisations en lecture seule et peuvent seulement afficher les versions majeures du contenu.

Un site d’environnement de création à grande échelle peut être basé sur le modèle de site de centre de documents SharePoint Server 2010, qui comprend une grande bibliothèque de documents optimisée pour la création à grande échelle.

Archive de contenu à grande échelle

Une archive de contenu à grande échelle est un référentiel de documents dans lequel les utilisateurs peuvent afficher des documents ou télécharger de nouveaux documents. Il y a peu ou pas de création dans le site. Il existe deux scénarios principaux d’archive de contenu à grande échelle : base de connaissances ou gestion des enregistrements.

Dans un site de base de connaissances, il n’existe qu’une seule version de la plupart des documents et le site peut donc s’adapter facilement à la gestion de millions de documents (le maximum recommandé est de 30 000 000 de documents). Le contenu est généralement stocké dans une même base de données allant jusqu’à 1 To. Dans un scénario classique, tel que le centre de support technique d’une entreprise, 10 000 utilisateurs sont susceptibles d’accéder au contenu, principalement pour le lire. Un sous-ensemble des utilisateurs (trois ou quatre mille) peuvent télécharger du nouveau contenu sur le site. Un site de base de connaissances peut être basé sur le modèle de site de centre de documents.

Un autre type d’archive de contenu à grande échelle est un centre des enregistrements, basé sur le modèle de site de centre des enregistrements. L’utilisation de ce modèle est recommandée pour les sites contenant un million de documents ou plus. Ce modèle de site contient des fonctionnalités que vous pouvez utiliser pour gérer la conservation et l’élimination d’enregistrements (les documents qui servent de preuve d’activités ou de transactions effectuées par l’organisation et qui doivent être conservés pendant une certaine période de temps). De façon similaire à un site de base de connaissances, un centre des enregistrements contient une seule version de chaque document et peut généralement gérer des millions de documents. Il y a bien plus d’utilisateurs déposant des contenus dans un centre des enregistrements qu’il n’y a d’utilisateurs qui les affichent ou qui les lisent.

Archive de contenu à très grande échelle

Une archive de contenu à très grande échelle peut être utilisée en tant que bibliothèque de référence ou référentiel de contenu. Pour fournir un niveau au-delà d’une archive de contenu à grande échelle, une archive de contenu à très grande échelle doit pouvoir contenir 50 000 000 de documents ou plus, distribués entre plusieurs collections de sites. Le contenu de chaque collection de sites peut être stocké en tant que données Blob (Binary Large Object) dans plusieurs bases de données de contenu ou à l’aide du stockage Blob distant. Le stockage Blob distant permet aux données d’être stockées en dehors de SQL Server, ce qui autorise des options de stockage moins coûteuses et réduit la taille de la base de données de contenu. La recherche SharePoint ou FAST Search for SharePoint est utilisée pour rechercher du contenu à travers plusieurs collections de sites.

Niveaux de stockage : avantages et considérations sur le stockage de contenu

Collections de sites

Une collection de sites est un ensemble de sites Web qui ont le même propriétaire et partagent des paramètres d’administration. Chaque collection de sites contient un site Web de niveau supérieur et peut contenir un ou plusieurs sous-sites. Une collection de sites a généralement une structure de navigation partagée.

Les sites d’une collection de sites sont généralement liés entre eux à dessein. Pour optimiser l’utilisabilité de votre solution, stockez toutes les données et les contenus connexes dans une même collection de sites. Les avantages de cette pratique sont les suivants :

  • Les types et les colonnes de contenu gérés dans une collection de sites peuvent être partagées entre des sites de la collection de sites. Le service de métadonnées gérées peut être utilisé pour syndiquer les types et les définitions des colonnes de contenu à travers plusieurs collections de sites.

  • Les stratégies de gestion des informations gérées dans la collection de sites peuvent être rendues disponibles pour le contenu de tous les sites de la collection de sites.

  • La recherche peut être utilisée sur le contenu présent dans plusieurs collections de sites.

  • Certains affichages montrent une liste de documents provenant de plusieurs sites d’une même collection de sites (par exemple un affichage énumérant toutes les tâches affectées à un utilisateur dans une collection de sites). De même, les développeurs peuvent créer des requêtes de base de données sur plusieurs sites d’une collection de sites, ces requêtes n’étant toutefois pas prises en charge sur plusieurs collections de sites.

  • Les quotas de contenu et d’autres quotas peuvent être gérés seulement au niveau d’une collection de sites.

Considérez les limites suivantes lorsque vous planifiez la façon d’allouer votre contenu entre une ou plusieurs collections de sites :

  • Tous les sites d’une collection de sites partagent les mêmes ressources principales. En particulier, tout le contenu d’une collection de sites doit être stocké dans la même base de données de contenu. Pour cette raison, la performance des opérations de la base de données, telles que la sauvegarde et la restauration du contenu, dépend de la quantité de contenu de la collection de sites, de la taille de la base de données, de la rapidité des serveurs hébergeant la base de données ainsi que d’autres facteurs. Selon la quantité de contenu et la configuration de la base de données, il peut être nécessaire de segmenter une collection de sites en plusieurs collections pour être conforme aux accords de niveau de service concernant la sauvegarde et la restauration, le débit ou d’autres spécifications. Étant donné l’objet de cet article, il ne contient pas de directives sur la façon de gérer la taille et la performance des bases de données.

  • En particulier, conservez les sites très actifs dans des collections de sites distinctes. Par exemple, un site de base de connaissances sur Internet qui permet des accès anonymes est susceptible de générer beaucoup d’activité au niveau de la base de données. Si d’autres sites utilisent la même base de données, leurs performances peuvent être affectées. En plaçant le site de base de connaissances dans une collection de sites distincte, vous pouvez libérer des ressources pour d’autres sites qui ne doivent donc plus accéder aux ressources de base de données de façon concurrente avec cette collection.

Notes

SharePoint Foundation et SharePoint Server 2010 comprennent plusieurs fonctionnalités qui peuvent réduire la nécessité d’une restauration des contenus par le département informatique. La Corbeille et la Corbeille de la collection de sites offrent un double mécanisme de sécurité pour la restauration d’éléments supprimés par inadvertance. La gestion des versions des documents fournit également une sorte de filet de sécurité : si un document est perdu, sa version antérieure sera au moins disponible. Pour mieux assurer la disponibilité des versions précédentes, un administrateur peut retirer l’autorisation Supprimer les versions d’un auteur ; ceci permet de garantir que des versions antérieures des contenus sont disponibles sans devoir les restaurer à partir de la base de données.

Sites

Un site Web est le moyen principal d’organiser des contenus ayant un rapport entre eux dans SharePoint Server 2010 et SharePoint Foundation.

Le stockage du contenu dans le même site présente les avantages suivants :

  • Il est plus facile de créer des pages montrant des affichages de plusieurs bibliothèques et de plusieurs listes lorsqu’elles se trouvent dans le même site.

  • Vous pouvez utiliser le modèle de site de centre de documents pour créer un site optimisé pour la création et l’utilisation de nombreux documents.

  • L’interface utilisateur de navigation du site est optimisée pour faciliter la recherche et la localisation des bibliothèques au sein du même site.

  • Vous pouvez définir un ensemble de types de contenu et de colonnes de site à utiliser dans un site.

Bibliothèques

Le stockage du contenu dans la même bibliothèque présente les avantages suivants :

  • Il est plus facile pour les utilisateurs d’ajouter de nouveaux documents ou de rechercher des documents existants dans une seule bibliothèque.

  • De nombreux paramètres de gestion des documents, tels que les autorisations, la gestion des versions du contenu et les approbations, sont appliqués au niveau d’une bibliothèque.

  • Les affichages créés à l’aide de l’interface utilisateur sont liés à une bibliothèque particulière.

  • Les stratégies de gestion des informations, telles que les paramètres d’audit et de rétention, peuvent être appliquées à une bibliothèque. Pour certaines bibliothèques, seules des stratégies de rétention peuvent être appliquées.

Prenez en compte les limites suivantes lorsque vous planifiez comment organiser le contenu dans la même bibliothèque :

  • Des paramètres tels que les extractions obligatoires ou la gestion des versions sont spécifiés au niveau de la bibliothèque de documents. Si vous voulez spécifier des paramètres différents pour d’autres documents, vous devez placer ces documents dans une autre bibliothèque avec les paramètres appropriés.

  • Les affichages contenant des colonnes qui sont utilisées seulement sur un type de contenu peuvent ne pas être pratiques car aucune valeur de métadonnées ne sera affichée pour les éléments d’autres types de contenus.

  • La performance des affichages est limitée lorsque le nombre d’éléments affichés dépasse le seuil de l’affichage de liste de 5 000 éléments (valeur par défaut). De plus, l’exécution des requêtes est empêchée si elles dépassent ce seuil. Organisez le contenu de la bibliothèque en dossiers contenant 5 000 éléments ou moins, ou bien créez des affichages qui tirent parti de la navigation par métadonnées et des colonnes indexées pour retourner des ensembles de 5 000 éléments ou moins.

Dossiers

Un dossier est une sous-division nommée du contenu dans une bibliothèque, similaire aux dossiers d’un système de fichiers. Le but principal des dossiers est d’organiser logiquement le contenu de façon à correspondre à la fonctionnalité attendue de la bibliothèque. Par exemple, si une bibliothèque est destinée à fournir des spécifications de produits, l’ensemble des dossiers de la bibliothèque peut être nommé selon chaque domaine de caractéristiques du produit ou selon chaque membre de l’équipe qui écrit les spécifications des produits.

Lorsque vous répartissez le contenu entre plusieurs dossiers, chacun contenant 5 000 éléments (la valeur par défaut du seuil d’affichage de liste) ou moins, les affichages des dossiers peuvent fonctionner correctement. Notez que pour tirer parti de ceci, les affichages disponibles dans les dossiers doivent être configurés pour montrer seulement les éléments qui se trouvent dans les dossiers (cette fonctionnalité est disponible dans l’interface de création des affichages par défaut). Notez aussi que si des dossiers contiennent 5 000 éléments ou moins, les affichages des dossiers n’ont pas à être filtrés à l’aide de colonnes indexées. Pour les dossiers contenant plus de 5 000 éléments, vous pouvez améliorer la performance à l’aide de la navigation par métadonnées et/ou de colonnes indexées, puis en filtrant les affichages de façon à retourner moins de 5 000 éléments.

Envisagez de créer des dossiers dans le cadre d’une solution de routage et de stockage de contenu qui est basée sur les métadonnées. À l’aide de l’organisateur de contenu, vous pouvez configurer des paramètres qui créent automatiquement des dossiers lorsqu’un dossier cible devient d’une taille trop importante ou pour chaque valeur d’une propriété de métadonnées. Pour plus d’informations, voir Routage et stockage de contenu d'entreprise basé sur les métadonnées plus loin dans cet article.

Routage et stockage de contenu d’entreprise basé sur les métadonnées

SharePoint Server 2010 introduit le routage et le stockage de métadonnées à l’aide de l’organisateur de contenu. Avec l’organisateur de contenu, de nouvelles fonctionnalités au niveau du site facilitent pour les administrateurs et les utilisateurs la classification, le routage et le stockage de contenu à l’aide de règles basées sur des métadonnées.

Sur la base des métadonnées d’un document, l’organisateur de contenu peut router un document vers un dossier spécifique ou créer automatiquement un nouveau dossier. Les dossiers peuvent être créés en tant qu’enfants du dossier cible parce que le nombre d’éléments du dossier cible dépasse une limite spécifiée ; de nouveaux dossiers peuvent aussi être créés pour chaque nouvelle valeur d’un champ. Les nouveaux dossiers héritent des paramètres du dossier parent. Ils peuvent aussi avoir des règles supplémentaires qui définissent des paramètres supplémentaires, tels que des autorisations, des métadonnées supplémentaires, des stratégies de rétention et des flux de travail dont les documents placés dans ces dossiers hériteront.

Pour plus d’informations, voir Présentation du stockage et du routage basés sur des métadonnées (SharePoint Server 2010).

Navigation et filtrage de métadonnées est une nouvelle fonctionnalité de SharePoint Server 2010 qui permet aux utilisateurs de filtrer et de rechercher du contenu à l’aide de métadonnées. La fonctionnalité Navigation et filtrage de métadonnées inclut une interface utilisateur simple qui est basée sur le contrôle de hiérarchie d’arborescence SharePoint et qui la combine avec un nouveau contrôle Filtres clés, offrant aux utilisateurs un outil puissant pour la recherche de contenu basée sur les métadonnées.

Les propriétaires de liste peuvent configurer les paramètres de navigation par métadonnées qui promeuvent des champs sur une liste en tant que champs de navigation clés. Les utilisateurs affichant ces listes peuvent aussi filtrer ensuite l’affichage de liste actif pour montrer seulement les éléments avec les valeurs souhaitées dans ces champs.

Les fonctionnalités d’indexation automatique peuvent créer des index de liste automatiquement en fonction des champs promus en tant que champs de navigation pour la liste. L’indexation automatique peut améliorer les résultats des requêtes ainsi que les performances.

Pour plus d’informations sur la façon dont vous pouvez intégrer la navigation par métadonnées dans votre solution de stockage de contenu d’entreprise, voir Vue d’ensemble de la navigation par métadonnées (SharePoint Server 2010).

Affichages de liste

Au cœur de chaque solution de gestion de contenu d’entreprise se trouve la possibilité pour les utilisateurs de rechercher facilement le contenu qu’ils souhaitent trouver. Lorsqu’ils parcourent une bibliothèque ou un dossier, les arborescences ou les affichages de liste offrent aux utilisateurs une interface simple pour naviguer visuellement à travers la taxinomie du stockage de contenu. Dans le même temps, lorsqu’une bibliothèque ou un dossier contient trop d’éléments, la possibilité pour la liste d’effectuer une requête et d’afficher rapidement ses résultats peut nécessiter des ressources système considérables. SharePoint Server 2010 peut optimiser les performances des affichages de liste tout en minimisant la consommation de ressources système à l’aide des propriétés Limitation de ressources. Ces propriétés sont définies pour une application Web dans les paramètres généraux de l’Administration centrale et affectent les ressources allouées aux requêtes et à l’affichage des listes dans cette application Web.

Le fait de configurer votre stockage de façon telle que lorsque vous affichez le contenu d’une bibliothèque ou d’un dossier, le seuil d’affichage de liste n’est pas dépassé, empêche la limitation des ressources et optimise les performances des affichages de liste.

La limitation des ressources comprend les propriétés suivantes qui se rapportent aux performances des affichages de liste :

Propriété Description Valeur par défaut

Seuil d’affichage de liste

Le nombre maximal d’éléments de liste ou de bibliothèque qu’une opération de base de données telle qu’une requête peut traiter en même temps en dehors de la fenêtre de temps quotidienne définie par l’administrateur, au cours de laquelle les requêtes ne sont pas limitées. Il est recommandé de ne pas modifier la valeur de cette propriété.

5 000

Remplacement du modèle objet

Spécifie que les utilisateurs disposant d’une autorisation spéciale peuvent remplacer le Seuil d’affichage de liste par programme pour des requêtes particulières.

Oui

Seuil d’affichage de liste pour les auditeurs et les administrateurs

Le nombre maximal d’éléments de liste ou de bibliothèque qu’une opération de base de données telle qu’une requête peut traiter en même temps lorsqu’elle est effectuée par un auditeur ou un administrateur ayant les autorisations appropriées. Ce paramètre fonctionne en combinaison avec Autoriser le remplacement du modèle objet.

20 000

Seuil de recherche d’affichage de liste

Le nombre maximal de jointures autorisées par requête, telles que celles basées sur des colonnes de recherche, Personne/groupe ou d’état de flux de travail. Si la requête utilise plus de huit jointures, l’opération est bloquée. Ceci ne s’applique pas à des opérations sur un seul élément. Lors de l’utilisation de l’affichage maximal via le modèle objet (en ne spécifiant aucun champ d’affichage), SharePoint retourne jusqu’au huit premières recherches. Il est recommandé de ne pas modifier la valeur de cette propriété.

8

Fenêtre Délai quotidien pour les requêtes volumineuses

Une période de temps pendant laquelle les requêtes volumineuses peuvent être exécutées. La période de temps doit être définie en dehors des heures de travail normales car les requêtes volumineuses peuvent provoquer une charge serveur trop importante.

Désactivé

Ressources supplémentaires

En plus des informations de cet article, les ressources suivantes peuvent vous aider à comprendre et à planifier une solution de stockage de contenu d’entreprise.