企业内容存储规划 (SharePoint Server 2010)

 

适用于: SharePoint Server 2010

上一次修改主题: 2015-03-09

本文介绍如何规划使用 Microsoft SharePoint Server 2010 的企业内容存储解决方案。尽管本文中的示例主要与基于 SharePoint Server 2010 的解决方案相关,但此处提供的说明性指导信息同样适用于 SharePoint Server 2010 和 SharePoint Foundation 2010,除非另有说明。

本主题中的信息和指导旨在介绍企业内容存储概念。本主题中的某些信息来源于其他有关在 Microsoft 执行的性能和容量测试的更详细文档,以及其他提供有关特定概念的详细指导的文章。强烈建议在规划企业内容存储解决方案时使用所有这些资源。有关详细信息及链接,请参阅下文中的其他资源。

本文内容:

  • 了解企业内容存储

  • 典型的大型内容管理方案

  • 存储级别:优点和限制

  • 基于元数据传送和存储企业内容

  • 通过使用元数据来导航和筛选企业内容

  • 列表视图

  • 其他资源

了解企业内容存储

文档管理解决方案不只是提供文档位置。完整的企业级文档管理解决方案可在多个级别解决文档存储问题,包括网站集、网站、库和文件夹内的存储。利用此解决方案,公司可以高效和富有成效地管理数量不断增长的企业文档,并确保可保留文档生命周期各个阶段的文档版本,以供参考或用于法律方面的用途。

SharePoint Server 2010 支持大容量文档存储。一个文档库可包含数百万个文档。但是,根据内容的使用方式,包含许多文档的站点的性能可能会降低。本文提供的说明性指导可帮助您设计大型内容管理解决方案,可根据企业的要求进行扩展,同时向解决方案的用户提供在其中创建和使用文档的高性能环境。

做出关于网站集容量、网站容量和库容量的决策时,不仅应考虑到环境的物理存储限制,还应考虑内容用途以及用户的查看模式。例如,当用户在包含数千个文档的文档库中查看或查询一组文档时,如果网站没有正确配置,性能可能会降低。或者,如果服务级别协议要求每天备份两次内容,而内容集合过大时,服务可能无法令人满意地运行。

典型的大型内容管理方案

通常,大型内容管理方案是以下方案之一的变体:

  • 大型创作环境

  • 大型内容存档

  • 极大型内容存档

此处提供的方案说明旨在阐明大型解决方案的含义,并提供有望反映您的内容管理目标的高级示例。当然,这些说明对于特定方案无法面面俱到。特定方案可能有几十个甚至几百个独特之处不在本文的讨论范围之内。

大型创作环境

在大型创作环境中,例如,一个网站包含的库可能允许用户在其中编辑 50,000 个或更多个文档,而这些文档位于 500 个或更多个文件夹中。由于启用了版本控制,通常每个文档都存在多个版本。文档频繁地签入签出,使用工作流控制它们的生命周期。此类网站的典型数据库含有大约 150 GB 的数据。库设置可用于限制所保存版本的数量,以减少数据库消耗。(注意文档的每个版本都单独存储在数据库中。)通常,在大型创作环境中,80% 的网站用户是有权访问文档主要版本和次要版本的作者,而 20% 的网站用户只有只读权限,只能查看内容的主要版本。

大型创作环境网站可以基于 SharePoint Server 2010 文档中心网站模板,该模板包含一个专为大型创作优化的大型文档库。

大型内容存档

大型内容存档是用户可在其中查看文档或上载新文档的文档库。网站中很少进行创作或不进行创作。大型内容存档方案主要有两种:知识库和记录管理。

在知识库网站中,多数文档只有一个版本,因此网站可轻松扩展到保存数百万个文档(建议最多 30,000,000 个文档)。内容通常存储在 1TB 大小的一个数据库中。在典型方案(例如企业的技术支持中心)中,可能有 10,000 个用户访问内容,主要目的是阅读内容。其中一部分用户(3,000 或 4,000)可能向网站上载新内容。知识库网站可以基于文档中心网站模板。

另一种大型内容存档是记录中心,基于记录中心网站模板。建议对包含一百万个或更多文档的网站使用记录中心网站模板。该网站模板包含的功能可用于管理记录的保留和处置(用作组织执行的活动或事务证据的文档,必须保留一段时间)。与知识库网站类似,记录中心包含的每个文档只有一个版本,通常可保存数百万个文档。向记录中心提交内容的用户要比查看或阅读内容的用户多。

极大型内容存档

极大型内容存档可用作参考库或内容库。为了提供比大型内容存档更大的存档规模,极大型内容存档可包含分布在多个网站集的 50,000,000 个或更多文档。各个网站集中的内容可以用 BLOB(二进制大型对象)数据的形式存储在多个内容数据库中,或通过远程 BLOB 存储 (RBS) 进行存储。利用远程 BLOB 存储,可将数据存储在 SQL Server 之外,从而可以采用成本较低的存储选项并减小内容数据库大小。SharePoint 的 SharePoint Search 或 FAST Search 用于跨多个网站集查找内容。

存储级别:内容存储的优点和注意事项

网站集

网站集是具有相同所有者并共享管理设置的网站的集合。每个网站集都包含一个首要网站,并且可以包含一个或多个子网站。网站集通常具有共享导航结构。

网站集中的网站通常按用途关联。为了使解决方案的可用性最大化,将所有相关数据和内容存储在一个网站集中。这样做有以下好处:

  • 网站集中管理的内容类型和列可以跨网站集中的多个网站共享。Managed Metadata Service 可用于跨多个网站集组合内容类型和列定义。

  • 网站集中托管的信息管理策略可用于网站集中所有网站的内容。

  • 可以跨多个网站集的内容使用搜索。

  • 一些视图会列出一个网站集中多个网站的文档(例如,枚举出跨网站集分配给一个用户的所有任务的视图)。此外,开发人员可在一个网站集中创建跨网站的数据库查询,但不支持跨多个网站集的跨网站查询。

  • 内容配额和其他配额只能在网站集级别进行管理。

当您规划如何跨一个或多个网站集分配内容时,应考虑以下限制:

  • 网站集中的所有网站都共享相同的后端资源。具体来讲,网站集中的所有内容都必须存储在同一个内容数据库中。因此,数据库操作(例如备份和还原内容)的性能将取决于网站集的内容量、数据库的大小、承载数据库的服务器速度以及其他因素。根据内容量和数据库配置的不同,您可能需要将一个网站集分割成多个网站集,以满足针对备份和恢复的服务级别协议、吞吐量或其他要求。本文不提供有关如何管理数据库大小和性能的说明性指导。

  • 要特别注意,将非常活跃的网站放在单独的网站集中。例如,Internet 上允许匿名浏览的知识库网站可能会生成大量数据库活动。如果其他网站使用同一个数据库,则其性能很可能会受到影响。通过将知识库网站及其数据库放在一个单独的网站集中,您可以释放其他网站的资源,从而这些网站不必再与之争用数据库资源。

备注

SharePoint Foundation 和 SharePoint Server 2010 包括的多个功能可减少要求 IT 部门还原内容的需求。回收站和网站集回收站提供了双重安全机制,用于还原意外删除的项目。文档版本控制也提供了一个针对各种情况的安全网:如果文档丢失,至少其早期版本可用。为了更好地确保早期版本的可用性,管理员可去掉作者的“删除版本”权限;这样有助于在不必从数据库中还原的情况下,保证早期版本的内容可用。而。

网站

网站是 SharePoint Server 2010 和 SharePoint Foundation 中组织相关内容的主要方式。

在同一网站中存储内容有以下好处:

  • 更轻松地创建页面,显示同一网站中多个库和列表的视图。

  • 您可以使用文档中心网站模板来创建专为创建和使用许多文档而优化的网站。

  • 网站导航用户界面经过优化,可轻松查找和定位同一网站中的库。

  • 您可以定义一组内容类型和网站栏,以便在网站中使用。

在同一个库中存储内容可带来以下好处:

  • 用户在单个库中添加新文档或查找现有文档更容易。

  • 许多文档管理设置(例如权限、版本控制和审批)应用于库级别。

  • 使用用户界面创建的视图绑定到特定库。

  • 信息管理策略(例如内容审计和保留设置)可应用于库。对于某些库,只能使用保留策略。

当您规划如何将内容组织到同一个库中时,请考虑以下限制:

  • 诸如所需签出或版本控制等设置在文档库级别指定。如果想要为其他文档指定不同的设置,必须将这些文档放置在具有必要特定设置的其他库中。

  • 包含多个仅用于一种内容类型的列的视图可能不实用,因为不会为其他内容类型的项目显示任何元数据值。

  • 当查看的项目数超过 5,000 个项目(默认)的列表视图阈值时,视图性能会受到限制。此外,查询超过列表视图阈值时也会被阻止。请将库中的内容组织到包含 5,000 个或更少项目的文件夹中,或创建可利用元数据导航和索引列返回多组 5,000 个项目或更少项目的视图。

文件夹

文件夹是库中内容的命名细分部分,与文件系统中的文件夹类似。文件夹的主要用途是在逻辑上组织内容以匹配预期的库功能。例如,如果某个库用于提供产品规范,则库中的文件夹集合可以针对产品的各个功能区域命名或针对编写产品规范的各个团队成员命名。

分隔多个文件夹(每个文件夹都包含 5,000 个或更少项目,5,000 是列表视图默认阈值)中的内容时,文件夹上的视图可正常显示。请注意,要利用这一点,文件夹内的可用视图必须配置为仅显示文件夹内的项目(此功能在默认视图创建界面中可用)。还要注意,如果文件夹包含 5,000 个或更少项目,则不必使用索引列对文件夹中的视图进行筛选。对于包含多于 5,000 个项目的文件夹,可以使用元数据导航和/或索引列来提高性能,然后筛选视图使其返回少于 5,000 个项目。

将创建文件夹视为基于元数据的内容传送和存储解决方案的一部分。通过使用内容管理器,可以将设置配置为在目标文件夹过大时自动创建文件夹,或自动为元数据属性的每个值创建文件夹。有关详细信息,请参阅下文中的基于元数据传送和存储企业内容。

基于元数据传送和存储企业内容

SharePoint Server 2010 通过使用内容管理器引入了元数据传送和存储。通过使用内容管理器,新的网站级别功能使管理员和用户能够使用基于元数据的规则,更轻松地对内容进行分类、传送和存储。

根据文档的元数据,内容管理器可将文档传送到指定文件夹或自动创建新文件夹。文件夹可创建为目标文件夹的子文件夹,因为目标文件夹中的项目数超过指定限值,或者可为字段中的每个新值创建新文件夹。新文件夹将从父文件夹继承设置。然后,新文件夹也可以拥有其他规则,用于定义诸如权限、其他元数据、保留策略以及其中的文档将会继承的工作流等其他参数。

有关详细信息,请参阅基于元数据的路由和存储概述 (SharePoint Server 2010)

通过使用元数据来导航和筛选企业内容

元数据导航和筛选是 SharePoint Server 2010 中的一项新功能,该功能允许用户使用元数据筛选和查找内容。元数据导航和筛选功能包含一个基于 SharePoint 树视图层次结构控件构建的简单用户界面,并将其与新的密钥筛选器 控件结合使用,为用户提供一个基于元数据查找内容的强大工具。

列表所有者可配置元数据导航设置,将列表上的字段提升为密钥导航字段。这样,查看这些列表的用户即可进一步筛选当前列表视图,以便仅显示那些字段中具有所需值的项目。

自动索引功能可根据提升为列表的导航字段的字段自动创建列表索引。自动索引可改善查询结果并提高性能。

有关如何将元数据导航集成到企业内容存储解决方案的详细信息,请参阅元数据导航概述 (SharePoint Server 2010)

列表视图

每个企业内容管理解决方案的核心是赋予用户轻松搜索和找到所需内容的能力。在库或文件夹中移动时,树视图和列表视图提供了一个简单的用户界面,用户可利用该界面直观地在内容存储分类中导航。同时,如果库或文件夹包含过多项目,列表的查询和快速显示结果的能力可能需要相当多的系统资源。SharePoint Server 2010 可将列表视图性能最大化,同时使用资源限制将系统资源消耗降至最低限度。Web 应用程序的资源限制属性在管理中心的常规设置中进行设置,可影响该 Web 应用程序内分配给查询和显示列表的资源。

以适当的方式配置存储,以便在查看库或文件夹的内容时不会超过列表视图阈值,这样可防止资源限制,并使列表视图性能最大化。

资源限制包括以下与列表视图性能相关的属性:

属性 说明 默认值

列表视图阈值

在管理员设置的不限制查询的每日时间段之外,数据库操作(例如查询)可一次处理的列表或库项目的最大数。建议不要更改此属性设置。

5000

对象模型覆盖

指定用户授予的特殊权限可以通过编程方式覆盖特定查询的列表视图阈值。

可以

用于审核员和管理员的列表视图阈值

拥有适当权限的审核员或管理员所执行的数据库操作(例如查询)可一次处理的列表或库项目的最大数。此设置与“允许对象模型覆盖”共同起作用。

20,000

列表视图查询阈值

每次查询(例如基于查询、人员/组或工作流状态列的查询)允许的联接最大数。如果查询使用的联接数大于 8,操作将被阻止。这不适用于单项目操作。当通过 OM(不指定任何视图字段)使用最大化视图时,SharePoint 将最多返回前 8 个查询。建议不要更改此属性设置。

8

大型查询的每日时间段

可执行大型查询的时间段。时间段应设置在正常工作时间之外,因为大型查询可能产生过多服务器负载。

已禁用

其他资源

除了本文中的信息,以下资源可帮助您了解和规划企业内容存储解决方案。