规划企业内容存储

本文包含的信息可帮助解决方案规划人员和设计人员正确规划和配置基于 Microsoft Office SharePoint Server 2007 的大规模企业内容管理解决方案,使其在提供网站用户所需的功能的同时顺利运行。Office SharePoint Server 2007 支持高容量文档存储;一个文档库最多可以包含 500 万个文档。但是,根据内容使用方式的不同,如果网站包含大量文档,则其性能可能会有所降低。本文中提供的说明性指导可帮助您在设计出切合企业需要的大规模内容管理解决方案的同时,为您的解决方案用户提供可在其中创建和使用文档的良好运行环境。

在决定 Office SharePoint Server 2007 中的网站集、网站和库的容量时,不仅要考虑到您的 Office SharePoint Server 2007 环境的物理存储条件,还应考虑用户的内容使用情况和查看模式。例如,如果未正确配置网站,那么在用户查看或查询包含数千个文档的文档库中的一组文档时,则网站的性能就会降低。或者,如果内容过多,则当服务级别协议要求一天备份两次内容时,服务运行的效果可能不会令人满意。您可以使用本文讨论的方法提供所需的内容管理功能,同时使性能保持在可接受的范围内。

本主题中将讨论四个级别的内容存储:

  • 网站集

  • 网站

  • 文件夹

对于每个级别的存储,本文分别介绍组织该级别内容的好处,讨论性能将如何随存储文档数的增加而降低,并提供在存在大量内容时如何提高性能的建议。

本文内容:

  • 典型的大规模内容管理方案

  • 网站集:内容存储的优点和限制

  • 网站:内容存储的优点和限制

  • 库:内容存储的优点和限制

  • 文件夹:内容存储的优点和注意事项

  • 推荐做法摘要

备注

尽管本文中的示例主要与基于 Office SharePoint Server 2007 的解决方案相关,但此处提供的说明性指导信息同时适用于 Office SharePoint Server 2007 和 Windows SharePoint Services 3.0。

典型的大规模内容管理方案

通常,大规模内容管理方案是下列任一方案的变化形式:

  • 大规模创作环境

  • 大规模内容存档

  • 巨大规模内容存档

此处提供的方案说明意在阐明大规模解决方案的含义,并提供可望反映您的内容管理目标的示例。

大规模创作环境

在大规模创作环境中,一个网站可以包含这样一个库:用户在其中可主动编辑 500 个或更多文件夹中的 50,000 个或更多文档。版本管理已启用,通常每个文档存在 10 个或更多的以前版本。文档频繁签入和签出,并使用工作流控制其生命周期。可能会使用 20 种或更多的内容类型。该类型网站的典型数据库大约包含 150 GB 的数据。(请注意:文档的各个版本在数据库中是单独存储的。)通常,在大规模创作环境中,80% 的网站用户是能够访问文档的主要和次要版本的作者,20% 的网站用户则只有只读权限,只能查看内容的主要版本。

大规模创作环境网站可以基于 Office SharePoint Server 2007 文档中心网站模板,该模板包含单个大型文档库,并针对大规模创作过程进行了优化。请参阅文档中心网站。

大规模内容存档

大规模存档是一个文档存储库,用户可在其中查看文档或上载新文档。几乎或根本不在此网站中进行创作。主要有两种大规模存档方案:知识库和记录管理。

在知识库网站中,大多数文档只有一个版本,所以网站可以扩展以轻松容纳 1,000,000 个或更多文档。内容通常存储在一个最大可达 400 GB 的数据库中。在典型的方案(例如企业的技术支持中心)中,可能有 10,000 名用户访问内容,主要是阅读内容。一小部分用户(3,000–4,000 名)可将新内容上载到该网站。知识库网站可以基于文档中心网站模板。

另一种大规模存档是基于记录中心网站模板的记录中心。您可以使用此网站模板提供的功能来管理记录保留和处置(作为组织所执行活动或事务的凭据的文档必须保留一段时间)。与知识库网站类似,记录中心也包含每个文档的单个版本,且通常可容纳 1,000,000 个或更多文档。更多的用户是向记录中心提交内容,而不是查看或阅读内容。

巨大规模内容存档

如果自定义了某网站的用户界面以移除相当耗费资源的用户界面操作(例如复杂的查看查询),则可将巨大规模内容存档用作引用库或内容库。巨大规模存档最多可以存档分布在 5,000 个或更多文件夹中的 10,000,000 个文档。数据库可增大到 3 TB 以上。

在巨大规模存档中,用户(50,000 名或更多)主要是通过搜索来浏览内容,并通过使用自定义提交表单来提交内容。

网站集:内容存储的优点和限制

网站集是由同一所有者拥有且共享管理设置的一组网站。每个网站集都包含一个首要网站,并且可以包含一个或多个子网站。一个网站集通常共享一个导航结构。

在同一网站集中存储内容的优点

网站集中的网站通常根据用途相互关联。若要最大限度提高解决方案的可用性,应将所有相关的数据和内容存储在单个网站集中。这样做的优点包括:

  • 网站集中管理的内容类型和列可以在该网站集的所有网站之间共享。相反,没有任何自动机制可以实现在多个网站集之间传播内容类型和列定义。

  • 网站集中管理的信息管理策略可用于网站集中所有网站的内容。

  • Office SharePoint Server 2007 可自动更新指向网站集中已重命名或移动的文件的链接,以反映其新的名称或位置。但不会更新指向其他网站集中的文档的链接。

  • 如果网站集位于运行 Windows SharePoint Services 3.0 的服务器上,则只能搜索该网站集中的内容。如果网站集位于运行 Office SharePoint Server 2007 的服务器上,则可以搜索多个网站集的内容。

  • Windows SharePoint Services 3.0 和 Office SharePoint Server 2007 中的某些视图列出了单个网站集内多个网站中的文档(例如,列出整个网站集中分配给用户的所有任务的视图)。同时,开发人员可以在网站集中创建跨网站数据库查询,但不支持在多个网站集之间进行跨网站查询。

  • 内容配额和其他配额只能在网站集级别进行管理。

在同一网站集中存储内容的限制

当规划如何在一个或多个网站集中分配内容时,应牢记下列限制:

  • 在网站集中为任意网站创建太多的子网站可能会影响其性能和可用性。任一网站的子网站数不能超过 2,000 个。

  • 网站集中的所有网站都共享相同的后端资源。特别是网站集中的所有内容都必须存储在同一个内容数据库中。因此,数据库操作(例如备份和还原内容)的性能将取决于整个网站集中的内容量、数据库的大小、承载数据库的服务器速度以及其他因素。根据内容量和数据库配置的不同,您可能需要将一个网站集分割成多个网站集,以满足针对备份和恢复的服务级别协议、吞吐量或其他要求。本文不提供有关管理数据库大小和性能的说明性指导。有关容量规划的详细信息,请参阅性能和容量规划 (Office SharePoint Server)

  • 尤其是要将非常活跃的网站放在单独的网站集中。例如,允许匿名浏览的 Internet 知识库网站可能会生成大量数据库活动。如果其他网站使用这同一个数据库,则其性能很可能会受到影响。通过将知识库网站及其数据库放在一个单独的网站集中,您可以释放资源以供其他网站使用,从而不必再与之争用数据库资源。

请注意,Windows SharePoint Services 3.0 和 Office SharePoint Server 2007 有很多功能,使您的 IT 部门无需还原内容。“回收站”和“网站集回收站”可提供一个双安全机制,以还原无意中删除的项目。文档版本控制还可以为丢失的文档提供一个安全网,这是因为其先前版本仍然可用。为进一步确保以前版本的可用性,管理员可以取消作者的删除版本权限;这有助于保证内容的以前版本都可用,而无需从数据库中恢复它们。

网站:内容存储的优点和限制

网站是组织 Office SharePoint Server 2007 和 Windows SharePoint Services 3.0 中相关内容的主要方式。

在同一个网站中存储内容的优点

  • 当多个库和列表位于同一网站时,可以更方便地创建页面来显示这些库和列表的视图。

  • 网站导航用户界面经过优化,可方便地查找并导航到同一网站内的库。

  • 您可以在网站级别定义权限并将其分配给组。

  • 您可以定义一组内容类型和网站栏以便在网站中使用。

文档中心网站

Office SharePoint Server 2007 包括一个文档中心网站模板。使用此模板可创建已进行优化、可用于创建和使用大量文档的网站。

为实现文档管理最佳实践,基于文档中心网站模板的网站默认情况下会启用推荐的文档管理功能,其中包括:

  • 可帮助作者查找内容的导航功能。

  • 启用了主要/次要版本控制。

  • 必需的文档签入和签出。

  • 启用了多种内容类型。

  • 相关文档 Web 部件,可生成由当前用户签出、创建或最后修改的文档的个性化视图。您可以将该 Web 部件配置为使用多个条件。

  • 即将开始的任务 Web 部件,可生成分配给当前用户的文档相关任务的个性化视图。

列索引 技术可确保视图或查询返回的项目数不超过建议的 2,000 个。使用下表可确定相关文档 Web 部件支持的每个查询的正确索引列:

如果您将相关文档 Web 部件配置为…… 则在共享文档库中索引以下列:

包含上一次由我修改的文档

修改者

包含由我创建的文档

创建者

包含由我签出的文档

签出者

在对列编制索引以提高相关文档 Web 部件性能的同时,请确保在大规模文档管理环境中配置 Web 部件时未选中“显示整个网站集中的项目”复选框。

在同一个网站中存储内容的限制

  • 如果单个网站中包含 2,000 个以上的库和列表,则网站性能会降低。

  • 可用性测试显示,如果网站导航结构中包含 50 个以上的列表和库,将会使得通过用户界面来导航内容变得更为困难。

库:内容存储的优点和限制

文档库 是网站中的一个位置,其中包含一个或多个内容类型的文件。文档库用于管理和存储相关的文档,并允许用户创建相应类型的新文档。

在同一个库中存储内容的优点

  • 用户可以更方便地在单个库中添加新文档或查找现有文档。

  • 可在库级别应用许多文档管理设置(例如权限、内容版本控制和审批)。

  • 可将通过用户界面创建的视图绑定到特定的库。

  • 信息管理策略(例如内容审核和保留设置)可应用于库。

在同一个库中存储内容的限制

  • 库的最大建议容量为可存储 10,000,000 个文档。

  • 若要将特殊的文档管理设置应用于内容(例如,必需的签出或版本控制),则必须将内容存储在单独的库中。

  • 如果在一个库中使用多个内容类型,并且每种内容类型都有一个或多个只适用于此内容类型的元数据列,则视图可能会变得令人费解。为解决此问题,您可以将每种内容类型与单独的库相关联。

  • 当查看的项目数超过 2,000 时,内容视图的性能会下降。对此限制的补救措施是将库中的内容组织到分别包含 2,000 个或更少项目的文件夹中,或创建利用索引列的视图,使返回的项目数不超过 2,000 个(请参阅下文有关在视图中使用索引列的讨论)。

备注

网站中的所有网页内容都存储在该网站的单个页库中,该库包含该网站的所有 Web 内容页。每个视图或查询推荐的 2,000 个或更少项目的限制除了适用于文档库外,也适用于页库。

使用索引列以提高查看性能

如上所述,如果显示的项目数超过 2,000,则视图的性能会下降。限制视图中显示的项目数的一个有用办法是,对视图中使用的某一列编制索引,然后基于此栏来筛选视图,以使显示的项目数不超过 2,000 个。(索引列 是 Office SharePoint Server 2007 维护的一种记录,以提高与视图相关的查询的效率。)

例如,如果不太可能在任何一个七天期限内修改库中的 2,000 多个项目,则您可以对库中的“修改时间”列编制索引,然后筛选视图,以便只显示在过去 7 天内发生更改的项目。(为此,请指定“修改时间”列“小于”今天“- 7”。)再例如,如果每个作者将创建的项目可能少于 2,000 个,则可以对“创建者”列编制索引,然后筛选视图,以便作者只看到他们创建的文档。(为此,请指定“创建者”列“等于”Me。)

以下类型的列类型可被编制索引并用来筛选视图:

  • 单行文本

  • 多行文本

  • 数值

  • 货币

  • 选择

  • 日期和时间

  • 查找

  • 是/否

  • 个人或组

  • 计算值

下面是在创建按索引列筛选的视图过程中的其他注意事项:

  • 一个视图中只能使用一个索引列。

  • 在使用索引列筛选视图时,不要使用“或者”创建筛选器来提供多个条件。

  • 使用“项目限制”功能来修改视图并不能提高视图的性能。

备注

如果用户尝试创建的视图可利用索引列,Office SharePoint Server 2007 将显示一条推荐此方法的警告消息。

文件夹:内容存储的优点和注意事项

文件夹 是库中内容的命名分支,与文件系统中的文件夹类似。文件夹主要用来组织内容以实现库的预期功能。例如,如果库的作用是提供产品说明,则库中的文件夹可以针对产品中的各个功能区域进行命名,或针对编写产品说明的每个工作组成员进行命名。

文件夹可用于提高库的性能。通过将内容分割到多个文件夹(使每个文件夹包含 2,000 个或更少项目),文件夹视图将运行良好。请注意,为了充分利用这一点,文件夹内的视图必须配置为仅显示文件夹中的项目(默认的 Office SharePoint Server 2007 视图创建界面中提供有此功能)。另外还要注意,如果文件夹包含的项目数不超过 2,000 个,则不需要使用索引列筛选文件夹中的视图。

推荐做法摘要

下面是当存储大量内容时,用于改进每个存储级别的性能的推荐做法摘要:

级别 性能限制

网站集

建议将任一网站的子网站数限制为 2,000 个。

整个网站集使用同一内容数据库。这可能会影响备份和还原之类操作的性能。

网站

建议限制为 2,000 个库和列表。

建议限制为 10,000,000 个文档。

建议将每个视图限制为最多包含 2,000 个项目。

文件夹

建议将每个文件夹限制为最多包含 2,000 个项目。

下载此书籍

本主题包含在以下可下载书籍内,以方便您阅读和打印:

有关可下载书籍的完整列表,请参阅 Office SharePoint Server 2007 的可下载书籍

另请参见

概念

性能和容量规划 (Office SharePoint Server)
规划记录管理