Планирование хранения корпоративного контента (SharePoint Server 2010)

 

Применимо к: SharePoint Server 2010

Последнее изменение раздела: 2015-03-09

В этой статье описывается порядок планирования решения для хранения корпоративного контента, использующего Microsoft SharePoint Server 2010. Несмотря на то, что приведенные в этой статье примеры относятся в основном к решениям на базе SharePoint Server 2010, приведенные в ней рекомендации распространяются и на SharePoint Server 2010, и на SharePoint Foundation 2010, если явно не указано иное.

Сведения и рекомендации, приведенные в этом разделе, позволяют ознакомиться с основными понятиями хранения корпоративного контента. Некоторые сведения в этом разделе выбраны из более подробных документов, посвященных тестам производительности и емкости, которые были проведены корпорацией Майкрософт, а также из статей, в которых представлено более подробное описание отдельных понятий. Настоятельно рекомендуется использовать все эти ресурсы при планировании решения для хранения корпоративного контента. Дополнительные сведения и ссылки см. в разделе Дополнительные ресурсы этой статьи.

Содержание:

  • Общие сведения о хранении корпоративного контента

  • Типовые сценарии управления большими объемами контента

  • Уровни хранения: преимущества и ограничения

  • Маршрутизация и хранение корпоративного контента на основе метаданных

  • Навигация и фильтрация корпоративного контента на основе метаданных

  • Представления списка

  • Дополнительные ресурсы

Общие сведения о хранении корпоративного контента

Решение управления документами предоставляет значительно более широкие возможности, нежели простое размещение документов. Комплексное решение управления документами корпоративного уровня обеспечивает многоуровневое хранение документов, в том числе хранение в семействах сайтов, на сайтах, в библиотеках и папках. Такое решение также обеспечивает эффективное управление увеличивающимся объемом корпоративных документов и позволяет хранить версии документов на всех стадиях жизненного цикла с возможностью их извлечения для справки или по юридическим требованиям.

SharePoint Server 2010 поддерживает системы хранения документов высокой емкости. Библиотека документов может содержать миллионы документов. Тем не менее, в зависимости от используемого контента, производительность сайтов, содержащих множество документов, может снижаться. В этой статье приведены рекомендации по разработке решений по управлению большими объемами контента, которые поддерживают горизонтальное масштабирование в соответствии с изменениями требований организации и позволяют создать высокопроизводительную среду для создания документов и работы с ними.

Решения, принимаемые относительно размеров семейств сайтов, сайтов и библиотек, должны учитывать не только физические ограничения на хранение для существующей среды, но и модели использования и просмотра контента пользователями. Например, если пользователи просматривают или запрашивают набор документов в библиотеке, содержащей тысячи документов, ненадлежащая настройка конфигурации сайта может привести к снижению производительности. Кроме того, если в соответствии с соглашением об уровне обслуживания требуется резервное копирование контента дважды в день, возможна неудовлетворительная работа службы при обработке слишком большого набора контента.

Типовые сценарии управления большими объемами контента

Как правило, сценарии управления большими объемами контента могут быть следующими:

  • Крупномасштабная среда разработки

  • Крупномасштабный архив контента

  • Сверхкрупный архив контента

Описание сценариев в этой статье ставит своей целью разъяснение понятия крупномасштабных решений и представление высокоуровневых примеров, которые, как кажется, отражают цели управления контентом. Естественно, такие описания не могут охватить все аспекты, характерные для конкретных сценариев. Каждый сценарий может обладать десятками и даже сотнями уникальных аспектов, которые выходят за рамки данной статьи.

Крупномасштабная среда разработки

В крупномасштабной среде разработки, например, сайт может содержать библиотеку, в которой пользователи активно изменяют свыше 50 000 документов, хранящихся в более чем 500 папках. Управление версиями включено, и обычно для каждого документа существует несколько версий. Документы часто извлекаются, а для контроля их жизненных циклов применяются рабочие процессы. Обычная база данных для этого типа сайта содержит около 150 гигабайт (ГБ) данных. Чтобы ограничить число сохраняемых версий и нагрузку на базу данных, могут использоваться параметры библиотеки. (Следует упомянуть, что каждая версия документа хранится в базе данных отдельно.) Как правило, в крупномасштабной среде разработки 80% пользователей сайтов являются авторами, которые имеют доступ к основным и вспомогательным версиями документов, в то время как 20% пользователей сайтов имеют разрешения только для чтения и могут только просматривать основные версии контента.

Крупномасштабная среда разработки может быть основана на шаблоне сайта центра разработки SharePoint Server 2010, который содержит одну большую библиотеку документов и который оптимизирован для крупномасштабной разработки.

Крупномасштабный архив контента

Крупномасштабный архив контента представляет собой хранилище документов, в котором пользователи либо просматривают документы, либо отправляют новые. На сайте выполняется незначительное число операций разработки, или они не выполняются совсем. Существует два основных сценария крупномасштабного архива контента: база знаний и управление записями.

На сайте базы знаний присутствует только одна версия большинства документов, поэтому его можно легко масштабировать для хранения миллионов документов (рекомендуемый максимум — 30 миллионов документов). Контент, как правило, хранится в отдельной базе данных размером 1 ТБ. В типовом сценарии это может быть корпоративный центр технической поддержки, в котором 10 000 пользователей могут обращаться к контенту преимущественно для чтения. Подмножество пользователей (3000–4000) загружают контент на сайт. Сайт базы знаний может основываться на шаблоне сайта центра документов.

Другой тип крупномасштабного архива — центр записей, основанный на шаблоне сайта центра записей. Использование шаблона сайта центра записей рекомендуется для сайтов, содержащих более миллиона документов. Этот шаблон сайта содержит функции для управления хранением и удалением записей (документами, которые служат подтверждением действий или операций, выполненных организацией и которые должны храниться в течение некоторого времени). Подобно сайту базы знаний, центр записей содержит одну версию каждого документа и, как правило, может содержать миллионы и более документов. Контент в центр записей отправляют намного больше пользователей, чем просматривают и читают его.

Сверхкрупный архив контента

Сверхкрупный архив контента может использоваться в качестве справочной библиотеки или хранилища контента. Чтобы обеспечить масштабирование сверх размеров крупномасштабного архива контента, сверхкрупный архив может содержать более 50 миллионов документов, распределенных по нескольким семействам сайтов. Контент в каждом семействе сайтов может храниться в виде больших двоичных объектов в нескольких базах данных контента, а также с применением удаленного хранилища больших двоичных объектов (RBS). Применение такого удаленного хранилища позволяет хранить данные вне SQL Server, сокращая тем самым стоимость решения хранения и размер базы данных контента. Для поиска контента по нескольким семействам сайтов используются поиск SharePoint или FAST Search для SharePoint.

Уровни хранения: преимущества и ограничения хранения контента

Семейства сайтов

Семейство сайтов — это набор веб-сайтов с единым владельцем и общими параметрами администрирования. Каждое семейство сайтов содержит веб-сайт верхнего уровня и может содержать один или более дочерних сайтов. Как правило, семейство сайтов имеет общую структуру навигации.

Сайты в семействе сайтов обычно имеют общее назначение. Чтобы сделать использование решения максимально удобным, рекомендуется хранить все связанные данные и контент в одном семействе сайтов. При этом можно получить следующие преимущества:

  • Типы контента и столбцы, управляемые в семействе сайтов, можно будет совместно использовать на всех сайтах в семействе сайтов. Для объединения типов контента и определений столбцов в нескольких семействах сайтов может использоваться служба управляемых метаданных.

  • Политики управления информацией, поддерживаемые в семействе сайтов, могут быть доступны контенту на всех сайтах семейства сайтов.

  • Поиск может осуществляться по контенту нескольких семейств сайтов.

  • В некоторых представлениях выводится список документов с нескольких сайтов в одном семействе сайтов (например, представление с перечислением всех задач, назначенных пользователю в семействе сайтов). Кроме того, разработчики могут создавать запросы к базам данных сайтов в семействе сайтов, но запросы к семействам сайтов не поддерживаются в масштабе нескольких семейств сайтов.

  • Управление квотами контента и другими квотами возможно только на уровне семейства сайтов.

При планировании способов распределения контента по одному или нескольким семействам сайтов необходимо учитывать следующие ограничения:

  • Все сайты в семействе сайтов используют общие серверные ресурсы. В частности, весь контент в семействе сайтов должен храниться в одной базе данных контента. По этой причине производительность операций с базами данных, таких как резервное копирование и восстановление контента, будет зависеть от объема контента всего семейства сайтов, размера базы данных, скорости работы серверов с базой данных и других факторов. В зависимости от объема контента и конфигурации базы данных может возникнуть необходимость разделения семейства сайтов на несколько семейств, чтобы отвечать условиям соглашений об уровне обслуживания в отношении резервного копирования и восстановления, пропускной способности и других требований. В рамки этой статьи не входят рекомендации по управлению размером и производительностью баз данных.

  • В частности, сайты с высоким уровнем активности пользователей следует хранить в отдельных семействах сайтов. Например, сайт базы знаний в Интернете, допускающий анонимный просмотр, может быть сопряжен с высокой активностью базы данных. Если другие сайты используют эту же базу данных, то их производительность может быть низкой. Помещение сайта базы знаний в отдельное семейство сайтов с собственной базой данных позволит высвободить ресурсы для других сайтов, которым более не придется конкурировать с сайтом базы знаний при использовании ресурсов базы данных.

Примечание

SharePoint Foundation и SharePoint Server 2010 поддерживают несколько компонентов, позволяющих сократить необходимость восстановления контента ИТ-отделом. Корзина и корзина семейства сайтов обеспечивают двойной механизм защиты для восстановления случайно удаленных элементов. Управление версиями документов также служит страховкой при потере документов, предыдущие версии которых будут доступны. Чтобы дополнительно гарантировать доступность предыдущих версий, администратор может исключить разрешение на удаление версий из разрешений автора; это поможет гарантировать наличие предыдущих версий контента без необходимости их восстановления из базы данных.

Сайты

Веб-сайт — это основной способ организации связанного контента в SharePoint Server 2010 и SharePoint Foundation.

Хранение контента на одном сайте имеет следующие преимущества:

  • Размещение библиотек и списков на одном сайте делает создание страниц с представлениями нескольких библиотек и списков проще.

  • Можно использовать шаблон сайта центра документов для создания сайта, который оптимизирован для создания и использования большого числа документов.

  • Оптимизированный пользовательский интерфейс для навигации по сайтам упрощает поиск и переход по библиотекам в одном сайте.

  • Возможность определения набора типов контента и столбцов сайта на сайте.

Библиотеки

Хранение контента в одной библиотеке имеет следующие преимущества:

  • Пользователям проще добавлять новые документы и искать существующие в одной библиотеке.

  • Множество параметров управления документами, таких как разрешения, управление версиями контента и утверждение, применяются на уровне библиотеки.

  • Представления, созданные при помощи пользовательского интерфейса, привязаны к определенной библиотеке.

  • Политики управления информацией, такие как параметры аудита и хранения контента, можно применить к библиотеке. Некоторые библиотеки поддерживают только политики хранения.

При планировании организации контента в одной библиотеке учитывайте следующие ограничения:

  • Параметры, в том числе обязательное извлечение или управление версиями, задаются на уровне библиотеки документов. Чтобы задать другие параметры для других документов, необходимо переместить эти документы в другую библиотеку и задать необходимые параметры.

  • Представления, содержащие столбцы, которые используются только для одного типа контента, могут быть бесполезны, поскольку для элементов или других типов контента не будут отображаться значения метаданных.

  • Производительность представления снижается, если число просматриваемых элементов превышает установленное для представления списка ограничение в 5000 элементов (по умолчанию). Кроме того, не выполняются запросы, превышающие заданное пороговое значение для представления списка. Рекомендуется организовывать контент библиотеки в папки, содержащие не более 5000 элементов, или создавать представления, которые используют преимущества навигации на основе метаданных и индексированных столбцов для возврата наборов, содержащих не более 5000 элементов.

Папки

Папка служит для разделения контента на части по именам подобно тому, как это делается в файловой системе. Основной задачей папок является логическая организация контента для соответствия предполагаемым функциональным возможностям библиотеки. Например, если библиотека предназначена для предоставления спецификаций продукта, набору папок в библиотеке можно присвоить имя для каждой области функции продукта или для каждого члена группы, который разрабатывает спецификации продукта.

Разделение контента на несколько папок, содержащих не более 5000 элементов (ограничение по умолчанию для представления списка), позволяет обеспечить высокую производительность представлений папок. Обратите внимание, что для использования преимуществ такого подхода представления, доступные в папках, необходимо настроить на отображение только элементов из соответствующих папок (эта возможность доступна в интерфейсе создания представлений по умолчанию). Также необходимо отметить, что для папок, содержащих менее 5000 элементов, не требуется выполнять фильтрацию по индексированным столбцам. Для папок, содержащих более 5000 элементов, можно повысить производительность с использованием навигации на основе метаданных или индексированных столбцов с последующей фильтрацией представлений таким образом, чтобы они возвращали менее 5000 элементов.

Рекомендуется создавать папки в составе решения маршрутизации и хранения контента на основе метаданных. С помощью компонента "Организатор контента" можно настроить параметры, обеспечивающие автоматическое создание папок при слишком большом размере целевой папки, а также автоматическое создание папок для каждого значения свойства метаданных. Дополнительные сведения см. в разделе Маршрутизация и хранение корпоративного контента на основе метаданных этой статьи.

Маршрутизация и хранение корпоративного контента на основе метаданных

В SharePoint Server 2010 представлена функция маршрутизации и хранения на основе метаданных с использованием компонента "Организатор контента". Новый компонент уровня сайта "Организатор контента" позволяет упростить классификацию, маршрутизацию и хранение контента администраторами и пользователями с помощью правил, основанных на метаданных.

Компонент "Организатор контента" обеспечивает маршрутизацию документа в заданную папку или автоматически создает новую папку на основе метаданных документа. Папки могут создаваться как дочерние для целевой папки, если в ней превышено установленное ограничение на число элементов, либо как новые папки для каждого нового значения в поле. Новые папки наследуют параметры родительской папки. К новым папкам также могут применяться дополнительные правила, определяющие дополнительные параметры, в том числе разрешения, дополнительные метаданные, политики хранения и рабочие процессы, которые будут наследоваться располагающимися в них документами.

Дополнительные сведения см. в статье Обзор маршрутизации и хранения на основе метаданных (SharePoint Server 2010).

Навигация и фильтрация корпоративного контента на основе метаданных

Новый компонент навигации и фильтрации метаданных в SharePoint Server 2010 позволяет пользователям выполнять фильтрацию и поиск контента на основе метаданных. Компонент навигации и фильтрации на основе метаданных предоставляет простой пользовательский интерфейс, который построен на базе элемента управления иерархического древовидного представления SharePoint в сочетании с новым элементом управления Ключевые фильтры, что обеспечивает эффективный поиск контента на основе метаданных.

С помощью параметров навигации для метаданных владельцы списков могут повышать уровень полей в списке, определяя их как ключевые поля. Пользователи, просматривающие такие списки, могут выполнять дополнительную фильтрацию текущего представления списка и отображать только элементы соответствующих полей с нужными значениями.

Компонент автоматической индексации обеспечивает автоматическое создание индексов списков на основе полей, определенных как поля навигации для списка. Автоматическая индексация позволяет повысить эффективность запросов и быстродействие.

Дополнительные сведения об интеграции навигации на основе метаданных в решение хранения корпоративного контента см. в статье Обзор навигации для метаданных (SharePoint Server 2010).

Представления списка

В основе любого решения по управлению корпоративным контентом лежит возможность пользователей быстро и удобно находить нужный контент. При перемещении по библиотекам и папкам представления дерева и списка предоставляют простой интерфейс, обеспечивающий визуальную навигацию по таксономии хранилища контента. В то же время, если библиотека или папка содержит слишком много элементов, для быстрого запроса и отображения результатов в списке может потребляться значительный объем ресурсов системы. В SharePoint Server 2010 поддерживается функция регулирования ресурсов, позволяющая обеспечить максимальную производительность представления списка при минимальном потреблении ресурсов. Свойства регулирования ресурсов для веб-приложения задаются в разделе "Общие параметры" центра администрирования и влияют на выделение ресурсов для запроса и отображения списков в этом веб-приложении.

Настройка решения хранения таким образом, чтобы при просмотре контента библиотеки или папки не превышалось установленное для представления списка ограничение, позволяет предотвратить необходимость регулирования ресурсов и обеспечить максимальную производительность представления списка.

Поддерживаются следующие свойства регулирования ресурсов, влияющие на производительность представления списка:

Свойство Описание Значение по умолчанию

Пороговое значение представления списка

Максимальное число элементов списка или библиотеки, которые могут обрабатываться одновременно операцией базы данных (например, запросом), вне установленного администратором ежедневного периода времени, в течение которого число запросов неограниченно. Изменять значение этого свойства не рекомендуется.

5000

Перезапись объектной модели

Пользователи с особыми разрешениями могут программным способом переопределять "Пороговое значение представления списка" для отдельных запросов.

Да

Пороговое значение представления списка для аудиторов и администраторов

Максимальное число элементов списка или библиотеки, которые могут обрабатываться одновременно операцией базы данных (например, запросом), выполняемой аудитором или администратором с соответствующими разрешениями. Этот параметр используется совместно с параметром "Перезапись объектной модели".

20 000

Пороговое значение подстановки представления списка

Максимально допустимое число объединений на запрос, в том числе основанных на подстановке, пользователе или группе, либо столбцах состояния рабочего процесса. Если в запросе используется более восьми объединений, операция блокируется. Это не относится к операциям с одним элементом. При использовании максимального представления объектной модели, в котором не заданы поля представления, SharePoint возвращает до восьми первых подстановок. Изменять значение этого свойства не рекомендуется.

8

Ежедневный временной интервал для больших запросов

Период времени, в течение которого могут выполняться большие запросы. Период времени следует задавать в нерабочие часы, поскольку выполнение больших запросов может привести к значительной нагрузке на сервер.

Отключено

Дополнительные ресурсы

В дополнение к сведениям, представленным в этой статье, можно ознакомиться со следующими ресурсами, которые содержат рекомендации по изучению и планированию решения хранения корпоративного контента.