Планирование хранения содержимого предприятия

В этой статье содержатся сведения, призванные помочь планировщикам решений и разработчикам правильно спланировать и настроить крупномасштабное решение для управления содержимым предприятия на основе Microsoft Office SharePoint Server 2007, так чтобы решение правильно работало, обеспечивая функциональные возможности, необходимые пользователям сайта. Office SharePoint Server 2007 поддерживает хранилище документов большой емкости; библиотека документов может содержать до 5 миллионов документов. Однако в зависимости от того, как используется содержимое, производительность сайтов с очень большим числом документов сайтов может снижаться. Рекомендуемое указание, описанное в этой статье, может помочь в построении масштабных решений управления содержимым, которые способны удовлетворить требованиям предприятия за счет решения с производительной средой, в которой можно создавать и использовать документы.

Решения, принимаемые о размерах сайтов, семейств сайтов и библиотек в Office SharePoint Server 2007 должны учитывать не только физические ограничения к хранению в среде Office SharePoint Server 2007, но и использование содержимого и просмотр шаблонов пользователей. Например, если пользователи просматривают или запрашивают набор документов в библиотеке документов с тысячами документов, производительность может снизиться, если сайте настроек неправильно. Или, если по условиям соглашения об уровне обслуживания требуется резервное копирование содержимого дважды в день, служба может выполняться неудовлетворительно, если набор содержимого имеет слишком большой размер. В этой статье обсуждаются методы, при помощи которых можно добиться необходимых функциональных возможностей управления содержимым с сохранением приемлемой производительности.

В этом разделе описаны четыре уровня хранения содержимого:

  • Семейство сайтов

  • Сайт

  • Библиотека

  • Папка

По каждому уровню хранения в этой статье описаны преимущества организации содержимого на соответствующем уровне, рассказано о том, как увеличение числа хранимых документов может повлиять на производительность, и даются рекомендации по повышению производительности в случае с большими объемами содержимого.

Содержание:

  • Типовые сценарии управления большими объемами содержимого

  • Семейства сайтов: преимущества и ограничения хранения содержимого

  • Сайты: преимущества и ограничения хранения содержимого

  • Библиотеки: преимущества и ограничения хранения содержимого

  • Папки: преимущества и ограничения хранения содержимого

  • Сводка рекомендаций

Примечание

Несмотря на то, что примеры в этой статье главным образом относятся к решениям, основанным на Office SharePoint Server 2007, рекомендации в этой статье действительны как для Office SharePoint Server 2007, так и для Windows SharePoint Services 3.0.

Типовые сценарии управления большими объемами содержимого

Как правило, сценарии управления большими объемами содержимого могут быть следующими:

  • Масштабная среда создания

  • Масштабный архив содержимого

  • Сверхмасштабный архив содержимого

Описание сценариев в этой статье ставит своей целью разъяснение понятия "масштабных решений" и представление примеров, которые, как кажется, отражают цели управления содержимым.

Масштабная среда создания

В масштабной среде создания сайт может содержать библиотеку, в которой пользователи активно изменяют свыше 50 000 документов, хранящихся в более чем 500 папках. Управление версиями включено, и обычно для каждого документа существует 10 или более версий. Документы часто извлекаются, а для контроля их жизненных циклов применяются рабочие процессы. Могут использоваться двадцать или более типов контента. Обычная база данных для этого типа сайта содержит около 150 гигабайт (ГБ) данных. (Следует упомянуть, что каждая версия документа хранится в базе данных отдельно.) Как правило, в масштабной среде создания 80% пользователей сайтов являются авторами, которые имеют доступ к основным и вспомогательным версиями документов, в то время как 20% пользователей сайтов имеют разрешения только для чтения и могут только просматривать основные версии содержимого.

Масштабная среда создания может быть основана на шаблоне сайта центра разработки Office SharePoint Server 2007, который содержит одну большую библиотеку документов и который оптимизирован для масштабного создания. См. раздел Сайт центра разработки.

Масштабный архив содержимого

Масштабный архив представляет собой хранилище документов, в котором пользователи либо просматривают документы, либо отправляют новые. На сайте выполняется незначительное число операций создания или они не выполняются совсем. Существует два основных сценария масштабного архива: база знаний и управление записями.

В сайте базы знаний присутствует только одна версия большинства документов, поэтому его можно легко расширить для хранения 1 000 000 или большего числа документов. Содержимое, как правило, хранится в отдельной базе данных размером 400 ГБ. В типовом сценарии это может быть центр технической поддержки на предприятии, где 10 000 пользователей могут обращаться к содержимому и главным образом для чтения. Подмножество пользователей (3000-4000) загружает содержимое на сайт. Сайт базы знаний может основываться на шаблоне сайта центра разработки.

Другой тип масштабного архива — центра записей, основанный на шаблоне центра записей. Этот шаблон сайта содержит функции для управления хранением и удалением записей (документами, которые служат подтверждением действий или операций, выполненных организацией и которые должны храниться в течение некоторого времени). Подобно сайту базы знаний, центр записей содержит одну версию каждого документа и, как правило, может содержать 1 000 000 или более документов. Содержимое в центр записей отправляют намного больше пользователей, чем просматривают и читают его.

Сверхмасштабный архив содержимого

Если пользовательский интерфейс сайта настроен на исключение ресурсоемких операций пользовательского интерфейса, таких как сложный просмотр запросов, сверхмасштабный архив содержимого можно использовать в качестве справочной библиотеки или хранлища содержимого. Сверхмасштабный архив содержимого может содержать до 10 000 000 документов в более чем 5 000 папок. Размер базы данных может превысить три терабайта (ТБ).

В сверхмасштабном архиве пользователи (50 000 или более) главным образом просматривают содержимое, пользуясь поиском. Содержимое отправляется при помощи настраиваемой формы отправки.

Семейства сайтов: преимущества и ограничения хранения содержимого

Семейство сайтов — это набор веб-сайтов с единым владельцем и общими параметрами администрирования. Каждое семейство сайтов содержит веб-сайт верхнего уровня и может содержать один или более дочерних сайтов. Как правило, семейство сайтов имеет общую структуру переходов.

Преимущества хранения содержимого в одном семействе сайтов

Сайты в семействе сайтов обычно имеют общее назначение. Чтобы сделать использование решения максимально удобным, рекомендуется хранить все связанные данные и содержимое в одном семействе сайтов. При этом можно получить следующие преимущества:

  • Типы и столбцы, управляемые в семействе сайтов, можно будет совместно использовать на нескольких сайтах в семействе сайтов. С другой стороны, не существует автоматического механизма распространения типов контента и определений столбцов в нескольких семействах сайтов.

  • Политики управления информацией, поддерживаемые в семействе сайтов, можно предоставить содержимому во всех сайтах семейства сайтов.

  • Office SharePoint Server 2007 автоматически обновляет ссылки на переименованные или перемещенные файлы в семействе сайтов и отражает их новые имена и расположения. При этом ссылки на документы в других семействах сайтов не обновляются.

  • Если семейство сайтов находится на сервере с Windows SharePoint Services 3.0, поиск можно выполнять только по содержимому в этом семействе сайтов. Если семейство сайтов расположено на сервере с Office SharePoint Server 2007, поиск по содержимому возможен на нескольких семействах сайтов.

  • В некоторых представлениях в Windows SharePoint Services 3.0 и Office SharePoint Server 2007 выводится список документов с нескольких сайтов в одном семействе сайтов (например, представление с перечислением всех задач, назначенных пользователю в семействе сайтов). Кроме того, разработчики могут создавать запросы к базам данных сайтов в семействе сайтов, но запросы к семействам сайтов не поддерживаются в масштабе нескольких семейств сайтов.

  • Управление квотами содержимого и другими квотами возможно только на уровне семейства сайтов.

Ограничения на хранение содержимого в одном семействе сайтов

При планировании способов распределения содержимого по одному или нескольким семействам сайтов необходимо учитывать следующие предельные значения:

  • Создание слишком большого числа дочерних сайтов любого сайта в семействе сайтов может повлиять на производительность и удобство работы. Рекомендуется ограничить число дочерних сайтов любого сайта максимум 2 000.

  • Все сайты в семействе сайтов используют одни серверные ресурсы. В частности, все содержимое в семействе сайтов должен храниться в одной базе данных контента. По этой причине производительность операций с базами данных, таких как резервное копирование и восстановление содержимого, будет зависеть от объема содержимого всего семейства сайтов, размера базы данных, скорости работы серверов с базой данных и другие факторы. В зависимости от объема содержимого и конфигурации базы данных может возникнуть необходимость разделения семейства сайтов на несколько семейств сайтов, чтобы отвечать условиям соглашений об уровне обслуживания в отношении резервного копирования и восстановления, пропускной способности и других требований. В рамки этой статьи не входит руководство об управлении размером и производительностью баз данных. Дополнительные сведения о планировании производительности см. в разделе Планирование производительности и мощности (Office SharePoint Server).

  • В частности, крайне активные сайты следует хранить в семействах сайтов. Например, сайт базы знаний в Интернете, допускающий анонимный просмотр, может быть сопряжен с высокой активностью базы данных. Если другие сайты используют эту же базу данных, то их производительность может быть низкой. Помещение сайта базы знаний в отдельное семейство сайтов с собственной базой данных позволит высвободить ресурсы для других сайтов, которым более не придется конкурировать с сайтом базы знаний при использовании ресурсов базы данных.

Следует упомянуть, что Windows SharePoint Services 3.0 и Office SharePoint Server 2007 имеют ряд возможностей, которые сокращают необходимость восстановления содержимого ИТ-отделом. Корзина и корзина семейства сайтов обеспечивают двойной механизм защиты для восстановления окончательно удаленных элементов. Управление версиями документов также служит страховкой при потере документов, предыдущие версии которых будут доступны. Чтобы дополнительно гарантировать доступность предыдущих версий, администратор может исключить разрешение на удаление версий из разрешений создателя; это поможет гарантировать наличие предыдущих версий содержимого без необходимости их восстановления из базы данных.

Сайты: преимущества и ограничения хранения содержимого

Веб-сайт является основным средством для организации связанного содержимого в Office SharePoint Server 2007 и Windows SharePoint Services 3.0.

Преимущества хранения содержимого в одном сайте

  • Размещение библиотек и списков в одном сайте делает создание страниц с представлениями нескольких библиотек и списков проще.

  • Оптимизированный пользовательский интерфейс для перехода по сайтам упрощает поиск и переход по библиотекам в одном сайте.

  • Возможность определения и назначения разрешений группам на уровне сайта.

  • Возможность определения набора типов контента и столбов сайта на сайте.

Сайт центра документов

Office SharePoint Server 2007 содержит шаблон сайта центра документов. Используйте этот шаблон для создания сайта, который оптимизирован для создания и использования большого числа документов.

Чтобы воспользоваться рекомендациями по управлению документами, сайты на основе шаблона сайта центра документов содержат рекомендуемые возможности управления документами, которые включены по умолчанию, в частности:

  • Возможности перехода, помогающие создателям в поиске содержимого.

  • Управление основными/второстепенными версиями.

  • Обязательное извлечение и возврат документов.

  • Несколько типов контента.

  • Веб-часть "Необходимые документы", создающая индивидуальное представление документов для текущего пользователя (извлеченные текущим пользователем, созданные или измененные им документы). Веб-часть можно настроить на использование более чем одного условия.

  • Веб-часть "Предстоящие задачи", создающая индивидуальное представление связанных с документом задач, назначенных текущему пользователю.

Индексирование столбцов это метод, посредством которого можно добиться возврата представлением или запросом списка элементов в рекомендуемом диапазоне 2 000 или менее элементов. Следующая таблица поможет определить правильные столбцы для индексирования по каждому запросу, который поддерживает веб-часть необходимых документов:

Если веб-часть необходимых документов настроена на… То в библиотеке общих документов индексируется следующий столбец:

Включение документов, измененных последний раз мной

Автор изменений

Включение документов, созданных мной

Автор

Включение документов, извлеченных мной

Кто извлек

В дополнение к индексированию столбцов для повышения производительности веб-части необходимых документов следует убедиться, что при настройке веб-части в масштабной среде управления документов флажок Показывать элементы из всего семейства сайтов не установлен.

Ограничения на хранение содержимого в одном сайте

  • Более 2 000 библиотек и списков в одном сайте приведут к снижению производительности.

  • Тестирование удобства использования показывает, что более 50 списков и библиотек в структуре навигации по сайту усложняет переход по содержимому при помощи пользовательского интерфейса.

Библиотеки: преимущества и ограничения хранения содержимого

Библиотека документов представляет собой место сайта с файлами одного или нескольких типов контента. Библиотеки документов предназначены для управления и хранения связанных документов и для того, чтобы пользователи могли создавать новые документы соответствующих типов.

Преимущества хранения содержимого в одной библиотеке

  • Пользователям проще добавлять новые документы и искать существующие в одной библиотеке.

  • Многие параметры управления документами, такие как разрешения, управление версиями содержимого и утверждение, применяются на уровне библиотеки.

  • Представления, созданные при помощи пользовательского интерфейса, привязаны к определенной библиотеке.

  • Политики управления информацией, такие как параметры аудита и хранения содержимого, можно применить к библиотеке.

Ограничения на хранение содержимого в одной библиотеке

  • Максимальный рекомендуемый размер библиотеки составляет 10 000 000 документов.

  • Чтобы к содержимому применить уникальные параметры управления документами, например, обязательные извлечения или управление версиями, содержимое должно храниться в отдельной библиотеке.

  • Если в библиотеке используется несколько типов контента и каждый тип контента имеет один или несколько столбцов метаданных, которые применяются только в этому типу контента, представления могут запутывать. Чтобы избежать этого, каждый тип контента можно связать с отдельной библиотекой.

  • Производительность представлений содержимого ухудшается, если число просматриваемых элементов превышает 2000. Чтобы устранить это ограничение, содержимое в библиотеках можно упорядочить в папки по 2000 или менее элементов; можно также создать представление, использующее преимущества индексированных столбцов для возврата наборов из 2000 или менее элементов (описание использования индексированных столбцов в представлениях см. ниже).

Примечание

Все содержимое веб-страниц на сайте хранится в отдельной библиотеке страниц этого сайта, и в ней же находится все страницы веб-содержимого сайта. Рекомендуемое ограничение числа элементов в представлении или запросе, равное 2 000 или менее, применяется к библиотекам страниц и библиотекам документов.

Использование индексированных столбцов для повышения производительности просмотра

Как говорилось выше, производительность представлений снижается, если число отображаемых элементов превышает 2 000. Полезным методом для ограничения числа элементов для отображения в представлении является индексация столбца, используемого в представлении, и последующая фильтрация представления на основе этого столбца, так чтобы на экране отображалось 2 000 или менее элементов. (Индексированный столбец это столбец, запись которого ведется в Office SharePoint Server 2007 для более эффективных запросов к представлению.)

Например, если вероятность того, что за неделю будет изменено более 2 000 элементов в библиотеке невысока, то можно индексировать столбец Изменено в библиотеке и затем применить фильтр к представлению, так чтобы отображались только измененные за последние семь дней элементы. (Для этого необходимо указать, что столбец Изменено меньше Сегодня-7). Другой пример: если существует вероятность того, что каждый автор создаст менее 2 000 элементов, то можно индексировать столбец Автор и затем применить к представлению фильтр таким образом, чтобы создатели видели только созданные ими документы. (Для этого необходимо указать, что столбец Автор равен Me.)

Допускается индексировать следующие типы столбцов и использовать их для фильтрации представлений:

  • Однострочный текст

  • Многострочный текст

  • Число

  • Денежный

  • Выбор (меню)

  • Дата и время

  • Подстановка (данные, уже имеющиеся на этом узле)

  • Да/Нет (флажок)

  • Пользователь или группа

  • Вычисляемое поле

Ниже приводятся другие рекомендации по созданию представлений с фильтрацией по индексированным столбцам:

  • В представлении может использоваться только один индексированный столбец.

  • Не рекомендуется создавать фильтры при помощи альтернативного "Или" в качестве множественных критериев при использовании индексированного столбца для фильтрации представления.

  • Использование ограничения элементов для изменения представления не повышает производительность представления.

Примечание

Если пользователь попытается создать представление, опирающееся на индексированный столбец, Office SharePoint Server 2007 отобразит предупреждение с рекомендацией этого подхода.

Папки: преимущества и ограничения хранения содержимого

Папка служит для разделения содержимого на части по именам подобно тому, как это делается в файловой системе. Основной задачей папок является организация содержимого для соответствия предполагаемым функциональным возможностям библиотеки. Например, если библиотека предназначена для предоставления характеристик продукта, набору папок в библиотеке можно присвоить имя для каждой области функции продукта или для каждого члена группы, который готовит характеристики продукта.

Папки можно использовать для повышения производительности библиотеки. Распределение содержимого по нескольким папкам, в каждой из которых содержится не более 2 000 элементов, позволит добиться лучшей работы представлений папок. Следует отметить: для того чтобы воспользовавшись преимуществом такого подхода, представления в папках должны быть настроены на отображение только элементов внутри папок (эта возможность доступна в интерфейсе создания представлений по умолчанию Office SharePoint Server 2007). Также необходимо напомнить, что если папка содержит до 2 000 элементов, представления не придется фильтровать по индексированным столбцам.

Сводка рекомендаций

Далее вкратце описаны рекомендации для улучшения производительности на каждом уровне хранилища в случае с хранением больших объемов содержимого.

Уровень Ограничения производительности

Семейство сайтов

2 000 дочерних сайтов любого сайта является рекомендуемым предельным значением.

Одна база данных контента используется для целого семейства сайтов. Это может повлиять на производительность операций, таких как резервное копирование и восстановление.

Сайт

2 000 библиотек и списков является рекомендуемым предельным значением.

Библиотека

10 000 000 документов является рекомендуемым предельным значением.

2 000 элементов в представлении является рекомендуемым предельным значением.

Папка

2 000 элементов в папке является рекомендуемым предельным значением.

Загрузка данной книги

Для упрощения чтения и печати этот раздел включен в следующую загружаемую книгу:

См. полный список доступных книг на веб-сайте Загружаемые материалы для Office SharePoint Server 2007.

См. также

Понятия

Планирование производительности и мощности (Office SharePoint Server)
Планирование управления записями