Planeación de almacenamiento de contenido empresarial

Este artículo contiene información para ayudar a los programadores y diseñadores de soluciones a planear y configurar adecuadamente una solución de administración de contenido empresarial a gran escala basada en Microsoft Office SharePoint Server 2007 para que funcione correctamente y proporcione las características necesarias para los usuarios del sitio. Office SharePoint Server 2007 es compatible con el almacenamiento de documentos de gran capacidad; una biblioteca de documentos puede contener hasta 5 millones de documentos. Sin embargo, en función sobre cómo se use el contenido, el rendimiento de los sitios que contienen un gran número de documentos puede llegar a degradarse. Los consejos preceptivos que se facilitan en este artículo le ayudarán a diseñar soluciones de administración de contenido a gran escala que se adaptarán a los requisitos de su empresa al tiempo que proporcionará a los usuarios de la solución un entorno con buen rendimiento en el que poder crear y usar documentos.

Las decisiones que tome sobre las capacidades de colecciones de sitios, sitios y bibliotecas en Office SharePoint Server 2007 deben tener en cuenta no sólo las restricciones de almacenamiento físico de su entorno Office SharePoint Server 2007 sino también el uso del contenido y los patrones de vista de los usuarios. Por ejemplo, si los usuarios ven o consultan un conjunto de documentos en una biblioteca de documentos que contiene miles de documentos, el rendimiento puede verse afectado de forma negativa si el sitio no está configurado correctamente. O, si un acuerdo de nivel de servicio requiere que se hagan dos copias de seguridad del contenido cada día, el servicio podría no realizarse satisfactoriamente si el conjunto de contenido es demasiado grande. En este artículo se describen las técnicas que puede usar para proporcionar la funcionalidad de administración de contenido necesaria y mantener al mismo tiempo un rendimiento aceptable.

En este tema, se describen cuatro niveles de almacenamiento de contenido:

  • Colección de sitios

  • Sitio

  • Biblioteca

  • Carpeta

Para cada nivel de almacenamiento, en este artículo se describen las ventajas de organizar el contenido en ese nivel, se analiza cómo puede disminuir el rendimiento a medida que aumentan los documentos almacenados y ofrece recomendaciones para mejorar el rendimiento cuando existen grandes volúmenes de contenido.

En este artículo:

  • Escenarios típicos de administración de contenido a gran escala

  • Colecciones de sitios: ventajas y limitaciones del almacenamiento de contenido

  • Sitios: ventajas y limitaciones del almacenamiento de contenido

  • Bibliotecas: ventajas y limitaciones del almacenamiento de contenido

  • Carpetas: ventajas y consideraciones del almacenamiento de contenido

  • Resumen de recomendaciones

Nota

Aunque los ejemplos de este artículo son principalmente relevantes para soluciones basadas en Office SharePoint Server 2007, la información de consejos preceptivos aquí proporcionados se aplica tanto a Office SharePoint Server 2007 como a Windows SharePoint Services 3.0.

Escenarios típicos de administración de contenido a gran escala

Normalmente, los escenarios de administración de contenido a gran escala son variantes de uno de los siguientes escenarios:

  • Entorno de creación de documentos a gran escala

  • Archivo de contenido a gran escala

  • Archivo de contenido a escala extremadamente grande

Las descripciones de escenarios aquí proporcionadas están pensadas para clarificar qué queremos decir con soluciones a gran escala y para proporcionar ejemplos que esperamos reflejen sus objetivos de administración de contenido.

Entorno de creación de documentos a gran escala

En un entorno de creación de documentos a gran escala, un sitio puede contener una biblioteca en la que los usuarios editen activamente 50.000 o más documentos a través de 500 o más carpetas. El control de versiones está habilitado y normalmente existen 10 o más versiones anteriores de cada documento. Los documentos se protegen y desprotegen con frecuencia y se usan flujos de trabajo para controlar sus ciclos de vida. Veinte o más tipos de contenido podrían estar en uso. Una base de datos típica de este tipo de sitio contiene aproximadamente 150 gigabytes (GB) de datos. (Tenga en cuenta que cada versión de un documento se almacena por separado en la base de datos). Normalmente, en un entorno de creación de documentos a gran escala, el 80% de los usuarios del sitio son autores que tienen acceso a las versiones principal y secundaria de los documentos, mientras el 20% de los usuarios del sitio tiene permisos de solo lectura y sólo puede ver las versiones principales del contenido.

Un sitio de entorno de creación de documentos a gran escala se puede basar en la plantilla de sitio Centro de documentos de Office SharePoint Server 2007, que incluye una biblioteca de documentos única y de gran tamaño que está optimizada para la creación de documentos a gran escala. Vea el Sitio del Centro de documentación.

Archivo de contenido a gran escala

Un archivo a gran escala es un repositorio de documentos en el que los usuarios ven documentos o cargan documentos nuevos. Poca o ninguna creación tiene lugar en el sitio. Hay dos escenarios principales de almacenamiento a gran escala: base de conocimientos y administración de registros.

En un sitio de knowledge base, sólo existe una única versión de la mayoría de los documentos, de modo que el sitio se puede ampliar hasta contener fácilmente un millón de documentos o más. Normalmente, el contenido se almacena en una única base de datos de hasta 400 GB. En un escenario típico, como un centro de soporte técnico de una empresa, 10.000 usuarios podrían tener acceso al contenido, principalmente para leerlo. Un subconjunto de los usuarios (entre 3.000 y 4.000) carga nuevo contenido en el sitio. Un sitio de knowledge base puede basarse en la plantilla de sitio de Centro de documentación.

Otro tipo de archivo a gran escala es un centro de registros, basado en la plantilla de sitio Centro de registros. Esta plantilla de sitio contiene características que se pueden usar para administrar la retención y disposición de los registros (documentos que sirven como evidencia de actividades o transacciones realizadas por la organización y que se deben conservar durante un período de tiempo). Similar a un sitio de knowledge base, un centro de registros contiene una única versión de cada documento y normalmente puede contener un millón de documentos o más. El número de usuarios que envían contenido a un centro de registros es mucho mayor que el de usuarios que lo ven o leen.

Archivo de contenido a escala extremadamente grande

Si la interfaz de usuario de un sitio se personaliza para excluir operaciones de interfaz de usuario que consumen muchos recursos, como consultas de visualización complejas, se puede usar un archivo de contenido a escala extremadamente grande como biblioteca de referencia o repositorio de contenido. Un archivo de almacenamiento a escala extremadamente grande puede contener hasta diez millones de documentos distribuidos entre 5.000 o más carpetas. La base de datos puede superar los tres terabytes (TB).

En un archivo a escala extremadamente grande, los usuarios (50.000 o más) principalmente navegan por el contenido mediante búsquedas. El contenido se envía mediante un formulario de envío personalizado.

Colecciones de sitios: ventajas y limitaciones del almacenamiento de contenido

Una colección de sitios es un conjunto de sitios web que tienen el mismo propietario y comparten la configuración de administración. Cada colección de sitios contiene un sitio web de nivel superior y puede contener uno o más subsitios. Normalmente, una colección de sitios tiene una estructura de navegación compartida.

Ventajas de almacenar contenido en la misma colección de sitios

Normalmente, los sitios en una colección de sitios están interrelacionados por su propósito. Para obtener la máxima facilidad de uso de su solución, almacene todos los datos relacionados y contenido dentro de una misma colección de sitios. Las ventajas de hacerlo incluyen:

  • Los tipos de contenido y las columnas administrados en una colección de sitios se pueden compartir entre todos los sitios de la colección de sitios. Por el contrario, no hay ningún mecanismo automático para propagar los tipos de contenido y las definiciones de columna por varias colecciones de sitios.

  • Las directivas de administración de información administradas en la colección de sitios pueden estar disponibles para el contenido de todos los sitios de la colección de sitios.

  • Office SharePoint Server 2007 actualiza automáticamente los vínculos a archivos cuyos nombres cambian o que se mueven dentro de una colección de sitios para reflejar sus nuevos nombres o ubicaciones. Por el contrario, los vínculos a documentos en otras colecciones de sitios no se actualizan.

  • Si la colección de sitios está en un servidor que ejecuta Windows SharePoint Services 3.0, la búsqueda sólo se puede realizar en el contenido de esa colección de sitios. Si la colección de sitios está en un servidor que ejecuta Office SharePoint Server 2007, puede buscar en el contenido de varias colecciones de sitios.

  • Algunas vistas en Windows SharePoint Services 3.0 y en Office SharePoint Server 2007 enumeran documentos de varios sitios dentro de una misma colección de sitios (por ejemplo, una vista que enumera todas las tareas asignadas a un usuario en toda la colección de sitios). Asimismo, los programadores pueden crear consultas de base de datos entre sitios dentro de una colección de sitios, pero dichas consultas entre sitios no se admiten entre varias colecciones de sitios.

  • Las cuotas de contenido y otras cuotas sólo se pueden administrar en el nivel de colección de sitios.

Límites al almacenar contenido en la misma colección de sitios

Tenga en cuenta los siguientes límites al planear cómo asignar el contenido entre una o más colecciones de sitios:

  • Crear un número excesivo de subsitios de cualquier sitio en una colección de sitios podría afectar al rendimiento y la facilidad de uso. Limite el número de subsitios de cualquier sitio a 2.000 como máximo.

  • Todos los sitios de una colección de sitios comparten los mismos recursos back-end. En concreto, todo el contenido de una colección de sitios debe almacenarse en la misma base de datos de contenido. Debido a esto, el rendimiento de las operaciones de base de datos —como la copia de seguridad y la restauración de contenido— dependerán de la cantidad de contenido que haya en toda la colección de sitios, el tamaño de la base de datos, la velocidad de los servidores donde se hospeda la base de datos y otros factores. Dependiendo de la cantidad de contenido y de la configuración de la base de datos, quizás tenga que segmentar una colección de sitios en varias colecciones de sitios para cumplir los acuerdos de nivel de servicio relativos a copias de seguridad y restauración, rendimiento y otros requisitos. Escapa al ámbito de este artículo proporcionar orientación normativa acerca de cómo administrar el tamaño y el rendimiento de las bases de datos. Para obtener más información acerca de cómo planear la capacidad, vea Planeación de rendimiento y capacidad (Office SharePoint Server).

  • Especialmente, mantenga en colecciones de sitios separadas los sitios extremadamente activos. Por ejemplo, un sitio de knowledge base en Internet que permite la navegación anónima podría generar una gran cantidad de actividad en la base de datos. Si otros sitios usan la misma base de datos, su rendimiento podría verse afectado. Al colocar el sitio de knowledge base en una colección de sitios separada con su propia base de datos, puede liberar recursos para otros sitios que ya no tienen que competir con él por los recursos de base de datos.

Tenga en cuenta que Windows SharePoint Services 3.0 y Office SharePoint Server 2007 tienen varias características que mitigan la necesidad de que el departamento de TI restaure contenido. La Papelera de reciclaje y la Papelera de reciclaje de la colección de sitios proporcionan un doble mecanismo de seguridad para restaurar elementos eliminados sin darse cuenta. El control de versiones de los documentos también proporciona una red de seguridad para los documentos perdidos porque sus versiones anteriores están disponibles. Para garantizar la disponibilidad de las versiones anteriores aún más, un administrador puede quitar el permiso Eliminar versiones de los permisos de los autores; esto puede contribuir a garantizar que las versiones anteriores de contenido estén disponibles sin tener que restaurarlas desde la base de datos.

Sitios: ventajas y limitaciones del almacenamiento de contenido

Un sitio web es el medio principal de organizar contenido relacionado en Office SharePoint Server 2007 y en Windows SharePoint Services 3.0.

Ventajas de almacenar contenido en el mismo sitio

  • Resulta más fácil crear páginas que muestran vistas de varias bibliotecas y listas cuando se encuentran en el mismo sitio.

  • La interfaz de usuario de navegación del sitio está optimizada para que sea más fácil encontrar y desplazarse a las bibliotecas del mismo sitio.

  • Puede definir y asignar permisos a los grupos en el nivel de sitio.

  • Puede definir un conjunto de tipos de contenido y columnas de sitio para su uso en un sitio.

El sitio de Centro de documentación

Office SharePoint Server 2007 incluye una plantilla de sitio de Centro de documentación. Use esta plantilla para crear un sitio que está optimizado para crear y usar un gran número de documentos.

Para habilitar los procedimientos recomendados para la administración de documentos, los sitios basados en la plantilla de sitio de Centro de documentación tienen habilitadas de forma predeterminada las características de administración de documentos recomendadas, que incluyen:

  • Características de navegación para ayudar a los autores a encontrar su contenido.

  • Control de versiones mayores/menores habilitado.

  • Protección y desprotección de documentos obligatorias.

  • Varios tipos de contenido habilitados.

  • Un elemento web Documentos relevantes que genera una vista personalizada de documentos desprotegidos, creados o modificados por última vez por el usuario actual. Puede configurar el elemento web para que use más de un criterio.

  • Un elemento web Próximas tareas que genera una vista personalizada de tareas relacionadas con los documentos asignadas al usuario actual.

La indización de columnas es una técnica que ayuda a garantizar que una vista o una consulta devuelvan una lista de elementos en el intervalo recomendado de 2.000 elementos o menos. Use la siguiente tabla para determinar las columnas adecuadas para indizar para cada consulta que admita el elemento web Documentos relevantes:

Si configura el elemento web Documentos relevantes para... En la biblioteca de documentos compartidos, indice la siguiente columna:

Incluir documentos modificados por última vez por mí

Modificado por

Incluir documentos creados por mí

Creado por

Incluir documentos desprotegidos por mí

Desprotegido por

Junto con la indización de columnas para mejorar el rendimiento del elemento web Documentos relevantes, asegúrese de que la casilla Mostrar elementos de toda la colección de sitios no esté activada al configurar el elemento web en un entorno de administración de documentos a gran escala.

Límites al almacenar contenido en el mismo sitio

  • Más de 2.000 bibliotecas y listas en un único sitio degradarán el rendimiento.

  • Las pruebas de facilidad de uso muestran que tener más de 50 listas y bibliotecas en la estructura de navegación del sitio hace más difícil navegar por el contenido mediante la interfaz de usuario.

Bibliotecas: ventajas y limitaciones del almacenamiento de contenido

Una biblioteca de documentos es una ubicación en un sitio que contiene los archivos de uno o más tipos de contenido. Las bibliotecas de documentos están diseñadas para administrar y almacenar documentos relacionados y para permitir a los usuarios crear nuevos documentos de los tipos adecuados.

Ventajas de almacenar contenido en la misma biblioteca

  • Es más fácil para los usuarios agregar nuevos documentos o buscar documentos existentes en una única biblioteca.

  • Muchos parámetros de configuración de la administración de documentos —como los permisos, el control de versiones y la aprobación— se aplican en el nivel de biblioteca.

  • Las vistas creadas mediante la interfaz de usuario se enlazan a una biblioteca particular.

  • Las directivas de administración de información, como la configuración de auditoría y retención de contenido, se pueden aplicar a una biblioteca.

Límites al almacenar contenido en la misma biblioteca

  • El tamaño máximo recomendado para una biblioteca es de 10.000.000 documentos.

  • Para aplicar la configuración de administración de documentos única a contenido, como desprotecciones o control de versiones obligatorios, el contenido debe almacenarse en una biblioteca independiente.

  • Si se usan varios tipos de contenido en una biblioteca y cada tipo de contenido tiene una o más columnas de metadatos que sólo se aplican a ese tipo de contenido, las vistas pueden resultar confusas. Para aliviar este problema, puede asociar cada tipo de contenido con una biblioteca independiente.

  • El rendimiento de las vistas de contenido se degrada cuando el número de elementos vistos supera los 2.000 elementos. Las soluciones de esta limitación son organizar el contenido de la biblioteca en carpetas que contengan cada una 2.000 elementos o menos, o crear vistas que se beneficien de columnas indizadas para devolver conjuntos de 2.000 elementos o menos (vea a continuación para ver una explicación acerca de cómo usar columnas indizadas en las vistas).

Nota

Todo el contenido de páginas web en un sitio se almacena en una única biblioteca Páginas en ese sitio, que contiene todas las páginas de contenido de ese sitio web. La limitación recomendada de 2.000 elementos o menos por vista o consulta se aplica a las bibliotecas de páginas además de a las bibliotecas de documentos.

Uso de columnas indizadas para mejorar el rendimiento de las vistas

Como se mencionó anteriormente, el rendimiento de las vistas se degrada si el número de elementos mostrados supera los 2.000 elementos. Una técnica útil para limitar el número de elementos para mostrar en una vista consiste en indizar una columna usada en la vista y, a continuación, filtrar la vista según esa columna de modo que se muestren 2.000 elementos o menos. (Una columna indizada es una columna de la cual Office SharePoint Server 2007 mantiene un registro para hacer que las consultas relacionadas con la vista sean más eficaces).

Por ejemplo, si es poco probable que más de 2.000 elementos en una biblioteca se modifiquen en un período cualquiera de siete días, podría indizar la columna Modificado en una biblioteca y, a continuación, filtrar una vista de modo que sólo se muestren los elementos modificados en los últimos siete días. (Para ello, especifique que la columna Modificado es menor que Hoy-7). Otro ejemplo: si es probable que cada autor cree menos de 2.000 elementos, podría indizar la columna Creado por y, a continuación, filtrar una vista de modo que los autores sólo vean los documentos que han creado. (Para ello, especifique que la columna Creado por es igual a Me).

Los siguientes tipos de columna se pueden indizar y usar para filtrar las vistas:

  • Una línea de texto

  • Varias líneas de texto

  • Número

  • Moneda

  • Opción

  • Fecha y hora

  • Búsqueda

  • Sí/No

  • Persona o grupo

  • Calculada

Otra consideración que debe tomar al crear vistas filtradas por columnas indizadas son:

  • Sólo se puede usar una columna indizada en una vista.

  • No debe crear filtros con "or" para proporcionar varios criterios al usar una columna indizada para filtrar una vista.

  • Usar la característica Límite de elementos para modificar una vista no mejora el rendimiento de la vista.

Nota

Si un usuario intenta crear una vista que podría beneficiarse del uso de una columna indizada, Office SharePoint Server 2007 mostrará un mensaje de advertencia recomendando ese enfoque.

Carpetas: ventajas y consideraciones del almacenamiento de contenido

Una carpeta es una subdivisión con nombre del contenido de una biblioteca similar a las carpetas en un sistema de archivos. El propósito principal de las carpetas es organizar el contenido para que coincida con la funcionalidad esperada de la biblioteca. Por ejemplo, si una biblioteca está destinada a proporcionar especificaciones de productos, los nombres del conjunto de carpetas en la biblioteca podrían coincidir con cada área característica en el producto o con cada integrante del equipo que escribe especificaciones de productos.

Las carpetas se pueden usar para mejorar el rendimiento de la biblioteca. Si el contenido se divide entre varias carpetas, cada una de las cuales contiene 2.000 elementos o menos, las vistas en las carpetas funcionarán correctamente. Tenga en cuenta que, para beneficiarse de esto, las vistas disponibles dentro de carpetas deben estar configuradas para mostrar sólo los elementos dentro de las carpetas (esta característica está disponible en la interfaz de creación de vistas de Office SharePoint Server 2007 predeterminada). Tenga también en cuenta que, si las carpetas contienen 2.000 elementos o menos, las vistas en las carpetas no tienen que filtrarse mediante columnas indizadas.

Resumen de recomendaciones

A continuación se muestra un resumen de las recomendaciones para mejorar el rendimiento en cada nivel de almacenamiento cuando se almacenan grandes volúmenes de contenido:

Nivel Límites de rendimiento

Colección de sitios

2.000 subsitios de cualquier sitio es el límite recomendado.

Se usa la misma base de datos de contenido para una misma colección de sitios. Esto puede afectar al rendimiento en operaciones tales como la copia de seguridad y la restauración.

Sitio

2.000 bibliotecas y listas es el límite recomendado.

Biblioteca

10.000.000 documentos es el límite recomendado.

2.000 elementos por vista es el límite recomendado.

Carpeta

2.000 elementos por carpeta es el límite recomendado.

Descargar este libro

En este tema se incluye el siguiente libro descargable para facilitar la lectura y la impresión:

Vea la lista completa de libros disponibles en la página que muestra el contenido descargable para Office SharePoint Server 2007.

Vea también

Conceptos

Planeación de rendimiento y capacidad (Office SharePoint Server)
Planeación de la administración de registros