Planeación del almacenamiento del contenido empresarial (SharePoint Server 2010)

 

Se aplica a: SharePoint Server 2010

Última modificación del tema: 2015-03-09

En este artículo se describe cómo planear una solución de almacenamiento de contenido empresarial que utilice Microsoft SharePoint Server 2010. Aunque los ejemplos de este artículo son relevantes principalmente para las soluciones basadas en SharePoint Server 2010, la información y las instrucciones prescriptivas que se proporcionan aquí se aplican a SharePoint Server 2010 y SharePoint Foundation 2010, a menos que se indique lo contrario.

La información y las instrucciones de este tema están pensadas para que sirvan como una introducción a los conceptos de almacenamiento de contenido empresarial. Determinada información deriva de otros documentos más detallados sobre las pruebas de rendimiento y capacidad realizadas en Microsoft y de otros artículos que proporcionan instrucciones detalladas sobre conceptos particulares. Se recomienda que utilice todos estos recursos al planear la solución de almacenamiento de contenido empresarial. Para obtener más información y más vínculos, vea la sección Otros recursosmás adelante en este artículo.

En este artículo:

  • Información acerca del almacenamiento de contenido empresarial

  • Escenarios habituales de administración de contenido a gran escala

  • Niveles de almacenamiento: ventajas y consideraciones del almacenamiento de contenido

  • Enrutamiento y almacenamiento de contenido empresarial mediante el uso de metadatos

  • Filtrado y navegación del contenido empresarial mediante el uso de metadatos

  • Vistas de lista

  • Otros recursos

Información acerca del almacenamiento de contenido empresarial

Una solución de administración de documentos tiene otras funciones aparte de proporcionar una ubicación para los documentos. Una solución de administración de documentos de nivel empresarial completa trata el almacenamiento de documentos en varios niveles, incluido el almacenamiento en colecciones de sitios, sitios, bibliotecas y carpetas. También permite que las empresas administren de forma eficiente y eficaz volúmenes cada vez mayores de documentos empresariales y garantiza que se puedan conservar las versiones de los documentos de cada etapa del ciclo de vida por razones legales o para referencia.

SharePoint Server 2010 admite el almacenamiento de documentos de gran capacidad. Una biblioteca de documentos puede contener millones de documentos. Sin embargo, dependiendo del uso del contenido, el rendimiento de los sitios que contienen muchos documentos puede disminuir. Las instrucciones prescriptivas que se proporcionan en este artículo pueden ayudarle a diseñar soluciones de administración de contenido a gran escala que incrementen su escalabilidad horizontal para adaptarse a las necesidades de su empresa, proporcionando a los usuarios de la solución un entorno de alto rendimiento para crear y utilizar documentos.

Al tomar decisiones sobre las capacidades de las colecciones de sitios, los sitios y las bibliotecas, debe considerar las restricciones de almacenamiento físico de su entorno, así como el uso del contenido y los patrones de visualización de los usuarios. Por ejemplo, si los usuarios ven o consultan un conjunto de documentos de una biblioteca de documentos que contiene miles de documentos, el rendimiento puede disminuir si el sitio no está configurado correctamente. O si un acuerdo de nivel de servicio requiere que se haga una copia de seguridad del contenido dos veces al día, es posible que el servicio no tenga un buen rendimiento si el conjunto del contenido es demasiado grande.

Escenarios habituales de administración de contenido a gran escala

Normalmente, los escenarios de administración de contenido a gran escala son variantes de uno de los siguientes escenarios:

  • Entorno de autoría a gran escala

  • Archivo de contenido a gran escala

  • Archivo de contenido a escala extremadamente grande

Las descripciones de los escenarios que se proporcionan aquí están diseñadas para clarificar el concepto de las soluciones a gran escala y para proporcionar ejemplos de alto nivel que se espera reflejen sus objetivos de administración de contenido. Por supuesto, estas descripciones no incluyen todos los aspectos de un escenario determinado. Hay docenas, incluso cientos, de aspectos exclusivos de un determinado escenario que quedan fuera de este artículo.

Entorno de autoría a gran escala

En un entorno de creación a gran escala, por ejemplo, un sitio puede contener una biblioteca en la que los usuarios editan 50.000 documentos o más en al menos 500 carpetas. El control de versiones está habilitado y, normalmente, existen varias versiones de cada documento. Los documentos se protegen y desprotegen con frecuencia y los flujos de trabajo se utilizan para controlar los ciclos de vida. Una base de datos típica de este tipo de sitio contiene aproximadamente 150 gigabytes (GB) de datos. La configuración de la biblioteca se puede utilizar para limitar el número de versiones guardadas, lo que reduce el uso de la base de datos. (Tenga en cuenta que cada versión de un documento se almacena por separado en la base de datos). Por lo general, en un entorno de creación a gran escala, el 80% de los usuarios del sitio son autores que tienen acceso a las versiones principales y secundarias de los documentos, mientras que el 20% de los usuarios del sitio tiene permisos de solo lectura y únicamente pueden ver las versiones principales del contenido.

Un sitio de entorno de creación a gran escala puede basarse en la plantilla de sitio del Centro de documentación de SharePoint Server 2010, el cual incluye una única biblioteca de documentos grande optimizada para la creación a gran escala.

Archivo de contenido a gran escala

Un archivo de contenido a gran escala es un repositorio de documentos en el que los usuarios ven documentos o cargan nuevos documentos. Se realiza poca o ninguna creación en el sitio. Hay dos escenarios principales de archivado de contenido a gran escala: base de conocimiento y administración de registros.

En un sitio de base de conocimiento, hay solo una única versión de la mayoría de los documentos, para que el sitio pueda incrementar la escalabilidad vertical con el objetivo de contener fácilmente millones de documentos (con un máximo recomendado de 30.000.000). Normalmente, el contenido se almacena en una sola base de datos de hasta 1 terabyte. En un escenario típico, por ejemplo, en el centro de soporte técnico de una empresa, 10.000 usuarios pueden tener acceso al contenido, principalmente para leerlo. Un subconjunto de usuarios (tres o cuatro mil) podría cargar nuevo contenido en el sitio. Un sitio de base de conocimiento se puede basar en la plantilla de sitio del Centro de documentación.

Otro tipo de archivo de contenido a gran escala es un centro de registros, basado en la plantilla de sitio del Centro de registros. Se recomienda el uso de esta plantilla para sitios con un millón de documentos o más. La plantilla contiene características que se pueden utilizar para administrar la retención y disposición de registros (documentos que sirven como prueba de las actividades o transacciones realizadas por la organización y que deben conservarse durante un período de tiempo). Al igual que un sitio de base de conocimiento, un centro de registros contiene una única versión de cada documento y normalmente puede contener millones de documentos. Son más los usuarios que envían contenido a un centro de registros que los que lo ven o leen.

Archivo de contenido a escala extremadamente grande

Un archivo de almacenamiento de contenido a escala extremadamente grande puede utilizarse como una biblioteca de referencia o un repositorio de contenido. Para proporcionar una escala mayor que la de un archivo de contenido a gran escala, un archivo de contenido a escala extremadamente grande puede contener 50.000.000 de documentos o más distribuidos en varias colecciones de sitios. El contenido de cada colección de sitios puede almacenarse como datos BLOB (objeto binario grande) en varias bases de datos de contenido o por medio del almacenamiento remoto de blobs (RBS). El almacenamiento remoto de blobs permite que los datos se almacenen fuera de SQL Server, lo que habilita opciones de almacenamiento menos costosas y reduce el tamaño de la base de datos de contenido. Para buscar contenido en varias colecciones de sitios, se usa la búsqueda de SharePoint o FAST Search para SharePoint.

Niveles de almacenamiento: ventajas y consideraciones del almacenamiento de contenido

Colecciones de sitios

Una colección de sitios es un conjunto de sitios web que tienen el mismo propietario y comparten la configuración de administración. Cada colección de sitios contiene un sitio web de nivel superior y puede tener uno o más subsitios. Normalmente, una colección de sitios tiene una estructura de navegación compartida.

Por lo general, los sitios de una colección de sitios están relacionados entre sí por su propósito. Para maximizar la capacidad de uso de la solución, almacene todo el contenido y los datos relacionados en una única colección de sitios. A continuación, se enumeran las ventajas de hacerlo:

  • Los tipos de contenido y columnas que se administran en una colección de sitios pueden compartirse entre los sitios de la colección de sitios. El servicio de metadatos administrados se puede utilizar para distribuir los tipos de contenido y las definiciones de columna en varias colecciones de sitios.

  • Las directivas de administración de información de la colección de sitios pueden estar disponibles para el contenido de todos los sitios de la colección de sitios.

  • Puede realizar la búsqueda en el contenido de varias colecciones de sitios.

  • Algunas vistas muestran documentos de varios sitios de una colección de sitios (por ejemplo, una vista puede mostrar todas las tareas asignadas a un usuario en una colección de sitios). Además, los programadores pueden crear consultas de base de datos entre los sitios de una colección de sitios, pero no se admiten consultas entre los sitios de múltiples colecciones de sitios.

  • Las cuotas de contenido y otras cuotas solo se pueden administrar en el nivel de la colección de sitios.

Al planear cómo asignar el contenido a una o varias colecciones de sitios, tenga en cuenta los siguientes límites:

  • Todos los sitios de una colección de sitios comparten los mismos recursos de servicios back-end. En particular, todo el contenido de una colección de sitios se debe almacenar en la misma base de datos de contenido. A causa de esto, el rendimiento de las operaciones de la base de datos (por ejemplo, la realización de la copia de seguridad y restauración del contenido), depende de la cantidad de contenido de la colección de sitios, el tamaño de la base de datos, la velocidad de los servidores que hospedan la base de datos y otros factores. Según la cantidad de contenido y la configuración de la base de datos, quizás tenga que dividir una colección de sitios en varias colecciones de sitios para cumplir los acuerdos de nivel de servicio relativos a copias de seguridad y restauración, rendimiento y otros requisitos. Este artículo no proporciona instrucciones prescriptivas acerca de cómo administrar el tamaño y el rendimiento de las bases de datos.

  • En especial, mantenga los sitios muy activos en colecciones de sitios separadas. Por ejemplo, un sitio de base de conocimiento en Internet que permite la exploración anónima podría generar una gran cantidad de actividad en la base de datos. Si otros sitios usan la misma base de datos, su rendimiento podría verse afectado. Al colocar el sitio de base de conocimiento en una colección de sitios separada con su propia base de datos, puede poner los recursos a disposición de otros sitios que ya no tienen que competir con el sitio de la base de conocimiento por los recursos de la base de datos.

Nota

SharePoint Foundation y SharePoint Server 2010 incluyen varias características que reducen la necesidad de que el departamento de TI deba restaurar contenido. La papelera de reciclaje y la papelera de reciclaje de la colección de sitios proporcionan un mecanismo de doble seguridad para restaurar los elementos eliminados accidentalmente. El control de versiones del documento también proporciona un tipo red de seguridad: si se pierde un documento, por lo menos la versión anterior estará disponible. Para garantizar mejor la disponibilidad de las versiones anteriores, un administrador puede quitar el permiso para eliminar versiones de un autor. De esta forma, se puede garantizar que las versiones anteriores del contenido estén disponibles sin tener que restaurarlas desde la base de datos.

Sitios

Un sitio web es la principal forma de organizar contenido relacionado en SharePoint Server 2010 y SharePoint Foundation.

El almacenamiento de contenido en el mismo sitio ofrece las siguientes ventajas:

  • Es más fácil crear páginas que muestren vistas de varias bibliotecas y listas cuando se encuentran en el mismo sitio.

  • Puede utilizar la plantilla de sitio del Centro de documentación para crear un sitio que esté optimizado para la creación y el uso de varios documentos.

  • La interfaz de usuario de navegación del sitio está optimizada para que sea fácil buscar y encontrar bibliotecas dentro del mismo sitio.

  • Puede definir un conjunto de tipos de contenido y las columnas del sitio que se usarán en un sitio.

Bibliotecas

El almacenamiento de contenido en la misma biblioteca ofrece las siguientes ventajas:

  • Es más fácil para los usuarios agregar documentos nuevos o encontrar documentos existentes en una única biblioteca.

  • Muchas configuraciones de administración de documentos (como los permisos, el contenido del control de versiones y la aprobación) se implementan en el nivel de la biblioteca.

  • Las vistas creadas mediante el uso de la interfaz de usuario están enlazadas a una biblioteca concreta.

  • Las directivas de administración de información, como la configuración de auditoría y retención de contenido, se pueden implementar en una biblioteca. En algunas bibliotecas, solo se pueden utilizar las directivas de retención.

Piense en los siguientes límites al planear cómo organizar el contenido en la misma biblioteca:

  • La configuración, como las desprotecciones necesarias o el control de versiones, se especifica en el nivel de la biblioteca de documentos. Si desea especificar una configuración diferente para otros documentos, debe colocar estos documentos en una biblioteca diferente con la configuración específica necesaria.

  • Es posible que las vistas que contienen las columnas que se usan solo en un tipo de contenido no sean útiles, ya que no se mostrará ningún valor de metadatos para los elementos de otros tipos de contenido.

  • El rendimiento de las vistas es limitado cuando la cantidad de elementos que se ven supera el umbral de la vista de lista de 5.000 elementos (predeterminado). Además, no se permiten las consultas cuando se supera el umbral de la vista de lista. Organice el contenido de la biblioteca en carpetas con 5.000 elementos o menos o cree vistas que se beneficien de la navegación por metadatos y las columnas indizadas para devolver conjuntos de 5.000 elementos o menos.

Carpetas

Una carpeta es una subdivisión con nombre del contenido de una biblioteca similar a las carpetas en un sistema de archivos. El propósito principal de las carpetas es organizar lógicamente el contenido para que coincida con la funcionalidad esperada de la biblioteca. Por ejemplo, si una biblioteca tiene como objetivo proporcionar especificaciones de productos, el conjunto de carpetas de la biblioteca podría denominarse de acuerdo con cada área de las características del producto o según cada integrante del grupo que escribe especificaciones de los productos.

Al dividir el contenido en varias carpetas, cada una de las cuales con 5.000 (umbral de vista de lista predeterminado) elementos o menos, las vistas de las carpetas se pueden llevar a cabo correctamente. Tenga en cuenta que para aprovechar las ventajas de esto, las vistas disponibles en las carpetas se deben configurar para mostrar solo los elementos de las carpetas (esta característica está disponible en la interfaz de creación de la vista predeterminada). También considere que si las carpetas tienen 5.000 elementos o menos, las vistas en las carpetas no tienen que filtrarse mediante el uso de las columnas indizadas. En las carpetas que contienen más de 5.000 elementos, puede mejorar el rendimiento mediante la navegación por metadatos o columnas indizadas y, a continuación, filtrar las vistas para que devuelvan menos de 5.000 elementos.

Considere la posibilidad de crear las carpetas como parte de una solución de enrutamiento y almacenamiento de contenido basada en metadatos. Al utilizar el organizador de contenido, puede establecer opciones de configuración para la creación automática de carpetas cuando una carpeta de destino se vuelve demasiado grande o para la creación automática de carpetas para cada valor de una propiedad de metadatos. Para obtener más información, vea Enrutamiento y almacenamiento de contenido empresarial mediante el uso de metadatos más adelante en este artículo.

Enrutamiento y almacenamiento de contenido empresarial mediante el uso de metadatos

SharePoint Server 2010 presenta el almacenamiento y enrutamiento de metadatos mediante el uso del organizador de contenido. Con el organizador de contenido, las nuevas características de nivel del sitio hacen que las tareas de clasificar, enrutar y almacenar contenido sean más fáciles para los administradores y usuarios mediante la aplicación de reglas basadas en metadatos.

En función de los metadatos de un documento, el organizador de contenido puede redirigir un documento a una carpeta especificada o crear automáticamente una nueva carpeta. Las carpetas se pueden crear como elementos secundarios de la carpeta de destino, debido a que la cantidad de elementos de la carpeta de destino excede un límite especificado o se pueden crear para cada nuevo valor en un campo. Las carpetas nuevas heredarán la configuración de la carpeta primaria. Las carpetas nuevas luego podrán tener más reglas que definan otros parámetros, como permisos, metadatos adicionales, directivas de retención y flujos de trabajo que los documentos que contengan heredarán.

Para obtener más información, vea Introducción al almacenamiento y enrutamiento basados en metadatos (SharePoint Server 2010).

Filtrado y navegación del contenido empresarial mediante el uso de metadatos

El filtrado y la navegación por metadatos es una característica nueva de SharePoint Server 2010 que permite a los usuarios filtrar y buscar contenido mediante el uso de metadatos. La característica Filtrado y navegación por metadatos incluye una interfaz de usuario simple que se basa en el control de jerarquía de vista de árbol de SharePoint y que combina con un nuevo control de filtros clave, lo que proporciona a los usuarios una herramienta muy eficaz en la búsqueda de contenido basada en metadatos.

Los propietarios de la lista pueden configurar las opciones de navegación por metadatos que promuevan los campos de una lista como campos clave de navegación. Luego, los usuarios que vean las listas, pueden filtrar la vista de lista actual para mostrar solo elementos con los valores deseados en esos campos.

Las características de indización automática pueden crear índices de lista automáticamente en función de los campos indicados como campos de navegación de la lista. La indización automática puede mejorar los resultados de las consultas y el rendimiento.

Para obtener más información acerca de cómo puede integrar la navegación por metadatos en la solución de almacenamiento de contenido empresarial, vea Introducción a la navegación por metadatos (SharePoint Server 2010).

Vistas de lista

La posibilidad de que los usuarios puedan buscar y encontrar fácilmente el contenido deseado es parte central de cada solución de administración de contenido empresarial. Cuando se mueve a través de una carpeta o biblioteca, las vistas de árbol y de lista proporcionan una interfaz sencilla para que los usuarios naveguen visualmente por la taxonomía de almacenamiento de contenido. Al mismo tiempo, cuando una biblioteca o carpeta contiene demasiados elementos, la capacidad de la lista de realizar consultas y mostrar rápidamente los resultados puede requerir una gran cantidad de recursos del sistema. SharePoint Server 2010 puede maximizar el rendimiento de la vista de lista y reducir al mínimo el consumo de recursos del sistema mediante el uso de la limitación de recursos. Las propiedades de la limitación de recursos se establecen para una aplicación web en Configuración general de Administración central y afecta los recursos asignados para consultar y mostrar listas dentro de esa aplicación web.

Configurar el almacenamiento de modo que cuando se vea el contenido de una biblioteca o carpeta no se supere el umbral de la vista de lista impide que limitación de recursos y aumenta al máximo el rendimiento de la vista de lista.

La limitación de recursos incluye las siguientes propiedades que están relacionadas con el rendimiento de la vista de lista:

Propiedad Descripción Valor predeterminado

Umbral de la vista de lista

La cantidad máxima de elementos de lista o biblioteca que una operación de base de datos, como una consulta, puede procesar al mismo tiempo, fuera del intervalo diario de horas definido por el administrador durante el cual las consultas no tienen restricciones. Se recomienda no cambiar este valor de la configuración de la propiedad.

5.000

Invalidación de modelo de objeto

Especifica que los usuarios que tienen un permiso especial pueden reemplazar el Umbral de la vista de lista mediante programación para consultas determinadas.

Umbral de la vista de lista para auditores y administradores

La cantidad máxima de elementos de lista o biblioteca que una operación de base de datos, como una consulta, puede procesar a la vez cuando un auditor o administrador con los permisos apropiados realiza la operación. Esta configuración funciona junto con Permitir invalidación de modelos de objetos.

20.000

Umbral de búsqueda en la vista de lista

La cantidad máxima de combinaciones permitidas por consulta, como las basadas en las columnas de búsqueda, persona o grupo o de estado de flujo de trabajo. Si la consulta utiliza más de ocho combinaciones, la operación se bloquea. Esto no se aplica a las operaciones de un elemento. Cuando se utiliza la vista máxima mediante el modelo de objetos (por no especificar ningún campo de vista), SharePoint volverá a las ocho primeras búsquedas. Se recomienda no cambiar este valor de la configuración de la propiedad.

8

Intervalo diario de horas para grandes consultas

Un período de tiempo en el que se pueden ejecutar consultas de gran tamaño. El período de tiempo se debe establecer fuera del horario normal de trabajo porque las consultas de gran tamaño pueden provocar demasiada carga del servidor.

Deshabilitado

Otros recursos

Además de la información de este artículo, los siguientes recursos pueden ayudarle a comprender y planear una solución de almacenamiento de contenido empresarial.