Share via


Planejar o armazenamento de conteúdo corporativo

Atualizado em: 2009-02-26

Este artigo contém informações para ajudar os planejadores de solução e designers a planejar e configurar adequadamente uma solução de gerenciamento de conteúdo corporativo em larga escala com base no Microsoft Office SharePoint Server 2007 para que ele funcione corretamente e ofereça os recursos de que os usuários do site necessitam. O Office SharePoint Server 2007 oferece suporte ao armazenamento de documentos de alta capacidade; uma biblioteca de documentos pode conter até 5 milhões de documentos. No entanto, dependendo da forma como o conteúdo for usado, o desempenho de sites com um número muito grande de documentos poderá ser menor. A orientação prescritiva fornecida neste artigo pode ajudar você a projetar soluções de gerenciamento de conteúdo em larga escala que estejam dimensionadas para os requisitos da sua corporação, fornecendo aos usuários de sua solução um ambiente de bom desempenho para a criação e utilização de documentos.

As decisões tomadas sobre os recursos dos conjuntos de sites, sites e bibliotecas do Office SharePoint Server 2007 devem levar em conta não só as restrições físicas de armazenamento de seu ambiente Office SharePoint Server 2007 mas também o uso de conteúdo e a exibição de padrões de seus usuários. Por exemplo, se os usuários exibem ou consultam um conjunto de documentos em uma biblioteca com milhares de documentos, o desempenho poderá cair se o site não estiver configurado corretamente. Ou se um acordo de nível de serviço exigir que o conteúdo seja gravado em backup duas vezes por dia, o serviço poderá não ser satisfatoriamente executado caso o conjunto de conteúdo seja muito grande. Este artigo discute as técnicas que você pode usar para fornecer a funcionalidade de gerenciamento de conteúdo necessária mantendo um desempenho aceitável.

Neste tópico, serão discutidos quatro níveis de armazenamento de conteúdo:

  • Conjunto de sites

  • Site

  • Biblioteca

  • Pasta

Para cada nível de armazenamento, este artigo descreverá as vantagens da organização de conteúdo nesse nível, discutirá como o desempenho pode diminuir à medida que o número de documentos armazenados aumentar e oferecerá recomendações para melhorar o desempenho quando houver volumes altos de conteúdo.

Neste artigo:

  • Cenários típicos de gerenciamento de conteúdo em larga escala

  • Conjuntos de sites: vantagens e limitações do armazenamento de conteúdo

  • Sites: vantagens e limitações do armazenamento de conteúdo

  • Bibliotecas: vantagens e limitações do armazenamento de conteúdo

  • Pastas: vantagens e considerações sobre o armazenamento de conteúdo

  • Resumo das recomendações

Dica

Embora os exemplos neste artigo sejam principalmente relevantes para soluções baseadas no Office SharePoint Server 2007, as informações prescritivas fornecidas aqui se aplicam ao Office SharePoint Server 2007 e ao Windows SharePoint Services 3.0.

Cenários típicos de gerenciamento de conteúdo em larga escala

Normalmente, os cenários de gerenciamento de conteúdo em larga escala são variações de um dos seguintes cenários:

  • Ambiente de criação em larga escala

  • Arquivo morto de conteúdo em larga escala

  • Arquivo morto de conteúdo em escala extremamente larga

As descrições de cenário fornecidas aqui se destinam a esclarecer o que queremos dizer com soluções em larga escala e a oferecer exemplos que esperamos que reflitam seus objetivos de gerenciamento de conteúdo.

Ambiente de criação em larga escala

Em um ambiente de criação em larga escala, um site pode conter uma biblioteca na qual os usuários editam ativamente 50.000 ou mais documentos entre 500 ou mais pastas. O controle de versão está habilitado, e geralmente existem 10 ou mais versões anteriores de cada documento. Os documentos entram e saem com frequência e os fluxos de trabalho são usados para controlar seus ciclos de vida. Vinte ou mais tipos de conteúdo podem estar em uso. Um banco de dados comum para esse tipo de site contém aproximadamente 150 GB (GB) de dados (observe que cada versão de um documento é armazenada separadamente no banco de dados). Normalmente, em um ambiente de criação em larga escala, 80% dos usuários do site são autores que têm acesso a versões principais ou secundárias de documentos, enquanto que 20% dos usuários do site têm permissões de somente leitura e só podem exibir as versões principais do conteúdo.

Um site ambiente de criação em larga escala pode se basear no modelo de site da Central de Documentos do Office SharePoint Server 2007, que inclui uma única biblioteca de documentos, muito grande, e que é otimizada para a criação em larga escala. Consulte o site da Central de Documentos.

Arquivo morto de conteúdo em larga escala

Um arquivo morto em larga escala é um repositório de documentos no qual os usuários exibem documentos ou carregam novos documentos. Pouca ou nenhuma criação acontece no site. Existem dois cenários de arquivo morto principais: base de dados de conhecimento e gerenciamento de registros.

Em um site de base de dados de conhecimento, há somente uma única versão da maioria dos documentos, para que o site possa ser dimensionado para armazenar 1.000.000 de documentos ou mais com facilidade. O conteúdo é geralmente armazenado em um único banco de dados de 400 GB. Em um cenário típico, como uma central de suporte técnico de uma corporação, 10.000 usuários podem acessar o conteúdo, principalmente para lê-lo. Um subconjunto de usuários (entre 3. 000 e 4. 000) carrega conteúdo novo para o site. Um site de base de dados de conhecimento pode se basear no modelo de site da Central de Documentos.

Outro tipo de arquivo morto em larga escala é uma central de registros, baseada no modelo de site da Central de Registros. Esse modelo de site contém recursos que você pode usar para gerenciar a retenção e disposição de registros (documentos que servem como evidência de atividades ou transações realizadas por organização e que devem ser mantidos por um período de tempo). Semelhante a um site de base de dados conhecimento, uma central de registros contém uma única versão de cada documento e geralmente armazena 1.000.000 ou mais documentos. Muitos mais usuários enviam conteúdo para uma central de registros do que os exibem ou os leem.

Arquivo morto de conteúdo em escala extremamente larga

Se a interface do usuário de um site for personalizado para remover operações de interface do usuário que utilizam intensamente recursos, como consultas complexas de exibição, um arquivo morto de conteúdo em escala extremamente larga pode ser usado como uma biblioteca de referência ou repositório de conteúdo. Um arquivo morto em escala extremamente larga pode conter até 10.000.000 de documentos distribuídos por 5.000 pastas ou mais. O banco de dados pode ter mais de três terabytes (TB).

Em um arquivo morto em escala extremamente larga, os usuários (50.000 ou mais) procuram conteúdo principalmente por meio de pesquisa. O conteúdo é enviado usando um formulário personalizado de envio.

Conjuntos de sites: vantagens e limitações do armazenamento de conteúdo

Um conjunto de sites é aquele que contém o mesmo proprietário e compartilha configurações administrativas. Cada conjunto de sites contém um site de alto nível e pode conter um ou mais subsites. UM Conjunto de sites normalmente tem uma estrutura de navegação compartilhada.

Vantagens do armazenamento de conteúdo no mesmo conjunto de sites

Os sites de um conjunto de sites normalmente estão inter-relacionados por finalidade. Para maximizar a usabilidade de sua solução, armazene todos os dados e conteúdo relacionados em um único conjunto de sites. As vantagens de fazer isso incluem:

  • Tipos de conteúdo e colunas gerenciados em um conjunto de sites podem ser compartilhados em todos os sites de um conjunto de sites. Inversamente, há um mecanismo automático para propagar os tipos de conteúdo e as definições de coluna entre vários conjuntos de sites.

  • As políticas de gerenciamento de informações gerenciadas no conjunto de sites podem ser disponibilizadas para conteúdo em todos os sites do conjunto.

  • O Office SharePoint Server 2007 atualiza automaticamente links para arquivos renomeados ou movidos em um conjunto de sites para refletir seus nomes ou localizações novos. Inversamente, links para documentos em outros conjuntos de sites não são atualizados.

  • Se o conjunto de sites estiver em um servidor que esteja executando o Windows SharePoint Services 3.0, a pesquisa só poderá ser feita no conteúdo desse conjunto de sites. Se o conjunto de sites estiver em um servidor que esteja executando o Office SharePoint Server 2007, o conteúdo poderá ser pesquisado em vários conjuntos de sites.

  • Alguns modos de exibição do Windows SharePoint Services 3.0 Office SharePoint Server 2007 listam documentos de vários sites em único conjunto de sites (por exemplo, uma exibição enumerando todas as tarefas atribuídas a um usuário de um conjunto de sites). Além disso, os desenvolvedores podem criar consultas em bancos de dados entre sites que não têm suporte em vários conjuntos de sites.

  • Cotas de conteúdo e outras cotas só podem ser gerenciadas no nível do conjunto de sites.

Limites de armazenamento de conteúdo no mesmo conjunto de sites

Tenha em mente os limites a seguir quando estiver planejando a alocação do seu conteúdo em um ou mais conjuntos de sites:

  • A criação de muitos subsites de qualquer site de um conjunto de sites poderá a usabilidade e o desempenho. Limite o número máximo de subsites de qualquer site para 2.000.

  • Todos os sites de um conjunto de sites compartilham os mesmos recursos de back-end. Em particular, todo o conteúdo de um conjunto de sites deve ser armazenado no mesmo banco de dados de conteúdo. Devido a isso, o desempenho das operações banco de dados — como o backup e a restauração de conteúdo — dependerá da quantidade de conteúdo em todo o conjunto de sites, do tamanho do banco de dados, da velocidade dos servidores que hospedam o banco de dados e de outros fatores. Dependendo da quantidade de conteúdo e da configuração do banco de dados, convém segmentar um conjunto de sites em vários conjuntos de sites para atender aos acordos de nível de serviço para backup e restauração, taxa de transferência ou outros requisitos. Está além do escopo deste artigo oferecer orientação orientação prescritiva sobre como gerenciar o tamanho e o desempenho dos bancos de dados. Para obter mais informações sobre planejamento da capacidade, consulte Planejar o desempenho e a capacidade (Office SharePoint Server).

  • Particularmente, mantenha sites extremamente ativos em conjuntos de sites separados. Por exemplo, um site de base de dados de conhecimento sobre a Internet que permite a navegação anônima poderia gerar muita atividade de banco de dados. Se outros sites usarem o mesmo banco de dados, seu desempenho poderia ser afetado. Ao colocar o site da base de dados de conhecimento em um conjunto de sites separado com seu próprio banco de dados, você poderá liberar recursos para outros sites que não tenham mais que competir com ele por recursos de banco de dados.

Observe que o Windows SharePoint Services 3.0 e o Office SharePoint Server 2007 têm um número de recursos que atenua a necessidade de fazer com que seu departamento de TI restaure conteúdo. A Lixeira e a Lixeira do Conjunto de Sites oferecem um mecanismo de segurança duplo para a restauração de itens excluídos inadvertidamente. O controle de versão de documentos também oferece uma rede de segurança para documentos perdidos porque suas versões anteriores estão disponíveis. Para garantir ainda mais a disponibilidade de versões anteriores, um administrador pode remover a permissão de excluir versões das permissões dos autores; isso pode ajudar a garantir que as versões anteriores do conteúdo estejam disponíveis sem que seja preciso restaurá-las a partir de banco de dados.

Sites: vantagens e limitações do armazenamento de conteúdo

Um site é o principal meio de organizar conteúdo relacionado no Office SharePoint Server 2007 Windows SharePoint Services 3.0.

Vantagens de armazenar conteúdo no mesmo site

  • É mais fácil criar páginas que mostrem modos de exibição de várias bibliotecas e listas quando elas estão no mesmo site.

  • A interface do usuário de navegação do site é otimizada para facilitar a localização e a navegação para bibliotecas dentro do mesmo site.

  • Você define e atribui permissões para grupos no nível do site.

  • Você pode definir um conjunto de tipos de conteúdo e colunas de site para uso em um site.

O site da Central de Documentos

O Office SharePoint Server 2007 inclui um modelo de site da Central de Documentos. Use esse modelo para criar um site otimizado para criar e usar um grande número de documentos.

Para habilitar práticas recomendadas de gerenciamento de documentos, os sites baseados no modelo de site da Central de Documentos têm recursos de gerenciamento de documentos recomendados por padrão, incluindo:

  • Recursos de navegação para ajudar os autores a localizarem seu conteúdo.

  • Controle de versão principal/secundária habilitado.

  • Check-in e check-out obrigatórios de documentos.

  • Vários tipos de conteúdo habilitados.

  • Um Web Part de documentos relevantes que gera uma exibição personalizada de documentos retirados, criados ou modificados pela última vez pelo usuário atual. Você pode configurar o Web Part para usar mais de um critério.

  • Um Web Part de tarefas futuras que gera uma exibição personalizada de tarefas relacionadas a documentos atribuídas ao usuário atual.

A indexação de colunas é uma técnica que ajuda a garantir que uma exibição ou consulta retornará uma lista de itens no intervalo recomendado de 2.000 ou menos itens. Use a tabela a seguir para determinar as colunas corretas a serem indexadas para cada consulta aceita pelo Web Part de documentos relevantes:

Se você configurar o Web Part de documentos relevantes para... Em seguida, na biblioteca Documentos Compartilhados, faça a indexação das seguintes colunas:

Incluir documentos modificados pela última vez por mim

Modificado por

Incluir documentos criados por mim

Criado por

Incluir documentos retirados por mim

Retirado por

Além de indexar colunas para melhorar o desempenho do Web Part de documentos relevantes, verifique se a caixa de seleção Mostrar itens de todo o conjunto de sites não está marcada ao configurar o Web Part em um ambiente de gerenciamento de documentos em larga escala.

Limites de armazenamento de conteúdo no mesmo site

  • Mais de 2.000 bibliotecas e listas em um único site degradará o desempenho.

  • Testes de usabilidade mostram que mais de 50 listas e bibliotecas na estrutura de navegação do site dificultará a navegação do conteúdo na interface do usuário.

Bibliotecas: vantagens e limitações do armazenamento de conteúdo

Uma biblioteca de documentos é um local em um site que que contém os arquivos de um ou mais tipos de conteúdo. As bibliotecas de são projetadas para gerenciar e armazenar documentos relacionados e para permitir que os usuários criem novos documentos dos tipos apropriados.

Vantagens do armazenamento de conteúdo na mesma biblioteca

  • É mais fácil para os usuários adicionarem novos documentos ou localizarem documentos existentes em uma única biblioteca.

  • Muitas configurações de gerenciamento de documentos — como permissões, controle de versão de conteúdo e aprovação — são aplicadas no nível da biblioteca.

  • As exibições criadas por meio da interface do usuário são ligadas a uma determinada biblioteca.

  • Políticas de gerenciamento de informações, como a auditoria de conteúdo e configurações de retenção, podem ser aplicadas a uma biblioteca.

Limites de armazenamento de conteúdo na mesma biblioteca

  • O tamanho máximo recomendado de uma biblioteca é de 10.000.000 documentos.

  • Para aplicar configurações exclusivas de gerenciamento de documentos para conteúdo, como checkouts ou controles de versão exigidos, o conteúdo deverá ser armazenado em uma biblioteca separada.

  • Se vários tipos de conteúdo forem usados em uma biblioteca e cada tipo de conteúdo tiver uma ou mais colunas de metadados que se aplicam somente a esse tipo de conteúdo, as exibições poderão ficar confusas. Para melhorar isso, é possível associar cada tipo de conteúdo a uma biblioteca separada.

  • O desempenho das exibições de conteúdo diminui quando o número de itens for maior do que 2.000. As soluções para essa limitação são organizar o conteúdo da biblioteca em pastas, cada uma contendo 2.000 itens ou menos, ou criar exibições que tirem proveito colunas indexadas para retornar conjuntos de 2.000 itens ou menos (consulte a seguir uma discussão sobre o uso de colunas indexadas em exibições).

Dica

Todo o conteúdo de página da Web de um site é armazenado em uma única biblioteca de páginas desse site, que contém todas as páginas de conteúdo do site. A limitação recomendada de 2.000 itens ou menos por exibição ou consulta se aplica a bibliotecas de páginas, bem como a bibliotecas de documentos.

Usando colunas indexadas para melhorar o desempenho da exibição

Como mencionado acima, o desempenho das exibições cairá o número de itens for maior do que 2.000. Uma técnica útil para limitar o número de itens a serem mostrados em uma exibição é indexar uma coluna usada na exibição e filtrar a exibição com base nessa coluna, para que 2.000 itens ou menos sejam exibidos (uma coluna indexada é aquela em que o Office SharePoint Server 2007 mantém um registro para tornar as consultas relacionadas à exibição mais eficientes).

Por exemplo, se for improvável que mais de 2.000 itens de uma biblioteca sejam modificados em qualquer período de sete dias, você poderia indexar a coluna Modificado de uma biblioteca e filtrar uma exibição para que somente os itens alterados nos últimos sete dias fossem exibidos (para isso, especifique que a coluna Modificado seja menor do que Hoje-7). Como em outro exemplo, se for provável que cada autor criará menos de 2.000 itens, você poderia indexar a coluna Criado por e filtrar uma exibição para que autores só pudessem ver os documentos criados por eles (para isso, especifique que a coluna Criado por seja igual a Me).

Os tipos de coluna a seguir podem ser indexados e usados para filtrar exibições:

  • Linha única de texto

  • Várias linhas de texto

  • Número

  • Moeda

  • Escolha

  • Data e hora

  • Pesquisa

  • Sim/Não

  • Pessoa ou grupo

  • Calculado

Estas são outras considerações sobre como criar modos de exibição filtrados por colunas indexadas:

  • Somente uma coluna indexada pode ser usada em uma exibição.

  • Não crie filtros usando "Ou" para fornecer vários critérios ao utilizar uma coluna indexada para filtrar uma exibição.

  • Usar o recurso Limite de Itens para modificar uma exibição não melhora o desempenho da exibição.

Dica

Se um usuário tentar criar uma exibição que poderia se beneficiar do uso de uma coluna indexada, o Office SharePoint Server 2007 exibirá uma mensagem de aviso recomendando essa abordagem.

Pastas: vantagens e considerações do armazenamento de conteúdo

Uma pasta é uma subdivisão nomeada do conteúdo de uma biblioteca semelhante a pastas de um sistema de arquivos. O principal objetivo de pastas é organizar conteúdo para coincidir com a funcionalidade esperada da biblioteca. Por exemplo, se uma biblioteca se destina a fornecer as especificações do produto, o conjunto de pastas de biblioteca poderia ser nomeado para cada área de recurso no produto ou para cada membro da equipe que grava as especificações do produto.

As pastas podem ser usadas para melhorar o desempenho da biblioteca. Ao dividir o conteúdo em várias pastas, cada uma contendo 2.000 itens ou menos, as exibições nas pastas funcionarão bem. Observe que, para aproveitar isso, as exibições disponíveis nas pastas deverão ser configuradas para mostrarem somente itens dentro de pastas (esse recurso está disponível na interface de criação de exibições padrão do Office SharePoint Server 2007). Observe também que, se as pastas contiverem 2.000 itens ou menos, as exibições nas pastas não precisarão ser filtradas com colunas indexadas.

Resumo das recomendações

Este é um resumo das recomendações para melhorar o desempenho em cada nível de armazenamento quando volumes altos de conteúdo estiverem sendo armazenados:

Nível Limites de desempenho

Conjunto de sites

2.000 subsites de qualquer site é o limite recomendado.

O mesmo banco de dados de conteúdo é usado para um conjunto de sites inteiro. Isso pode afetar desempenho em operações como backup e restauração.

Site

2.000 bibliotecas e listas é o limite recomendado.

Biblioteca

10.000.000 de documentos é o limite recomendado.

2.000 itens por exibição é o limite recomendado.

Pasta

2.000 itens por pasta é o limite recomendado.

Baixar este manual

Este tópico está incluído no manual baixável a seguir para facilitar a leitura e a impressão:

Consulte a lista completa de manuais disponíveis na página de download de conteúdo do Office SharePoint Server 2007.

Consulte também

Conceitos

Planejar o desempenho e a capacidade (Office SharePoint Server)
Planejar o gerenciamento de registros