Información general sobre Desduplicación de datos
Publicada: febrero de 2012
Actualizado: agosto de 2012
Se aplica a: Windows Server 2012, Windows Storage Server 2012
En este tema se describe la característica de desduplicación de datos de Windows Server 2012, así como sus aplicaciones prácticas.
La desduplicación de datos implica buscar y quitar duplicados dentro de los datos sin poner en peligro la fidelidad ni la integridad. El objetivo es almacenar más datos en menos espacio al segmentar archivos en pequeños fragmentos de tamaño variable (32–128 KB), identificar fragmentos duplicados y mantener una sola copia de cada fragmento. Las copias redundantes de los fragmentos se reemplazan por una referencia a la copia única. Los fragmentos se comprimen y se organizan en archivos de contenedor especiales de la carpeta de información de volumen del sistema.
Después de habilitar un volumen para desduplicación y de optimizar los datos, el volumen contiene lo siguiente:
-
Archivos sin optimizar. Por ejemplo, entre los archivos sin optimizar se podrían encontrar archivos que no cumplen la opción de directiva de antigüedad de archivo, archivos de estado del sistema, secuencias de datos alternas, archivos cifrados, archivos con atributos extendidos, archivos menores de 32 KB, otros archivos de punto de repetición de análisis o archivos que otras aplicaciones están usando.
-
Archivos optimizados. Archivos que se almacenan como puntos de repetición de análisis y que contienen punteros a un mapa de los fragmentos correspondientes en el almacén de fragmentos que es necesario restaurar cuando se solicite el archivo.
-
Almacén de fragmentos. Ubicación de los datos de archivos optimizados.
-
Espacio libre adicional. Los archivos optimizados y el almacén de fragmentos ocupan mucho menos espacio que antes de la optimización.
Para abordar el crecimiento del almacenamiento de datos en la empresa, los administradores consolidan servidores y hacen de la escalabilidad de la capacidad y de la optimización de los datos sus principales objetivos. La desduplicación de datos proporciona formas prácticas de lograr estos objetivos, entre ellas:
-
Optimización de la capacidad. En Windows Server 2012, la desduplicación de datos almacena más datos en menos espacio físico. Logra más eficacia de almacenamiento que la que ofrecían características como la compresión NTFS o Almacenamiento de instancia única (SIS). La desduplicación de datos usa la compresión y fragmentación de tamaño variable en subarchivos, lo que reporta una relación de optimización del almacenamiento de 2:1 en los servidores de archivos generales, y de hasta 20:1 en los datos de virtualización.
-
Escala y rendimiento. En Windows Server 2012, la desduplicación de datos es sumamente escalable, eficiente en cuanto al uso de recursos y no intrusiva. Puede procesar unos 20 MB de datos por segundo y puede ejecutarse en varios volúmenes simultáneamente sin afectar a otras cargas de trabajo del servidor. El escaso impacto que tiene en las cargas de trabajo del servidor se consigue limitando los recursos de CPU y memoria que se consumen. Si el servidor se carga con mucho trabajo, la desduplicación puede detenerse por completo. Además, los administradores tienen la posibilidad de ejecutar los trabajos de desduplicación de datos en cualquier momento, programar cuándo se ejecutará la desduplicación de datos y establecer directivas de selección de archivos.
-
Confiabilidad e integridad de los datos. Cuando se aplica la desduplicación de datos, se conserva la integridad de los mismos. Windows Server 2012 usa validación de suma de comprobación, de la coherencia y de la identidad para garantizar la integridad de los datos. Para todos los metadatos y los datos de referencia más frecuentes, la desduplicación de datos mantiene la redundancia para garantizar que los datos se puedan recuperar en caso de que resulten dañados.
-
Eficacia del ancho de banda con BranchCache. Gracias a la integración con BranchCache, se aplican las mismas técnicas de optimización a los datos que se transfieren a través de la WAN a una sucursal. Como resultado, los tiempos de descarga de archivos son más rápidos y se reduce el consumo de ancho de banda.
-
Administración de la optimización con herramientas familiares. Windows Server 2012 dispone de funcionalidad de optimización integrada en el Administrador de servidor y en Windows PowerShell. La configuración predeterminada puede proporcionar ahorros de inmediato y los administradores pueden optimizar las opciones para obtener mejores resultados. Se pueden usar fácilmente los cmdlets de Windows PowerShell para iniciar un trabajo de optimización o para programar uno para que se ejecute en el futuro. La instalación de la característica de desduplicación de datos y la habilitación de la desduplicación en volúmenes determinados también se puede lograr con un archivo Unattend.xml que llama a un script de Windows PowerShell y se puede usar con Sysprep para implementar la desduplicación cuando un sistema se inicia por primera vez.
Para aprovechar las ventajas de la desduplicación de datos en Windows Server 2012, el entorno debe cumplir los requisitos siguientes:
-
Servidor: un equipo que ejecuta Windows Server 2012 o una máquina virtual con al menos un volumen de datos
-
(Opcional) Otro equipo: un equipo que ejecuta Windows Server 2012 o Windows® 8 y que está conectado al servidor a través de la red
Para obtener más información sobre las tecnologías relacionadas en Windows Server 2012, consulte:
