Descripción de los códecs de audio de mensajería unificada

 

Se aplica a: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1, Exchange Server 2007

Última modificación del tema: 2008-03-20

En la mensajería unificada (UM) de Microsoft Exchange Server 2007, se usa un códec para almacenar los mensajes de correo de voz. Entre una puerta de enlace IP o una central de conmutación (PBX) de IP y un servidor que ejecute Exchange 2007 que tenga la función del servidor Mensajería unificada se usa otro códec. La mensajería unificada de Exchange 2007 puede usar cualquiera de los siguientes tres códecs de audio y almacenar los mensajes de voz:

  • Windows Media Audio (WMA)

  • Group System Mobile (GSM) 06.10

  • Modulación por impulsos codificados (PCM) lineal G.711

Sin embargo, los códecs G.711 (PCMA y PCMU) y G.723.1 son códecs VoIP que se usan entre una puerta de enlace de IP y el servidor de mensajería unificada.

Parte del planeamiento del sistema de mensajería unificada consiste en elegir el códec de audio según las necesidades y los requisitos de su organización. En este tema, se contemplan los códecs de audio que la mensajería unificada de Exchange 2007 puede usar para ayudarle a planear su implementación de mensajería unificada.

Importante

En servidores de mensajería unificada de 64 bits, deberá instalar el Codificador de Windows Media si tiene pensado usar el códec de plan de marcado de mensajería unificada WMA. Para obtener más información acerca de cómo instalar el Codificador de Windows Media, consulte Disponibilidad del códec de voz de equipos basados en x 64 audio de Windows Media 9 o el Centro de descarga de Microsoft.

Códecs

En la mensajería unificada de Exchange 2007 se usan dos tipos de códecs: el códec que se usa entre las puertas de enlace IP y el servidor de mensajería unificada o entre un PBX y una puerta de enlace IP, dependiendo del tipo de PBX, y el códec que se usa para codificar y almacenar los mensajes de voz para los usuarios.

El término "códec" es una combinación de las palabras "codificación" y "descodificación", y se usa con datos de audio digitales. Un códec es un software informático que transforma los datos digitales en un formato de archivo de audio o de secuencias de audio. Los códecs se usan para convertir una señal de voz analógica en una versión digital de la señal de voz. Los códecs pueden variar en calidad de sonido, ancho de banda necesario para usarlos y requisitos del sistema necesarios para hacer la codificación.

Al usar un teléfono normal en la red telefónica pública conmutada (PSTN) la voz se transporta en formato analógico en la línea telefónica. Pero con el protocolo de voz sobre Internet (VoIP), la voz debe convertirse en señales digitales. Este proceso de conversión se conoce como codificación. Un códec realiza la codificación. Después de que la voz digitalizada haya alcanzado su destino, debe decodificarse a su formato analógico original para que la persona al otro lado de la llamada pueda oír y entender al autor de la llamada.

Códec VoIP

En la mensajería unificada de Exchange 2007, se pueden usar tres tipos de códecs entre las puertas de enlace IP y el servidor de mensajería unificada o entre una PBX y la puerta de enlace IP, según el tipo de PBX. Los servidores de mensajería unificada pueden aceptar los siguientes códecs VoIP de una puerta de enlace p un PBX IP:

  • G.711 µ-law

  • G.711 A-law

  • G.723.1

G.711 es un estándar que se desarrolló para usarlo con códecs de audio. Existen dos algoritmos principales definidos en el estándar para G.711.El algoritmo µ-law, usado en América del Norte y Japón, y el algoritmo A-law, usado en Europa y otros países. El códec de audio G.723.1 se usa mayoritariamente en aplicaciones VoIP y necesita una licencia para poder usarse. G.723.1 es un tipo de códec de alta calidad y de compresión elevada.

Tanto un servidor de mensajería unificada como una puesta de enlace IP compatible pueden ofrecer tanto el códec G.711 como el G.723.1. Sin embargo, el servidor de mensajería unificada elegirá su códec preferido en función de la clave WireCodecList del Registro. De forma predeterminada, el primer códec que se usa es G.723.1. Si desea usar un códec que no sea G.723.1 entre el servidor de mensajería unificada y la puerta de enlace IP o IP PBX, se recomienda modificar la configuración en la puerta de enlace IP o IP PBX y no agregar, quitar o modificar ningún valor de la clave WireCodecList del Registro. El servidor de mensajería unificada determinará el códec que usa la puerta de enlace IP o IP-PBX y seleccionará el códec adecuado de la lista del ‏Registro.

En la tabla siguiente se resumen algunos de los códecs VoIP comunes.

Códecs VoIP

Códec VoIP Ancho de banda (Kbps) Descripción

G0,711

64

Este códec requiere un procesamiento muy lento. Necesita un mínimo de 128 Kb por segundo (Kbps) para una comunicación a dos bandas.

G.723.1

5.3/6.3

Este códec ofrece una compresión alta con audio de alta calidad. Necesita más procesamiento que el códec G.711. El códec G.723.1 usa un ancho de banda reducido pero ofrece una calidad de audio más pobre.

Códec de almacenamiento de mensajes de voz de mensajería unificada

Los planes de marcado de mensajería unificada constituyen una parte integral del funcionamiento de la mensajería unificada de Exchange 2007. De forma predeterminada, al crear un plan de marcado de mensajería unificada, éste usa el códec de audio WMA. Sin embargo, tras crear el plan de marcado, puede configurarlo para que use los códecs de audio GSM 06.10 o G.711 PCM Linear.

Cada códec de audio tiene ventajas e inconvenientes. El códec de audio WMA se eligió como códec de audio predeterminado debido a su calidad de sonido y propiedades de compresión. Los códecs de audio GSM 06.10 y G.711 PCM Linear se incluyeron como opciones disponibles por su capacidad para admitir otros tipos de sistemas de mensajería.

Al planear la mensajería unificada de Exchange 2007, debe equilibrar el tamaño y la calidad relativa del archivo de audio que se creará para los mensajes de voz. En general, cuanto más alta sea la velocidad de bits de un archivo de audio, mayor será la calidad. Sin embargo, también debe tener en cuenta si el archivo de audio se va a comprimir. La velocidad de muestreo (bit/seg.) y las propiedades de compresión para cada códec usado en la mensajería unificada de Exchange 2007 son las siguientes:

Códec de almacenamiento de mensajes de voz de mensajería unificada

Códec de almacenamiento de mensajes de voz Bits ¿Archivo comprimido?

WMA

16 bits

G.711 PCM

16 bits

No

GSM 06.10

8 bits

En la mensajería unificada de Exchange 2007, los códecs de audio WMA, G.711 PCM Linear y GSM 06.10 se usan para crear archivos de audio .wma y .wav para mensajes de voz. Sin embargo, el tipo de archivo que se crea depende del códec de audio usado para crear el archivo de audio de mensaje de voz. En la mensajería unificada de Exchange 2007, el códec de audio .wma crea archivos de audio .wma y los códecs de audio GSM 06.10 y G.711 PCM Linear producen archivos de audio .wav. Ambos tipos de archivos de audio se envían junto con el mensaje de correo electrónico al destinatario del mensaje de voz.

A menudo, pero no siempre, la codificación y descodificación de los datos digitales también implica compresión y descompresión. La compresión de audio es una forma de compresión de datos que reduce el tamaño de los archivos de datos de audio. El algoritmo de compresión de audio que usa el códec de audio comprime los archivos de audio .wma o .wav. En la mensajería unificada de Exchange 2007, el tipo de algoritmo de compresión de audio que se usa se basa en el tipo de códec de audio elegido en las propiedades del plan de marcado de mensajería unificada. Después de crear y comprimir el archivo de audio, éste se adjunta al mensaje de voz.

A veces, la información de los datos digitales se pierde durante la compresión y descompresión. Cuanto más alta sea la compresión usada para comprimir el archivo de audio, mayor será la pérdida de información durante la conversión. Sin embargo, se usa menor espacio de disco debido a que el tamaño del archivo de audio se reduce. En cambio, cuanto menor sea la compresión, menor será la pérdida de información. Sin embargo, se usará más espacio de disco debido a que el tamaño del archivo de audio aumenta.

Novedades en Exchange 2007 SP1

Exchange 2007 Service Pack 1 (SP1) admite ancho de banda RTAudio o audios de alta fidelidad para grabar mensajes de voz. Sin embargo, los audios de alta fidelidad sólo están disponibles después de haber integrado correctamente la mensajería unificada de Exchange 2007 con Communications Server 2007 de Office. Para habilitar RTAudio, el plan de marcado de mensajería unificada se debe configurar como un plan de marcado del tipo URI de protocolo de inicio de sesión (SIP), y el códec de respuesta de llamada se debe establecer en WMA en el plan de marcado.

Importante

RTAudio no está disponible en entornos en los que Communications Server 2007 de Office no esté implementado. Esto se debe a que, en estos entornos, el plan de marcado está establecido en la extensión del teléfono y no en el URI del SIP.

Existen dos flujos de medios para cada llamada entrante: de entrada a un servidor de mensajería unificada y de salida de un servidor de mensajería unificada. Cuando el tipo de plan de marcado está establecido en URI de SIP y el códec de respuesta de llamada del plan de marcado está establecido en WMA, un servidor de mensajería unificada intenta seleccionar el códec VoIP RTAudio para el flujo de medios de entrada. Si la negociación es correcta, se usará el códec RTAudio para el flujo de entrada en las llamadas de respuesta o llamadas que se creen desde Communicator 2007 de Office.

Nota

Las llamadas establecidas para usar la característica Reproducir en teléfono no usarán el códec RTAudio. El flujo de entrada para las llamadas establecidas para usar Reproducir en teléfono utilizará el códec G.711 o G.723.1.

Cuando se usa el códec RTAudio, el mensaje de voz grabado de grabará en alta fidelidad y se almacenará como un archivo de audio con una extensión .wma. Al reproducir el mensaje de voz de nuevo al usuario en Office Outlook 2007 o Outlook Web Access, se escuchará el mensaje de voz en un audio de alta fidelidad. Si la negociación no es correcta, se usará tanto el códec G.711 como el G.723.1. Tanto el códec G.711 como el G.723.1 son códecs de banda estrecha. Al usarlos como el códec VoIP, el mensaje de voz se graba y almacena como un archivo de audio de banda estrecha con una extensión .wma.

El flujo de medio de salida siempre se negociará usando tanto el códec G.711 como el G.723.1. Esto significa que el autor de la llamada siempre escuchará audio de banda estrecha en el teléfono. Esto se aplica también a situaciones en las que una llamada se establece para usar Office Communicator.

El procesamiento de RTAudio a través servidores de mensajería unificada consume más ciclos de CPU que ninguno de los códecs G.711 o G.723.1. Si ha integrado correctamente Communications Server 2007 de Office pero desea desactivar RTAudio para reducir el número de ciclos de CPU usados, puede:

  • Configurar el códec de respuesta de llamada o el códec de almacenamiento del plan de marcado en GSm o PCM.

  • Deshabilitar la configuración del Registro. La clave del Registro es: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft Speech Server\2.0\WireCodecList. Para deshabilitar RTAudio, quite RTAudio16KHz y RTAudio8KHz de la lista de códecs de la clave del Registro.

    Importante

    No se admite ninguna adición, modificación o eliminación del resto de valores o claves de la clave WireCodecList.

Nota

UNRESOLVED_TOKEN_VAL(exRegistry)

Tamaño de los mensajes de mensajería unificada

Puede configurar la mensajería unificada para usar uno de los tres códecs de audio siguientes con el fin de crear mensajes de voz: WMA, GSM 06.10 y G.711 PCM Linear. El códec de audio WMA siempre se almacena en formato multimedia de Windows y los datos adjuntos son un archivo con extensión .wma. Los archivos de audio codificados mediante los códecs de audio GSM o G.711 PCM Linear siempre se almacenan en formato RIFF/WAV y los datos adjuntos son un archivo con extensión .wav.

El tamaño de los mensajes de voz de mensajería unificada depende del tamaño de los datos adjuntos que contienen los datos de voz. Así, el tamaño de los datos adjuntos depende de los siguientes factores:

  • La duración de la grabación del correo de voz

  • El códec de audio usado

  • El formato de almacenamiento del archivo de audio

La siguiente figura ilustra cómo el tamaño del archivo de audio depende de la duración de la grabación del correo de voz para los tres códecs de audio que se pueden usar en la mensajería unificada.

Nota

En esta figura, la longitud media de un mensaje de voz de llamada contestada es de unos 30 segundos.

Tamaño del archivo de audio

UM_Message_Sizing

WMA

WMA es el códec de audio con mayor índice de compresión de los tres tipos de códecs. Su índice de compresión es de unos 11.000 bytes por cada 10 segundos de audio. Sin embargo, el formato de archivo .wma tiene una sección de encabezado mucho más grande que un formato de archivo .wav. La sección de encabezado de un archivo .wma es aproximadamente de 7 kilobytes (KB), mientras que la sección de encabezado de un archivo .wav es de menos de 100 bytes. Aunque las grabaciones de audio WMA se graban durante más de 15 segundos, su tamaño queda más reducido que el de las grabaciones de audio GSM. Por eso, para obtener archivos de audio más pequeños, pero de mayor calidad de audio, use el códec de audio WMA.

G.711 PCM Linear

El códec de audio G.711 PCM Linear crea archivos de audio .wav que no se comprimen. Por eso, los archivos de audio G.711 PCM Linear .wav son los que ocupan más espacio, independientemente de su duración, en comparación con los códecs de audio GSM y WMA. Los archivos de audio G.711 PCM Linear .wav ocupan más de 160.000 bytes por cada 10 segundos de audio. Los archivos de audio .wav G.711 PCM Linear tienen la mayor calidad de audio de los tres archivos de audio usados por la mensajería unificada de Exchange 2007. Sin embargo, la calidad de los archivos de audio compatibles creados con códecs de audio WMA y GSM es aceptable para la mayoría de usuarios que escuchan mensajes de voz.

GSM

El códec de audio GSM crea archivos de audio .wav que se comprimen. Los archivos de audio GSM .wav ocupan más de 16.000 bytes por cada 10 segundos de audio. Sin embargo, GSM crea archivos de audio más grandes que los creados por el códec de audio WMA. Por eso, si desea obtener un equilibrio entre la calidad y el tamaño de los mensajes de voz, puede que no se trate de la mejor elección.

Para obtener más información

Para obtener más información acerca los planes de marcado de mensajería unificada, consulte Comprensión de los planes de conmutación de mensajería unificada.

Para obtener más información sobre la configuración del códec de audio en un plan de marcado de mensajería unificada, consulte Cómo modificar un plan de conmutación de mensajería unificada.