Descripción de los códecs de audio de mensajería unificada

 

Se aplica a: Exchange Server 2010 SP2, Exchange Server 2010 SP3

Última modificación del tema: 2016-11-28

En la mensajería unificada (MU) de Microsoft Exchange Server 2010, se usa un códec para almacenar los mensajes de correo de voz. Se usa otro códec entre una puerta de enlace IP o una central de conmutación IP (PBX) y el servidor de mensajería unificada. El servicio de mensajería unificada de Exchange 2010 puede usar cualquiera de los cuatro códecs de audio siguientes para crear y almacenar mensajes de voz:

  • MP3 (predeterminado)

  • Windows Media Audio (WMA)

  • Group System Mobile (GSM) 06.10

  • Modulación por impulsos codificados (PCM) lineal G.711

Sin embargo, los códecs G.711 (PCMA y PCMU) y G.723.1 son códecs VoIP que se usan entre una puerta de enlace de IP y el servidor de mensajería unificada.

Parte del planeamiento del sistema de mensajería unificada consiste en elegir el códec de audio según las necesidades y los requisitos de su organización. En este tema, se explican los códecs de audio que mensajería unificada puede usar para ayudarlo a planear su implementación de MU.

Códecs

En mensajería unificada, se usan dos tipos de códecs: el códec que se usa entre las puertas de enlace IP y el servidor de mensajería unificada o entre una PBX y una puerta de enlace IP, según el tipo de PBX, y el códec que se usa para codificar y almacenar los mensajes de voz para los usuarios.

El término códec es una combinación de las palabras "codificación" y "descodificación", y se usa con datos de audio digitales. Un códec es un software informático que transforma los datos digitales en un formato de archivo de audio o de secuencias de audio. Los códecs se usan para convertir una señal de voz analógica en una versión digital de la señal de voz. Los códecs pueden variar en calidad de sonido, ancho de banda necesario para usarlos y requisitos del sistema necesarios para hacer la codificación.

Al usar un teléfono normal en la red telefónica pública conmutada (PSTN), la voz se transporta en formato analógico en la línea telefónica. Pero con el protocolo de voz sobre Internet (VoIP), la voz debe convertirse en señales digitales. Este proceso de conversión se conoce como codificación. Un códec realiza la codificación. Después de que la voz digitalizada haya alcanzado su destino, debe decodificarse a su formato analógico original para que la persona que recibe la llamada pueda oír y entender a quien la inició.

Códec VoIP

En mensajería unificada, se pueden usar tres tipos de códecs entre las puertas de enlace IP o IP PBX y el servidor de mensajería unificada. Los servidores de mensajería unificada pueden aceptar los siguientes códecs VoIP de una puerta de enlace IP o IP PBX:

  • G.711 µ-law

  • G.711 A-law

  • G.723.1

G.711 es un estándar que se desarrolló para usarlo con códecs de audio. Existen dos algoritmos principales definidos en el estándar para G.711: el algoritmo µ-law que se usa en los Estados Unidos y el algoritmo A-law que se usa en Europa y en otros países. El códec de audio G.723.1 se usa mayoritariamente en aplicaciones VoIP y necesita una licencia para poder usarse. G.723.1 es un tipo de códec de alta calidad y de compresión elevada.

Tanto un servidor de mensajería unificada como una puerta de enlace IP o IP PBX compatibles pueden ofrecer el códec G.711 y G.723.1. De forma predeterminada, el primer códec que se usa es G.723.1. Si desea usar un códec que no sea G.723.1 entre el servidor de mensajería unificada y la puerta de enlace IP o IP PBX, se recomienda modificar la configuración en la puerta de enlace IP o IP PBX. En la tabla siguiente se resumen algunos de los códecs VoIP comunes.

Códecs VoIP

Códec VoIP Ancho de banda (Kbps) Descripción

G.711

64

Este códec requiere un procesamiento muy lento. Necesita un mínimo de 128 Kb por segundo (Kbps) para una comunicación bidireccional.

G.723.1

5.3/6.3

Este códec ofrece una compresión alta con audio de alta calidad. Necesita más procesamiento que el códec G.711. El códec G.723.1 usa un ancho de banda reducido pero ofrece una calidad de audio más pobre.

Códec de almacenamiento de mensajes de voz de mensajería unificada

Los planes de conmutación de llamadas de mensajería unificada constituyen una parte integral del funcionamiento de la mensajería unificada. De forma predeterminada, al crear un plan de conmutación de llamadas de mensajería unificada, éste utilizará el códec de audio WMA. Sin embargo, después de crear el plan de conmutación de llamadas de mensajería unificada, puede configurarlo de forma que utilice los códecs de audio GSM 06.10 o G.711 PCM Linear.

Cada códec de audio presenta ventajas y desventajas. El códec de audio WMA se eligió como códec de audio predeterminado debido a su calidad de sonido y propiedades de compresión. Los códecs de audio GSM 06.10 y G.711 PCM Linear se incluyeron como opciones disponibles por su capacidad para admitir otros tipos de sistemas de mensajería.

Cuando planifique la mensajería unificada, debe considerar el tamaño y la calidad relativa del archivo de audio que se creará para los mensajes de correo de voz. Normalmente, cuanto mayor sea la velocidad de bits de un archivo de audio, mayor será su calidad. También debe tener en cuenta si el archivo de audio se va a comprimir. La velocidad de bits de muestreo (bit/seg) y las propiedades de compresión para cada códec de audio que se usa en mensajería unificada son las que se detallan a continuación:

Códecs de almacenamiento de mensajes de voz de MU predeterminados

Códec de almacenamiento de mensajes de voz Bits ¿Archivo comprimido?

MP3

16 bits

WMA

16 bits

G.711 PCM

16 bits

No

GSM 06.10

8 bits

En la Mensajería unificada, los códecs de audio MP3, WMA, G.711 PCM Linear y GSM 06.10 se usan para crear archivos de audio mp3, .wma y .wav para mensajes de voz. Sin embargo, el tipo de archivo que se crea depende del códec de audio que se usó para crear el archivo de audio de mensajes de voz. En Mensajería unificada, el códec de audio mp3 crea archivos de audio .mp3, el códec de audio wma crea archivos de audio .wma y los códecs de audio GSM 06.10 y G.711 PCM Linear producen archivos de audio .wav. Ambos tipos de archivos de audio se envían junto con el mensaje de correo electrónico al destinatario del mensaje de voz.

Generalmente, pero no siempre, la codificación y descodificación de los datos digitales también implican compresión y descompresión. La compresión de audio es una forma de compresión de datos que reduce el tamaño de los archivos de datos de audio. El algoritmo de compresión de audio que utiliza el códec de audio comprime los archivos de audio .wma o .wav. En mensajería unificada, el tipo de algoritmo de compresión de audio que se usa se basa en el tipo de códec de audio elegido en las propiedades del plan de marcado de MU. Después de crear y comprimir el archivo de audio, éste se adjunta al mensaje de voz.

A veces, la información de los datos digitales se pierde durante la compresión y descompresión. Cuanta más alta sea la compresión usada para comprimir el archivo de audio, mayor será la pérdida de información durante la conversión. Sin embargo, se usa menor espacio de disco debido a que se reduce el tamaño del archivo de audio. En cambio, cuanto menor sea la compresión, menor será la pérdida de información. Sin embargo, se usará más espacio de disco debido a que el tamaño del archivo de audio aumenta.

El ancho de banda RTAudio o audio de alta fidelidad para grabar mensajes de voz también está disponible como códec de audio. Sin embargo, el audio de alta fidelidad RTAudio está disponible solamente después de que haya integrado correctamente la mensajería unificada de Exchange 2007 con Office Communications Server 2007 R2 o Microsoft Lync Server 2010 (en inglés) (la próxima generación de Office Communications Server). Para habilitar RTAudio, el plan de marcado de MU se debe configurar como un plan de marcado del tipo URI de Protocolo de inicio de sesión (SIP), y el códec de respuesta de llamada se debe establecer en WMA en el plan de marcado.

Importante

RTAudio no está disponible en entornos en los que Communications Server 2007 o R2 o Lync Server 2010 de Office no esté implementado. Esto se debe a que, en estos entornos, el plan de marcado está establecido en la extensión del teléfono y no en el URI del SIP.

Existen dos flujos de medios para cada llamada entrante: de entrada a un servidor de mensajería unificada y de salida de un servidor de mensajería unificada. Cuando el tipo de plan de marcado está establecido en URI de SIP y el códec de respuesta de llamada del plan de marcado está establecido en WMA, un servidor de mensajería unificada intenta seleccionar el códec VoIP RTAudio para el flujo de medios de entrada. Si la negociación es correcta, se usará el códec RTAudio para el flujo de entrada en las llamadas de respuesta o llamadas que se creen desde Communicator 2007 de Office.

Nota

Las llamadas establecidas para usar la característica Reproducir en teléfono no usarán el códec RTAudio. El flujo de entrada para las llamadas establecidas para usar Reproducir en teléfono utilizará el códec G.711 o G.723.1.

Cuando se usa el códec RTAudio, el mensaje de voz grabado de grabará en alta fidelidad y se almacenará como un archivo de audio con una extensión .wma. Al reproducir el mensaje de voz de nuevo al usuario en Office Outlook 2007 o Outlook Web Access, se escuchará el mensaje de voz en un audio de alta fidelidad. Si la negociación no es correcta, se usará tanto el códec G.711 como el G.723.1. Tanto el códec G.711 como el G.723.1 son códecs de banda estrecha. Al usarlos como el códec VoIP, el mensaje de voz se graba y almacena como un archivo de audio de banda estrecha con una extensión .wma.

El flujo de medio de salida siempre se negociará usando tanto el códec G.711 como el G.723.1. Esto significa que el autor de la llamada siempre escuchará audio de banda estrecha en el teléfono. Esto se aplica también a situaciones en las que una llamada se realiza mediante Office Communicator.

El formato y el códec de audio que usan los servidores de mensajería unificada para almacenar los mensajes de voz de audio no solamente depende del códec de audio que esté configurado en el plan de marcado, sino también de la velocidad de bits del audio que la mensajería unificada negocia con un SIP del mismo nivel. Si su entorno incluye Office Communications Server 2007 R2, Lync Server 2010 o los extremos de SIP, un servidor de mensajería unificada también negociará el códec de audio que se debe usar con un SIP del mismo nivel. Por ejemplo, si se negocia RTAudio de banda ancha como códec de transferencia, el servidor de mensajería unificada usará el formato MP3 de 32 Kbps o WMA 9.2 para crear mensajes de voz, en función de la configuración del plan de marcado. En la tabla siguiente se muestra la relación entre el códec de audio de almacenamiento de mensajes de voz y el códec de audio de transferencia o VoIP usado.

Relación entre el códec de audio de almacenamiento y el códec de audio de transferencia o VoIP

Códec de audio configurado en un plan de marcado de mensajería unificada Códec de transferencia o VoIP (banda estrecha) - G.723, G.711 o RTAudio (8 KHz) Códec de transferencia o VoIP (banda ancha) - RTAudio (16 KHz)

G.711

G.711

No aplicable Un servidor de mensajería unificada no negocia audio de banda ancha si el plan de marcado está definido en G.711.

WMA

WMA 9 Voice

WMA 9.2

GSM

GSM 6.10

No aplicable Un servidor de mensajería unificada no negocia audio de banda ancha si el plan de marcado está definido en G.711.

MP3

MP3 (16 Kbps)

MP3 (32 Kbps)

Códecs

Tamaño de los mensajes de mensajería unificada

Puede configurar la Mensajería unificada para utilizar uno de los cuatro códecs de audio siguientes para crear mensajes de voz: MP3, WMA, GSM 06.10 y G.711 PCM Linear. El formato MP3 está seleccionado de forma predeterminada. El formato MP3 es un formato de archivo de audio habitual que se usa para reducir considerablemente el tamaño de los archivos de audio; se trata del formato de audio que usan la mayoría de dispositivos de audio personales y reproductores MP3. MP3 es un códec de audio multiplataforma que se usa para obtener compatibilidad con una amplia variedad de teléfonos móviles, dispositivos y sistemas operativos.

El códec de audio WMA siempre se almacena en formato multimedia de Windows y los datos adjuntos son un archivo con extensión .wma. Los archivos de audio cifrados mediante los códecs de audio GSM o G.711 PCM Linear siempre se almacenan en formato RIFF/WAV y los datos adjuntos son un archivo con extensión .wav.

El tamaño de los mensajes de voz de mensajería unificada depende del tamaño de los datos adjuntos que contienen los datos de voz. Así, el tamaño de los datos adjuntos depende de los siguientes factores:

  • La duración de la grabación del correo de voz

  • El códec de audio usado

  • El formato de almacenamiento del archivo de audio

La siguiente figura muestra cómo el tamaño del archivo de audio depende de la duración de la grabación del correo de voz para los tres códecs de audio que se pueden usar en MU.

Nota

En esta figura, la longitud media de un mensaje de voz de llamada contestada es de unos 30 segundos.

Tamaño del archivo de audio

MP3

De forma predeterminada, se selecciona el formato MP3 y es el formato de archivo de audio predeterminado para los mensajes de correo de voz. El formato MP3 es un formato de archivo de audio habitual que se usa para reducir considerablemente el tamaño de los archivos de audio; se trata del formato de audio que usan la mayoría de dispositivos de audio personales y reproductores MP3. MP3 es un códec de audio multiplataforma que se usa para obtener compatibilidad con una amplia variedad de teléfonos móviles, dispositivos y sistemas operativos.

WMA

WMA es el códec de audio con mayor índice de compresión de los tres tipos de códecs. Su índice de compresión es de unos 11.000 bytes por cada 10 segundos de audio. Sin embargo, el formato de archivo .wma tiene una sección de encabezado mucho más grande que un formato de archivo .wav. La sección de encabezado de un archivo .wma es aproximadamente de 7 kilobytes (KB), mientras que la sección de encabezado de un archivo .wav es de menos de 100 bytes. Aunque las grabaciones de audio WMA se graban durante más de 15 segundos, su tamaño queda más reducido que el de las grabaciones de audio GSM. Por lo tanto, para obtener archivos de audio más pequeños, pero de mayor calidad de audio, utilice el códec de audio WMA.

G.711 PCM Linear

El códec de audio G.711 PCM Linear crea archivos de audio .wav que no se comprimen. Por eso, los archivos de audio G.711 PCM Linear .wav son los que ocupan más espacio, independientemente de su duración, en comparación con los códecs de audio GSM y WMA. Los archivos de audio G.711 PCM Linear .wav ocupan más de 160.000 bytes por cada 10 segundos de audio. Los archivos de audio G.711 PCM Linear .wav ofrecen la mejor calidad de audio de los tres códecs que utiliza Mensajería unificada. Sin embargo, la calidad de los archivos de audio comparables que se crean con los códecs de audio WMA y GSM es aceptable para la mayoría de los usuarios que escuchan mensajes de voz.

GSM

El códec de audio GSM crea archivos de audio .wav que se comprimen. Los archivos de audio GSM .wav ocupan más de 16.000 bytes por cada 10 segundos de audio. Sin embargo, GSM crea archivos de audio más grandes que los creados por el códec de audio WMA. Por eso, si desea obtener un equilibrio entre la calidad y el tamaño de los mensajes de voz, puede que no se trate de la mejor elección.

Códecs

 © 2010 Microsoft Corporation. Reservados todos los derechos.