Compreendendo codecs de áudio da Unificação de Mensagens

 

Aplica-se a: Exchange Server 2010 SP2, Exchange Server 2010 SP3

Tópico modificado em: 2016-11-28

Na UM (Unificação de Mensagens) do Microsoft Exchange Server 2010, um codec é usado para armazenar mensagens de caixa postal. Outro codec é usado entre um gateway de IP ou PBX (Private Branch eXchange) e o servidor de Unificação de Mensagens (UM). A Unificação de Mensagens do Exchange 2010 pode usar qualquer um dos quatro seguintes codecs de áudio para criar e armazenar mensagens de caixa postal:

  • MP3 (padrão)

  • Windows Media Audio (WMA)

  • Group System Mobile (GSM) 06.10

  • G.711 Pulse Code Modulation (PCM) Linear

No entanto, os codecs G.711 (PCMA e PCMU) e G.723.1 são codecs VoIP usados entre um gateway IP e o servidor de Unificação de Mensagens.

Parte do planejamento do sistema de Unificação de Mensagens envolve a seleção do codec de áudio correto com base nas necessidades e nos requisitos de sua organização. Este tópico aborda os codecs de áudio que a Unificação de Mensagens pode usar e o ajudará a planejar a implantação de UM.

Codecs

Dois tipos de codec são usados na Unificação de Mensagens: o codec que é usado entre gateways IP e o servidor de Unificação de Mensagens ou entre gateways PBX e IP, dependendo do tipo de PBX e do codec usado para codificar e armazenar mensagens de voz para os usuários.

O termo codec é uma combinação das palavras "codificação" e "decodificação" e é usado com dados de áudio digitais. Um codec é um programa de software que transforma dados digitais em formato de arquivo de áudio ou formato de streaming de áudio. Codecs são usados para converter um sinal de voz analógico em uma versão digital do sinal de voz. Os codecs podem variar em questões como qualidade do som, largura de banda necessária para usá-los e requisitos de sistema necessários para a codificação.

Quando você usa um telefone comum por PSTN (Rede Telefônica de Comutação Pública), sua voz é transportada em um formato analógico através da linha telefônica. Mas com VoIP, sua voz é convertida em sinais digitais. Esse processo de conversão é conhecido como codificação. A codificação é realizada por um codec. Depois que a voz digitalizada alcançar seu destino, ela deverá ser decodificada de volta ao seu formato analógico original para que a pessoa na outra extremidade da chamada possa ouvir e compreender o chamador.

Codec VoIP

Em UM, três tipos de codecs podem ser usados entre gateways de IP ou IP PBXs e o servidor de UM. Os servidores de Unificação de Mensagens podem aceitar os seguintes codecs VoIP de um gateway IP ou IP PBX:

  • G.711 µ-law

  • G.711 A-law

  • G.723.1

G.711 é um padrão que foi desenvolvido para uso com codecs de áudio. Há dois algoritmos principais definidos no padrão para G.711: o algoritmo µ-law, usado na América do Norte e no Japão, e o algoritmo A-law, usado na Europa e em outros países. O codec de áudio G.723.1 é mais usado em aplicativos VoIP e exige uma licença para ser usado. G.723.1 é um tipo de codec de alta qualidade e alta compactação.

Tanto um servidor de Unificação de Mensagens como um gateway IP ou IP PBX aceito podem oferecer os codecs G.711 e G.723.1. Por padrão, o primeiro codec a ser usado é G.723.1. Se você quiser usar outro codec entre o servidor de Unificação de Mensagens e o gateway IP ou PBX IP, recomendamos que altere a configuração no gateway IP ou PBX IP. A tabela a seguir resume alguns codecs VoIP comuns.

Codecs VoIP

Codec VoIP Largura de banda (Kbps) Descrição

G.711

64

Este codec exige pouco processamento. Ele precisa de pelo menos 128 kbps (quilobits por segundo) para comunicação bidirecional.

G.723.1

5.3/6.3

Este codec oferece alta compactação com áudio de alta qualidade. Ele exige mais processamento do que o codec G.711. O codec G.723.1 usa largura de banda reduzida, mas oferece áudio de qualidade inferior.

Codec de armazenamento de mensagens de voz do UM

Os planos de discagem de UM são essenciais para o funcionamento da Unificação de Mensagens. Por padrão, quando você cria um plano de discagem de UM, ele usa o codec de áudio WMA. Entretanto, depois de criar um plano de discagem de UM, você pode configurá-lo para usar codecs de áudio GSM 06.10 ou G.711 PCM Linear.

Cada codec de áudio apresenta vantagens e desvantagens. O codec de áudio WMA foi selecionado como padrão por suas propriedades de qualidade de som e compactação. Os codecs de áudio GSM 06.10 e G.711 PCM Linear foram incluídos como opções disponíveis por causa de sua capacidade de oferecer suporte a outros tipos de sistemas de mensagens.

Ao planejar a Unificação de Mensagens, você deve equilibrar o tamanho e a qualidade relativa do arquivo de áudio que será criado para as mensagens de voz. Em geral, quanto mais alta a taxa de bits de um arquivo de áudio, melhor será a qualidade. Você deve considerar também se o arquivo de áudio está compactado. A taxa de bits de amostra (bits/s) e as propriedades de compactação de cada codec de áudio usado em Unificação de Mensagens são as seguintes:

Codecs de armazenamento de mensagens de voz de UM padrão

Codec de armazenamento de mensagens de voz Bits Arquivo compactado?

MP3

16 bits

Sim

WMA

16 bits

Sim

G.711 PCM

16 bits

Não

GSM 06.10

8 bits

Sim

Na Unificação de Mensagens, os codecs de áudio MP3, WMA, G.711 PCM Linear e GSM 06.10 são usados para criar arquivos de áudio .mp3, .wma e .wav para mensagens de voz. Entretanto, o tipo de arquivo criado depende do codec de áudio usado para criar o arquivo de áudio da mensagem de voz. Na Unificação de Mensagens, o codec de áudio .mp3 cria arquivos de áudio .mp3, o codec de áudio .wma cria arquivos de áudio .wma e os codecs de áudio GSM 06.10 e G.711 PCM Linear produzem arquivos de áudio .wav. Os dois tipos de arquivos de áudio são enviados juntos com a mensagem de email para o destinatário da mensagem de voz.

Normalmente, mas não sempre, a codificação e a decodificação dos dados digitais também envolve compactação ou descompactação. A compactação de áudio é uma forma de compactação de dados que reduz o tamanho dos arquivos de dados de áudio. O algoritmo de compactação de áudio usado pelo codec de áudio compacta os arquivos de áudio .wma ou .wav. Na Unificação de Mensagens, o tipo de algoritmo de compactação de áudio usado é baseado no tipo de codec de áudio selecionado nas propriedades do plano de discagem de UM. Depois que o arquivo de áudio é criado e compactado, ele é anexado à mensagem de voz.

Algumas vezes, as informações dos dados digitais são perdidas durante a compactação e descompactação. Quanto maior a compactação usada para compactar o arquivo de áudio, maior será a perda de informações durante a conversão. No entanto, será usado menos espaço em disco porque o tamanho do arquivo de áudio será reduzido. Por outro lado, quanto menor a compactação, menor a perda de informações. No entanto, será usado mais espaço em disco devido ao aumento de tamanho de cada arquivo de áudio.

Banda larga RTAudio ou áudio de alta fidelidade para gravar mensagens de voz está também disponível como um codec de áudio. Entretanto, o áudio de alta fidelidade com o uso de RTAudio estará disponível apenas depois de você ter integrado com êxito a Unificação de Mensagens do Exchange 2007 ao Office Communications Server 2007 R2 ou Microsoft Lync Server 2010 (a próxima geração de Office Communications Server). Para habilitar RTAudio, o plano de discagem do UM deve ser configurado como um plano de discagem do tipo URI do protocolo SIP e o codec de atendimento de chamadas no plano de discagem deve ser configurado para WMA.

Importante

O RTAudio não está disponível em ambientes onde o Office Communications Server 2007 ou R2 ou Lync Server 2010 não está implantado. Isso ocorre porque, nesses ambientes, o plano de discagem está configurado para Ramal e não URI do SIP.

Há dois fluxos de mídia para cada chamada de entrada: entrada para um servidor de Unificação de Mensagens e saída de um servidor de Unificação de Mensagens. Quando o tipo de plano de discagem está configurado para URI do SIP e o codec de atendimento de chamadas no plano de discagem está configurado para WMA, um servidor de Unificação de Mensagens tenta selecionar o codec VoIP RTAudio para o fluxo de mídia de entrada. Se a negociação for bem-sucedida, o codec RTAudio do fluxo de entrada será usado para chamadas de atendimento de chamadas ou chamadas originadas do Office Communicator 2007.

Dica

Chamadas realizadas usando o recurso Tocar no Telefone não usarão o codec RTAudio. O fluxo de entrada de chamadas realizadas usando o recurso Tocar no Telefone usará o codec G.711 ou G.723.1.

Quando o codec RTAudio é usado, a mensagem de voz será gravada em alta fidelidade e armazenada como um arquivo de áudio com extensão .wma. Quando a mensagem de voz for reproduzida para o usuário no Office Outlook 2007 ou Outlook Web Access, ele irá ouvi-la em áudio de alta fidelidade. Se a negociação for malsucedida, o codec G.711 ou G.723.1 será usado. Os codecs G.711 e G.723.1 são codecs de banda estreita. Quando eles são usados como o codec VoIP, a mensagem de voz é gravada e armazenada como um arquivo de áudio de banda estreita com extensão .wma.

O fluxo de mídia de saída sempre será negociado usando o codec G.711 ou G.723.1. Isso significa que os chamadores sempre ouvirão áudio de banda estreita pelo telefone. Isso também se aplica a situações em que a chamada é realizada usando o Office Communicator.

O formato de áudio e o codec usados pelos servidores de Unificação de Mensagens para armazenar o áudio em mensagens de voz dependem não apenas do codec de áudio configurado no plano de discagem, mas também da taxa de bits do áudio que a UM negocia com um par SIP. Caso seu ambiente inclua pontos de extremidade SIP, Office Communications Server 2007 R2 ou Lync Server 2010, um servidor de Unificação de Mensagens também negociará o codec de áudio usado com um par SIP. Por exemplo, quando RTAudio de banda ampla for negociado como codec de transmissão, um servidor de Unificação de Mensagens usará o formato MP3 de 32 Kbps ou WMA 9.2 ao criar mensagens de voz, dependendo da configuração do plano de discagem. A tabela a seguir mostra a relação entre o codec de áudio de armazenamento de mensagem de voz e o codec de áudio de transmissão ou VoIP usado.

Relação entre o codec de áudio de armazenamento e o codec de áudio de transmissão ou VoIP

Codec de áudio configurado em um plano de discagem da UM Codec de transmissão ou VoIP (banda estreita) - G.723, G.711 ou RTAudio (8 KHz) Codec de transmissão ou VoIP (banda ampla) - RTAudio (16 KHz)

G0.711

G0.711

Não se aplica. Um servidor da UM não negocia áudio de banda ampla se o plano de discagem estiver configurado para G.711.

WMA

WMA 9 Voice

WMA 9.2

GSM

GSM 6.10

Não se aplica. Um servidor da UM não negocia áudio de banda ampla se o plano de discagem estiver configurado para G.711.

MP3

MP3 (16 Kbps)

MP3 (32 Kbps)

Codecs

Dimensionamento da mensagem do UM

Você pode configurar a UM para usar um destes quatro codecs de áudio para criar mensagens de voz: MP3, WMA, GSM 06.10 e G.711 PCM Linear. Por padrão, o formato MP3 é selecionado. O formato MP3 é um formato de arquivo de áudio comum usado para reduzir significativamente o tamanho do arquivo de áudio e é mais usado por dispositivos de áudio pessoais ou players de MP3. MP3 é um tipo de codec de áudio que funciona em várias plataformas e é usado para compatibilidade com muitos dispositivos e telefones celulares, assim como diversos sistemas operacionais de computador.

O codec de áudio WMA é sempre armazenado no formato Windows Media, e o anexo é um arquivo que tem uma extensão de nome de arquivo .wma. Arquivos de áudio codificados com o codec de áudio GSM ou G.711 PCM Linear são sempre armazenados em formato RIFF/WAV, e o anexo é um arquivo que tem uma extensão de nome de arquivo .wav.

O tamanho de mensagens de voz de Unificação de Mensagens depende do tamanho do anexo que contém os dados de voz. Por sua vez, o tamanho do anexo depende dos seguintes fatores:

  • A duração da gravação da mensagem de voz

  • O codec de áudio usado

  • O formato de armazenamento do arquivo de áudio

A figura a seguir mostra como o tamanho do arquivo de áudio depende da duração da gravação da mensagem de voz para os três codecs de áudio que você pode usar na UM.

Dica

Nesta figura, a duração média de uma mensagem de voz de atendimento de chamadas é de aproximadamente 30 segundos.

Tamanho do arquivo de áudio

MP3

Por padrão, o formato MP3 está selecionado e é o formato de arquivo de áudio padrão para mensagens de caixa postal. O formato MP3 é um formato de arquivo de áudio comum usado para reduzir significativamente o tamanho do arquivo de áudio e é mais usado por dispositivos de áudio pessoais ou players de MP3. MP3 é um tipo de codec de áudio que funciona em várias plataformas e é usado para compatibilidade com muitos dispositivos e telefones celulares, assim como diversos sistemas operacionais de computador.

WMA

WMA é o codec de áudio com maior taxa de compactação dos três tipos de codec. A compactação é de aproximadamente 11.000 bytes para cada 10 segundos de áudio. Entretanto, o formato do arquivo .wma tem uma seção de cabeçalho muito maior do que o formato de arquivo .wav. A seção de cabeçalho do arquivo .wma é de aproximadamente 7 quilobytes (KB), embora a seção de cabeçalho do arquivo .wav seja de menos de 100 bytes. Embora as gravações de áudio WMA sejam gravadas por mais de 15 segundos, ficam menores do que as gravações de áudio GSM. Portanto, para os arquivos de áudio menores, mas com melhor qualidade, use o codec de áudio WMA.

G.711 PCM Linear

O codec de áudio G.711 PCM Linear cria arquivos de áudio .wav que não são compactados. Por essa razão, os arquivos de áudio .wav do G.711 PCM Linear ocupam mais espaço, seja qual for a duração, quando comparados com os codecs de áudio GSM e WMA. Arquivos de áudio G.711 PCM Linear .wav ocupam um pouco mais de 160.000 bytes para cada 10 segundos de áudio. Arquivos de áudio G.711 PCM Linear .wav têm a melhor qualidade de áudio dos três codecs de áudio usados pela Unificação de Mensagens. Entretanto, a qualidade de arquivos de áudio comparáveis criados com os codecs de áudio WMA e GSM são aceitáveis para a maioria dos usuários que ouvem mensagens de voz.

GSM

O codec de áudio GSM cria arquivos de áudio .wav que são compactados. Arquivos de áudio GSM .wav ocupam um pouco mais de 16.000 bytes para cada 10 segundos de áudio. Entretanto, GSM cria um arquivo de áudio maior do que o arquivo de áudio criado pelo codec de áudio WMA. Por essa razão, ao considerar a qualidade da mensagem de voz e o tamanho, talvez essa não seja a melhor opção.

Codecs

 © 2010 Microsoft Corporation. Todos os direitos reservados.