了解统一消息音频编码解码器

 

适用于: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1, Exchange Server 2007

上一次修改主题: 2008-03-20

在 Microsoft Exchange Server 2007 统一消息 (UM) 中,使用编码解码器来存储语音邮件。在 IP 网关或 IP 专用交换机 (PBX) 与安装了统一消息服务器角色的 Exchange 2007 服务器之间使用另一种编码解码器。Exchange 2007 统一消息可以使用下列三种音频编码解码器中的任意一种来创建和存储语音邮件:

  • Windows Media Audio (WMA)

  • Group System Mobile (GSM) 06.10

  • G.711 Pulse Code Modulation (PCM) Linear

但是,在 IP 网关与统一消息服务器之间使用的是 G.711(PCMA 和 PCMU)和 G.723.1 编码解码器。

规划统一消息系统时,作为规划的一部分,需要根据组织的需求选择正确的音频编码解码器。本主题讨论 Exchange 2007 统一消息可以使用的音频编码解码器,并将帮助您规划 UM 部署。

important要点:
在 64 位统一消息服务器上,如果计划使用 WMA UM 拨号计划编解码器,则必须安装 Windows 媒体编码器。有关如何安装 Windows Media 编码器的详细信息,请参阅 Availability of the Windows Media Audio 9 Voice codec for x64-based computers(英文),或访问 Microsoft Download Center(英文)。

编码解码器

Exchange 2007 统一消息中使用两种类型的编码解码器:在 IP 网关与统一消息服务器之间或 PBX 与 IP 网关之间(取决于 PBX 的类型)使用的编码解码器,以及用于为用户的语音邮件进行编码和存储的编码解码器。

“编码解码器”一词是“编码”和“解码”两个词的组合,用于数字音频数据。编码解码器是将数字数据转换为音频文件格式或流式音频格式的软件程序。使用编码解码器将模拟语音信号转换为数字版本的语音信号。编码解码器在音质、使用时所需的带宽以及执行编码时所需的系统要求方面可能会有所不同。

通过公用电话交换网 (PSTN) 使用普通电话时,语音以模拟格式通过电话线路进行传输。但是,在使用 IP 语音 (VoIP) 时,必须将语音转换为数字信号。此转换过程称为编码。编码通过编码解码器来执行。数字化语音到达目的地后,必须经过解码回到原来的模拟格式,以便电话另一端的用户可以听到并理解呼叫者所说的内容。

VoIP 编码解码器

在 Exchange 2007 统一消息中,根据 PBX 类型的不同,可以在 IP 网关与统一消息服务器之间或 PBX 与 IP 网关之间使用三种类型的编解码器。统一消息服务器可以接受 IP 网关或 IP PBX 中的下列 VoIP 编码解码器:

  • G.711 µ-law

  • G.711 A-law

  • G.723.1

G.711 是为用于音频编码解码器而开发的一项标准。G.711 标准中定义了两种主要算法。在北美洲和日本使用的 µ-law 算法以及在欧洲和其他国家(地区)使用的 A-law 算法。G.723.1 音频编码解码器主要用于 VoIP 应用程序,要求获得许可证才能使用。G.723.1 是一种高音质、高压缩率的编码解码器。

统一消息服务器和受支持的 IP 网关或 IP PBX 均可以提供 G.711 和 G.723.1 编码解码器。但是,统一消息服务器将根据注册表中的 WireCodecList 项来选择其首选的编解码器。默认情况下,使用的第一个编解码器是 G.723.1。如果要在统一消息服务器和 IP 网关或 IP PBX 之间使用 G.723.1 以外的其他编解码器,则我们建议在 IP 网关或 IP PBX 上更改配置,并且不要在注册表中添加、删除或更改“WireCodecList”项的任何值。统一消息服务器将确定 IP 网关或 IP PBX 所使用的编码解码器,并从注册表的列表中选择适合的编码解码器。

下表总结了一些常用的 VoIP 编码解码器。

VoIP 编码解码器

VoIP 编码解码器 带宽 (Kbps) 说明

G.711

64

此编码解码器需要非常少的处理。需要至少 128 Kbps 用于双向通信。

G.723.1

5.3/6.3

此编码解码器提供高压缩率和高音质。所需的处理要多于 G.711 编码解码器。G.723.1 编码解码器占用的带宽较少,但是提供的音质较差。

UM 语音邮件存储编码解码器

统一消息拨号计划是 Exchange 2007 统一消息操作不可或缺的一部分。默认情况下,在创建 UM 拨号计划时,UM 拨号计划将使用 WMA 音频编解码器。但是,在创建 UM 拨号计划之后,可以将 UM 拨号计划配置为使用 GSM 06.10 或 G.711 PCM Linear 音频编解码器。

每种音频编码解码器都有各自的优缺点。选择 WMA 音频编码解码器作为默认音频编码解码器是由于其音质和压缩属性的原因。将 GSM 06.10 和 G.711 PCM Linear 音频编码解码器作为可用选项是由于其支持其他类型消息系统的能力。

在规划 Exchange 2007 统一消息时,将为语音邮件创建的音频文件必须在大小和相对音质之间做出平衡。通常,音频文件的比特率越高,音质也越高。但是,必须还要考虑是否压缩音频文件。Exchange 2007 统一消息中使用的每种音频编解码器的采样比特率(位/秒)和压缩属性如下所述:

UM 语音邮件存储编码解码器

语音邮件存储编码解码器 位数 是否是压缩文件?

WMA

16 位

G.711 PCM

16 位

GSM 06.10

8 位

在 Exchange 2007 统一消息中,使用 WMA、G.711 PCM Linear 和 GSM 06.10 音频编码解码器为语音邮件创建 .wma 和 .wav 音频文件。但是,创建的文件类型取决于创建语音邮件音频文件所使用的音频编码解码器。在 Exchange 2007 统一消息中,.wma 音频编码解码器创建 .wma 音频文件,GSM 06.10 和 G.711 PCM Linear 音频编码解码器生成 .wav 音频文件。两种音频文件均随电子邮件一起发送给语音邮件的收件人。

对数字数据进行编码和解码还通常(但并非始终)会涉及到压缩或解压缩。音频压缩是数据压缩的一种形式,可以减小音频数据文件的大小。音频编码解码器所使用的音频压缩算法将压缩 .wma 或 .wav 音频文件。在 Exchange 2007 统一消息中,所使用的音频压缩算法类型取决于在 UM 拨号计划属性中选择的音频编码解码器类型。创建并压缩了音频文件之后,文件将附加到语音邮件中。

有时,在压缩和解压缩期间,数字数据中的信息会丢失。压缩音频文件所使用的压缩率越高,转换期间丢失的信息就越多。但是,由于减小了音频文件的大小,占用的磁盘空间就越少。反之,压缩率越低,丢失的信息就越少。但是,由于增大了每个音频文件的大小,必须占用更多的磁盘空间。

Exchange 2007 SP1 新增功能

Exchange 2007 Service Pack 1 (SP1) 增加了在录制音频邮件时对 RTAudio 宽带或高保真音频的支持。但是,只有成功地将 Exchange 2007 统一消息与 Office Communications Server 2007 集成之后,才能使用高保真音频。若要启用 RTAudio,必须将 UM 拨号计划配置为会话初始协议 (SIP) URI 类型的拨号计划,并且必须将拨号计划上的呼叫应答编码解码器设置为 WMA。

important要点:
在未部署 Office Communications Server 2007 的环境中无法使用 RTAudio。这是由于在这种环境中,拨号计划设置为电话分机,而不是 SIP URI。

每次传入呼叫有两种媒体流:入站到统一消息服务器的媒体流和从统一消息服务器出站的媒体流。将拨号计划类型设置为 SIP URI 并将拨号计划上的呼叫应答编码解码器设置为 WMA 时,统一消息服务器将尝试为入站媒体流选择 RTAudio VoIP 编码解码器。如果协商成功,入站媒体流的 RTAudio 编码解码器将用于呼叫应答或 Office Communicator 2007 发起的呼叫。

note注意:
使用电话播放功能发出的呼叫不会使用 RTAudio 编码解码器。使用电话播放功能发出的呼叫的入站媒体流将使用 G.711 或 G.723.1 编码解码器。

使用 RTAudio 编码解码器时,将录制高保真的语音邮件,并将存储为扩展名为 .wma 的音频文件。在 Office Outlook 2007 或 Outlook Web Access 中为用户播放语音邮件时,用户将听到高保真的语音邮件。如果协商未成功,将使用 G.711 或 G.723.1 编码解码器。G.711 和 G.723.1 编码解码器均是窄带编码解码器。使用这些编码解码器作为 VoIP 编码解码器时,将录制语音邮件并将其存储为扩展名为 .wma 的窄带音频文件。

出站媒体流将始终使用 G.711 或 G.723.1 编码解码器进行协商。这意味着呼叫者通过电话听到的始终是窄带音频。此规则在使用 Office Communicator 发出呼叫时同样适用。

统一消息服务器所处理的 RTAudio 会比任何 G.711 或 G.723.1 编解码器消耗更多的 CPU 循环。如果已成功地集成 Office Communications Server 2007,但是希望禁用 RTAudio,以减少占用的 CPU 周期数,可以执行下列操作:

  • 将拨号计划的呼叫应答编码解码器或存储编码解码器设置为 GSM 或 PCM。

  • 在注册表中禁用该设置。注册表项为:HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft Speech Server\2.0\WireCodecList、若要禁用 RTAudio,将 RTAudio16KHz 和 RTAudio8KHz 从该注册表项的编码解码器列表中删除。

    important要点:
    不支持对“WireCodecList”项中的其他值或项进行任何其他添加、修改或删除。
note注意:
UNRESOLVED_TOKEN_VAL(exRegistry)

UM 邮件大小调整

可以将 UM 配置为使用下列三种音频编码解码器中的一种来创建语音邮件:WMA、GSM 06.10 和 G.711 PCM Linear。WMA 音频编码解码器始终存储为 Windows Media 格式,附件是文件扩展名为 .wma 的文件。使用 GSM 或 G.711 PCM Linear 音频编码解码器编码的音频文件始终存储为 RIFF/WAV 格式,附件是文件扩展名为 .wav 的文件。

统一消息语音邮件的大小取决于包含语音数据的附件的大小。而附件的大小取决于下列因素:

  • 语音邮件录音的持续时间

  • 使用的音频编码解码器

  • 音频文件的存储格式

下图说明对于可以在 UM 中使用的三种音频编解码器,音频文件的大小如何依赖于语音邮件录音的持续时间。

note注意:
在此图中,用于应答呼叫的语音邮件的平均长度大约为 30 秒。

音频文件大小

UM_Message_Sizing

WMA

WMA 是三种编码解码器中压缩率最高的音频编码解码器。压缩率为每 10 秒的音频大约 11,000 个字节。但是,与 .wav 文件格式相比,.wma 文件格式的文件头部分要大得多。.wma 文件的文件头部分大约为 7 KB,而 .wav 文件的文件头部分小于 100 个字节。尽管 WMA 音频录音超过 15 秒,却仍小于 GSM 音频录音。因此,若要获得文件最小但是质量最高的音频文件,请使用 WMA 音频编码解码器。

G.711 PCM Linear

G.711 PCM Linear 音频编码解码器创建未压缩的 .wav 音频文件。因此,与 GSM 和 WMA 音频编码解码器相比,G.711 PCM Linear .wav 音频文件在给定持续时间占用的空间最多。G.711 PCM Linear .wav 音频文件每 10 秒的音频占用的空间超过 160,000 个字节。G.711 PCM Linear .wav 音频文件在 Exchange 2007 统一消息使用的三种音频编码解码器中音质最高,但是,大多数收听语音邮件的用户可以接受使用 WMA 和 GSM 音频编码解码器创建的音质相当的音频文件。

GSM

GSM 音频编码解码器创建压缩的 .wav 音频文件。GSM .wav 音频文件每 10 秒的音频占用的空间超过 16,000 个字节。但是,GSM 创建的音频文件大于 WMA 音频编码解码器创建的音频文件。因此,在平衡语音邮件的质量和大小时,此编码解码器可能不是最佳的选择。

详细信息

有关 UM 拨号计划的详细信息,请参阅了解统一消息拨号计划

有关如何配置 UM 拨号计划的音频编码解码器的详细信息,请参阅如何修改统一消息拨号计划