了解整合通訊音訊轉碼器

 

適用版本: Exchange Server 2010 SP2, Exchange Server 2010 SP3

上次修改主題的時間: 2016-11-28

Microsoft Exchange Server 2010 整合通訊 (UM) 使用轉碼器來儲存語音信箱訊息,另外在 IP 閘道或 IP 專用交換機 (PBX) 與整合通訊伺服器之間會使用另一個轉碼器。Exchange 2010 整合通訊可以使用下列四個音訊轉碼器中的任何一個來建立和儲存語音訊息:

  • MP3 (預設值)

  • Windows Media 音訊 (WMA)

  • 群組系統電話 (GSM) 06.10

  • G.711 脈衝碼調制 (PCM) 線性

不過,G.711 (PCMA 和 PCMU) 和 G.723.1 轉碼器是 VoIP 轉碼器,用於 IP 閘道和整合通訊伺服器之間。

規劃整合通訊系統時,有部分的工作是要根據組織的需求來選取正確的音訊轉碼器。本主題討論整合通訊可使用的音訊轉碼器,並協助您規劃 UM 部署。

轉碼器

整合通訊中使用兩種轉碼器:一種轉碼器是用在 IP 閘道和整合通訊伺服器或 PBX 和 IP 閘道之間 (根據 PBX 類型而定),另一種轉碼器則是用來編碼和儲存使用者的語音訊息。

英文的 *codec (轉碼器)*一詞是由「coding (編碼)」和「decoding (解碼)」二字所組成,用於數位音訊資料上。轉碼器是一種軟體程式,負責將數位資料轉換成音訊檔案格式或音訊資料流格式。轉碼器可用來將類比音訊信號轉換成數位版本的音訊信號。根據聲音品質,使用所需頻寬以及執行編碼的所需系統需求而定,轉碼器可分成許多種類。

透過公用交換電話網路 (PSTN) 使用普通電話時,您的聲音是以類比格式透過電話線傳輸出去。但使用 VoIP 時,您的聲音就必須轉換成數位信號。此轉換程序稱為編碼。轉碼器會執行編碼。數位化語音到達目的地後,接著必須解碼回到其原始類比格式,如此通話另一端的人才能聽得懂來電者在說什麼。

VoIP 轉碼器

在整合通訊中,可以在 IP 閘道或 IP PBX 和整合通訊伺服器之間使用三種類型的轉碼器。整合通訊伺服器可從 IP 閘道或 IP PBX 接受下列 VoIP 轉碼器:

  • G.711 µ-law

  • G.711 A-law

  • G.723.1

G.711 是專為供音訊轉碼器使用而開發的標準。G.711 標準中有兩種主要演算法定義:µ-law 演算法用於北美洲和日本,而 A-law 演算法用於歐洲和其他國家。G.723.1 音訊轉碼器大部分用於 VoIP 應用程式,而且需要授權才能使用。G.723.1 是高品質、高壓縮類型的轉碼器。

整合通訊伺服器和受支援的 IP 閘道或 IP PBX 都能同時提供 G.711 和 G.723.1 轉碼器。依預設,會優先使用 G.723.1 轉碼器。如果您要在整合通訊伺服器和 IP 閘道或 IP PBX 之間使用 G.723.1 以外的轉碼器,建議您變更 IP 閘道或 IP PBX 上的組態。下表摘要說明一些常見的 VoIP 轉碼器。

VoIP 轉碼器

VoIP 轉碼器 頻寬 (Kbps) 描述

G.711

64

此轉碼器需要極低的處理能力。雙向通訊需要最少 128 Kbps。

G.723.1

5.3/6.3

此轉碼器可提供高壓縮率與高品質音訊。所需要的處理能力比 G.711 轉碼器高。G.723.1 轉碼器使用的頻寬較低,但提供較差的音訊品質。

UM 語音訊息儲存轉碼器

整合通訊撥號對應表是整合通訊作業的必要部分。當您建立 UM 撥號對應表時,UM 撥號對應表預設會使用 WMA 音訊轉碼器。不過,您可以在建立 UM 撥號對應表後,將它設為使用 GSM 06.10 或 G.711 PCM 線性音訊轉碼器。

每種音訊轉碼器都有優缺點。WMA 因其聲音品質和壓縮內容,被選為預設的音訊轉碼器。GSM 06.10 和 G.711 PCM 線性音訊轉碼器則因其能夠支援其他類型的訊息系統,而併入可用的選項。

在規劃整合通訊時,您必須對針對語音訊息建立的音訊檔案,平衡其大小和相對品質。一般來說,音訊檔案的位元速率越高,品質就越好。您還必須考量是否壓縮音訊檔案。整合通訊中使用的每種音訊轉碼器,其範例位元速率 (位元/秒) 和壓縮內容如下:

預設 UM 語音訊息儲存轉碼器

語音訊息儲存轉碼器 位元 壓縮檔案?

MP3

16 位元

WMA

16 位元

G.711 PCM

16 位元

GSM 06.10

8 位元

在整合通訊中,MP3、WMA、G.711 PCM 線性和 GSM 06.10 音訊轉碼器都可用來建立語音訊息的 .mp3, .wma 和 .wav 音訊檔案。不過,會建立哪種檔案類型則視用來建立語音訊息音訊檔案的音訊轉碼器而定。在整合通訊中,.mp3 音訊轉碼器會建立 .mp3 音訊檔案, .wma 音訊轉碼器會建立 .wma 音訊檔案,而 GSM 06.10 和 G.711 PCM 線性音訊轉碼器則會產生 .wav 音訊檔案。這兩種音訊檔案會隨著電子郵件一起傳送給語音訊息收件者。

編碼和解碼數位資料經常會牽涉到壓縮和解壓縮,但並非絕對。音訊壓縮是一種資料壓縮,會讓音訊資料檔案變小。音訊轉碼器所用的音訊壓縮演算法會壓縮成 .wma 或 .wav 音訊檔案。在整合通訊中,會使用哪種音訊壓縮演算法,則要根據在 UM 撥號對應表內容中選取的音訊轉碼器類型而定。建立音訊檔案並進行壓縮後,便會將它附加到語音訊息內。

在壓縮和解壓縮期間,有時候會遺失數位資料的資訊。用來壓縮音訊檔案的壓縮比愈高,在轉換期間所遺失的資訊愈多。不過,因為音訊檔案的大小變小,所以使用的磁碟空間也跟著變小。相反地,壓縮比愈小,遺失的資訊愈少。但是因為每個音訊檔案都變大,所以必須使用較大的磁碟空間。

錄製語音訊息的 RTAudio 寬頻或高逼真度音訊也可當做音訊轉碼器使用。不過,您必須成功整合 Exchange 2007 整合通訊與 Office Communications Server 2007 R2 或 Microsoft Lync Server 2010 (下一代的 Office Communications Server),才能使用 RTAudio 的高逼真度音訊。若要啟用 RTAudio,必須將 UM 撥號對應表設定為工作階段初始通訊協定 (SIP) URI 類型撥號對應表,而且必須將撥號對應表上的自動達路轉碼器設為 WMA。

重要事項重要事項:
未部署 Office Communications Server 2007 或 R2 或 Lync Server 2010 的環境無法使用 RTAudio。這是因為在此類環境中,撥號對應表是設為電話分機,而非 SIP URI。

每通來電都有兩個媒體資料流:輸入至整合通訊伺服器,以及從整合通訊伺服器輸出。當撥號對應表類型設為 SIP URI 而撥號對應表上的自動答錄服務轉碼器設為 WMA,整合通訊伺服器會嘗試為輸入媒體資料流選取 RTAudio VoIP 轉碼器。如果交涉成功,輸入資料流的 RTAudio 轉碼器就會用於自動答錄服務通話,或從 Office Communicator 2007 發出的通話。

注意事項附註:
使用「在電話上播放」功能撥出的通話不會使用 RTAudio 轉碼器。使用「在電話上播放」所撥出通話的輸入資料流會使用 G.711 或 G.723.1 轉碼器。

使用 RTAudio 轉碼器時,所錄製的語音訊息會以高逼真度進行錄音,並儲存為具有 .wma 副檔名的音訊檔案。系統將這些語音訊息播放給 Office Outlook 2007 或 Outlook Web Access 的使用者時,他們會聽到高逼真度音訊形式的語音訊息。若交涉失敗,則會使用 G.711 或 G.723.1 轉碼器。G.711 和 G.723.1 轉碼器都是窄頻轉碼器,將它們用作 VoIP 轉碼器時,語音訊息會錄製並儲存為窄頻音訊檔,並具有 .wma 副檔名。

輸出媒體資料流則一律使用 G.711 或 G.723.1 轉碼器進行交涉。這表示來電者在電話中聽到的一定是窄頻音訊。使用 Office Communicator 撥出通話時,也是這種情形。

整合通訊伺服器用來儲存語音訊息中音訊的音訊格式和轉碼器,不僅取決於撥號對應表上設定的音訊轉碼器之外,還需仰賴 UM 與 SIP 對等網路交涉的音訊位元速率。如果您的環境內含 Office Communications Server 2007 R2、Lync Server 2010 或 SIP 端點,則整合通訊伺服器也會與 SIP 對等網路交涉要使用的音訊轉碼器。例如,當交涉使用寬頻 RTAudio 做為線路的轉碼器時,整合通訊伺服器便會根據撥號對應表的設定使用 32 Kbps MP3 或 WMA 9.2 格式建立語音訊息。下表顯示語音訊息儲存音訊轉碼器和 VoIP 或所使用線路音訊轉碼器之間的關係。

儲存音訊轉碼器和 VoIP 或線路音訊轉碼器之間的關係

UM 撥號對應表上設定的音訊轉碼器 VoIP 或線路轉碼器 (窄頻) - G.723、G.711 或 RTAudio (8KHz) VoIP 或線路轉碼器 (寬頻) - RTAudio (16KHz)

G.711

G.711

不適用。如果撥號對應表設定為 G.711,UM 伺服器不會交涉寬頻音訊。

WMA

WMA 9 Voice

WMA 9.2

GSM

GSM 6.10

不適用。如果撥號對應表設定為 G.711,UM 伺服器不會交涉寬頻音訊。

MP3

MP3 (16 Kbps)

MP3 (32 Kbps)

轉碼器

調整 UM 訊息大小

您可以將整合通訊設定為使用下列四種音訊轉碼器的其中一項來建立語音訊息:MP3、WMA、GSM 06.10 和 G.711 PCM 線性。預設會選取 [MP3] 格式。MP3 是一般的音訊檔案格式,除了可用來大幅減少音訊檔大小,還是個人音訊裝置或 MP3 播放器最常使用的音訊格式。MP3 是一種跨平台的音訊轉碼器類型,能夠與許多行動電話及裝置和不同電腦作業系統相容。

WMA 音訊轉碼器一律會儲存為 Windows 媒體格式,且附件的副檔名為 .wma。使用 GSM 或 G.711 PCM 線性音訊轉碼器編碼的音訊檔案一律會儲存為 RIFF/WAV 格式,且附件的副檔名為 .wav。

整合通訊語音訊息的大小視附件所包含的語音資料大小而定。而附件大小又視下列因素而定:

  • 語音信箱錄音的時間長短

  • 使用的音訊轉碼器

  • 音訊檔案儲存格式

下圖針對三種您可以在 UM 中使用的音訊轉碼器,說明語音信箱錄音的時間長短對音訊檔案大小的影響。

注意事項附註:
在此圖中,自動答錄之語音訊息的平均長度大約是 30 秒。

音訊檔案大小

MP3

根據預設,會選取 MP3 格式,而且 MP3 格式是語音信箱訊息的預設語音檔案格式。MP3 是一般的音訊檔案格式,除了可用來大幅減少音訊檔大小,還是個人音訊裝置或 MP3 播放器最常使用的音訊格式。MP3 是一種跨平台的音訊轉碼器類型,能夠與許多行動電話及裝置和不同電腦作業系統相容。

WMA

WMA 是三種轉碼器中壓縮比最高的音訊轉碼器。壓縮後,每 10 秒音訊大約需要 11,000 個位元組。不過,.wma 檔案格式的標頭區段遠比 .wav 檔案格式大。.wma 檔案的標頭區段大約是 7 KB,而 .wav 檔案的標頭區段則小於 100 個位元組。雖然 WMA 音訊記錄記錄了超過 15 秒的時間,所需空間卻比 GSM 音訊記錄小。因此,若需要最小但品質最高的音訊檔案,請使用 WMA 音訊轉碼器。

G.711 PCM 線性

G.711 PCM 線性音訊轉碼器會建立未壓縮的 .wav 音訊檔案。因此,在時間長短相同的狀況下,與 GSM 和 WMA 音訊轉碼器相比較下,G.711 PCM 線性 .wav 音訊檔案都會佔用最大的空間。G.711 PCM 線性 .wav 音訊檔案每 10 秒的音訊會佔用超過 160,000 個位元組的空間。在整合通訊使用的三種音訊轉碼器中,G.711 PCM 線性 .wav 音訊檔案擁有最高的音訊品質。不過,對大部分聽取語音訊息的使用者而言,使用 WMA 和 GSM 音訊轉碼器建立的音訊檔案,其品質都足以滿足他們的需要。

GSM

GSM 音訊轉碼器會建立壓縮的 .wav 音訊檔案。GSM .wav 音訊檔案每 10 秒的音訊會佔用超過 16,000 個位元組的空間。不過,GSM 建立的音訊檔案會大於使用 WMA 音訊轉碼器建立的音訊檔案。因此,當您需要在語音訊息的品質與大小間取得平衡時,這就不是最佳的選擇。

轉碼器

 © 2010 Microsoft Corporation. 著作權所有,並保留一切權利。