Аудиокодеки

 

Применимо к:Exchange Server 2013, Exchange Server 2016

Последнее изменение раздела:2016-12-09

В единой системе обмена сообщениями аудиокодек используется для хранения сообщений голосовой почты. Другой кодек используется между шлюзом VoIP или IP-УАТС и сервером почтовых ящиков, на котором запущена служба единой системы обмена сообщениями Microsoft Exchange, или сервером клиентского доступа, на котором работает служба маршрутизатора вызовов этой системы. В единой системе обмена сообщениями для создания и хранения голосовых сообщений могут использоваться любые из следующих четырех аудиокодеков:

  • MP3 (по умолчанию)

  • Windows Media Audio (WMA);

  • Group System Mobile (GSM) 06.10

  • G.711 Pulse Code Modulation (PCM) Linear

ПредупреждениеПредупреждение.
Кодеки G.711 (PCMA и PCMU) и G.723.1 — это кодеки VoIP, которые используются для обмена данными между шлюзом VoIP и серверами клиентского доступа и почтовых ящиков.

Один из этапов планирования единой системы обмена сообщениями — выбор необходимого аудиокодека, соответствующего требованиям организации. В этом разделе описываются аудиокодеки, которые могут использоваться единой системой обмена сообщениями. С помощью этих сведений вы сможете правильно спланировать развертывание данной системы.

Термин кодек, относящийся к цифровым аудиоданным, состоит из слов «кодирование» и «декодирование». Кодек — это программа, которая преобразует цифровые данные в формат звукового файла или звукового потока. Кодеки используются для преобразования аналогового голосового сигнала в его цифровую версию. Они различаются по качеству звука, пропускной способности, которая необходима для их использования, и требованиям к системе, соблюдение которых необходимо для выполнения кодирования.

В единой системе обмена сообщениями используются два типа кодеков:

  • Кодек, который используется для обмена данными между шлюзом VoIP, IP-УАТС или УАТС с поддержкой протокола SIP и серверами клиентского доступа и почтовых ящиков, либо между УАТС и шлюзом VoIP.

  • Кодек, который используется для кодирования и хранения голосовых сообщений для пользователей.

При использовании обычного телефона в телефонной сети общего пользования (ТСОП) голос передается по телефонной линии в аналоговом формате. Но при использовании протокола VoIP голос необходимо преобразовать в цифровые сигналы. Этот процесс преобразования называется кодированием. Кодирование выполняется с помощью кодека. После того как оцифрованный голос достигает места назначения, его необходимо декодировать обратно в аналоговый формат, чтобы абонент мог слышать и понимать звонящего.

В единой системе обмена сообщениями для обмена данными между шлюзами VoIP или IP-УАТС и серверами клиентского доступа и почтовых ящиков можно использовать три приведенных ниже типа кодеков.

  • G.711 µ-law

  • G.711 A-law

  • G.723.1

G.711 — это стандарт, разработанный для использования с аудиокодеками. Существует два основных алгоритма, определенных в стандарте для G.711: Алгоритм «µ-law», используемый в Северной Америке и Японии, и алгоритм «A-law», который используется в Европе и других странах. В приложениях VoIP чаще всего используется аудиокодек G.723.1. Для использования этого кодека требуется получение лицензии. Кодек G.723.1 обеспечивает высокое качество при высокой степени сжатия.

Сервер клиентского доступа или почтовых ящиков и поддерживаемый шлюз VoIP или IP-УАТС могут использовать как кодек G.711, так и кодек G.723.1. По умолчанию первым необходимо использовать кодек G.723.1. Если для обмена данными между серверами клиентского доступа или почтовых ящиков и шлюзом VoIP либо IP-УАТС, требуется использовать другой кодек вместо G.723.1, рекомендуется изменить конфигурацию шлюза VoIP или IP-УАТС. В приведенной ниже таблице содержатся сведения о наиболее распространенных кодеках VoIP.

Кодеки VoIP

Кодек VoIP Пропускная способность (Кбит/с) Описание

G.711

64

Данный кодек требует очень мало обработки. Для установки двусторонней связи необходима пропускная способность не менее 128 килобит в секунду (Кбит/с).

G.723.1

5.3/6.3

Данный кодек обеспечивает высокую степень сжатия при высоком качестве аудиосигнала. Он требует больше обработки по сравнению с кодеком G.711. Кодек G.723.1 требует меньшей пропускной способности, но качество аудиосигнала при этом хуже.

Абонентские группы являются неотъемлемой частью единой системы обмена сообщениями. При создании абонентской группы единой системы обмена сообщениями эта абонентская группа по умолчанию использует аудиокодек MP3 для создания и хранения голосовых сообщений. Однако после создания абонентской группы единой системы обмена сообщениями данную группу можно настроить на использование аудиокодеков WMA, GSM 06.10 или G.711 PCM Linear.

Каждый аудиокодек имеет преимущества и недостатки. Аудиокодек MP3 выбран кодеком по умолчанию из-за качества звука и сжатия. Аудиокодеки GSM 06.10 и G.711 PCM Linear были выбраны из-за их способности поддерживать другие типы систем обмена сообщениями.

При планировании единой системы обмена сообщениями необходимо сбалансировать размер и относительное качество аудиофайла, который будет создаваться для голосовых сообщений. В общем, чем выше скорость передачи в аудиофайле, тем выше качество. Необходимо учитывать, сжат ли аудиофайл. В следующей таблице перечислены примерная скорость (бит/с) и свойства сжатия для каждого аудиокодека единой системы обмена сообщениями.

Кодеки хранилища голосовых сообщений единой системы обмена сообщениями по умолчанию

Кодек хранилища голосовых сообщений Биты Сжатие

MP3

16 бит

Да

WMA

16 бит

Да

G.711 PCM

16 бит

Нет

GSM 06.10

8 бит

Да

В единой системе обмена сообщениями тип файлов, который создается для голосового сообщения, зависит от аудиокодека, используемого для создания аудиофайла голосового сообщения. С помощью аудиокодека MP3 создаются аудиофайлы MP3, путем применения кодека WMA — файлы WMA, а с использованием кодеков GSM 06.10 и G.711 PCM Linear — аудиофайлы WAV. Все виды данных аудиофайлов отправляются вместе с сообщением электронной почты получателю голосового сообщения.

Часто, но не всегда в кодировании и декодировании цифровых данных используются сжатие и распаковка. Сжатие аудиопотока — это форма сжатия данных, уменьшающая размер аудиофайлов. Алгоритм сжатия аудио, используемый аудиокодеком, сжимает аудиофайлы WMA и WAV. В единой системе обмена сообщениями тип используемого алгоритма сжатия основан на типе аудиокодека, выбранного в свойствах абонентской группы системы. После создания и сжатия звуковой файл вкладывается в голосовое сообщение.

Иногда во время сжатия или распаковки теряются некоторые данные. Чем выше степень сжатия звукового файла, тем больше теряется данных во время преобразования. Тем не менее, используется меньшее количество дискового пространства вследствие меньшего размера звукового файла. Наоборот, более низкая степень сжатия приведет к меньшей потере данных. Однако будет задействовано больше дискового пространства вследствие увеличившегося размера звукового файла.

Также доступен широкополосный кодек RTAudio для записи голосовых сообщений с высоким качеством звука. Однако данная возможность становится доступна только после интеграции единой системы обмена сообщениями с сервером Microsoft Lync Server . Чтобы включить кодек RTAudio в качестве сетевого кодека (узко- или широкополосного), необходимо настроить абонентскую группу единой системы обмена сообщениями в качестве абонентской группы SIP с универсальным кодом ресурса (URI), а в качестве кодека автоответчика для данной абонентской группы установить кодек MP3 или WMA для активации широкополосного аудио (16 кГц).

ВажноВажно!
Кодек RTAudio недоступен в средах, где не развернут сервер Lync Server. Это связано с тем, что в средах, в которых не интегрирован сервер Lync Server, для абонентской группы настраивается добавочный телефонный номер или номер по рекомендации E.164, а не SIP универсального кода ресурса (URI).

Для каждого входящего вызова существует два потока мультимедиа: входящий на сервер клиентского доступа и исходящий с сервера почтовых ящиков. Если в качестве типа абонентской группы установлен универсальный код ресурса (URI) протокола SIP, а в качестве кодека автоответчика для данной абонентской группы выбран кодек MP3 или WMA, сервер клиентского доступа пытается выбрать для входящего потока мультимедиа кодек RTAudio VoIP. Если согласование осуществляется успешно, кодек RTAudio для входящего потока будет использоваться для вызовов по автоответчику или вызовов с клиента либо сервера Lync.

ПримечаниеПримечание.
Кодек RTAudio не используется для вызовов с помощью возможности воспроизведения на телефоне. Во входящем потоке для вызовов с помощью возможности воспроизведения на телефоне используется кодек G.711 или G.723.1.

При использовании кодека RTAudio голосовое сообщение записывается с высоким качеством звука и сохраняется как звуковой файл в формате MP3 или WMA в зависимости от конфигурации абонентской группы. Для пользователей Outlook или Outlook Web App голосовое сообщение будет воспроизводиться с высоким качеством звука. Если согласование не выполнено, используется кодек G.711 или G.723.1 Кодеки G.711 и G.723.1 — узкополосные кодеки. Если эти кодеки используются в качестве кодека VoIP, голосовое сообщение записывается и сохраняется как узкополосный звуковой файл в формате MP3 или WMA.

Для исходящего потока мультимедиа всегда используется кодек G.711 или G.723.1. Это означает, что звонящий всегда слышит по телефону узкополосный звук. Это правильно и для тех случаев, когда вызов совершается с помощью Microsoft Lync Server 2010 или более поздней версии.

Звуковой формат и кодек, используемые серверами почтовых ящиков для хранения звука в голосовых сообщениях, зависят не только от аудиокодека, настроенного в абонентской группе, но также от скорости потока звуковых данных, которая согласовывается единой системой обмена сообщениями с одноранговым узлом SIP. Если в среду входят конечные точки Lync Server или SIP, сервер почтовых ящиков также согласует используемый аудиокодек с одноранговым узлом SIP. Например, если широкополосный кодек RTAudio согласован в качестве сетевого кодека, сервер почтовых ящиков будет использовать формат MP3 со скоростью 32 кбит/с или WMA 9.2 при создании голосовых сообщений, в зависимости от настройки абонентской группы. В таблице ниже показана взаимосвязь между аудиокодеком для хранения голосовых сообщений и используемым протоколом VoIP или сетевым аудиокодеком.

Связь между аудиокодеком хранения и протоколом VoIP или сетевым аудиокодеком

Аудиокодек, настроенный в абонентской группе единой системы обмена сообщениями VoIP или сетевой кодек (узкополосный) — G.723, G.711 или RTAudio (8 кГц) VoIP или сетевой кодек (широкополосный) — RTAudio (16 кГц)

G.711

G.711

Неприменимо. Серверы клиентского доступа и почтовых ящиков не согласовывают широкополосное аудио, если абонентская группа настроена на G.711.

WMA

WMA 9 Voice

WMA 9.2

GSM

GSM 6.10

Неприменимо. Серверы клиентского доступа и почтовых ящиков не согласовывают широкополосное аудио, если абонентская группа настроена на GSM.

MP3

MP3 (16 кбит/с)

MP3 (32 кбит/с)

Кодеки

Единую систему обмена сообщениями можно настроить на использование одного из следующих четырех аудиокодеков для создания голосовых сообщений. MP3, WMA, GSM 06.10 и G.711 PCM Linear. По умолчанию выбран формат MP3.

Аудиокодек WMA всегда сохраняет данные в формате Windows Media, а вложением является файл с расширением WMA. Аудиофайлы, кодированные с помощью аудиокодеков GSM или G.711 PCM Linear, всегда сохраняются в формате RIFF или WAV, а вложением будет являться файл с расширением WAV.

Размер голосовых сообщений единой системы обмена сообщениями зависит от размера вложений, содержащих голосовые данные. В свою очередь размер вложений зависит от следующих факторов:

  • продолжительности записи голосовой почты;

  • используемого аудиокодека;

  • формата хранения звукового файла.

На приведенном ниже рисунке показано, как размер звукового файла зависит от продолжительности записи голосовой почты в случае каждого из трех аудиокодеков, используемых в единой системе обмена сообщениями.

ПримечаниеПримечание.
На данном рисунке показано, что средняя длина голосового сообщения автоответчика примерно равна 30 секундам.

Размер звукового файла

UM_Message_Sizing

По умолчанию выбран формат MP3, он также является форматом аудиофайлов по умолчанию для сообщений голосовой почты. Формат MP3 — это распространенный формат аудиофайлов, используемый для значительного уменьшения размера аудиофайлов и чаще других применяемый в персональных аудиоустройствах и MP3-плеерах. MP3 — это межплатформенный тип аудиокодека, используемый для совместимости со многими мобильными телефонами и устройствами, а также с различными компьютерными операционными системами.

WMA является аудиокодеком с наибольшим уровнем сжатия из всех трех типов кодеков. Сжатие составляет примерно 11 000 байт на каждые 10 секунд аудиопотока. Однако формат WMA имеет гораздо больший заголовок, чем формат WAV. Раздел заголовка WMA-файла составляет примерно 7 килобайт (КБ), тогда как раздел заголовка WAV-файла занимает менее 100 байт. Несмотря на то что аудиозаписи в формате WMA записываются дольше 15 секунд, они становятся меньше аудиозаписей в формате GSM. Поэтому для получения аудиофайлов наименьшего размера с самым высоким качеством используйте аудиокодек WMA.

ПримечаниеПримечание.
Если вы используете push-уведомления из локального развертывания OWA для устройств, формат WMA использовать нельзя. OWA для устройств поддерживает только формат MP3.

Аудиокодек G.711 PCM Linear создает несжатые WAV-файлы. Поэтому звуковые файлы WAV, созданные с помощью кодека G.711 PCM Linear, занимают наибольшее количество дискового пространства по сравнению с аудиокодеками GSM и WMA. WAV-файлы G.711 PCM Linear занимают более 160 000 байт на каждые 10 секунд звучания. Аудиофайлы G.711 PCM Linear обеспечивают наивысшее качество звука среди всех трех аудиокодеков единой системы обмена сообщениями. Однако качество сравниваемых аудиофайлов, созданных с помощью аудиокодеков WMA и GSM, подходит для большинства пользователей, которые прослушивают голосовые сообщения.

Аудиокодек GSM создает сжатые WAV-файлы. WAV-файлы GSM занимают более 16 000 байт на каждые 10 секунд звучания. Однако с помощью GSM создается аудиофайл, который занимает больше места, чем файл, созданный с помощью аудиокодека WMA. Поэтому при попытке сбалансировать качество и размер голосового сообщения этот кодек может и не являться наилучшим выбором.

Кодеки

 
Показ: