Аудиокодеки единой системы обмена сообщениями в Exchange Server

Область применения: Exchange Server 2013 г., Exchange Server 2016 г.

В единой системе обмена сообщениями аудиокодек используется для хранения сообщений голосовой почты. Другой кодек используется между шлюзом VoIP или IP-УАТС и сервером почтовых ящиков, на котором запущена служба единой системы обмена сообщениями Microsoft Exchange, или сервером клиентского доступа, на котором работает служба маршрутизатора вызовов этой системы. В единой системе обмена сообщениями для создания и хранения голосовых сообщений могут использоваться любые из следующих четырех аудиокодеков:

  • MP3 (по умолчанию)
  • Windows Media Audio (WMA);
  • Group System Mobile (GSM) 06.10
  • G.711 Pulse Code Modulation (PCM) Linear

Предупреждение

Кодеки G.711 (PCMA и PCMU) и G.723.1 — это кодеки VoIP, которые используются для обмена данными между шлюзом VoIP и серверами клиентского доступа и почтовых ящиков.

Часть планирования системы единой системы обмена сообщениями включает в себя выбор правильного аудиокодека в зависимости от потребностей и требований вашей организации. В этом разделе рассматриваются звуковые кодеки, которые могут использоваться в единой системе обмена сообщениями, и вы можете использовать их для планирования развертывания единой системы обмена сообщениями.

Кодеки

Термин кодек, относящийся к цифровым аудиоданным, состоит из слов «кодирование» и «декодирование». Кодек — это программа, которая преобразует цифровые данные в формат звукового файла или звукового потока. Кодеки используются для преобразования аналогового голосового сигнала в его цифровую версию. Они различаются по качеству звука, пропускной способности, которая необходима для их использования, и требованиям к системе, соблюдение которых необходимо для выполнения кодирования.

В единой системе обмена сообщениями используются два типа кодеков:

  • Кодек, который используется для обмена данными между шлюзом VoIP, IP-УАТС или УАТС с поддержкой протокола SIP и серверами клиентского доступа и почтовых ящиков, либо между УАТС и шлюзом VoIP.
  • Кодек, который используется для кодирования и хранения голосовых сообщений для пользователей.

При использовании обычного телефона в телефонной сети общего пользования (ТСОП) голос передается по телефонной линии в аналоговом формате. Но при использовании протокола VoIP голос необходимо преобразовать в цифровые сигналы. Этот процесс преобразования называется кодированием. Кодирование выполняется с помощью кодека. После того как оцифрованный голос достигает места назначения, его необходимо декодировать обратно в аналоговый формат, чтобы абонент мог слышать и понимать звонящего.

Кодек VoIP

В единой системе обмена сообщениями для обмена данными между шлюзами VoIP или IP-УАТС и серверами клиентского доступа и почтовых ящиков можно использовать три приведенных ниже типа кодеков.

  • G.711 µ-law
  • G.711 A-law
  • G.723.1

G.711 — это стандарт, разработанный для использования со звуковыми кодеками. Существует два main алгоритмов, определенных в стандарте для G.711: алгоритм μ права, используемый в Северная Америка и Японии, и алгоритм A-law, используемый в Европе и других странах и регионах. Аудиокодек G.723.1 в основном используется в приложениях VoIP и требует лицензии. G.723.1 — это высококачественный кодек с высоким уровнем сжатия.

Сервер клиентского доступа или почтовых ящиков и поддерживаемый шлюз VoIP или IP-УАТС могут использовать как кодек G.711, так и кодек G.723.1. По умолчанию первым необходимо использовать кодек G.723.1. Если для обмена данными между серверами клиентского доступа или почтовых ящиков и шлюзом VoIP либо IP-УАТС, требуется использовать другой кодек вместо G.723.1, рекомендуется изменить конфигурацию шлюза VoIP или IP-УАТС. В приведенной ниже таблице содержатся сведения о наиболее распространенных кодеках VoIP.

Кодек VoIP Пропускная способность (Кбит/с) Описание
G.711 64 Данный кодек требует очень мало обработки. Для установки двусторонней связи необходима пропускная способность не менее 128 килобит в секунду (Кбит/с).
G.723.1 5.3/6.3 Данный кодек обеспечивает высокую степень сжатия при высоком качестве аудиосигнала. Он требует больше обработки по сравнению с кодеком G.711. Кодек G.723.1 требует меньшей пропускной способности, но качество аудиосигнала при этом хуже.

Кодек хранилища голосовых сообщений единой системы обмена сообщениями

Абонентские группы являются неотъемлемой частью единой системы обмена сообщениями. При создании абонентской группы единой системы обмена сообщениями эта абонентская группа по умолчанию использует аудиокодек MP3 для создания и хранения голосовых сообщений. Однако после создания абонентской группы единой системы обмена сообщениями данную группу можно настроить на использование аудиокодеков WMA, GSM 06.10 или G.711 PCM Linear.

Каждый аудиокодек имеет преимущества и недостатки. Аудиокодек MP3 выбран кодеком по умолчанию из-за качества звука и сжатия. Аудиокодеки GSM 06.10 и G.711 PCM Linear были выбраны из-за их способности поддерживать другие типы систем обмена сообщениями.

При планировании единой системы обмена сообщениями необходимо сбалансировать размер и относительное качество аудиофайла, который будет создаваться для голосовых сообщений. В общем, чем выше скорость передачи в аудиофайле, тем выше качество. Необходимо учитывать, сжат ли аудиофайл. В следующей таблице перечислены примерная скорость (бит/с) и свойства сжатия для каждого аудиокодека единой системы обмена сообщениями.

Кодек хранилища голосовых сообщений Биты Сжатие
MP3-проигрыватели 16-разрядный Да
WMA 16-разрядный Да
G.711 PCM 16-разрядный Нет
GSM 06.10 8 бит Да

В единой системе обмена сообщениями тип файлов, который создается для голосового сообщения, зависит от аудиокодека, используемого для создания аудиофайла голосового сообщения. С помощью аудиокодека MP3 создаются аудиофайлы MP3, путем применения кодека WMA — файлы WMA, а с использованием кодеков GSM 06.10 и G.711 PCM Linear — аудиофайлы WAV. Все виды данных аудиофайлов отправляются вместе с сообщением электронной почты получателю голосового сообщения.

Часто, но не всегда в кодировании и декодировании цифровых данных используются сжатие и распаковка. Сжатие аудиопотока — это форма сжатия данных, уменьшающая размер аудиофайлов. Алгоритм сжатия аудио, используемый аудиокодеком, сжимает аудиофайлы WMA и WAV. В единой системе обмена сообщениями тип используемого алгоритма сжатия основан на типе аудиокодека, выбранного в свойствах абонентской группы системы. После создания и сжатия звуковой файл вкладывается в голосовое сообщение.

Иногда во время сжатия или распаковки теряются некоторые данные. Чем выше степень сжатия звукового файла, тем больше теряется данных во время преобразования. Тем не менее, используется меньшее количество дискового пространства вследствие меньшего размера звукового файла. Наоборот, более низкая степень сжатия приведет к меньшей потере данных. Однако будет задействовано больше дискового пространства вследствие увеличившегося размера звукового файла.

Также доступен широкополосный кодек RTAudio для записи голосовых сообщений с высоким качеством звука. Однако звук с высокой точностью с помощью RTAudio доступен только после успешной интеграции единой системы обмена сообщениями с Microsoft Lync Server. Чтобы включить кодек RTAudio в качестве сетевого кодека (узко- или широкополосного), необходимо настроить абонентскую группу единой системы обмена сообщениями в качестве абонентской группы SIP с универсальным кодом ресурса (URI), а в качестве кодека автоответчика для данной абонентской группы установить кодек MP3 или WMA для активации широкополосного аудио (16 кГц).

Важно!

Кодек RTAudio недоступен в средах, где не развернут сервер Lync Server. Это связано с тем, что в средах, в которых не интегрирован сервер Lync Server, для абонентской группы настраивается добавочный телефонный номер или номер по рекомендации E.164, а не SIP универсального кода ресурса (URI).

Для каждого входящего вызова существует два потока мультимедиа: входящий на сервер клиентского доступа и исходящий с сервера почтовых ящиков. Если в качестве типа абонентской группы установлен универсальный код ресурса (URI) протокола SIP, а в качестве кодека автоответчика для данной абонентской группы выбран кодек MP3 или WMA, сервер клиентского доступа пытается выбрать для входящего потока мультимедиа кодек RTAudio VoIP. Если согласование осуществляется успешно, кодек RTAudio для входящего потока будет использоваться для вызовов по автоответчику или вызовов с клиента либо сервера Lync.

Примечание.

Кодек RTAudio не используется для вызовов с помощью возможности воспроизведения на телефоне. Во входящем потоке для вызовов с помощью возможности воспроизведения на телефоне используется кодек G.711 или G.723.1.

При использовании кодека RTAudio записанное голосовое сообщение будет записано с высокой точностью и будет храниться в виде звукового файла с расширением .mp3 или WMA в зависимости от настройки абонентской группы. При воспроизведении голосового сообщения пользователю в Outlook или Outlook Web App он услышит голосовое сообщение с высокой точностью звука. Если согласование не удается, будет использоваться кодек G.711 или G.723.1. Кодеки G.711 и G.723.1 являются узкополосными кодеками. При использовании в качестве кодека VoIP голосовое сообщение записывается и сохраняется в виде узкополосного звукового файла с расширением .mp3 или WMA.

Для исходящего потока мультимедиа всегда используется кодек G.711 или G.723.1. Это означает, что звонящий всегда слышит по телефону узкополосный звук. Это правильно и для тех случаев, когда вызов совершается с помощью Microsoft Lync Server 2010 или более поздней версии.

Звуковой формат и кодек, используемые серверами почтовых ящиков для хранения звука в голосовых сообщениях, зависят не только от аудиокодека, настроенного в абонентской группе, но также от скорости потока звуковых данных, которая согласовывается единой системой обмена сообщениями с одноранговым узлом SIP. Если в среду входят конечные точки Lync Server или SIP, сервер почтовых ящиков также согласует используемый аудиокодек с одноранговым узлом SIP. Например, если широкополосный кодек RTAudio согласован в качестве сетевого кодека, сервер почтовых ящиков будет использовать формат MP3 со скоростью 32 кбит/с или WMA 9.2 при создании голосовых сообщений, в зависимости от настройки абонентской группы.

В таблице ниже показана взаимосвязь между аудиокодеком для хранения голосовых сообщений и используемым протоколом VoIP или сетевым аудиокодеком.

Аудиокодек, настроенный в абонентской группе единой системы обмена сообщениями VoIP или сетевой кодек (узкополосный) — G.723, G.711 или RTAudio (8 кГц) VoIP или сетевой кодек (широкополосный) — RTAudio (16 кГц)
G.711 G.711 Неприменимо. Серверы клиентского доступа и почтовых ящиков не согласовывают широкополосное аудио, если абонентская группа настроена на G.711.
WMA WMA 9 Voice WMA 9.2
GSM GSM 6.10 Неприменимо. Серверы клиентского доступа и почтовых ящиков не согласовывают широкополосное аудио, если абонентская группа настроена на GSM.
MP3-проигрыватели MP3 (16 кбит/с) MP3 (32 кбит/с)

Изменение размера сообщения единой системы обмена сообщениями

Единая система обмена сообщениями может использовать один из следующих четырех аудиокодеков для создания голосовых сообщений: MP3, WMA, GSM 06.10 и G.711 PCM Linear. По умолчанию выбран формат MP3.

Аудиокодек WMA всегда сохраняет данные в формате Windows Media, а вложением является файл с расширением WMA. Аудиофайлы, кодированные с помощью аудиокодеков GSM или G.711 PCM Linear, всегда сохраняются в формате RIFF или WAV, а вложением будет являться файл с расширением WAV.

Размер голосовых сообщений единой системы обмена сообщениями зависит от размера вложений, содержащих голосовые данные. В свою очередь размер вложений зависит от следующих факторов:

  • продолжительности записи голосовой почты;

  • используемого аудиокодека;

  • формата хранения звукового файла.

На приведенном ниже рисунке показано, как размер звукового файла зависит от продолжительности записи голосовой почты в случае каждого из трех аудиокодеков, используемых в единой системе обмена сообщениями.

Примечание.

На данном рисунке показано, что средняя длина голосового сообщения автоответчика примерно равна 30 секундам.

UM_Message_Sizing.

MP3-проигрыватели

По умолчанию выбран формат MP3, он также является форматом аудиофайлов по умолчанию для сообщений голосовой почты. Формат MP3 — это распространенный формат аудиофайлов, используемый для значительного уменьшения размера аудиофайлов и чаще других используемый в персональных аудиоустройствах и MP3-плеерах. MP3 — это межплатформенный тип аудиокодека, используемый для совместимости со многими мобильными телефонами и устройствами, а также с различными компьютерными операционными системами.

WMA

WMA является аудиокодеком с наибольшим уровнем сжатия из всех трех типов кодеков. Сжатие составляет примерно 11 000 байт на каждые 10 секунд аудиопотока. Однако формат WMA имеет гораздо больший заголовок, чем формат WAV. Раздел заголовка WMA-файла составляет примерно 7 килобайт (КБ), тогда как раздел заголовка WAV-файла занимает менее 100 байт. Несмотря на то что аудиозаписи в формате WMA записываются дольше 15 секунд, они становятся меньше аудиозаписей в формате GSM. Поэтому для получения аудиофайлов наименьшего размера с самым высоким качеством используйте аудиокодек WMA.

Примечание.

Если вы используете push-уведомления из локального развертывания OWA для устройств, формат WMA использовать нельзя. OWA для устройств поддерживает только формат MP3.

G.711 PCM Linear

Аудиокодек G.711 PCM Linear создает несжатые WAV-файлы. Поэтому звуковые файлы WAV, созданные с помощью кодека G.711 PCM Linear, занимают наибольшее количество дискового пространства по сравнению с аудиокодеками GSM и WMA. WAV-файлы G.711 PCM Linear занимают более 160 000 байт на каждые 10 секунд звучания. Аудиофайлы G.711 PCM Linear обеспечивают наивысшее качество звука среди всех трех аудиокодеков единой системы обмена сообщениями. Однако качество сравниваемых аудиофайлов, созданных с помощью аудиокодеков WMA и GSM, подходит для большинства пользователей, которые прослушивают голосовые сообщения.

GSM

Аудиокодек GSM создает сжатые WAV-файлы. WAV-файлы GSM занимают более 16 000 байт на каждые 10 секунд звучания. Однако с помощью GSM создается аудиофайл, который занимает больше места, чем файл, созданный с помощью аудиокодека WMA. Поэтому при попытке сбалансировать качество и размер голосового сообщения этот кодек может и не являться наилучшим выбором.