Улучшения предварительного просмотра голосовой почты в Exchange Server

Область применения: Exchange Server 2013 г., Exchange Server 2016 г.

Предварительный просмотр голосовой почты — это функция, доступная пользователям, получающим сообщения голосовой почты с помощью единой системы обмена мгновенными сообщениями (UM) Microsoft Exchange Server 2010 или Exchange Server 2013. Предварительный просмотр голосовой почты улучшает функциональность голосовой почты UM, предоставляя текстовую версию аудиозаписей. Текст голосовой почты отображается в сообщении электронной почты в Outlook Web App, Outlook 2010 и других почтовых программах.

Улучшения предварительного просмотра голосовой почты

В Exchange 2013 в единую систему обмена мгновенными сообщениями внесен ряд улучшений для пользовательского интерфейса клиентов Outlook Web App и Outlook, а также усовершенствования для повышения уровней уверенности и точности предварительного просмотра голосовой почты. Некоторые улучшения, связанные со службами преобразования речи, предлагаются на базе платформы обработки речи Майкрософт (версия 11.0) и управляемых интерфейсов Unified Communications Managed API (UCMA) 4.0 и предназначены для совершенствования создания грамматики и поддержки языков.

В единой системе обмена сообщениями представлена функция предварительного просмотра голосовой почты в Exchange 2010. Для добавления текстовой версии звукового файла голосового сообщения в голосовое сообщение функция предварительного просмотра голосовой почты использует автоматическое распознавание речи (ASR). ASR не является абсолютно точным механизмом, особенно при использовании записи звука по телефону, содержащего неизвестные голоса и шумы.

Некоторым организациям требуются согласованные безошибочные (или практически безошибочные) транскрипции сообщений голосовой почты некоторых, если не всех, пользователей. Для удовлетворения этих требований предназначена партнерская программа предварительного просмотра голосовой почты. Эта программа была разработана для Exchange 2010 с целью улучшения результатов предварительного просмотра голосовой почты, но в связи с высокими накладными расходами и стоимостью она не использовалась клиентами Exchange 2010. Для решения этих проблем в Exchange 2013 были внесены следующие улучшения для функции предварительного просмотра голосовой почты.

  • Улучшенная нормализация звука. Нормализация звука — это процесс равномерного увеличения (или уменьшения) амплитуды всего звукового сигнала таким образом, чтобы полученная пиковая амплитуда соответствовала заданному целевому объекту или норме. Единая система обмена мгновенными сообщениями нормализует запись звука до ее сжатия и отправки пользователю.

  • Улучшенное распознавание речи. Собирая сообщения голосовой почты (только если клиент Exchange решит поделиться этой информацией), результаты предварительного просмотра голосовой почты можно использовать для добавления слов и фраз в подсистему распознавания речи. Это можно сделать, задав для параметра VoiceMailAnalysisEnabled значение $true с помощью командлета Set-UMMailbox или задав параметру AllowVoiceMailAnalysis значение $true в командлете Set-UMMailboxPolicy . Кроме того, единой системы обмена сообщениями Exchange 2013 более эффективно используется информация из потоков электронной почты, созданных пользователем с помощью голосового доступа к Outlook. Сюда входят сведения об участниках (Active Directory или личные контактные данные) (страна или регион, город, компания) и номер телефона пользователя голосового доступа Outlook.

  • Достоверность предварительной версии голосовой почты. Оценка достоверности — это номер, назначенный единой системой обмена сообщениями, который напрямую связан с общей точностью транскрибирования. Вычисления уровня уверенности, используемые единой системой обмена мгновенными сообщениями, были настроены для обеспечения большей точности и представляют реальный уровень точности транскрибированного сообщения.

  • Фильтрация. Оскорбительные слова обнаруживаются и фильтруются, а результаты кэшируются и сохраняются в почтовом ящике пользователя.

  • Скрытие предварительного просмотра текста. Если оценка достоверности для предварительного просмотра голосовой почты ниже заданного порогового значения, текст предварительного просмотра голосовой почты будет скрыт. Если текст скрывается, в голосовом сообщении будет содержаться информация о том, что уровень уверенности голосовой почты слишком низкий для отображения результатов.

  • Производительность транскрибирования. Предварительная версия голосовой почты — это ресурсоемкая операция, которая требует примерно в два раза больше времени, необходимого для обработки звукового файла. Если процесс создания текста предварительного просмотра голосового сообщения длится слишком долго, регулировка ЦП останавливает обработку предварительного просмотра. В Exchange 2010 единая система обмена мгновенными сообщениями не транскрибировала голосовые сообщения длиннее 75 секунд. В Exchange 2013 транскрибируется все голосовое сообщение, но если текст для сообщения превышает 75 секунд, он не включается.

  • Цветовые схемы. Из-за путаницы в цветах, которые использовались для различия между низкой, средней и высокой достоверностью для предварительного просмотра голосовой почты, цветовая схема была удалена в Exchange 2013 для Outlook Web App и Outlook.