Grundlegendes zu Unified Messaging-Audiocodecs

 

Gilt für: Exchange Server 2010 SP2, Exchange Server 2010 SP3

Letztes Änderungsdatum des Themas: 2016-11-28

In Microsoft Exchange Server 2010 Unified Messaging (UM) wird ein Codec zum Speichern von Voicemailnachrichten verwendet. Ein weiterer Codec wird zwischen einem IP-Gateway oder einer IP-PBX-Anlage (Private Branch eXchange) und dem Unified Messaging-Server eingesetzt. Exchange 2010 Unified Messaging kann Sprachnachrichten mithilfe der folgenden vier Audiocodecs erstellen und speichern:

  • MP3 (Standardeinstellung)

  • Windows Media Audio (WMA)

  • Group System Mobile (GSM) 06.10

  • G.711 Pulse Code Modulation (PCM) Linear

Die VoIP-Codecs G.711 (PCMA und PCMU) und G.723.1 werden dagegen zwischen einem IP-Gateway und dem Unified Messaging-Server eingesetzt.

Ein Teil der Planung Ihres Unified Messaging-Systems besteht in der Auswahl des Audiocodecs, der für die Anforderungen Ihres Unternehmens geeignet ist. In diesem Thema werden die Audiocodecs beschrieben, die von Unified Messaging verwendet werden können. Außerdem finden Sie hier Hilfe zur Planung Ihrer UM-Bereitstellung.

Codecs

In Unified Messaging werden zwei Typen von Codecs verwendet: Der eine Codec wird zwischen IP-Gateways und dem Unified Messaging-Server oder zwischen einer PBX-Anlage und einem IP-Gateway (je nach PBX-Anlagentyp) eingesetzt, der andere Codec dient zum Verschlüsseln und Speichern von Sprachnachrichten für Benutzer.

Der Ausdruck Codec ist eine Kombination aus "Coding" (Codieren) und "Decoding" (Decodieren) und bezieht sich auf digitale Audiodaten. Ein Codec ist ein Programm zum Transformieren von digitalen Daten in ein Audiodatei- oder Audiostreamingformat. Codecs werden zum Konvertieren eines analogen Sprachsignals in eine digitale Version des Sprachsignals verwendet. Codecs können hinsichtlich der Soundqualität, der für ihre Nutzung erforderlichen Bandbreite und den Systemanforderungen, die für die Verschlüsselung benötigt werden, unterschiedlich sein.

Beim Telefonieren mit einem gewöhnlichen Telefon über das herkömmliche öffentliche Telefonnetz wird das Sprachsignal in einem analogen Format über die Telefonleitung übertragen. Mit Voice over IP (VoIP) muss das Sprachsignal in digitale Signale umgewandelt werden. Dieser Umwandlungsprozess wird als Verschlüsselung bezeichnet. Die Verschlüsselung erfolgt über einen Codec. Nachdem das digitalisierte Sprachsignal sein Ziel erreicht hat, muss es wieder in das ursprüngliche analoge Format umgewandelt werden, damit die Person am anderen Ende der Leitung den Anrufer hören und verstehen kann.

VoIP-Codec

In Unified Messaging können zwischen IP-Gateways oder IP-PBX-Anlagen und dem Unified Messaging-Server drei Typen von Codecs eingesetzt werden. Unified Messaging-Server können von einem IP-Gateway oder einer IP-PBX-Anlage folgende VoIP-Codecs annehmen:

  • G.711 µ-law

  • G.711 A-law

  • G.723.1

G.711 ist ein Standard, der für den Einsatz mit Audiocodecs entwickelt wurde. Im Standard G.711 sind zwei Haupt-Algorithmen definiert: Der Algorithmus µ-law wird in Nordamerika und Japan verwendet, der Algorithmus A-law dagegen in Europa und anderen Ländern. Der G.723.1-Audiocodec wird hauptsächlich in VoIP-Anwendungen eingesetzt und erfordert eine entsprechende Lizenz. G.723.1 ist ein Codectyp für hohe Qualität bei hoher Komprimierung.

Sowohl ein Unified Messaging-Server als auch ein unterstütztes IP-Gateway oder eine IP-PBX-Anlage können den G.711- und den G.723.1-Codec anbieten. Standardmäßig wird als primärer Codec G.723.1 verwendet. Wenn Sie zwischen dem Unified Messaging-Server und dem IP-Gateway oder der IP-PBX-Anlage einen anderen Codec als G.723.1 verwenden möchten, empfiehlt es sich, die Konfiguration des IP-Gateways oder der IP-PBX-Anlage zu ändern. In der folgenden Tabelle werden einige allgemeine VoIP-Codecs zusammengefasst.

VoIP-Codec

VoIP-Codec Bandbreite (Kbit/s) Beschreibung

G.711

64

Dieser Codec erfordert eine sehr geringe Prozessorleistung. Er benötigt mindestens 128 KBits/s für die bidirektionale Kommunikation.

G.723.1

5.3/6.3

Dieser Codec bietet hohe Komprimierung bei hoher Audioqualität. Er erfordert eine höhere Prozessorleistung als der G.711-Codec. Der G.723.1-Codec benötigt, allerdings zu Lasten der Audioqualität, eine geringere Bandbreite.

Codec für UM-Sprachnachrichtenspeicher

Unified Messaging-Wähleinstellungen sind integraler Bestandteil des Unified Messaging-Betriebs. Beim Erstellen von UM-Wähleinstellungen verwenden diese standardmäßig den WMA-Audiocodec. Nachdem Sie die UM-Wähleinstellungen erstellt haben, können Sie diese jedoch so konfigurieren, dass sie GSM 06.10- oder G.711 PCM Linear-Audiocodecs verwenden.

Jeder Audiocodec hat Vor- und Nachteile. Der WMA-Audiocodec wurde aufgrund seiner Soundqualität und Komprimiereigenschaften als Standardaudiocodec ausgewählt. Die GSM 06.10- und G.711 PCM Linear-Audiocodecs wurden aufgrund ihrer Fähigkeit, andere Messagingsystemtypen zu unterstützen, als Optionen aufgenommen.

Bei der Planung von Unified Messaging sind die Größe und relative Qualität der Audiodatei für Sprachnachrichten zu berücksichtigen. Generell gilt der Grundsatz, je höher die Bitrate einer Audiodatei, desto höher die Qualität. Außerdem ist zu überlegen, ob die Audiodatei komprimiert werden soll. Die in Unified Messaging verwendeten Audiocodecs haben folgende Bitraten (Bit/s) und Kompressionseigenschaften:

Standardcodecs für UM-Sprachnachrichtenspeicher

Codec für Sprachnachrichtenspeicher Bit Komprimierte Datei?

MP3

16 Bit

Ja

WMA

16 Bit

Ja

G.711 PCM

16 Bit

Nein

GSM 06.10

8 Bit

Ja

In Unified Messaging werden zum Erstellen von MP3-, WMA- und WAV-Audiodateien für Sprachnachrichten die Audiocodecs MP3, WMA, G.711 PCM Linear und GSM 06.10 verwendet. Welcher Dateityp erstellt wird, hängt jedoch von dem Audiocodec ab, der zum Erstellen der Sprachnachrichten-Audiodatei verwendet wird. In Unified Messaging werden vom MP3-Audiocodec MP3-Audiodateien, vom WMA-Audiocodec WMA-Audiodateien und von den GSM 06.10- und G.711 PCM Linear-Audiocodecs WAV-Audiodateien erstellt. Beide Arten von Audiodateien werden zusammen mit der E-Mail-Nachricht an den Empfänger der Sprachnachricht gesendet.

Das Codieren und Decodieren von digitalen Daten beinhaltet häufig, allerdings nicht immer, eine Komprimierung oder Dekomprimierung. Die Audiokomprimierung ist eine Form der Datenkomprimierung, bei der die Größe von Audiodateien reduziert wird. Der vom Audiocodec benutzte Audiokomprimierungsalgorithmus komprimiert WMA- oder WAV-Audiodateien. In Unified Messaging hängt der verwendete Audiokomprimierungsalgorithmus von dem Audiocodectyp ab, der in den UM-Wähleinstellungseigenschaften ausgewählt wird. Nachdem die Audiodatei erstellt und komprimiert wurde, wird sie der Sprachnachricht als Anlage hinzugefügt.

Manchmal gehen bei der Komprimierung und Dekomprimierung Informationen der digitalen Daten verloren. Je höher der für die Audiodatei gewählte Komprimierungsgrad, desto größer der Verlust an Informationen während der Konvertierung. Es wird jedoch weniger Speicherplatz verwendet, da die Größe der Audiodatei verringert wird. Umgekehrt gilt, je niedriger der Komprimierungsgrad, desto geringer der Verlust an Informationen. Aufgrund der Größe der einzelnen Audiodateien wird jedoch mehr Speicherplatz benötigt.

RTAudio-Breitband bzw. HiFi-Audio zum Aufzeichnen von Sprachnachrichten wird ebenfalls als Audiocodec unterstützt. HiFi-Audio mithilfe von RTAudio ist jedoch erst nach einer erfolgreichen Integration von Exchange 2007 Unified Messaging mit Office Communications Server 2007 R2 oder Microsoft Lync Server 2010 (der nächsten Generation von Office Communications Server) verfügbar. Zur Aktivierung von RTAudio müssen die UM-Wähleinstellungen als SIP-URI-Typ (Session Initiation-Protokoll) konfiguriert und der Mailboxansagecodec in den Wähleinstellungen auf WMA festgelegt werden.

Wichtig

RTAudio steht ausschließlich in Umgebungen zur Verfügung, in denen Office Communications Server 2007 oder R2 oder Lync Server 2010 bereitgestellt ist. Der Grund hierfür besteht darin, dass die Wähleinstellungen in diesen Umgebungen auf Telefondurchwahl und nicht auf SIP URI gesetzt sind.

Für jeden eingehenden Anruf gibt es zwei Medienstreams: einen eingehenden an einen Unified Messaging-Server und einen ausgehenden von einem Unified Messaging-Server. Wenn der Wähleinstellungstyp auf SIP URI und der Mailboxansagecodec in den Wähleinstellungen auf WMA gesetzt ist, wählt ein Unified Messaging-Server den RTAudio-VoIP-Codec für den eingehenden Medienstream aus. Bei erfolgreicher Aushandlung wird der RTAudio-Codec des eingehenden Streams für die Mailboxansage oder für Anrufe verwendet, die aus Office Communicator 2007 stammen.

Hinweis

Anrufe, die mithilfe der Funktion "Wiedergabe über Telefon" abgesetzt werden, verwenden den RTAudio-Codec nicht. Der eingehende Stream für Anrufe, die mithilfe dieser Funktion abgesetzt werden, verwendet den G.711- oder G.723.1-Codec.

Bei Verwendung des RTAudio-Codecs wird die jeweilige Sprachnachricht in HiFi-Qualität aufgezeichnet und als Audiodatei mit einer WMA-Erweiterung gespeichert. Die Wiedergabe dieser Sprachnachricht für den Benutzer erfolgt in Office Outlook 2007 oder Outlook Web Access in HiFi-Qualität. Bei erfolgreicher Aushandlung wird entweder der G.711- oder der G.723.1-Codec verwendet. Sowohl beim G.711- als auch beim G.723.1-Codec handelt es sich um schmalbandige Codecs. Wenn diese als VoIP-Codecs verwendet werden, wird die Sprachnachricht als schmalbandige Audiodatei mit einer WMA-Erweiterung aufgezeichnet und gespeichert.

Der ausgehende Medienstrom wird immer unter Verwendung des G.711- oder des G.723.1-Codecs ausgehandelt. Anrufer hören daher immer eine schmalbandige Wiedergabe über das Telefon. Dies trifft ebenfalls auf Situationen zu, in denen ein Anruf unter Verwendung von Office Communicator abgesetzt wird.

Das von den Unified Messaging-Servern zum Speichern der Audiodaten in Sprachnachrichten verwendete Audioformat und der Audiocodec hängen nicht nur vom Audiocodec ab, der für die Wähleinstellungen konfiguriert ist, sondern auch von der Bitrate der Audiodaten, die vom UM mit einem SIP-Peer ausgehandelt werden. Wenn Ihre Umgebung Office Communications Server 2007 R2, Lync Server 2010 oder SIP-Endpunkte einbezieht, wird auch der mit einem SIP-Peer verwendete Audiocodec von einem Unified Messaging-Server ausgehandelt. Wenn z. B. Breitband-RTAudio als Übermittlungscodec ausgehandelt wird, verwendet ein Unified Messaging-Server in Abhängigkeit von den Wähleinstellungen entweder das MP3- oder WMA 9.2-Format (32 KBit/s) zum Erstellen von Sprachnachrichten. In der folgenden Tabelle wird die Beziehung zwischen dem zum Speichern der Sprachnachrichten verwendeten Audiocodec und dem für VoIP oder Übermittlungen verwendeten Audiocodec veranschaulicht.

Beziehung zwischen Speicheraudiocodec und VoIP- oder Übermittlungsaudiocodec

In UM-Wähleinstellungen konfigurierter Audiocodec VoIP- oder Übermittlungscodec (Schmalband) – G.723, G.711 oder RTAudio (8 kHz) VoIP- oder Übermittlungscodec (Breitband) – RTAudio (16 kHz)

G.711

G.711

Nicht zutreffend. Die Breitbandaudiodaten werden nicht von einem UM-Server ausgehandelt, wenn G.711 für die Wähleinstellungen festgelegt ist.

WMA

WMA 9-Voice

WMA 9.2

GSM

GSM 6.10

Nicht zutreffend. Die Breitbandaudiodaten werden nicht von einem UM-Server ausgehandelt, wenn G.711 für die Wähleinstellungen festgelegt ist.

MP3

MP3 (16 KBit/s)

MP3 (32 KBit/s)

Codecs

UM-Nachrichtengröße

Sie können Unified Messaging so konfigurieren, dass einer der vier folgenden Audiocodecs zum Erstellen von Sprachnachrichten verwendet wird: MP3, WMA, GSM 06.10 oder G.711 PCM Linear. Standardmäßig ist das MP3-Format ausgewählt. Das MP3-Format ist ein gängiges Audiodateiformat, das zum weitreichenden Verkleinern der Audiodatei dient und auf MP3-Playern und anderen Audiogeräten weite Verbreitung gefunden hat. MP3 ist ein plattformübergreifender Audiocodectyp, der mit vielen Mobiltelefonen und -geräten sowie verschiedenen Computerbetriebssystemen kompatibel ist.

Der WMA-Audiocodec wird immer im Windows Media-Format gespeichert. Die Anlage ist eine Datei mit der Erweiterung "WMA". Mit den GSM- oder G.711 PCM Linear-Audiocodecs codierte Audiodateien werden immer im RIFF/WAV-Format gespeichert. Die Anlage ist eine Datei mit der Erweiterung "WAV".

Die Größe der Unified Messaging-Sprachnachrichten hängt von der Größe der Anlage ab, die die Sprachdaten enthält. Umgekehrt ist die Größe der Anlage von folgenden Faktoren abhängig:

  • Dauer der Voicemailaufzeichnung

  • Verwendeter Audiocodec

  • Speicherformat der Audiodatei

In der folgenden Abbildung wird gezeigt, wie bei den drei in UM verwendbaren Audiocodecs die Größe der Audiodatei von der Dauer der Voicemailaufzeichnung abhängt.

Hinweis

In dieser Abbildung beträgt die durchschnittliche Länge einer als Anrufannahme verwendeten Sprachnachricht ca. 30 Sekunden.

Größe der Audiodatei

MP3

Das MP3-Format ist standardmäßig ausgewählt. Es ist das Standard-Audiodateiformat für Voicemailnachrichten. Das MP3-Format ist ein gängiges Audiodateiformat, das zum weitreichenden Verkleinern der Audiodatei dient und auf MP3-Playern und anderen Audiogeräten weite Verbreitung gefunden hat. MP3 ist ein plattformübergreifender Audiocodectyp, der mit vielen Mobiltelefonen und -geräten sowie verschiedenen Computerbetriebssystemen kompatibel ist.

WMA

WMA ist von den drei Codec-Arten der Audiocodec mit der höchsten Komprimierung. Die Kompression beträgt etwa 11.000 Byte pro 10 Sekunden Audio. Das WMA-Dateiformat hat jedoch einen wesentlich größeren Kopfzeilenbereich als das WAV-Dateiformat. Der Kopfbereich der WMA-Datei umfasst ca. 7 KB, der der WAV-Datei hingegen weniger als 100 Byte. Obwohl WMA-Audioaufzeichnungen länger als 15 Sekunden sind, sind sie kleiner als GSM-Audioaufzeichnungen. Verwenden Sie deshalb den WMA-Audiocodec, wenn Sie die Audiodateien benötigen, die besonders klein sind und zugleich die höchste Qualität bieten.

G.711 PCM Linear

Der G.711 PCM Linear-Audiocodec erstellt WAV-Audiodateien, die nicht komprimiert sind. Daher belegen WAV-Audiodateien des G.711 PCM Linear-Codectyps verglichen mit den GSM- und WMA-Audiocodecs unabhängig von der Dauer den meisten Speicherplatz. G.711 PCM Linear-WAV-Audiodateien belegen pro 10 Sekunden Audio etwas über 160.000 Byte. Unter den drei von Unified Messaging verwendeten Audiocodecs bieten G.711 PCM Linear-WAV-Audiodateien die höchste Audioqualität. Die Qualität vergleichbarer Audiodateien, die mit WMA- und GSM-Audiocodecs erstellt wurden, ist für die meisten Benutzer, die Sprachnachrichten abrufen, jedoch durchaus ausreichend.

GSM

Der GSM-Audiocodec erstellt WAV-Audiodateien, die komprimiert sind. GSM-WAV-Audiodateien belegen pro 10 Sekunden Audio etwas über 16.000 Byte. Von GSM erstellte Audiodateien sind jedoch größer als Audiodateien, die vom WMA-Audiocodec erstellt werden. Deshalb ist dies möglicherweise nicht die beste Wahl, wenn Sie Qualität und Größe der Sprachnachricht berücksichtigen müssen.

Codecs

 © 2010 Microsoft Corporation. Alle Rechte vorbehalten.