Grundlegendes zu Unified Messaging-Audiocodecs

Gilt für: Exchange Server 2010

Letztes Änderungsdatum des Themas: 2009-10-10

In Microsoft Exchange Server 2010 Unified Messaging (UM) wird ein Codec zum Speichern von Voicemailnachrichten verwendet. Ein weiterer Codec wird zwischen einem IP-Gateway oder einer IP-PBX-Anlage (Private Branch eXchange) und dem Unified Messaging-Server eingesetzt. Exchange 2010 Unified Messaging kann Sprachnachrichten mithilfe der folgenden drei Audiocodecs erstellen und speichern:

  • Windows Media Audio (WMA)
  • Group System Mobile (GSM) 06.10
  • G.711 Pulse Code Modulation (PCM) Linear

Die VoIP-Codecs G.711 (PCMA und PCMU) und G.723.1 werden dagegen zwischen einem IP-Gateway und dem Unified Messaging-Server eingesetzt.

Ein Teil der Planung Ihres Unified Messaging-Systems besteht in der Auswahl des Audiocodecs, der für die Anforderungen Ihres Unternehmens geeignet ist. In diesem Thema werden die Audiocodecs beschrieben, die von Unified Messaging verwendet werden können. Außerdem finden Sie hier Hilfe zur Planung Ihrer UM-Bereitstellung.

Codecs

In Unified Messaging werden zwei Typen von Codecs verwendet: Der eine Codec wird zwischen IP-Gateways und dem Unified Messaging-Server oder zwischen einer PBX-Anlage und einem IP-Gateway (je nach PBX-Anlagentyp) eingesetzt, der andere Codec dient zum Verschlüsseln und Speichern von Sprachnachrichten für Benutzer.

Der Ausdruck Codec ist eine Kombination aus "Coding" (Codieren) und "Decoding" (Decodieren) und bezieht sich auf digitale Audiodaten. Ein Codec ist ein Programm zum Transformieren von digitalen Daten in ein Audiodatei- oder Audiostreamingformat. Codecs werden zum Konvertieren eines analogen Sprachsignals in eine digitale Version des Sprachsignals verwendet. Codecs können hinsichtlich der Soundqualität, der für ihre Nutzung erforderlichen Bandbreite und den Systemanforderungen, die für die Verschlüsselung benötigt werden, unterschiedlich sein.

Beim Telefonieren mit einem gewöhnlichen Telefon über das herkömmliche öffentliche Telefonnetz wird das Sprachsignal in einem analogen Format über die Telefonleitung übertragen. Mit Voice over IP (VoIP) muss das Sprachsignal in digitale Signale umgewandelt werden. Dieser Umwandlungsprozess wird als Verschlüsselung bezeichnet. Die Verschlüsselung erfolgt über einen Codec. Nachdem das digitalisierte Sprachsignal sein Ziel erreicht hat, muss es wieder in das ursprüngliche analoge Format umgewandelt werden, damit die Person am anderen Ende der Leitung den Anrufer hören und verstehen kann.

VoIP-Codec

In Unified Messaging können zwischen IP-Gateways oder IP PBX-Anlagen und dem Unified Messaging-Server drei Typen von Codecs eingesetzt werden. Unified Messaging-Server können von einem IP-Gateway oder einer IP-PBX-Anlage folgende VoIP-Codecs annehmen:

  • G.711 µ-law
  • G.711 A-law
  • G.723.1

G.711 ist ein Standard, der für den Einsatz mit Audiocodecs entwickelt wurde. Im Standard G.711 sind zwei Haupt-Algorithmen definiert: Der Algorithmus µ-law wird in Nordamerika und Japan verwendet, der Algorithmus A-law dagegen in Europa und anderen Ländern. Der G.723.1-Audiocodec wird hauptsächlich in VoIP-Anwendungen eingesetzt und erfordert eine entsprechende Lizenz. G.723.1 ist ein Codectyp für hohe Qualität bei hoher Komprimierung.

Sowohl ein Unified Messaging-Server als auch ein unterstütztes IP-Gateway oder eine IP-PBX-Anlage können den G.711- und den G.723.1-Codec anbieten. Der Unified Messaging-Server wählt jedoch seinen bevorzugten Codec auf der Basis des Schlüssels WireCodecList in der Registrierung aus. Standardmäßig wird als primärer Codec G.723.1 verwendet. Wenn Sie zwischen dem Unified Messaging-Server und dem IP-Gateway oder der IP-PBX-Anlage einen anderen Codec als G.723.1 verwenden möchten, empfihlt es sich, die Konfiguration des IP-Gateways oder der IP-PBX-Anlage zu ändern und dem Schlüssel WireCodecList in der Registrierung weder Werte hinzuzufügen noch Werte zu entfernen oder zu ändern. Der vom IP-Gateway oder der IP PBX-Anlage zu verwendende Codec wird vom Unified Messaging-Server aus der Liste in der Registrierung ausgewählt.

In der folgenden Tabelle werden einige allgemeine VoIP-Codecs zusammengefasst.

VoIP-Codec

VoIP-Codec Bandbreite (Kbit/s) Beschreibung

G.711

64

Dieser Codec erfordert eine sehr geringe Prozessorleistung. Er benötigt mindestens 128 KBits/s für die bidirektionale Kommunikation.

G.723.1

5.3/6.3

Dieser Codec bietet hohe Komprimierung bei hoher Audioqualität. Er erfordert eine höhere Prozessorleistung als der G.711-Codec. Der G.723.1-Codec benötigt, allerdings zu Lasten der Audioqualität, eine geringere Bandbreite.

Nach oben

Codec für UM-Sprachnachrichtenspeicher

Unified Messaging-Wähleinstellungen sind integraler Bestandteil des Unified Messaging-Betriebs. Beim Erstellen von UM-Wähleinstellungen verwenden diese standardmäßig den WMA-Audiocodec. Nachdem Sie die UM-Wähleinstellungen erstellt haben, können Sie diese jedoch so konfigurieren, dass sie GSM 06.10- oder G.711 PCM Linear-Audiocodecs verwenden.

Jeder Audiocodec hat Vor- und Nachteile. Der WMA-Audiocodec wurde aufgrund seiner Soundqualität und Komprimiereigenschaften als Standardaudiocodec ausgewählt. Die GSM 06.10- und G.711 PCM Linear-Audiocodecs wurden aufgrund ihrer Fähigkeit, andere Messagingsystemtypen zu unterstützen, als Optionen aufgenommen.

Bei der Planung von Unified Messaging sind die Größe und relative Qualität der Audiodatei für Sprachnachrichten zu berücksichtigen. Generell gilt der Grundsatz, je höher die Bitrate einer Audiodatei, desto höher die Qualität. Außerdem ist zu überlegen, ob die Audiodatei komprimiert werden soll. Die in Unified Messaging verwendeten Audiocodecs haben folgende Bitraten (Bit/s) und Kompressionseigenschaften:

Standardcodecs für UM-Sprachnachrichtenspeicher

Codec für Sprachnachrichtenspeicher Bit Komprimierte Datei?

WMA

16 Bit

Ja

G.711 PCM

16 Bit

Nein

GSM 06.10

8 Bit

Ja

In Unified Messaging werden zum Erstellen von WMA- und WAV-Audiodateien für Sprachnachrichten die Audiocodecs WMA, G.711 PCM Linear und GSM 06.10 verwendet. Welcher Dateityp erstellt wird, hängt jedoch von dem Audiocodec ab, der zum Erstellen der Sprachnachrichten-Audiodatei verwendet wird. In Unified Messaging werden vom WMA-Audiocodec WMA-Audiodateien und von den GSM 06.10- und G.711 PCM Linear-Audiocodecs WAV-Audiodateien erstellt. Beide Arten von Audiodateien werden zusammen mit der E-Mail-Nachricht an den Empfänger der Sprachnachricht gesendet.

Das Codieren und Decodieren von digitalen Daten beinhaltet häufig, allerdings nicht immer, eine Komprimierung oder Dekomprimierung. Die Audiokomprimierung ist eine Form der Datenkomprimierung, bei der die Größe von Audiodateien reduziert wird. Der vom Audiocodec benutzte Audiokomprimierungsalgorithmus komprimiert WMA- oder WAV-Audiodateien. In Unified Messaging hängt der verwendete Audiokomprimierungsalgorithmus von dem Audiocodectyp ab, der in den UM-Wähleinstellungseigenschaften ausgewählt wird. Nachdem die Audiodatei erstellt und komprimiert wurde, wird sie der Sprachnachricht als Anlage hinzugefügt.

Manchmal gehen bei der Komprimierung und Dekomprimierung Informationen der digitalen Daten verloren. Je höher der für die Audiodatei gewählte Komprimierungsgrad, desto größer der Verlust an Informationen während der Konvertierung. Es wird jedoch weniger Speicherplatz verwendet, da die Größe der Audiodatei verringert wird. Umgekehrt gilt, je niedriger der Komprimierungsgrad, desto geringer der Verlust an Informationen. Aufgrund der Größe der einzelnen Audiodateien wird jedoch mehr Speicherplatz benötigt.

RTAudio-Breitband bzw. HiFi-Audio zum Aufzeichnen von Sprachnachrichten wird ebenfalls als Audiocodec unterstützt. HiFi-Audio mithilfe von RTAudio ist jedoch erst nach einer erfolgreichen Integration von Exchange 2007 Unified Messaging mit Office Communications Server 2007 verfügbar. Zur Aktivierung von RTAudio müssen die UM-Wähleinstellungen als SIP (Session Initiation-Protokoll) URI-Typ konfiguriert und der Mailboxansagecodec in den Wähleinstellungen auf WMA gesetzt werden.

Wichtig

RTAudio steht in Umgebungen ohne Office Communications Server 2007 nicht zur Verfügung. Der Grund hierfür besteht darin, dass die Wähleinstellungen in diesen Umgebungen auf Telefondurchwahl und nicht auf SIP URI gesetzt sind.

Für jeden eingehenden Anruf gibt es zwei Medienstreams: einen eingehenden an einen Unified Messaging-Server und einen ausgehenden von einem Unified Messaging-Server. Wenn der Wähleinstellungstyp auf SIP URI und der Mailboxansagecodec in den Wähleinstellungen auf WMA gesetzt ist, wählt ein Unified Messaging-Server den RTAudio-VoIP-Codec für den eingehenden Medienstream aus. Bei erfolgreicher Aushandlung wird der RTAudio-Codec des eingehenden Streams für die Anrufbeantwortung oder für Anrufe verwendet, die aus Office Communicator 2007 stammen.

Hinweis

Anrufe, die mithilfe der Funktion "Wiedergabe über Telefon" abgesetzt werden, verwenden den RTAudio-Codec nicht. Der eingehende Stream für Anrufe, die mithilfe dieser Funktion abgesetzt werden, verwendet den G.711- oder G.723.1-Codec.

Bei Verwendung des RTAudio-Codecs wird die jeweilige Sprachnachricht in HiFi-Qualität aufgezeichnet und als Audiodatei mit einer WMA-Erweiterung gespeichert. Die Wiedergabe dieser Sprachnachricht für den Benutzer erfolgt in Office Outlook 2007 oder Outlook Web Access in HiFi-Qualität. Bei erfolgreicher Aushandlung wird entweder der G.711- oder der G.723.1-Codec verwendet. Sowohl beim G.711- als auch beim G.723.1-Codec handelt es sich um schmalbandige Codecs. Wenn diese als VoIP-Codecs verwendet werden, wird die Sprachnachricht als schmalbandige Audiodatei mit einer WMA-Erweiterung aufgezeichnet und gespeichert.

Der ausgehende Medienstrom wird immer unter Verwendung des G.711- oder des G.723.1-Codecs ausgehandelt. Anrufer hören daher immer eine schmalbandige Wiedergabe über das Telefon. Dies trifft ebenfalls auf Situationen zu, in denen ein Anruf unter Verwendung von Office Communicator abgesetzt wird.

Die RTAudio-Verarbeitung durch einen Unified Messaging-Server benötigt eine größere Anzahl an CPU-Zyklen als der G.711- oder der G.723.1-Codec. Wenn Office Communications Server 2007 erfolgreich integriert wurde, RTAudio jedoch zur Reduzierung der verwendeten CPU-Zyklen ausgeschaltet werden soll, haben Sie folgende Möglichkeiten:

  • Setzen Sie den Mailboxansagecodec oder Speichercodec der Wähleinstellungen auf GSM oder PCM.

  • Deaktivieren Sie die Einstellung in der Registrierung. Der Registrierungsschlüssel lautet: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft Speech Server\2.0\WireCodecList. Zum Deaktivieren von RTAudio müssen "RTAudio16KHz" und "RTAudio8KHz" aus der Liste der Codecs im Registrierungsschlüssel entfernt werden.

    Wichtig

    Sonstiges Hinzufügen, Ändern oder Löschen anderer Werte oder Schlüssel im Schlüssel WireCodecList wird nicht unterstützt.

Hinweis

Eine fehlerhafte Bearbeitung der Registrierung kann zu schwerwiegenden Problemen führen, die eine Neuinstallation des Betriebssystems erforderlich machen kann. Durch fehlerhafte Bearbeitung der Registrierung verursachte Probleme können unter Umständen nicht mehr behoben werden. Sichern Sie alle wichtigen Daten, bevor Sie die Registrierung bearbeiten.

Nach oben

UM-Nachrichtengröße

Sie können Unified Messaging so konfigurieren, dass einer der drei folgenden Audiocodecs zum Erstellen von Sprachnachrichten verwendet wird: WMA, GSM 06.10 oder G.711 PCM Linear. Der WMA-Audiocodec wird immer im Windows Media-Format gespeichert. Die Anlage ist eine Datei mit der Erweiterung "WMA". Mit den GSM- oder G.711 PCM Linear-Audiocodecs codierte Audiodateien werden immer im RIFF/WAV-Format gespeichert. Die Anlage ist eine Datei mit der Erweiterung "WAV".

Die Größe der Unified Messaging-Sprachnachrichten hängt von der Größe der Anlage ab, die die Sprachdaten enthält. Umgekehrt ist die Größe der Anlage von folgenden Faktoren abhängig:

  • Dauer der Voicemailaufzeichnung
  • Verwendeter Audiocodec
  • Speicherformat der Audiodatei

In der folgenden Abbildung wird gezeigt, wie bei den drei in UM verwendbaren Audiocodecs die Größe der Audiodatei von der Dauer der Voicemailaufzeichnung abhängt.

Hinweis

In dieser Abbildung beträgt die durchschnittliche Länge einer als Anrufannahme verwendeten Sprachnachricht ca. 30 Sekunden.

Größe der Audiodatei
UM_Message_Sizing

WMA

WMA ist von den drei Codec-Arten der Audiocodec mit der höchsten Komprimierung. Die Kompression beträgt etwa 11.000 Byte pro 10 Sekunden Audio. Das WMA-Dateiformat hat jedoch einen wesentlich größeren Kopfzeilenbereich als das WAV-Dateiformat. Der Kopfbereich der WMA-Datei umfasst ca. 7 KB, der der WAV-Datei hingegen weniger als 100 Byte. Obwohl WMA-Audioaufzeichnungen länger als 15 Sekunden sind, sind sie kleiner als GSM-Audioaufzeichnungen. Verwenden Sie deshalb den WMA-Audiocodec, wenn Sie die Audiodateien benötigen, die besonders klein sind und zugleich die höchste Qualität bieten.

G.711 PCM Linear

Der G.711 PCM Linear-Audiocodec erstellt WAV-Audiodateien, die nicht komprimiert sind. Daher belegen WAV-Audiodateien des G.711 PCM Linear-Codectyps verglichen mit den GSM- und WMA-Audiocodecs unabhängig von der Dauer den meisten Speicherplatz. G.711 PCM Linear-WAV-Audiodateien belegen pro 10 Sekunden Audio etwas über 160.000 Byte. Unter den drei von Unified Messaging verwendeten Audiocodecs bieten G.711 PCM Linear-WAV-Audiodateien die höchste Audioqualität. Die Qualität vergleichbarer Audiodateien, die mit WMA- und GSM-Audiocodecs erstellt wurden, ist für die meisten Benutzer, die Sprachnachrichten abrufen, jedoch durchaus ausreichend.

GSM

Der GSM-Audiocodec erstellt WAV-Audiodateien, die komprimiert sind. GSM-WAV-Audiodateien belegen pro 10 Sekunden Audio etwas über 16.000 Byte. Von GSM erstellte Audiodateien sind jedoch größer als Audiodateien, die vom WMA-Audiocodec erstellt werden. Deshalb ist dies möglicherweise nicht die beste Wahl, wenn Sie Qualität und Größe der Sprachnachricht berücksichtigen müssen.

Nach oben