Fehlerbehebung bei Problemen mit der VoIP-Anrufqualität

Wir alle haben in letzter Zeit uns am Telefon mit einem Kommunikationspartner unterhalten und dabei festgestellt, dass die Qualität des Telefonats  bzw. des VoIP-Anruf ziemlich miserabel war. Bei einem Telefonat toleriert man eine schlechte Qualität noch. Hierfür wurden wir durch löchrige Mobilfunknetze umfassend geschult. Im schlimmsten Fall legt man auf und baut eine neue Telefonverbindung auf. Aber was muss man machen, wenn die Probleme immer wieder vorkommen?

Obwohl VoIP in der Regel eine ähnliche oder sogar bessere Gesprächsqualität als die herkömmliche Telefonanlagen bietet, können Qualitätsprobleme für den Benutzer immer wieder ein Problem darstellen.

 

Typische Probleme mit der VoIP-Anrufqualität

Eine präzise Problembeschreibung bei einem auftretenden Fehler während eines Telefonats ist nicht immer einfach. Daher muss sich ein VoIP-Administrator mit folgenden Fehlerbeschreibungen auseinandersetzen: „Jessicas Stimme bricht bei unserem Anruf ständig ab“ oder „die Jungs aus der Buchhaltung klingen manchmal wie Roboter“. Hinter diesen Beschreibungen verbergen sich eine Reihe von Problemen, die mit dem jeweiligen Fachjargon besser diagnostiziert werden können:

  • Verzögerung: Die Verzögerung beschreibt die Latenzzeit zwischen dem Auftreten eines Ereignisses und dem Auftreten eines erwarteten Folgeereignisses, um das ein Ereignis verzögert wird. In Netzwerken wird die Verzögerung oft mit dem Begriff Round-Trip-Time (RTT) beschrieben. Der Round-Trip-Delay beschreibt dagegen die Gesamtverzögerung (beide Wege) zwischen zwei IP-Endpunkten. Bei Voice-over-IP-Anwendungen und Videokonferenzen ist das so genannte One-Way-Delay (die Verzögerung in einer Richtung von Startpunkt zu Endpunkt) von Bedeutung. Netzwerkverzögerungen werden durch die physische Verzögerung der Übertragungsleitungen, der Queuing- und Pufferungsmechanismen in den Koppelkomponenten (Router, Switches, Gateways) verursacht und variieren in ihrem Ausmaß. Die so genannte Durchlaufzeit setzt sich aus zwei Größen zusammen: einer konstanten oder nur leicht variierenden Netzverzögerung und schnellen Schwankungen der Verzögerung, gemeinhin als Jitter bekannt. Die netzimmanente Verzögerung erfordert das Senden mehrerer Frames in einem Paket, eine Technik zur Reduzierung des Protokoll-Overheads bei IP-Übertragungen. Die typischen Verzögerungszeiten von Netzwerkkomponenten hängen stark von der eingesetzten Hard- und Software-Komponente ab.

Die Laufzeit setzt sich aus der Summe aller Verzögerungen, die während der Übertragung auftreten, zusammen. Jedes Netzelement erzeugt durch die internen Verarbeitungsprozesse eine bestimmte Verzögerungszeit. Für die Übertragung von Informationen in Echtzeit muss die Verzögerungszeit gering sein. Die Delay – Spezifikation gemäß G.114 der ITU-T definiert folgende Bereiche:

Bereich/Bedeutung

  • 0-150 ms / ausreichend für die meisten interaktiven Echtzeitanwendungen
  • 150-400 ms / akzeptable unter Berücksichtigung der Qualitätsverluste
  • über 400 ms / nicht akzeptabel
  • Paketverluste: Die Paketverlustrate ist ein Maß für die Übertragungsqualität einer Datenverbindung. Die Paketverlustrate definiert, wie viele Pakete eines Datenstroms zwischen einem Sender und einem oder mehreren Empfängern während der Übertragung verloren gegangen sind. Die Paketverlustrate berechnet sich aus dem Verhältnis der Anzahl verloren gegangener zur Anzahl gesendeter Datenpakete. Um eine gute Verbindung zu haben, sollte dieser Fehlerwert so klein wie möglich sein. Optimal ausgelegte und gut administrierte IP-Backbones weisen heute in der Regel eine Paketverlustrate von < 0,5 Prozent auf. Für die Übermittlung von VoIP-Datenströmen gilt gemäß der ITU G.114 Spezifikation eine Paketverlustrate bis zu 5 Prozent als noch akzeptable Qualität. Man muss folgende zwei unterschiedliche Arten der Paketverluste unterscheiden:
    • Der Paketverlust einzelner Datenpakete über einen bestimmten Zeitraum.
    • Der Paketverlust mehrerer aufeinander folgender Datenpakete über einen bestimmten Zeitraum.

Der Verlust von mehrerer aufeinander folgender Datenpakete (Daten-Burst) ist vom Empfänger nicht mehr kompensierbar und wirkt sich als Übertragungsstörung aus. Vereinzelte Paketverluste werden vom Gehör/Gehirn interpoliert und fallen dem Zuhörer nicht auf. Paketverluste wirken sich umso stärker aus, je länger der so genannte Payload (Sprach/Videoanteil im Paket) ist. Codecs weisen eine gewisse Toleranz gegenüber Paketverlusten auf. In Abhängigkeit vom genutzten Codec der Anwendung bemerkt der Nutzer die unterschiedlich stark aufgetretenen Paketverluste nicht. Bei Videoströmen liegen die Toleranzgrenzen erheblich niedriger, da sich Paketverluste direkt durch eine fragmentarische Darstellung des Videosignals bemerkbar machen.

  • Jitter: Als Jitter bezeichnet man allgemein ein Taktzittern bei der Übertragung von Digitalsignalen bzw. eine leichte Genauigkeitsschwankung im Übertragungstakt. In der Netzwerktechnik wird mit Jitter außerdem die Varianz der Laufzeit von Datenpaketen bezeichnet. Dieser Effekt ist insbesondere bei interaktiven Multimedia-Anwendungen störend, da dadurch Pakete zu spät eintreffen können, um noch zeitgerecht mit ausgegeben werden zu können. Dies wirkt sich wie eine erhöhte Paketverlustrate aus. Treffen die Pakete regelmäßig beim Empfänger ein, können diese direkt in Audio/Videosignale umgesetzt werden. Da die Verzögerungen bei der Übertragung nicht konstant sind, entstehen Lücken im abgespielten Signal. Die Differenz zwischen den Verzögerungen einzelner Pakete wird als Jitter (Verzögerungsschwankung) bezeichnet. Zur Vermeidung von Lücken im Signal müssen die empfangenen Daten in einem Zwischenspeicher abgelegt werden. Dieser Zwischenspeicher hat die Aufgabe, die Lücken zwischen verspäteten Paketen zu kompensieren. Die Größe dieses Zwischenspeichers (Synchronisationspuffer oder Jitter-Buffer) kann ein oder mehrere Frames umfassen. Durch die Pufferung mehrerer Sprachpakete/Video-Frames kann ein größerer Jitter ausgeglichen werden. Durch den Einsatz von einem größeren Jitterbuffer wird jedoch die Gesamtverzögerung negativ beeinflusst. Hier liegt die Kunst darin, die optimale Abstimmung der Puffergröße zu finden.

 

  • Datendurchsatz: Der Datendurchsatz zeigt die Ende-zu-Ende-Transportrate an. Wenn die Performance einer Netzwerkstrecke unterhalb des erforderlichen Datendurchsatzes liegt, bedeutet dies immer ein Ansteigen der Paketverlustrate und damit eine Verringerung der Signalgüte. Der Einsatz unterschiedlicher Codecs reduziert die Datendurchsatzraten im Sprachkanal. Die Einsparung der Bandbreite geht jedoch auf die Kosten der Sprachqualität. Jede Applikation benötigt eine definierte Bandbreite, wenn diese Informationen in Echtzeit übertragen werden soll. Typische Werte für benötige Bandbreiten sind:
    • Zur Sicherung der Qualität der Echtzeitströme muss in den Netzen ein durchgängiger Quality of Service (QoS) zur Verfügung stehen.
    • Nur eine Ende-zu-Ende-Lösung garantiert, dass der Video- und Sprachverkehr entsprechend seiner Prioritäten übertragen wird.

 

1×1 der Fehlersuche

Nachdem wir die technischen Ursachen für VoIP-Probleme kennen, können wir dazu übergehen, diese tatsächlich zu beheben.

 

Schritt 1: Überprüfen der verfügbaren Bandbreite

Es ist eine allgemein bekannte Weisheit, dass man zur gleichzeitigen Übermittlung  von Sprachdaten und den normalen Daten entsprechende Übertragungskapazität bereitstellen muss. Daher muss man bei Problem überprüfen, ob die geforderte Bandbreite überhaupt zur Verfügung steht. Eine Auslastung, die im Mittel pro Sekunde einen Wert von 40 Prozent (oder mehr) aufweist, ist ein sicherer Hinweis, dass auf der Leitung zur wenig Bandbreite zur Verfügung steht.

Einige Anwendungen verbrauchen sehr viel Bandbreite, vor allem Apps zum Streamen von Dateien. Es hilft der verfügbaren Bandbreite, wenn man Anwendungen wie Netflix, Spotify, YouTube usw. zu schließt bzw. bereits am Eingang des Netzwerks (Firewall) ausfiltert. Diese Maßnahme wird von den Nutzern im Netzwerk sicherlich nicht honoriert, führt jedoch erstaunlich oft sehr schnell zum Ziel. Darüber hinaus sollte man die Endgeräte auf Malware und/oder Spyware untersuchen, da auch diese unerwünschten Anwendungen die Verbindungen verlangsamen können.

 

Schritt 2: Wurde QoS aktiviert?

Eine der grundsätzlichen Erkenntnisse der Netzwerkerei besteht darin, dass man nur mit einer durchgängigen Qualitätskontrolle von Ende-zu-Ende eine hohe Übertragungsqualität erreichen kann. Jede Unterbrechung der QoS-Merkmale auf der jeweiligen Verbindung führt zwangsläufig zum Verlust der wichtigen Performance-Merkmale.  Will die gewünschten QoS-Funktionen aktivieren, müssen auf allen aktiven Koppelkomponenten (Switches, Router, Firewalls) im Netzwerk die spezifischen Konfigurationen vorgenommen werden.

Um eine Priorisierung einzelner Dienste gegenüber anderen Diensten vornehmen zu können, sind Markierungen notwendig, anhand welcher die Entscheidung über die Priorisierung geschehen kann. Man unterscheidet zwischen einer Layer 2 und einer Layer 3 Markierung. Auf Layer 2 kann man bei Nutzung eines IEEE 802.1Q VLAN-Tags eine Markierung auf Basis eines Class of Service Identifiers nach IEEE 802.1p nutzen. Hierfür steht im 802.1q-Header ein 3 Bit langes Feld zur Verfügung. Problem bei Layer 2 Markierungen ist, dass diese bei einem Routing-Übergang verloren gehen. Es gibt jedoch die Möglichkeit auf Basis von DiffServ eine Markierung im IP-Header (sowohl in IPv4, als auch in IPv6 vorgesehen) zu übertragen.

Mit DiffServ stehen die Werte 0 bis 63 zur Verwendung, um Datenverkehr zu klassifizieren. Im Voice over IP-Umfeld hat sich für die Echtzeitübertragung die Klasse Expedited Forwarding gemäß RFC4594 etabliert, da diese für Datenverkehr mit geringer Paketverlusttoleranz und geringe Latenz optimiert ist. Hierzu ist der Wert 46 vorgesehen. Im Signalisierungsbereich unterscheiden sich verschiedene Ansätze. Im genannten RFC wird Signalisierung in eine dedizierte Klasse mit dem DSCP Name CS5 und dem Wert 40 zugeordnet.

Multimedia-Konferenzen sind entsprechend der Klasse Multimedia Konferenz mit dem Name AF41 und dem Wert 34 zugewiesen.

 

ServiceklasseDSCP NameDSCP Wert
SprachdatenEF46
SignalisierungCS540
Multimedia KonferenzAF4134

DiffServ Markierungen zur Unterscheidung der Qualitätskategorien

 

Die Priorisierungsentscheidung erfolgt Hop-by-Hop, also auf jeder Komponente separat.

Sprache sollte aufgrund seiner Echtzeiteigenschaften in einer sogenannten Low Latency oder Priority Queue übertragen werden, bei welcher versucht wird, eine geringe Latenz und einen geringen Paketverlust sicher zu stellen.

 

Schritt 3: Überprüfen der vorhandenen Infrastruktur

Werden im Netzwerk ältere Geräte eingesetzt, kann ein Upgrade bzw. ein Ersatz für diese Komponenten notwendig werden. Dadurch werden in vielen Fällen auch gleichzeitig viele Probleme mit Jitter und Paketverlusten gelöst. Auch der Austausch von Headsets und das Auswechseln von drahtlosen gegen kabelgebundene Mikrofone wirkt manchmal Wunder. Aber auch der Internet Service Provider und der Anschluss ans Internet (DSL, Glasfaser, TX-Kabel) können die Ursache die Ursache für Ihre Probleme mit der Anrufqualität sein. Mit einen Ping oder einem simplen Speedtest lassen sich die Probleme selten ermitteln. Hierzu sollte ein Experte mit den entsprechenden Messgeräten in die Ursachenfindung eingebunden werden.

Befindet sich die Telefonanlage in der Cloud, ist auch die Netzinfrastruktur des Anbieters in die Fehlersuche einzubinden. Im Falle einer Cloudlösung muss das IT-Team des Kunden die vom VoIP-Provider festgelegten Richtlinien für das Datenverkehrsmanagement umsetzen. Die Echtzeitmedien einschließlich Sprache und Video sind daher auch im Unternehmensnetzwerk zu priorisiert en , damit Netzwerküberlastungen die Qualität der Telefonate und Konferenzen nicht beeinträchtigen.

Von Mathias Hein

 

Tipp

Netzwerkfehler haben mannigfaltige Ursachen. Nur ein immenses Troubleshooting-Know-how verhindert eine kostspielige Downtime. Das Kindle-Book von Netzpalaver zur Fehleranalyse und Fehlerbehebung.