Es gibt eine Vielzahl von guten UC&C-Tools zur Fehlerbehebung, die bei der Diagnose und der Beseitigung von lästigen Probleme helfen können.
Die Diagnose von UC&C-Problemen erfordert in der Regel mehrstufige Prozesse. Man muss über Mechanismen verfügen, die einem klarmachen, dass ein Problem besteht. Zusätzliche Werkzeuge werden notwendig, um festzustellen, welches Subsystem fehlgeschlagen ist, denn eine Reihe von Symptomen können aufgrund der unterschiedlichen Ausfälle auftreten. Schließlich ist es auch hilfreich zu verstehen, welche Anwendungen von dem Problem betroffen sind, damit man schnell ein Verständnis für das Problem gewinnt.
Werkzeugen, die erkennen können, wann und wo ein Problem entstanden ist, sind sehr hilfreich. Menschliche Fehler stellen in der Praxis die größte Quelle von Netzwerkproblemen dar. Kann man feststellen, dass eine Konfigurationsänderung mit einem Systemausfall korreliert, dann hat man schnell die mögliche Ursache eines Problems identifiziert.
Gut organisierte Unternehmen dokumentieren (in einer Art Drehbuch) ihre bekannten Probleme, die aufgetretenen Symptome und die daraus resultierenden Maßnahmen. Diese Drehbücher organisieren die Fehlerbehebung und stellen neuen IT-Teammitgliedern einen Mechanismus bereit, um sich schnell ein Bild von den vergangenen Ereignissen machen zu können. Die Rohdaten dieser Drehbücher bilden die Grundlage für ein Trouble-Ticket-System. Beginnen sollte man die Einrichtung eines neuen Drehbuchs mit den häufigsten auftretenden Problemen, anschließend arbeitet man sich zu den weniger häufigen Problemen durch. Dabei ist darauf zu achten, dass nicht die schwierigsten Probleme übersprungen werden, da diese viel Zeit und Mühe bei der Diagnose und bei der anschließenden Fehlerbehebung gekostet haben. In der Praxis ist es wichtig, auch die komplexen Probleme schnell identifizieren zu können. Beispiele für typische Probleme sind:
- Anruf wird nicht vollständig aufgebaut,
- Anrufe gehen nach dem Aufbau der Verbindung verloren,
- schlechte Audio- oder Videoqualität,
- Telefonkonferenzen arbeiten nicht oder weisen ein schlechte Qualität auf oder
- Collaboration-Tools arbeiten an einigen Standorten, an anderen Standorten jedoch nicht.
Testen und Überwachen
UC&C-Systeme bestehen in der Regel aus mehreren Komponenten, die über das Netzwerk miteinander verbunden sind. Die Interaktion über das Netzwerk hängt von der gewünschten Art der Kommunikation ab. Bei der Sprach- bzw. Videokommunikation ist jedoch darauf zu achten, dass diese Anwendungen auf eine Echtzeitkommunikation aufbauen und sehr spezifische Protokolle (beispielsweise SIP, RTP und WebRTC) nutzen. Diese Anwendungen bzw. Protokolle werden auf Basis der UDP- bzw. TCP-Transportmechanismen übermittelt.
Auf die UC&C-Anforderungen ausgelegte Monitoring-Werkzeuge können dem Systemadministrator einen Einblick geben, wie gut das gesamte UC&C-System funktioniert. Wenn ein UC&C-System nicht optimal funktioniert, müssen die Verursacher – sprich die zugrunde liegende Probleme – identifiziert und korrigiert werden. Probleme mit der Anrufsignalisierung haben einen direkten Einfluss auf den Rufaufbau, die Anrufterminierung und auf Verbindungstransfers. Probleme auf dem Medium führen zu verminderter Anrufqualität und schlechten Audio- und Videosignalen. In der Praxis ist die Qualität der meisten Anrufe akzeptabel. Aber immer wieder kann es vorkommen, dass einige Anrufe eine extrem schlechte Qualität aufweisen. Deshalb müssen Wege gefunden werden, um diese Anrufe eindeutig zu identifizieren. Der einfachste Weg darin besteht in der Suche nach den Gemeinsamkeiten der schlechten Anrufe. Diese können ihre Ursachen in einer defekten Hardware, Fehler in der Software der Endpunkte (Telefone) haben oder auf Netzwerkprobleme zurückzuführen sein. Auch inkonsistente Konfigurationen führen immer wieder zu diffusen Fehlerbildern.
Folgend Parameter sind für eine korrekte VoIP- bzw. Videoübermittlung wichtig:
- Der Jitter liefert genaue Werte zur Beurteilung der Laufzeitschwankungen im Netzwerk. Dieser Wert gehört zu den kritischen Netzparametern und darf gewisse Schwellwerte nicht überschreiten. Der Jitter in einem idealen Netzwerk beträgt 0 ms. In der Praxis kann dieser Wert von den heute verfügbaren Koppelkomponenten (Switches, Router) nicht eingehalten werden. Aus diesem Grund wurden spezielle Mechanismen zum Ausgleich des Netzwerkjitters entwickelt. Jedes VoIP-fähige Gerät verfügt über einen so genannten Jitter-Puffer. Dieser puffert eine gewissen Anzahl an Paketen im Eingangspuffer zwischen und spielt die Daten zeitversetzt an die Anwendung weiter. Dadurch wird der Jitter in einem gewissen Ausmaß ausgeglichen. Übersteigt der Jitter zwischen zwei bzw. mehreren Paketen diesen Schwellwert, kann der Taktdrift nicht ausgeglichen werden. In der Folge führt dies zu einem Paketverlust. Die Paketverluste führen in der Folge zu Sprachaussetzern Sprache und können bei exzessiven Paketverlusten sogar zum Abbruch des Gesprächs führen. Falsch eingestellte Netzkomponenten oder eine falsche Netzkonfiguration kann hierfür die Ursache sein. Daher ist es in einem ordnungsgemäß betriebenen Netzwerk die Überwachung des Jitters aller übertragenen VoIP-Pakete erforderlich um die Ende-zu-Ende-Qualität beurteilen zu können.
- Paketverluste haben unterschiedliche Ursachen. Ein defektes Kabel führt beispielsweise zu CRC-Fehlern. Defekte Pakete werden im Empfangspuffer der nachfolgenden Netzwerkkomponente verworfen. Hohe Datenlasten führen unter Umständen zu Überlastung der Switch-Ressourcen. Die Warteschlangen der Switch Ports können nur eine bestimmte Datenmenge aufnehmen, da diese über eine fixe Größe verfügen. Daher werden bei Überlasten die eingehenden Pakete verworfen. Der Verlust eines Pakets hat zur Folge, dass eine Sprachinformation verloren geht. Bei Echtzeitanwendungen wie beispielsweise VoIP können verloren gegangenen Pakete nicht erneut gesendet werden. In der Folge gehen bei Überlasten bestimmte Sprachinformationen unwiderruflich verloren. In richtig konzipierten Netzwerken lassen sich Paketverlustraten von unter 0,5 Prozent erzielen. In Abhängigkeit vom VoIP-Dienst genutzten Codec kann eine Paketverlustrate von 5 Prozent noch akzeptable Sprachqualitäten liefern. Aus diesem Grund müssen die Paketverluste im Netzwerk auf einer Ende-zu-Ende-Basis auf das Genaueste kontrolliert werden. Bei der Paketverlustanalyse ist es besonders wichtig, dass das Monitor-System zwischen Verlusten in Paket-Bursts oder einzelner Pakete beruhen.
- Die Sprachqualität gibt eine gezielte Auskunft über die Güte des Verbindungskanals. Diese wird meist auf Basis eines so genannten MOS-Werts dargestellt. Die MOS-Skala wurden von ITU festgelegt und die MOS-Werte liegen zwischen 1 (schlecht) und 5 (hervorragend). Die VoIP-Welt nutzt unterschiedliche Berechnungsverfahren der Sprachqualität, die sich jeweils auf unterschiedlichen Parameter stützen. Sämtliche Berechnungsverfahren lassen sich jedoch auf der MOS-Skala abbilden… Man unterscheidet in der Praxis jedoch zwischen den passiven und aktiven Messverfahren zur Ermittlung des MOS-Wertes. Bei passiven Monitoring-Lösungen wird meist das E-Modell (gemäß ITU Standard G.107) als Berechnungsgrundlage genutzt. Anhand der aus den Netzwerkparametern und den übermittelten RTP-Streams gewonnen Informationen wird der R-Faktor (Wert zwischen 0 und 100) gewonnen. . Anschließend wird der R-Faktor in den MOS-Wert umgerechnet. Da es sich beim MOS-Wert um eine Zusammenfassung vieler Werte handelt, gibt die alleinige Überwachung des MOS-Werts keine genauen Anhaltspunkte über die Ursache eines VoIP-Problems.. Beim Empfang eines Alarms ist daher eine Überprüfung der individuellen Parameter erfolgen.
- Die für die Übermittlung von VoIP-Strömen notwendige Bandbreite ist vom genutzten Codec abhängig. Mit Hilfe des Codec wird die analoge Sprache in digitaler Daten umgerechnet. Im Normalfall legt ein Unternehmen den für die VoIP-Übermittlung notwendigen Codec für die Telefone fest.. Dadurch produziert jedes Gespräch die gleiche Datenlast . Mit steigender Gesprächsanzahl wird daher auch immer mehr Bandbreite für die Übermittlung der VoIP-Dienste benötigt. Es kommt bei VoIP darauf an, dass die Bandbreite zur Übermittlung der VoIP-Streams durchgehend auf einer Ende-zu-Ende-Beziehung zur Verfügung steht. Steht zu wenig Bandbreite bereit, kommt es unweigerlich zu Paketverlusten.. Daher gehört es zu den Grundfunktionen des VoIP-Monitorings, dass die verfügbare Bandbreite und Gespräche dokumentiert wird. . Dadurch kann rechtzeitig eingegriffen werden, bevor die verfügbare Bandbreite nicht mehr ausreicht und es zu Problemen kommt.
- Die Priorisierung sorgt bei VoIP-Gesprächen für die vorrangige Übertragung der VoIP-Pakete in den Netzkomponenten. In einem VoIP-Netzwerk muss der Administrator die Priorisierungen der VoIP-Ströme in den Netzkomponenten individuell konfigurieren. Unterstützt eine Komponente im Netzwerk keine Priorisierung oder ist diese falsch konfiguriert, können Fehler bei der VoIP-Übermittlung auftreten. . Die VoIP-Priorisierungen kann entweder auf der Schicht 2 (802.1p) und/oder auf der Schicht 3 (DiffServ) erfolgen. Eine permanente Überwachung der RTP-Ströme durch ein Monitoring-System liefert die Gewissheit, dass das Netzsystem die übermittelten VoIP-Gespräche gemäß den konfigurierten Priorisierungen übertragen werden. Dadurch wird ein Ausfall der Priorisierung oder die falsche Priorisierung automatisch erkannt und der zuständige Netzadministrator umgehend darüber gewarnt.
Quality of Experience (und in diesem Zusammenhang auch Quality of Service) Messungen sorgen für eine Früherkennung von Problemen. Ein Verfahren zur Qualitätsüberwachung besteht in der aktiven Simulation von VoIP- bzw. Videoverbindungen. Hierbei arbeitet eine Software als Callgenerator zur Generierung von VoIP-Gesprächen. Das Messsystem meldet sich beispielsweise bei einer im Netz installierten TK-Anlage auf Basis des Session Initiation Protocols (SIP) an und kann anschließend wie ein Softphone über das Netzwerk die individuellen Gespräche zu anderen Teilnehmern im gleichen Netz bzw. im öffentlichen Netz (via ISDN-Gateway bzw. SIP Trunk) führen.
Dadurch lassen sich die Ende-zu-Ende-Qualitäten einer Kommunikationsinfrastruktur bewerten und überwachen. Hierbei wird ein echtes VoIP/Video-Signal (inklusive der notwendigen Signalisierung) zu den Test Agents geschickt. Mit Hilfe des PESQ (ITU-T Rec. P.862) bzw. POLQA (ITU-T P.863) Algorithmus wird ein entsprechender MOS-Wert für die jeweilige Verbindung errechnet. Da diese Algorithmen direkt auf den übermittelten Sprachsignalen aufsetzen, bieten diese den großen Vorteil, dass jede Signalveränderung (Paketverluste, Jitter, etc.) bzw. jeder Fehler auf der „Übertragungsstrecke“ ermittelt wird. In der Praxis kann es auf einer Ende-zu-Ende-Kommunikationsstrecke zu Wandlungen der Sprachsignale kommen. Ursachen hierfür sind beispielsweise Codec-Wandler zur Einsparung der Übertragungsbandbreite oder eine Wandlung der IP-Ströme in ein anderes Übertragungsmedium (beispielsweise ISDN Gateway). Die Platzierung mehrerer Test Agents an geeigneten Positionen im Netzwerk sorgt dafür, dass die aufgetretenen Fehler zielgenau erkannt werden. Zusätzlich werden bei der Über- bzw. Unterschreitung von festgelegten Schwellwerten entsprechende Alarme ausgelöst. Dieser Messmechanismus hat den Vorteil, dass die gleichen Netzwerkpfade – wie bei den echten Anrufen – verwendet werden.
Beim passiven Monitoring werden keine zusätzlichen Pakete in das Netz gesendet, sondern der übermittelte VoIP/Video-Verkehr wird an bestimmten Knotenpunkten lediglich „mitgehört“. Dabei werden die am betreffenden Netzknoten auftretenden Datenströme an das Monitoring-System gespiegelt und von diesem analysiert und dokumentiert. Der Vorteil der passiven Überwachung besteht darin, dass keine zusätzlichen Lasten im Netzwerk erzeugt werden. Die Analysedaten werden aus den von den Nutzern erzeugten VoIP/Video-Strömen ermittelt, bewertet und detaillierte Reports ausgegeben. Für die Bewertung der empfangenen VoIP-Ströme wird vom Monitoring-System das E-Modell (ITU-T Rec. G.107) genutzt. Dieses Messverfahren bewertet einen RTP-Stream anhand der darin enthaltenen Paketparameter. Dabei zeichnet das VoIP-Messgerät die von dem Telefon oder der Telefonanlage übermittelten RTP-Streams auf. Anschließend werden die Eigenschaften der aufgezeichneten RTP-Streams bewertet. Zu den, in die Beurteilung einfließenden Paketparameter gehören: die Paketverluste, der Jitter und die Codierung. Diese drei Parameter werden anschließend dem E-Modell Algorithmus zur Verfügung gestellt. Dieser berechnet daraufhin den MOS-Wert des jeweiligen RTP-Stromes. Das passive Monitoring bietet somit dem Betreiber eine dauerhafte Überwachung des Netzwerks, welches eine Übersicht der vorhandenen VoIP/Video-Qualitäten zu jeder Tages und Nachtzeit darstellt.
Funktion | Aktives Monitoring | Passives Monitoring |
Generierung zusätzlicher Daten auf das Netzwerk | X | – |
Bewertung von laufenden Gesprächen | – | X |
Bewertung der Sprachqualität | X | X |
Bewertung der End2End Qualität | X | – |
Trending | X | X |
SLA Reporting | X | X |
Alarmierung | X | X |
Tabelle 1: Funktionen der jeweiligen Monitoring-Varianten
Eine Kombination der beiden Monitoring-Ansätze stellt das Ideal dar und vereint die Vorteile beider Lösungen. Darüber hinaus müssen jedoch auch die „trivialen“ UC&C-Probleme, wie beispielsweise Server-Hardware Fehler oder so einfache Dinge wie volle Speichermedien überwacht werden. Auch muss das Monitoring auch die Netzwerkinfrastruktur umfassen. Im Bereich der Netzüberwachung stehen dem Administrator eine Vielzahl von unterschiedlichen Werkzeugen zur Verfügung, welche die Infrastruktur (von der Datensteckdose am Arbeitsplatz bis hin zum Rechenzentrum) inklusive der Netzwerkdienste (beispielsweise DHCP und DNS) überwachen können. In meiner Praxis stelle ich jedoch immer wieder fest, dass Unternehmen teure Werkzeuge kaufen, die sich nur bedingt (beispielsweise nicht an das Unternehmen angepasst oder kein Personal für den Betrieb) einsetzen lassen. Auch hier gilt: Wer sich an den realen Problemen des Unternehmens orientiert, findet sicher das passende Werkzeug und kann schnell zur Reduzierung der Betriebskosten beitragen. (mh)