Auf der Suche nach der Nadel im Heuhaufen

Allergro_schraeg_doppelEine präventive Datensammlung inklusive der Analyse der gesammelten Daten stellt einen Mechanismus zur Verbesserung der Leistungen und der Zuverlässigkeit von Netzwerkressourcen dar.

Die Analyse bietet ein wichtiges Werkzeug für den Netzbetrieb, liefert aber keine vorgefertigten Antworten auf alle komplexen Fragen des Troubleshootings. Die mit der Analyse ermittelten Daten bilden die Grundlage für die Schlussfolgerungen, mit denen ein Netzadministrator Fehler sucht. Die Netzanalysen werden heute in einer Vielzahl unterschiedlicher Situationen genutzt.

Ziele eines stabilen Netzbetriebs

Die folgenden Ziele sollte ein moderner Netzwerkbetrieb erfüllen:

  • Reduzieren der Ausfallzeiten.
  • Schnelle Eingrenzung von Problembereichen.
  • Reduzierung der für die Problemlösung benötigte Zeit.
  • Verlängerung der Lebensdauer der Netzressourcen.
  • Reduzierung der Fehlerbehebungszeiten.
  • Zufriedene Kunden und Nutzer.
  • Verbesserung der Reputation des Netzbetriebs.

Mehr Daten bedeuten mehr Wissen

Je mehr Daten gesammelt werden, desto mehr Wissen liegt dem Operator vor, desto besser wird der Netzbetrieb. Meist sind die gesammelten Daten zum Zeitpunkt ihrer Erfassung nicht wichtig. Tritt jedoch ein Fehler auf, kann man auf einen Fundus an Zahlenmaterial für die Fehleranalyse zurückgreifen. In jedem größeren Projekt gibt es ein oder mehrere Probleme, deren Identifikation und Analyse eine lange Zeit in Anspruch nimmt. Die meisten im Markt verfügbaren Troubleshooting-Werkzeuge melden zwar ein Problem, geben jedoch keinen Hinweis darauf, warum ein Problem aufgetreten ist.

Beispiel 1: Die neue VoIP-Anbindung in einer der Niederlassungen meldet in unregelmäßigen Abständen Qualitätsprobleme (MOS und Jitter). Die eingeleiteten Messungen ergeben, dass eigentlich kein Problem vorliegt.

Beispiel 2: Am Wochenende und an Feiertagen (an denen das Unternehmen nicht arbeitet) wird in einigen Unternehmensteilen ein auffällig hoher Verkehr gemessen. Die Analyse der Daten ergibt jedoch keinen Hinweis auf die Ursachen, und das Problem scheint verschwunden zu sein.

Beispiel 3: Es werden von einigen Nutzern die Zugriffe auf bestimmte Server bemängelt. In sehr unregelmäßigen Abständen scheinen diese Server von der Bildfläche verschwunden zu sein. Die Netz- und die Serveranalyse ergibt, dass derzeit kein Problem vorliegt.

In den drei dargestellten Szenarien haben die genutzten Netzwerkmanagement-Tools zwar die Probleme oberflächlich gemeldet, aber aufgrund des Mangels an Daten konnten die Werkzeuge keine Hinweise auf deren Lösung geben.

Ein wichtiger Teil der Arbeit eines Netzadministrators besteht darin, die verschiedenen Netzwerkkomponenten nach Performance, Auslastung und eventuellen Problemen abzusuchen sowie die bereitgestellten Services zu überwachen. Aus diesem Grund muss man als verantwortliche Person für den Netzbetrieb über die üblicherweise für das Troubleshooting bereitgestellten Daten hinausblicken und auf tiefergehende Informationen zugreifen. Für diese Aufgaben lässt sich beispielsweise das neue Allegro-Network-Multimeter – ohne große Konfigurationen vornehmen zu müssen – direkt zur Analyse des Netzverkehrs in Echtzeit einsetzen.Will ein Netzadministrator wissen, wie sich das Netzwerk in den vergangenen Wochen verändert hat (beispielsweise die durchschnittliche/maximale Auslastung oder Qualität von internen Servern), lassen sich die notwendigen Informationen schnell und einfach einholen. Das Monitoring-Werkzeug ermöglicht sowohl eine schnelle Übersicht eines Vorher-Nachher-Vergleichs, der Netzwerk-Nutzer und der verwendeten Protokolle als auch detaillierte Statistiken der einzelnen Serverdienste (SMB, HTTP, SSL, etc). Die Daten zur Langzeitauswertung des Netzwerks von vorletzter Woche, letzter Woche oder der aktuellen Woche können in Echtzeit erhoben werden und für die Archivierung oder weitere Verarbeitung aufbereitet werden.

Im optimalen Fall sind Probleme oder Störungen behebbar, bevor sie durch die Anwender bemerkt werden. Auch lassen sich mögliche Probleme auf Basis von täglichen oder wöchentlichen Reports darstellen. Treten im Netzwerk Unregelmäßigkeiten auf, kann der Administrator schnell reagieren. Auch sollte eine nachträgliche Analyse des Netzwerkverkehrs möglich sein. In derartigen History-Daten finden sich oft die besten Hinweise auf systematische Verfügbarkeitsprobleme. Man legt einen beliebigen Zeitbereich fest, beispielsweise zwischen 12:00 Uhr am Mittag und 06:00 Uhr am Abend, um einen Fehler binnen Minuten einzugrenzen und im Anschluss entsprechende Maßnahmen zur Behebung des Fehlers zu ergreifen.

Wird während dieses Zeitraums eine Verbindung zum betreffenden „fehlerhaften“ Server ermittelt? Wurden über die Verbindung Pakete gesendet und empfangen? Traten auf der Verbindung zu einem bestimmten Zeitpunkt viele Sendewiederholungen auf?

Falls man bei der Netzwerkanalyse der History-Daten erkennt, dass keine Verbindung zum Server aufgebaut wurde, lag wahrscheinlich ein Problem zwischen dem Mitarbeiter-PC und dem Server vor. Um die Ursache der fehlerhaften Verbindung näher einzukreisen, kann man anschließend andere Verbindungen des Mitarbeiters in diesem Zeitraum untersuchen. Was hat funktioniert, was nicht? Wie sind die Antwortzeiten einzelner Verbindungen?

Eine weitere Fehlerquelle stellt der Server dar. Eine historische Netzwerkanalyse lässt sich auch serverseitig nutzen. Ähnlich wie auf der Client-Seite lässt man sich alle Verbindungen des ausgewählten Servers anzeigen. In unserem Fall erkannte man, dass im betreffenden Zeitraum einige Mitarbeiter auf den Server zugreifen konnten. Der Mitarbeiter, der das Problem gemeldet hat, jedoch nicht. Damit wird der Server als Fehlerursache eliminiert und es erhärtet sich der Verdacht, dass ein Netzausfall aufgetreten sein muss.

Mit Hilfe eines umfassenden Netzwerk-Monitorings werden alle wichtigen Faktoren und Parameter eines Netzes erfasst. Dazu zählen beispielsweise der aktuelle Status von Leitungen und virtuellen Links, der Topographie und des Routings sowie die Übertragungseigenschaften einzelner Protokolle. Darüber hinaus lassen sich aus den gewonnenen Informationen auch die Übertragungszeiten, die Verzögerungszeiten oder die Fehlerraten ermitteln. Von den Netzwerkkomponenten erzeugte Alarme und Statusmeldungen komplettieren die für die Fehleranalyse notwendigen Daten.

Darüber hinaus kann der Netzadministrator die gesammelten Daten als Hilfsmittel für ein präventives Informationssystem nutzen. Im Fehlerfall (Überschreiten von Round-Trip-Zeiten, Probleme beim QoS, den Ende-zu-Ende-Verzögerungszeiten) oder bei Ausfällen von Netzwerkkomponenten wird der Administratoren per individuell konfigurierbarem Alarm informiert und kann dadurch sicherstellen, dass das Netzwerk seine Übertragungsmerkmale beibehält.

Fazit

Mathias Hein, Consultant, Buchautor, Redakteur
Mathias Hein, Consultant, Buchautor, Redakteur

Da die meisten Netzverwaltungstools nur über geringe Analysefunktionen verfügen, liefern diese auch nicht die für die Fehleranalyse benötigten Daten. Daher sollte man nur Werkzeuge verwenden, die auf Probleme im Netz aktiv hinweisen, die die notwendigen Informationen liefern, um mithilfe der Analyse die Netzprozesse zu verbessern und um die Ursachen für Probleme beheben zu können.