Netzwerkfehler analysieren und beheben

Kompendium zu Netzwerkfehler analysieren und beheben
Netzwerkfehler haben mannigfaltige Ursachen. Nur ein immenses Troubleshooting-Know-how verhindert eine kostspielige Downtime. Das Kindle-Book von Netzpalaver zur Fehleranalyse und Fehlerbehebung. Die Bedeutung der Netzwerke im Rahmen der gesamten IT-Infrastruktur ist im Lauf der Entwicklung kontinuierlich gestiegen. Ihre Funktion ist heute die Grundlage für das gesamte weltweite Business und bildet darüber hinaus die Basis für das soziale Zusammenleben – von der Ausbildung bis hin zum Gesundheitswesen.
War es noch vor Kurzem möglich, ein benötigtes Dokument mittels der auf dem eigenen Computer gespeicherten Daten auf einem lokalen Drucker zu erstellen, so befinden sich diese Informationen mittlerweile nicht einmal mehr auf dem eigenen Campus. Sie sind irgendwo in der Weite der Cloud gespeichert und gelangen über eine  Datenverbindung auf den Bildschirm. Steht diese nicht bereit, steht das Unternehmen, der Service oder gar die allgemeine Versorgung.
„Das Netz“ ist heute die erste Instanz, die für jedwede Probleme im Zusammenhang mit der Verfügbarkeit von  IT-Systemen in Anspruch genommen wird – berechtigt oder unberechtigt. Und es ist im Allgemeinen der Netzwerkverantwortliche, der als erste Anlaufstelle gefordert ist, Ursachen zu ermitteln und schnelle Abhilfe zu leisten.
Während allerdings die IT in Bezug auf Rechenkonzepte und Anwendungsintelligenz revolutionäre Entwicklungen durchgemacht hat, führte das Netz eher ein Schattendasein. Natürlich haben sich die Übertragungsraten seit der legendären ersten Ethernet-Skizze von Bob Metcalf aus den siebziger Jahren des vergangenen Jahrhunderts kontinuierlich entwickelt – von ursprünglichen 10 MBit/s bis auf heute gängige 10, 40 oder 100 GBit/s. Die Standards für 200 und 400 GBit/s sind bereits definiert. Aber die Grundlage dafür bildet immer noch das Ethernet-Protokoll. Es erschließt sich ohne über fundierte Kenntnisse zu verfügen, dass allein diese Bandbreitensteigerung nicht ohne Friktionen zu erzielen war. Es kommt hinzu, dass Ethernet als lokale „LAN“-Technologie konzipiert und das „WAN“ noch ein Buch mit sieben Siegeln war.
Ethernet-Skizze von Bob Metcalf
Mit dieser Skizze begann Anfang der 80er Jahre der Siegeszug von Ethernet
als prägende Netzwerktechnologie

 

Folgerichtig entstanden neben dem Ethernet eine Vielzahl anderer Netzwerktechnologien inklusive ihrer notwendigen Protokolle. Während im Wide-Area-Network-Konzepte wie X.25, ATM, MPLS oder SDH kamen und auch wieder gingen, entwickelten sich parallel dazu drahtlose Übertragungstechniken wie WLAN, Mobilfunk, Bluetooth und eine ganze Reihe anderer spezialisierter Standards für dedizierte Anwendungen. Diese Entwicklung hat dazu geführt, dass in einer Organisation gleich welcher Größe heute diverse Netzwerktypen parallel existieren –  kabelgebundene neben drahtlosen, Wide-Area-Networks neben Personal-Area-Networks. Sie alle haben ihre Berechtigung je nach Geschäftstyp, basieren auf unterschiedlichen Protokollen, erfordern eine dedizierte Hardware und sind die unerschöpfliche Quelle von Fehlern.

Es ist die Aufgabe des IT-Netzwerk-Administrators, diese Fehler zu erkennen, schnellstmöglich zu beheben, im Idealfall aber, ihr Entstehen zu antizipieren und so weit wie möglich im Vorfeld auszuschließen. Das ist in
Anbetracht der Vielzahl und der Komplexität der jeweiligen Technologien allerdings leichter gesagt als getan, trotzdem aber notwendig in Anbetracht der Folgen einer „Downtime“ der IT.

Fehler verursachen Immense Kosten

Verschiedene Analysten und Berater haben sich daran gemacht, die Kosten für den Ausfall der digitalen Arbeitsgrundlage in Unternehmen zu ermitteln. Sie kommen dabei auf Durchschnittswerte in der Größenordnung von 5.000,- Euro pro Minute, entsprechend 300.000,- Euro pro Stunde. Natürlich sind diese Zahlen rein fiktiv und hängen von vielen Faktoren ab – der Größe des Unternehmens, dem Geschäftsmodell oder dem Grad der Abhängigkeit von der Netzverfügbarkeit. Ein Online-Trader wird in der Zeit der Downtime keine Umsätze mehr realisieren, während ein Fabrikationsunternehmen weiterhin produzieren kann, auch wenn die Internetverbindung temporär ausfällt. Auf der anderen Seite ist der Ausfall einer einzigen Maschine innerhalb einer Produktionskette für einen Fabrikanten im Zeitalter der Just-in-Time-Fertigung gleichbedeutend mit einer wirtschaftlichen Katastrophe, auch wenn die Internetverbindung steht. Und nicht abzusehen sind die Folgen für die Reputation des Unternehmens oder der Organisation hinsichtlich langfristiger Image-Schäden.
Es kommt auch nicht so sehr darauf an, konkrete Zahlen zu ermitteln. Tatsache ist, dass IT-Downtime im günstigsten Falle zum Unmut der Mitarbeiter führt, im schlechtesten zur Existenzbedrohung. Und das verlangt in jeder Hinsicht nach einem Schuldigen. Weil eben das Netzwerk das Rückgrat der Unternehmens-IT bildet, ohne das nichts läuft, und weil mangelnde Performance der Anwendungen oder gar Systemausfälle gern auf das Netzwerk geschoben werden, steht der IT-Netzverantwortliche immer in der Verantwortung, Fehler entweder schnell zu erkennen und zu beheben, oder aber mögliche Ursachen dorthin zu delegieren, wo sie ihren Ursprung haben.

Die richtige Strategie, um Fehlern auf den Grund zu gehen

Dieses Kompendium soll Netzwerk-Administratoren Informationen und Strategien an die Hand geben, ihre Aufgabe in einem zunehmend komplexen Umfeld zu meistern. Der Schwerpunkt liegt auf praktischen Hinweisen, die auf einer mehr als 30-jährigen Erfahrung bei der Projektierung, der Implementierung und beim Troubleshooting von Netzwerken beruhen. Es ist weder allumfassend, noch folgt es Trends, deren praktische Bedeutung nicht einzuschätzen ist. Jeder IT-Verantwortliche weiß im Zweifel, wo er die Lösung aktueller Fehler recherchieren kann – sei es beim Hersteller, dem Software-Entwickler oder innerhalb einer Community, der er hoffentlich im Rahmen seiner Tätigkeit angehört. Ein Update oder Patch löst möglicherweise das Problem auf die Schnelle, gegebenenfalls auch ein geänderter Tabelleneintrag. Aber oftmals ist es eben nicht so einfach.
Von der Meldung eines Fehlers durch einen beliebigen Anwender bis zu dessen Behebung müssen vielfältige Schritte durchlaufen werden. Dabei gilt es zu beachten, dass der Nutzer einer Applikation lediglich eine Einschränkung seiner Arbeitsgrundlage registriert, ohne eine genaue Kenntnis darüber, woher diese resultiert. Weil er diese Performanceeinbuße als Störung oder gar temporären Ausfall seiner Tätigkeit wahrnimmt, wird er nach einer Lösungsinstanz suchen, die in der Lage ist, unmittelbar Abhilfe zu schaffen.
Das ist legitim, aus seiner Sicht, bedeutet für den Netzwerk-Administrator aber lediglich den Beginn einer Reise durch mögliche Fehlerquellen und Maßnahmen zu deren Behebung. Diese Reise führt von der methodischen Herangehensweise an das Problem über das Aufstellen von Fehlerhypothesen bis zur Messung und Deutung von Daten. Am Ende bedarf es möglicherweise einer detaillierten Kenntnis der Netzwerkprotokolle oder des Einsatzes entsprechender Tools.
In einem Asterix-Band erteilt der smarte Gallier seinem tumben Freund während einer Seefahrt die Anweisung: „Wirf das Netz aus, Obelix!“ Was dieser auch tut, natürlich ohne ein Ende dabei in der Hand zu behalten. Die Reaktion auf die folgenden Vorhaltungen ist lapidar: „Du hast doch gesagt, ich soll das Netz auswerfen.“ Die Geschichte ist nicht eigentlich lustig, sondern birgt eine Reihe von Lehren. Es gibt vielfältige Gründe für den Ausfall eines Netzwerkes. Ein wesentlicher ist der menschliche Irrtum, ein anderer liegt in unklaren Anweisungen. Ein dritter basiert darauf, dass die Technologie selbst nicht über einen Mechanismus verfügt, derartige Fehler zu verhindern. Natürlich können darüber hinaus fehlerhafte Elemente in der Infrastruktur zu Problemen führen oder aber, böswillige Zeitgenossen legen es darauf an, die Netzwerkperformance zu beeinträchtigen.

Methodische Herangehensweise des Troubleshootings

Netzwerkfehl verursachen immer wieder Kopfzerbrechen. Nur ein immenses Troubleshooting-Know-how verhindert eine kostspielige Downtime.
Netzwerkfehler führen zu Downtime. Diese kann extrem kostspielig werden, wenn das Troubleshooting-Team die Fehler nicht schnellstens eliminiert bzw. präventiv verhindern kann.

Das erste Kapitel dieses Buches beschäftigt sich folgerichtig mit den möglichen Strategien, um Netzwerkprobleme zu analysieren und entsprechende Maßnahmen zu treffen. Es ist natürlich leichter gesagt als getan, Ruhe zu bewahren, wenn zehn, 1.000 oder gar Millionen von Nutzern auf eine Response warten – trotzdem führt kein Weg daran vorbei. Es gilt immer, methodisch an das Problem heranzugehen, ohne voreilige Schlüsse oder sich gar aus der Verantwortung zu ziehen.

Was genau ist das Problem des Anwenders? Ist es reproduzierbar? Sind die Fehlermeldungen schlüssig?Oftmals hilft der gesunde Menschenverstand, Ursachen dingfest zu machen. Aber meist ist es leider nicht so simpel. Ohne fundierte Protokollkenntnisse wird es schwierig, Probleme zu analysieren und zu erkennen. Und in der Regel sind entsprechende Werkzeuge erforderlich, um zu messen, zu testen und zu analysieren. Der Markt bietet eine Vielzahl entsprechender Tools für das Gerätemanagement, zur Überwachung und Analyse von Datenströmen, zur Konfiguration und Planung.

Die richtigen Tools um Netzwerkfehler zu beheben

Im Kapitel 2 wird auf Netzwerkkommandos auf dem Layer 3 und Tools eingegangen um herauszufinden, wo mögliche Ursachen für Störungen liegen. Der Schwerpunkt liegt auf der Vorstellung bekannter Werkzeuge inklusive praktischer Beispiele der verschiedenen Syntaxen und Meldungen. Der Netzwerkadministrator findet hier vielfältige Hilfestellungen für die praktische Arbeit.
Die wichtigste Grundlage für die Detailanalyse der Aktivitäten im Netzwerk bilden Werkzeuge, die es ermöglichen, Datenströme zu empfangen, aufzuzeichnen, darzustellen und auszuwerten. Auch hier gibt es eine Reihe von Open-Source-Produkten mit hoher Funktionalität und Leistungsfähigkeit. Der Teufel liegt wie so oft im Detail, weshalb auch das Kapitel 3 mit vielen Beispielen und praktischen Tipps arbeitet.
Was für die Analyse der Verkehrsströme zutrifft, gilt auch für für das Netzwerkmanagement. Kapitel 4 stellt verbreitete Werkzeuge für das Netzwerkmanagement vor, die es dem Administrator erlauben, Daten von einer Vielzahl von Servern und Netzkomponenten über eine einzige Konsole zu überwachen. Auch hier stehen Open-Source-Lösungen bereit, die ihre eigenen Schwerpunkte verfolgen.

Sicherung der Dienstgüte – Service-Level-Agreements

Transparenz ist die wichtigste Voraussetzung für eine schnelle Reaktion auf Fehlermeldungen. Das entsprechende Monitoring des Netzwerkgeschehens ist deshalb unerlässlich. Aber über die Behebung von Fehlern hinaus bildet das Monitoring von Netzwerken auch die Grundlage für die Erfüllung elementarer Anforderungen an die Netzwerkfunktion. Die Bereitstellung von Netzservices beruht auf der Vereinbarung von Service-Levels zwischen Betreibern und Anwendern. Sie haben eine zentrale Bedeutung für die Geschäftsprozesse und definieren die Aufgaben und Ziele des Netzbetriebes wie Verfügbarkeit, Zuverlässigkeit und Performance.
Aber wie lässt sich dies in der Praxis messen und auf welcher Basis können entsprechende Infrastrukturen realisiert werden? Kapitel 5 beschäftigt sich mit der Qualitätssicherung im Netz inklusive der technischen Grundlagen sowie der notwendigen Überlegungen bei der Definition. Weil Software-basierte Lösungen einen immer breiteren Raum gegenüber dedizierter Hardware einnehmen, kommt dieser Bereich hier ausführlich zur Sprache.
Netzwerke werden zunehmend komplexer. Der Administrator steht vor der Aufgabe, nicht nur ein einzelnes LAN, sondern im Zweifel beliebig viele Netze zu administrieren und zu überwachen, die über Switche verbunden sind. Das erschwert den Blick auf die Zusammenhänge und erfordert im Problemfall ein tiefes Protokollwissen und Erfahrung, um Fehler zu ermitteln und zu beheben. Hinzu kommen Fragen der Zugriffskontrolle und der Authentisierung. Auch kann der Fehler seine Ursache in den unterschiedlichsten Komponenten haben, von der Verkabelung bis hin zur Applikation. Kapitel 6 beschäftigt sich mit der Fehlersuche in vernetzten Systemen und gibt praktische Beispiele für häufige Probleme und zur Behebung ihrer Ursachen – inklusive der Verkabelung und Stromversorgung.

Das ideale Netzwerk

Troubleshooting von Netzwerkfehlern
Das ideale Netzwerk gibt es nicht. Fehler schleichen sich immer wieder ein, durch Anwender, Komponentenausfälle oder gar kriminelle Energien.

Wenn auftretende Fehler mit den verfügbaren Werkzeugen zur Netzanalyse und -überwachung nicht ermittelt werden können, dann haben sie ihre Ursache möglicherweise auf der Schicht 2, dem Data-Link-Layer, und können in einem gewissen Rahmen hier behoben werden. Dies erfordert wiederum eine detaillierte Kenntnis der Protokolle, die im Kapitel 7 beschrieben werden.

Dabei ist es wichtig zu verstehen, dass das Netzwerk nicht immer die Schuld an auftretenden Problemen trägt. Performance-Einbußen können vielfältige Ursachen haben, etwa die jeweilige Anwendung oder schlechte Internet-Verbindungen, Phänomene wie „Bufferbloat“ oder „Silly-Window-Syndrome“. TCP-Protokolle und Anwendungen können ein Verhalten aufweisen, das zu einer Verschlechterung der Performance führt.
Das „ideale Netzwerk“ ist eben nur ein idealer Gedanke, und in der Praxis kommt es darauf an, Applikationen und Übertragungsnetze so gut wie möglich aufeinander abzustimmen.

Vom Ethernet zu WLAN

Während sich bei bei drahtgebundenen Netzen das Ethernet-Protokoll den Weg vom Local-Area-Network über das Metropolitan-Area-Network hin zum Carrier-Ethernet gebahnt hat, verlangen die Anwender und die modernen Business-Prozesse nach drahtlosen Technologien, die jederzeit und ortsunabhängig einen Zugang zu Ressourcen ermöglichen. Hier spielt – neben einer Vielzahl anderer dedizierter Funktechnologien – das WLAN eine herausragende Rolle für die Geschäftskommunikation und stellt Administratoren vor neue Herausforderungen. Das bezieht sich auf Fragen der Signalübertragung ebenso wie auf Zugangs- und Sicherheitsmechanismen. Als relativ junge Technologie befinden sich die Standards in einem stetigen Fluss, um insbesondere die Bandbreite zu erhöhen. Kapitel 8 widmet sich den Fragen nach der Fehlersuche in Wireless-LANs und beschäftigt sich zudem mit anderen drahtlosen Übertragungstechnologien für spezielle Anwendungen.

Katastrophen meistern, Netzwerkfehler verhindern

Es gibt kein perfektes Netzwerk und keine Möglichkeit, Fehler zu verhindern. Aber es ist sehr wohl möglich, deren Ursachen schnellstmöglich zu erkennen und zu beheben. Dazu bedarf es der Kenntnis darüber, wie Netze funktionieren, auf Basis welcher Mechanismen und mittels welcher Werkzeuge. Aber „Katastrophen“ sind niemals auszuschließen, seien sie verursacht durch menschliche Fehler, durch den Ausfall wesentlicher Komponenten, durch externe und böswillige Manipulationen oder durch wirkliche Naturgewalten.
Auf der sicheren Seite ist, wer das Undenkbare entsprechend plant und sich darauf vorbereitet hat. Es gilt, Abwehrpläne zu entwickeln und eine Wiederherstellung der Business-Continuity zu sichern.

Zusammenhänge des Netzbetriebes

Die beste Voraussetzung für das Troubleshooting von Netzwerkfehlern ist die detaillierte Kenntnis der Protokolle, Funktionen und Zusammenhänge des Netzbetriebes. Es ist für den einzelnen Netzwerk-Administrator nicht zu leisten, in allen Technologien und auf allen Ebenen auf dem Stand der Technik zu sein. Dazu ist deren Entwicklung zu schnell, und die Komplexität wächst mit jedem neuen Element in einer zunehmend heterogenen Infrastruktur.
Dieses Buch beschreibt grundlegende Herangehensweisen an die Ermittlung von Netzwerkproblemen, deren möglichen Ursachen auf verschiedenen Ebenen und Maßnahmen zu deren Behebung. Es beruht auf einer langjährigen Erfahrung mit entsprechenden Projekten und zeigt Beispiele aus der Praxis, die es IT-Netzwerk-Administratoren ermöglichen, ihrer Aufgabe nachzukommen.
Netzwerkfehler mit Best-Practices zum Troubleshooting beheben
Netzwerkfehler analysieren und beheben als Kindle-Book auf Amazon

Info; Das Buch „Netzwerkfehler analysieren und beheben“ erscheint in wenigen Wochen als Kindle-Book auf Amazon.

Autoren: Mathias Hein, Ralf Ladner, Uwe Scholz