Schnelle Fehleridentifikation mit Problemdiagnose-Tool

businesswoman-2253463_640Verzögerungen und unnötige Wartezeiten in der Lagerhaltung: Coop, eines der grössten Detail- und Grosshandelsunternehmen der Schweiz, hat mit Hilfe der Allegro-Network-Multimeter die Fehlersuche im Netzwerk schnell und effizient durchgeführt.

Die Coop-Gruppe hat als Genossenschaft mit rund 2,6 Millionen Mitgliedern ihren Sitz in Basel in der Schweiz und ist im Detailhandel, im Grosshandel und in der Produktion tätig. Zur Coop-Gruppe zählen Ladenformate aus den Bereichen Food, Non-Food und Dienstleistungen. Coop bietet die grösste Markenvielfalt im Schweizer Detailhandel und zeichnet sich durch ein breites ökologisch und sozial profiliertes Sortiment sowie durch Nachhaltigkeitsleistungen entlang der gesamten Wertschöpfungskette aus. Mit der Transgourmet Holding AG ist Coop die Nummer zwei im europäischen Abhol- und Belieferungsgrosshandel. Gesamthaft betreibt die Coop-Gruppe mit rund 2’300 Läden das dichteste Verkaufsstellennetz des Schweizer Detailhandels und bietet ihren Gastronomiekunden 142 Cash & Carry-Märkte in der Schweiz und im europäischen Ausland. Die Coop-Gruppe beschäftigt über 86’000 Mitarbeitende, davon mehr als 50’000 in der Schweiz. Darüber hinaus ermöglicht der Onlineshop coop@home die Bestellung von Artikeln aus dem Coop-Sortiment mit Heimlieferung. Die termingebundenen Sendungen erfordern massgeschneiderte, individuelle Transportlösungen und müssen mit höchster Präzision und Sorgfalt durchgeführt werden. Denn bereits in der Definition der Logistik ist diese grundsätzliche Verbindung zwischen Logistik und IT verankert: „Logistik ist die ganzheitliche Planung, Steuerung, Koordination, Durchführung und Kontrolle aller unternehmensinternen und unternehmensübergreifenden Informations- und Güterflüsse.“

Die zentrale Aufgabe der Logistik besteht in der vernünftigen Gestaltung materieller Bewegung in logistischen Netzwerken. Die Organisation und Steuerung der Logistik erfolgt vorrangig über ihre digitale Abbildung.

Logistik ist jedoch nicht mehr nur Anwender von IT. Technologische Trends wie das Internet der Dinge, Cloud Computing, Big Data und Industrie 4.0 sind informationstechnologische Innovationsfelder, auf denen die Wettbewerbsfähigkeit der Produktions- und Handelsunternehmen entschieden wird. Als Bindeglied zwischen Information, Produktion und Handel spielt die Logistik dabei eine zentrale Rolle. Sie ist getrieben durch IT, wird selbst zum Treiber von IT.

Aus diesem Grund müssen Störungen der betrieblichen Abläufe auf ein Minimum reduziert werden. Treten trotz aller Redundanz- und Vorsichtsmaßnahmen in der IT-Infrastruktur Fehler auf, ist schnelles Reagieren gefragt.

 

Probleme einer Java-Anwendung

Bei der Coop-Logistik funktionierte aus unerklärlichen Gründen eine Java-Anwendung nicht reibungslos. Die unternehmensübergreifende Zusammenarbeit im Sinne von Collaboration und der schnelle, automatisierte Datenaustausch wurde dadurch unterbrochen, was viele Verzögerungen und unnötige Wartezeiten zur Folge hatte. Durch die Komplexität und die Dynamik der Prozesse war umstritten, ob das Netzwerk oder eine andere Quelle das Problem verursachte. Die ersten Recherchen legten die Vermutung nahe, dass das Problem nicht im Netzwerk, sondern in der Anwendung des Zulieferers zu finden sei. Ein eindeutiger Hinweis auf die Fehlerursache bzw. ein Nachweis der Fehlerquelle war nicht eindeutig zu ermitteln.

In dieser Situation kam das Allegro-Network-Multimeter von Allegro Packets ins Spiel und lieferte sehr schnell einen eindeutigen Hinweis. Für die Installation des mobilen Allegro Network Multimeter bedurfte es nur wenige Minuten. Hierzu wurde das Gerät im Bridge-Modus vor den betreffenden Server in den Netzwerkpfad eingefügt. Arbeitet das Allegro Network Multimeter im Bridge-Modus wird der gesamte Datenverkehr zwischen benachbarten Monitor-Schnittstellen transparent weitergeleitet und gleichzeitig analysiert. Das Gerät agiert in diesem Fall als Netzwerkbrücke und es muss kein separater Tap (Test Access Point) für das transparente Zwischenschalten in die Leitung bereitstehen.

Der Vorteil des Allegro Network Multimeters besteht darin, schnell einsatzbereit zu sein, um die Probleme gezielt und schnell einzugrenzen zu können. Das Gerät kann auch problemlos per Post an den lokalen Systemadministrator geschickt werden, der dieses installiert. Anschliessend lässt sich das betreffende Netzwerk remote analysieren. Dadurch werden in vielen Fällen aufwendige und teure Dienstreisen eingespart.

Bereits nach den ersten Datenprüfungen der Datenströme signalisierte das Allegro-Network-Multimeter hohe Verzögerungen bei der S7-Anwendung. Die betroffenen Verbindungen bzw. die über das Netz übertragenen Daten wurden auf Basis eines Packet-Captures (Pcap) extrahiert. Die erste Analyse ergab, dass auf den Verbindungen

  • keinerlei Sendewiederholungen (retransmissions) oder ähnliches und
  • nur kurze TCP-Responses zu erkennen waren.

Aus den gewonnenen Informationen konnte die erste Prognose („der Fehler liegt im Netzwerk“) eindeutig als falsch bewiesen werden.

Aus diesem Grund wurden die im Pcap aufgezeichneten Datenströme des S7-Protokolls an den Support des externen Zulieferers geschickt. Der Support-Ingenieur bzw. der zuständige Entwickler konnte dank der vom Allegro Network Multimeter aufbereiteten Informationsdetails innerhalb von wenigen Minuten das Problem verstehen und eine entsprechende Lösung erarbeiten. Im Prinzip sorgten die vom Netz empfangenen Jumbo-Frames im „Socket Selector“ der Java-Framework-Library für ein Reset der Anwendung. Dies hatte zur Folge, dass die Anwendung erneut gestartet werden musste und dies zu den im Allegro Network Multimeter aufgezeichneten Verzögerungen geführt hat.

Anhand der mit dem Allegro Network Multimeter aufgezeichneten Datenströme wurde schnell klar, dass sich die Java-Anwendung immer bei der Übermittlung von sogenannten Jumbo Frames „verschluckte“ und folglich die hiervon betroffene S7-Anwendung in manchen Situationen eine grosse Latenz aufwies. Der Begriff Jumbo Frames bezeichnet in einem Ethernet nicht standardisierte und übergrosse Pakete. Die Standardgrösse dafür ist mit 1518 Byte in der Norm IEEE 802.3 festgelegt. Frames, die länger als dieser Wert sind, werden als Jumbo Frames bezeichnet. Für einige Anwendungen können Jumbo Frames sinnvoll sein, da der Protokoll-Overhead dadurch reduziert und die Effizienz verbessert werden kann. Ausserdem kann bei den beteiligten Knoten der Verarbeitungsoverhead möglicherweise gesenkt werden, da weniger Frames verarbeitet werden müssen. Solche Frames sind nicht Standard, und so muss sichergestellt werden, dass alle Netzwerkelemente mit diesen Jumbo Frames umgehen können.

Durch ein Update der Java-Bibliothek liess sich das Problem in der javabasierten S7-Anwendung schnell beheben und die Coop-Server funktionierten wieder reibungslos.

Für Coop bedeutete die schnelle Fehlerdiagnose auf Basis des Allegro Network Multimeters einen echten Mehrwert und eine Effizienzsteigerung, die sich in einer schnellen Identifizierung von Fehlern und einem durch die toolgestützte Analyse der Daten reduzierten Zeitaufwand für das Troubleshooting manifestiert.

„Das Ergebnis der ersten Analysen in den Coop-Netzen steht bereits nach den ersten Einsätzen des Allegro Network Multimeters fest: Die Investition in das Produkt hat sich bei uns im Betrieb bereits innerhalb weniger Wochen amortisiert,“ resümiert Roberto Abeledo Alonso, Systemtechniker der Coop am Hauptsitz des Unternehmens in Basel. „Darüber hinaus muss ich zum Support noch Anmerkungen machen: Die Kompetenz des Support-Personals ist von extrem hoher Qualität. Nicht nur bekommen wir die gewünschten Informationen umgehend, sondern erhalten auch zusätzliche Anregungen für unsere tägliche Arbeit.“

#Netzpalaver #Allegro