Angefangen bei den Sensoren über die Data-Management-Plattform und Analytics-Software bis hin zur Security gilt es bei der Einführung von IoT-Projekten allein aus IT-Sicht viele verschiedene Bausteine zu beachten. Schematisch lässt sich ein solches Projekt allerdings in fünf Phasen gliedern – bei deren Beachtung der erfolgreichen Umsetzung des Projekts nichts im Wege steht. Stefan Ebener, Strategy & Innovation Manager Automotive & Manufacturing bei NetApp erläutert die fünf Schritte zu einem erfolgreichen IoT-Projekt:
- „Collect“: In dieser Phase geht es darum, Sensordaten zu erfassen und sie transportfähig zu machen. Herangehensweisen gibt es viele: Ein sogenanntes Edge-Gateway beispielsweise übersetzt die Daten, die ältere Maschinen oftmals in Milliampere ausgeben, und leitet diese anschließend weiter. Ein anderer Weg, die vorliegenden Daten in IP-fähige Informationen umzuwandeln, sind Systeme, die über Webcams Lampen- oder Schaltersignale filmen, dieses Material mittels künstlicher Intelligenz in IP-Informationen übersetzen und dann zur Auswertung weiterleiten. Oder: Die Investition in neuere Maschinen, die bereits komplett IP-fähig sind.
- „Transport“: Hier geht es um die sichere und verlässliche Übertragung der Daten von den Produktionsmaschinen oder Geräten zum Rechenzentrum. Aus den rund 50 verschiedenen Protokollen für die Sensordatenkommunikation ist das passende für die Kommunikation zwischen den Maschinen auszuwählen. Auch wenn einheitliche Standards noch fehlen, hat sich das offene Nachrichtenprotokoll MQTT, kurz für Message Queue Telemetry Transport, weitgehend durchgesetzt.
- „Store“: Bei diesem Schritt werden die Sensordaten gespeichert und für die Analyse bereitgestellt. Dafür eignen sich je nach Einsatzszenario unterschiedliche Technologien. Ist für die Datenanalyse Hadoop im Einsatz, sind leistungsstarke Storage-Lösungen, so genannte Enterprise-Class-Speicherlösungen, empfehlenswert. Als Speicher in Industrie-PCs für Edge Computing kommen in der Regel SSDs zum Einsatz. Stream Analytics, also Echtzeitberechnungen von Datenströmen, benötigen hingegen schnelle Flash-Ressourcen. Hilfreich, um große Mengen an Daten im zentralen Data Lake aufzubewahren, ist zudem ein skalierbarer Cloud-Storage. Wichtig ist darüber hinaus ein Datenmanagement-Betriebssystem, durch das Daten zwischen verschiedenen Speicherlösungen verschoben oder gespiegelt werden können.
- „Analyze“: umfasst die Analyse der Sensordaten. Auch hier gilt es, abhängig vom Anwendungsfall die richtigen Lösungen auszuwählen. Um große Mengen an strukturierten und unstrukturierten Daten aus dem Data Lake zu verarbeiten, eignen sich zum Beispiel das Framework Hadoop und NoSQL (Not Only SQL)-Datenbanklösungen wie Couchbase, MongoDB oder Cassandra. Für Echtzeitanalysen kommen unter anderem SAP HANA oder SAP Business Objects zum Einsatz. In dieser Phase lassen sich überdies die Analyseergebnisse mit dem ERP-System verknüpfen.
- „Archive“: Sorgt für eine kosteneffiziente Langzeitarchivierung der Sensordaten. Ein wichtiger Aspekt dieser fünften Phase ist die regelbasierte, automatisierte Datenklassifizierung. So kann das System Daten nach der gesetzlichen Vorhaltezeit automatisch löschen. Auch das Storage Tiering kommt hier zum Zuge: Bei dieser Methode werden die Daten entsprechend ihrer Zugriffe auf unterschiedliche Speichermedien verteilt. So landen Daten in der Anfangsphase der Archivierung oft zunächst auf schnelleren Systemen, da sie noch häufiger abgerufen werden. Später ruhen sie auf weniger performanten, preiswerteren Speicherlösungen. Auch das Auslagern von Daten in eine Cloud oder der Abzug aus der Cloud sind Themen, um die es in der Archivierungsphase geht.
#Netzpalaver #NetApp