Große Daten, große Zukunft – um es mit den Worten des britischen Schriftstellers Douglas Adams zu sagen: Das Internet der Dinge ist groß. Wirklich groß. Die Meisten mögen denken, dass die Datenmenge, mit der sie in ihrem Unternehmen zu tun haben riesig ist – denn laut der IDG IoT Studie 2018 hat bereits ein Fünftel der befragten Unternehmen IoT-Projekte umgesetzt. In Wahrheit aber sind das nur Peanuts im Vergleich zu dem Volumen an Daten, das von vernetzten Fahrzeugen und IoT-fähigen Lieferketten erzeugt wird. Ganz zu schweigen von der Vielfalt an Datentypen und der Geschwindigkeit, mit der sie generiert werden. Dass der Umgang mit diesen Daten eine große Herausforderung ist, liegt auf der Hand. Was gilt es also zu beachten?
Mehr Daten, mehr Probleme oder vielleicht mehr Möglichkeiten?
Sensoren an jedem vernetzten Gerät sammeln durchgängig Informationen und erzeugen so Daten, um das aktuelle Geschehen abzubilden. Betrachtet man zudem den Straßenverkehr, erhält man Unmengen von Updates von tausenden Lastwagen, Bussen oder Autos. Sogar Schiffscontainer übermitteln Angaben zu ihrem Standort, ihrem Status und Problemen, mit denen sie zu kämpfen haben. Multipliziert man all diese Daten, ist das Ausmaß schon heute nicht mehr greifbar. Dabei planen einige globale Logistikunternehmen die Anzahl der Datenpunkte, mithilfe derer ein Paket oder eine Sendung nachverfolgt wird, noch zu erhöhen: Von heute etwa 20 bis 25 auf künftig mehr als 100.
Aus betriebswirtschaftlicher Sicht sind diese zusätzlichen Daten unerlässlich. Sie werden gebraucht, um mit Wettbewerbern im Supply Chain Management und der Logistik Schritt halten zu können. Denn richtig und in Echtzeit genutzt, können diese Daten die Servicequalität verbessern, indem sie aufkommende Probleme, zum Beispiel bei der Lieferung eines Produktes, frühzeitig lösen. Wie man es auch dreht und wendet: Die Zukunft wird uns noch mehr Daten bringen.
Die Datenflut kommt
Bereits heute produzieren wir mehr Daten als je zuvor in der Menschheitsgeschichte. Diese riesigen Datenmengen stellen Unternehmen vor eine Herausforderung: Sie müssen ihre internen IT-Infrastrukturen an die aktuellen Gegebenheiten anpassen. An dieser Stelle setzen Public-Cloud-Angebote an – aber sind diese auch für IoT-Daten geeignet?
Dabei hilft es, sich bewusst zu machen, wie die Daten eintreffen und wie sie von Datenbanken weiterverarbeitet werden. Datenbanken speichern Daten für die unterschiedlichsten Zwecke: als Transaktionssysteme, um weitere Anweisungen auszuführen, als Ablage von Langzeitdaten oder zur Analyse von Daten, die uns einen Einblick in das tägliche Geschehen geben kann. Gerade im Umgang mit IoT-Daten, die von unzähligen Sensoren stammen und bei denen die Reihenfolge entscheidend sein kann, ist die Skalierbarkeit der Datenbanken so wichtig. Hier setzen Cloud-Lösungen an: Anstatt intern neue Ressourcen aufzubauen, können Public-Cloud-Services einfach hinzugebucht werden, um die Nachfrage schnell zu decken. Cloud-Datenbanken stehen dabei allerdings vor einigen Herausforderungen.
Vertrauen ist gut, Kontrolle ist besser
Bei der Wahl der Cloud geht es daher um viel. Das Thema Vertrauen spielt eine sehr wichtige Rolle. Für viele international tätige Unternehmen, für die funktionierende Supply-Chains und die Logistik eine herausragende Rolle spielen, sind die bestehenden Datensätze und Anwendungen unternehmenskritisch. Diese einfach zu Cloud-Providern zu verlagern ist schwierig, wenn nicht gar unmöglich.
Darüber hinaus sind die Daten selbst unglaublich wertvoll. Natürlich sind die großen Cloud-Anbieter in der Lage, ihre IT-Sicherheit effektiver zu gestalten als einzelne Unternehmen; manche Unternehmen geben die Kontrolle aber trotzdem ungerne ab. Nachvollziehbar, will man doch informiert sein, wo die eigenen Daten gespeichert werden und wer Zugriff hat. Hinzu kommt, dass gerade Handel- und Logistikunternehmen den Druck neuer Marktteilnehmer, wie Amazon, spüren. Sie konkurrieren mit den gleichen Unternehmen, die ihnen ihre Cloud-Infrastruktur zur Verfügung stellen – keine einfache Situation.
Deshalb entscheiden sich Unternehmen mit hohen Anforderungen an das Supply-Chain-Management und die Logistik vorwiegend für den Einsatz einer Hybrid-Cloud. Schätzungen der Analysten von Gartner zufolge werden rund 90 Prozent der Unternehmen bis 2020 auf ein hybrides Infrastrukturmanagement setzen. Gleichzeitig prognostiziert Gartner eine Steigerung der Gesamtausgaben für Cloud-Computing auf 68,4 Milliarden US-Dollar im Jahr 2020.
Enorme Datenmengen bergen enormes Potenzial
Je größer die Datenmenge, desto größer ist ihr Potenzial – aber auch die Komplexität des Datenmanagements. Gerade Logistikunternehmen verfügen über komplexe Netzwerke von Anwendungen, die intern Daten produzieren. Hinzu kommen die Unmengen an IoT-Daten. Führt man beide Datenbestände zusammen, bergen diese ein enormes Potenzial.
Allerdings ist dieser Schritt nicht einfach. Während Cloud-basierte Compute- und Storage-Services schnell skalierbar sind, um auch zunehmende Datenmengen zu bewältigen, gilt dies nicht auch automatisch für die Datenbank. Denn die meisten traditionellen Vertreter basieren auf Technologien, die für den Betrieb einzelner Instanzen oder kleinerer Cluster an einem einzigen Standort entwickelt wurden – aber definitiv nicht für die Cloud.
Flexibles Datenmanagement ist gefragt
Planen Unternehmen den Einsatz von IoT und damit eine Cloud-Lösung zu implementieren, reicht es nicht aus, einzelne Datenbankinstanzen in der Cloud zu hosten. Vielmehr gilt es, Datenbanken so zu konzipieren, dass sie nativ in der Cloud laufen. Hierfür müssen sie vollständig verteilt sein, auf beliebig vielen Knoten laufen können und nicht abhängig von einem traditionellen „Master-Knoten“ sein.
Des Weiteren muss eine Cloud-Datenbank heterogene Informationen verarbeiten können – sie bekommt es schließlich mit Daten zu tun, die Milliarden verschiedener Sensoren, Geräte und Personen ständig und weltweit verteilt über diverse Kanäle produzieren. Genau deshalb ist die Skalierbarkeit so wichtig, eine Datenbank muss sich flexibel den Gegebenheiten anpassen können.
Wichtig für Hybrid-Cloud-Umgebungen ist, dass sie unabhängig von der jeweils zugrunde liegenden Cloud arbeiten – sei es eine interne Private-Cloud oder eine Public-Cloud. Im Idealfall läuft das System über mehrere Public-Clouds. So können Unternehmen die Vorteile derjenigen Provider nutzen, die in Sachen Standort und Service am besten zu ihnen passen – und überall aktiv sein. Lebt ein Unternehmen flexibles Datenmanagement, bewältigt es den Datenfluss spielend, den IoT-Projekte mit sich bringen.
#Netzpalaver #Datastax