Big-Data-Workloads in der Public-Cloud

clouds-1439324_1280Cloudera hat „Cloudera Altus“ vorgestellt, ein neues „Platform as a Service”-Angebot, mit dem Anwendungen zur Verarbeitung massiver Datenmengen ganz einfach in der Public-Cloud laufen können. Der erste Altus-Service hilft Dateningenieuren beim Einsatz einer flexiblen Infrastruktur. Sie können mit Altus die Erzeugung und Operationalisierung flexibler Daten-Pipelines beschleunigen, die fortschrittliche, datenorientierte Anwendungen antreiben.

Bei Anwendungen für das Data-Engineering wie ETL oder Batch-Scorings handelt es sich oft um große, Batch gesteuerte Workloads, die in einem festen Zeitraum laufen und Unternehmen helfen, wichtige Informationen aus Rohdaten zu extrahieren. Organisationen gewinnen aber enorm an Flexibilität und Effizienz, wenn sie diese Pipelines auf einer flexiblen Infrastruktur laufen lassen können. Cloud-basierte Daten-Pipelines bieten hier große Vorteile, bringen jedoch oft zusätzliche Risiken und Komplexität mit sich. Unternehmen wollen eine Cloud-Infrastruktur nutzen, ohne sich um neue Computer-Engines, die Neukonfigurierung von Sicherheits- und Management-Einstellungen sowie die Vermeidung von Datensilos und „Vendor-Lock-In” kümmern zu müssen.

Der neue Data-Engineering-Service Cloudera-Altus vereinfacht die Entwicklung und den Betrieb flexibler Daten-Pipelines. Altus stellt Data-Engineering-Jobs in den Mittelpunkt und abstrahiert Infrastruktur-Management und Betrieb, die zeitraubend und komplex sein können. Darüber hinaus reduziert Altus die Risiken, die mit Cloud-Migrationen verbunden sind, und bietet Anwendern vertraute Tools, verpackt in einem offenen, einheitlichen, für Unternehmen geeigneten Plattform-Service, der gemeinsamen Speicher, Metadaten, Security und Verwaltung über mehrere Data-Engineering-Anwendungen hinweg liefert.

„Data-Engineering-Workloads sind für die datengesteuerten Anwendungen von heute von grundlegender Bedeutung”, so Charles Zedlewski, Senior Vice President Products bei Cloudera. „Altus vereinfacht den Prozess, flexible Daten-Pipelines zu erstellen und laufen zu lassen. Gleichzeitig wird die Portabilität beibehalten und Elemente aus dem Data-Engineering lassen sich leicht in komplexere BI-, Data-Science- und Echtzeit-Anwendungen einbinden.“

Laut einer Studie von 451 Research („Voice of the Enterprise”) erwarten IT-Verantwortliche, dass 60 Prozent aller Workloads bis 2018 in der Cloud laufen werden. „Daten und Analysen. speziell in der Cloud, werden für viele Unternehmen weiterhin zu den wichtigsten Bereichen von Wachstum und Investitionen zählen. Aber Organisationen müssen sich auch Herausforderungen mit Cloud-basiertem Cluster-Management, Datenverarbeitung und -migration stellen, und genau da setzt Cloudera mit Altus an”, so James Curtis, Senior Analyst, Data Platforms and Analytics, bei 451 Research.

Die Cloud ist eine der am schnellsten wachsenden Deployment-Umgebungen für Cloudera-Kunden und mit Altus ist es einfacher als je zuvor, Data-Engineering-Workloads in der Cloud laufen zu lassen. In der ersten Rollout-Phase unterstützt Cloudera-Altus Apache-Spark, Apache-Hive on Mapreduce2 und Hive on Spark.
#Netzpalaver #Cloudera