Aufbereitung von Daten ohne kostspielige Big-Data-Umgebung

„Trifacta Wrangler Edge“ ist ein neues Angebot für Analystenteams zur Aufbereitung verschiedenartiger Daten außerhalb von Big-Data-Umgebungen. Seit seiner erstmaligen Einführung Ende 2015 erfreut sich die kostenlose Wrangler-Desktop-Edition großer Nachfrage. Wrangler unterstützt mehr als 4.000 Unternehmen in 132 Ländern bei der Exploration, Transformation und Verbindung verschiedenartiger Daten für Analysezwecke. Wrangler-Edge ergänzt den Funktionsumfang der kostenlosen Wrangler-Desktop-Edition, indem es mehrere Benutzer und umfangreichere Datenvolumina unterstützt und mehr Connectivity-Möglichkeiten bietet. Überdies ermöglicht Wrangler-Edge die Bereitstellung in der Cloud und vor Ort sowie die Planung und Operationalisierung von Wrangling-Workflows.

„Es ist unglaublich, in welchem Maße die Verbreitung von Wrangler in den letzten 12 Monaten zugenommen hat“, schwärmt Adam Wilson, CEO vonTrifacta. „Mit Wrangler-Edge bieten wir unseren Kunden, die das kostenlose Einbenutzerprodukt nutzen, einen logischen Upgrade-Pfad. Teams und Abteilungen ermöglicht Wrangler-Edge die gemeinsame Aufbereitung größerer und komplexerer Datasets. Mit Wrangler-Edge haben wir auch eine Antwort auf die Anforderungen jener Kunden, die großen Wert auf die Funktionsvielfalt unserer Enterprise-Edition legen, jedoch nicht über Hadoop oder einen Enterprise-Data-Lake verfügen.“

Mit Wrangler-Edge erweitert Trifacta die bereits vorhandenen Editionen Wrangler und Wrangler-Enterprise um umfassende, auf die unterschiedlichen Skalierungs- und Bereitstellungsanforderungen von Unternehmen zugeschnittene Data-Wrangling-Lösungen:

  • Wrangler : Ein Nutzer kann gleich loslegen und verschiedenartige Dateien kostenlos auf seinem Desktop aufbereiten.
  • Wrangler-Edge : Analystenteams können hunderte Gigabytes an Daten aus unterschiedlichen Quellen gemeinsam aufbereiten.
  • Wrangler-Enterprise: Ermöglicht Organisationen grenzenlose Skalierbarkeit, zentrale Daten-Administration und -Governance, während die Daten zwecks  Nutzung im gesamten Unternehmen verfeinert werden.

Trifactas innovativer Ansatz zur Datenaufbereitung kommt in jeder Umgebung zum Tragen, unabhängig davon, um welche Wrangler-Edition es sich handelt. Der Ansatz spiegelt sich in einem durchgängigen, von Machine-Learning getriebenen Nutzererlebnis wider. Das maschinelle Lernen ermöglicht die Automatisierung vieler komplexer und sich wiederholender Arbeitsschritte und gewährleist die Eignung der Daten für Analysezwecke. Ferner gewährleistet Trifactas intelligente Ausführungsarchitektur, dass die in einer Edition entwickelten Data-Wrangling-Rezepte auch in den anderen Editionen funktionieren. Dies gibt Unternehmen die Möglichkeit, erst einmal klein anzufangen und mit zunehmender Datenmanagementerfahrung die Nutzung von Trifacta ausweiten.

Die Ursprünge von Trifacta gehen auf ein gemeinsames Forschungsprojekt von Stanford und der University of California in Berkeley zurück. Damals wurde das erste Self-Service-Tool zur Datenaufbereitung entwickelt (siehe DataWrangler) . Seitdem hat Trifacta seinen Fokus darauf gelegt, Kunden die beste Data-Wrangling-Lösung anzubieten, unabhängig von Form, Größe und Standort der Daten. Mit Wrangler-Edge lässt sich den Herausforderungen, vor denen Teams und Abteilungen bei der gemeinsamen Aufbereitung von Daten stehen, untzer anderem die Aufbereitung unterschiedlicher Datenquellen außerhalb eines Hadoop-Datensees, noch wirksamer begegnen. Analysten, die mit Daten in Flatfiles, Tabellen, Datenbanken oder verschiedenen Systemen arbeiten und die nicht die Ressourcen von Plattformen für Parallelverarbeitung benötigen, verfügen mit Wrangler Edge über eine intuitive Data-Wrangling-Lösung.

Die wichtigsten Features von Wrangler-Edge:

  • Beschleunigte Datenaufbereitung dank Trifactas Nutzererfahrung durch die einmalige Kombination von Datenvisualisierung, Machine-Learning und Mensch-Computer-Interaktion.
  • Sichtbarkeit und nahtlose Zusammenarbeit zwischen Teams durch Nutzung einer gemeinsamen Plattform zur Datenaufbereitung.
  • Zahlreiche Bereitstellungsoptionen, sowohl in der Cloud als auch vor Ort.
  •  Entwicklung und Umsetzung von Data-Wrangling-Rezepten mit wenigen Handgriffen durch In-Memory-Verarbeitung powered by Photon.
  • Verbindung mit mehreren Datenformaten, Datenbanken und Analysetools und Publizieren der aufbereiteten Datasets.
  • Automatisierung von Datenaufbereitungsabläufen, die sich auf viele Datasets und Rezepte erstrecken, um konsistente und wiederholbare Ergebnisse zu gewährleisten.
  •  Publizieren der Datenaufbereitungsergebnisse zur interaktiven Visualisierung der Daten in Best-of-Breed-Lösungen von Tableau und Qlik.