Databricks stellt die Ergebnisse seines „2023 State of Data + AI Reports“ vor, der Aufschluss über die kommerzielle Nutzung von Large-Language-Models (LLM) gibt. Er basiert auf anonymisierten Informationen von mehr als 9000 Kunden. Demnach ist die Anzahl der SaaS-LLMs-Nutzungen (wie ChatGPT) zwischen November 2022 und Mai 2023 um beeindruckende 1310 Prozent gestiegen. Transformer-bezogene Bibliotheken, wie HuggingFace, wuchsen im gleichen Zeitraum um 82 Prozent.
Der beliebteste der untersuchten Anwendungsfälle ist das Naturale-Language-Processing (NLP), ein schnell wachsender Bereich, der es Unternehmen ermöglicht, aus unstrukturierten Textdaten einen Nutzen zu ziehen. Dies eröffnet den Nutzern die Möglichkeit, Aufgaben zu erfüllen, die bisher zu abstrakt für Code waren, z. B. das Zusammenfassen von Inhalten oder das Extrahieren von Stimmungen aus Kundenrezensionen. In dem untersuchten Datensätzen sind 49 Prozent der verwendeten Bibliotheken mit NLP verbunden. LLMs fallen ebenfalls in diesen Bereich. Angesichts der in den letzten Monaten auf den Markt gebrachten Innovationen deuten die Ergebnisse darauf hin, dass NLP in den kommenden Jahren noch mehr an Bedeutung gewinnen wird, da sie unterschiedlich eingesetzt werden können, wie in Chatbots, zur Forschungsunterstützung, Betrugserkennung, Inhaltserstellung und weitere Möglichkeiten.
Die wichtigsten Ergebnisse:
- Die Nutzung von LLMs in Unternehmen steigt: Die Zahl der Lakehouse-Kunden, die SaaS-LLMs nutzen, ist zwischen Ende November 2022 und Anfang Mai 2023 um 1310 Prozent gestiegen. Im Gegensatz dazu wuchs die Zahl der Bibliotheken im gleichen Zeitraum um 82 Prozent.
- Die ML-Nutzung wächst und wird effizienter: Unternehmen setzen mehr LLMs in der Produktion ein, nämlich mit einem Wachstum um 411 Prozent im Jahresvergleich, während sie gleichzeitig ihre ML-Experimente ausweiten. Hier liegt das Wachstum bei 54 Prozent im Jahresvergleich.
- Am schnellsten wachsende und beliebteste Daten- und KI-Produkte: Open-Source-Produkte dominieren den Daten- und KI-Markt. 8 von 10 der am weitesten verbreiteten Daten- und KI-Produkte von Databricks basieren auf Open Source. Microsoft Power BI ist das beliebteste Daten- und KI-Produkt des Jahres 2023, gefolgt von Databricks Lakehouse, das auf Platz 7 rangiert. Das Open-Source-Produkt Hugging Face demokratisiert KI mit seiner NLP-Bibliothek, die trainierte Modelle für eine Vielzahl von Aufgaben bereitstellt. Das am schnellsten wachsende Daten- und KI-Produkt ist dbt, das gemessen an der Zahl der Kunden um 206 Prozent zulegte.
Methodologie: Der 2023 State of Data + AI Report basiert auf den aggregierten und anonymisierten Daten, die von Databricks-Kunden erhoben wurden. Diese Informationen entstammen den Lakehouse-Architekturen und den Technologie-Ökosystemen dieser Unternehmen. Der Report untersucht die Adaption von maschinellem Lernen, die Daten-Architektur (Integrationen und Migrationen) sowie die Anwendungsfälle. Die untersuchten Unternehmen stammen aus den wichtigsten Branchen, darunter Startups und Großkonzerne. Die Daten wurden im Zeitraum Februar 2022 bis Januar 2023 erhoben.
#Databricks