Generative KI-Anwendungen in Produktionsqualität effizient aufbauen und dabei die Kontrolle über die Daten behalten

Databricks präsentiert DBRX, ein General-Purpose-Large-Language-Model (LLM). DBRX ermöglicht Organisationen generative KI-Anwendungen in Produktionsqualität effizient aufzubauen und gibt ihnen die Kontrolle über ihre Daten. Dabei soll nach Standard-Benchmarks DBRX besser abschneiden als alle anderen verfügbaren Open Source-Modelle.

„Bei Databricks teilen wir schon immer die Vision, Daten und KI zu demokratisieren. Wir tun dies, indem wir Datenintelligenz für jedes Unternehmen bereitstellen, was ihnen dabei hilft, ihre eigenen Daten zu verstehen und zu nutzen, um ihre eigenen KI-Systeme aufzubauen. DBRX ist das Ergebnis dieses Ziels,” erklärt Ali Ghodsi Co-Gründer und CEO von Databricks. „Wir freuen uns über DBRX aus drei zentralen Gründen: Erstens, es schlägt Open-Source-Modelle nach modernen Industrie-Benchmarks. Zweitens, es schlägt GPT-3.5 nach den meisten Benchmarks, was den Trend beschleunigen sollte, den wir über unsere Kunden hinweg beobachten: Organisationen ersetzen proprietäre Modelle mit Open-Source-Modellen. Und zu guter Letzt nutzt DBRX eine „Mixture-of-Experts“-Architektur, was dazu führt, dass das Modell sehr schnell ist, wenn man die Tokens per Sekunde als Maßstab nimmt. Darüber hinaus ist es kostengünstig zu betreiben. Insgesamt gesehen, setzt DBRX neue Standards für Open-Source-LLMs. Sie gibt Unternehmen eine Plattform, um maßgeschneiderte Schlussfolgerungen auf der Grundlage ihrer eigenen Daten zu treffen.“

 

DBRX übertrifft Open-Source-Modelle über Industrie-Benchmarks hinweg

DBRX schlägt nach Industriestandards bestehende Open-Source LLMs wie „Llama 2 70B“ und „Mxtral-8x7B“ in den Bereichen Sprachverständnis, Programmierung, Mathematik und Logik.

DBRX übertrifft die etablierten Open-Source-Modelle in den Bereichen Sprachverständnis (MMLU), Programmierung (HumanEval) und Mathematik (GSM8K). (Quelle: Databricks 2024)

 

DBRX übertrifft auch GPT-3.5 bei relevanten Benchmarks.

DBRX übertrifft GPT 3.5 in den Bereichen Sprachverständnis (MMLU), Programmierung (HumanEval) und Mathematik (GSM8K). (Quelle: Databricks 2024)

Für einen kompletten Einblick in die Modell-Bewertungen und Performance-Benchmarks und um zu vergleichen, wie konkurrenzfähig DBRX gegen GPT-4 bei der Qualität von internen Anwendungsfällen wie SQL ist, lässt sich auf dem Mosaic-Research-Technical-Blog verifizieren.

 

DBRX setzt neue Standards für effiziente Open-Source-LLMs

DBRX wurde von Mosaic AI entwickelt und auf Nvidia-DGX-Cloud trainiert. Databricks optimiert DBRX für Effizienz und mit einer Mixture-of-Experts (MoE) -Architektur baut es auf dem Megablocks-Open-Source-Projekt auf. Das daraus resultierende Modell verfügt über Spitzenleistung und ist zweimal so Compute-effizient wie andere verfügbare führende LLMs.

DBRX setzt einen neuen Standard für Open-Source-Modelle und ermöglicht anpassbare und transparente generative KI für alle Unternehmen. Eine aktuelle Umfrage von Andreessen Horowitz stellte fest, dass beinahe 60 Prozent aller KI-Führungskräfte an einer Steigerung der Open-Source-Nutzung interessiert sind oder umstellen, wenn die fein abgestimmten Open-Source-Modelle in etwa der Leistung der Closed-Source-Modelle entsprechen. 2024 und darüber hinaus erwarten Unternehmen einen starken Wandel bei der Nutzung von geschlossenen zu offenen Modellen. Databricks erwartet, dass DBRX diesen Trend beschleunigt.

 

Organisationen profitieren von unternehmenstauglichen Fähigkeiten mit DBRX auf der Data-Intelligence-Plattform

Gekoppelt mit den einheitlichen Werkzeugen von Databricks-Mosaic-AI, unterstützt DBRX Unternehmen dabei, generative KI-Anwendungen in Produktionsqualität schnell aufzubauen und auszurollen, die sich sicher, genau und ohne Kontrollverlust der eigenen Daten und geistigem Eigentum verwalten lassen. Unternehmen profitieren von KI-Anwendungen in Produktionsqualität mit eingebauten Datenmanagement, Governance-, Lineage- und Monitoring-Fähigkeiten auf der Databricks-Data-Intelligence-Plattform.

„Wir befinden uns an einem wichtigen Wendepunkt für KI, der eine Gemeinschaft von Forschern, Engineers und Technologen benötigt, um sie besser zu verstehen und sinnvolle Innovationen voranzutreiben. Deshalb engagiert sich unser Team bei AI2 sehr dafür, die Wissenschaft der generativen KI durch offene Modellentwicklung voranzubringen, und wir freuen uns darauf, neue Modelle wie DBRX zu sehen, die größere Transparenz, Zugänglichkeit und Zusammenarbeit in der Industrie ermöglicht,“ sagt Dirk Groeneveld, Principal Software Engineer beim Allen Institute for Artificial Intelligence (AI2).

„Unsere Forschung zeigt, dass Unternehmen die Hälfte ihrer KI-Budgets für generative KI ausgeben wollen,“ erläutert Dave Menninger, Executive Director, Ventana Research, Teil von ISG. „Eine der drei größten Herausforderungen, mit denen sie konfrontiert sind, ist die Datensicherheit und der Datenschutz. Mit ihrer Ende-zu-Ende-Data-Intelligence-Plattform und der Einführung von DBRX, versetzt Databricks Unternehmen in die Lage generative KI-Anwendungen aufzubauen, die verwaltet, abgesichert und auf den Kontext ihres Unternehmens zugeschnitten sind, während sie gleichzeitig die Kontrolle und das Eigentum an ihrem geistigen Eigentum behalten.“

DBRX ist auf Github und Hugging Face für die Forschung und den kommerziellen Gebrauch freigegeben. Ab sofort können Unternehmen DBRX auf der Databricks-Plattform aufrufen, seine langen Kontextfähigkeiten in den Retrieval-Augmented-Generation (RAG)-Systemen nutzen und auf ihren eigenen privaten Daten selbstgebaute DBRX-Modelle erstellen. DBRX ist auch auf AWS und Google-Cloud sowie direkt auf Microsoft-Azure über Azure-Databricks verfügbar. DBRX wird voraussichtlich auch über den Nvidia-API-Catalog verfügbar sein und von der Nvidia-NIM-Inference-Microservice unterstützt werden.

#Databricks