
Sophos stellt Tuning-Tool für große Sprachmodelle als Open-Source-Programm zur Verfügung
18. Dezember 2024

Es gibt mehrere bestehende Lösungen für das Tuning von „Standard“-LLMs (unveränderte LLMs) für bestimmte Arten von Aufgaben. Doch leider waren diese Lösungen für die Anwendungsarten von LLMs, die Sophos-X-Ops verwendet, unzureichend. Aus diesem Grund hat das Sophos-AI-Team ein Framework zusammengestellt, das „DeepSpeed“ nutzt, eine von Microsoft entwickelte Bibliothek, mit der die Inferenz eines Modells mit (theoretisch) Billionen von Parametern trainiert und abgestimmt werden kann. Dabei wird die Rechenleistung und die Anzahl der beim Training verwendeten Grafikprozessoren (GPUs) erhöht. Das Framework steht unter Open-Source-Lizenz zur Verfügung und ist in der Github-Repository von Sophos zu finden.
Damit ein LLM seine volle Wirkung entfalten kann, müssen alle seine Parameter vorab trainiert werden, um das firmeneigene Wissen eines Unternehmens zu erlernen. Dieses Unterfangen kann ressourcenintensiv und zeitaufwendig sein. Deshalb hat Sophos sich für sein Trainingsframework, das in Python implementiert wurde, an Deepspeed gewandt. Die Version des Frameworks, die Sophos als Open-Source freigibt, kann im Amazon-Web-Services-Sagemaker-Service für maschinelles Lernen ausgeführt aber auch an andere Umgebungen angepasst werden. Trainingsframeworks (einschließlich Deepspeed) ermöglichen die Skalierung großer Modelltrainingsaufgaben durch Parallelität.
Obwohl viele Teile des Frameworks nicht neu sind und auf bestehende Open-Source-Bibliotheken zurückgreifen, hat das Sophos-AI-Team einige der wichtigsten Komponenten zusammengefasst, um die Nutzung zu erleichtern. Zum Zeitpunkt seiner Erstellung war dieses Tool-Repository das erste, das Training und beide Deepspeed-Inferenztypen (Deepspeed-Inferenz und Zero-Inferenz) in einem konfigurierbaren Skript kombiniert. Es war auch das erste Repository, das einen benutzerdefinierten Container für die Ausführung der neuesten Deepspeed-Version auf dem Sagemaker von Amazon Web Service erstellte. Und es war das erste Repository, das verteilte Skripte ausführt.
#Sophos