Einfluss von Jailbreaking auf KI-basierte Chatbots

Chris Vaughan, AVP of Technical Account Management, EMEA bei Tanium

Slashnext, das Cybersicherheitsunternehmen, das hinter der Enttarnung von WormGPT steht, hat einen neuen Blogpost veröffentlicht. Dieser gibt Aufschluss über Strategien von Cyberkriminellen, die beliebte KI-Chatbots wie ChatGPT „jailbreaken“. Darunter versteht man Taktiken, mit denen die Sicherheitsgrenzen umgangen werden, die Unternehmen ihren Chatbots auferlegen. Ein Kommentar von Chris Vaughan, VP Technical Account Management bei Tanium.

Slashnext-Forscher haben herausgefunden, dass Cyberkriminelle ihre erfolgreichen Jailbreaks nicht nur in Diskussionsforen teilen, um sie für andere zugänglich zu machen. Stattdessen werben Entwickler auch für KI-Bots, die für kriminelle Zwecke verwendet werden können. Sie behaupten, es handele sich dabei um benutzerdefinierte Sprachmodelle (LLMs). Slashnext hat bestätigt, dass dies in den meisten Fällen nicht zutrifft, sondern dass es um Jailbroken-Versionen von öffentlichen Chatbots wie ChatGPT geht. Dazu gehören Tools wie EscapeGPT, BadGPT, DarkGPT und Black Hat GPT. Der Vorteil für Cyberkriminelle, die eines dieser Tools verwenden, anstatt ChatGPT selbst zu jailbreaken, besteht darin, dass ihre Identitäten völlig anonym bleiben.

„Jailbreaking“ und die Nutzung von generativer KI für eine gesteigerte Effektivität von Phishing genießen derzeit einen interessanten Hype. Noch gibt es allerdings kaum Anzeichen dafür, dass sie wirklich eine signifikante Neuerung darstellen. Zwar gibt es sicherlich Vorteile für Nicht-Muttersprachler bei der Erstellung besserer Phishing-Texte oder für unerfahrene Programmierer, die Malware schneller zusammenhacken können, aber nichts deutet darauf hin, dass professionelle Cyber-Kriminelle einen Vorteil aus der KI ziehen. Die Verkäufer profitieren davon, dass die Käufer nicht ausreichend recherchieren und auf attraktiv klingende Angebote hereinfallen.

Beim Thema „jailbroken“ LLMs dachte ich zuerst daran, dass bösartige Akteure die KI-gesteuerten Chatbots kompromittieren könnten, die auf legitimen Websites allgegenwärtig sind. Dies würde für mich eine größere Gefahr für den normalen Verbraucher darstellen als eine Phishing-E-Mail mit verbesserter Grammatik. Das soll nicht heißen, dass KI im Stil von GPT keine Bedrohung darstellt. Vielmehr haben wir noch nicht herausgefunden, worin diese Bedrohung genau besteht. Durch die gesteigerte Aufmerksamkeit wird die Zukunft der KI im Bereich der Cybersicherheit genau unter die Lupe genommen werden. So können hoffentlich die schwerwiegenderen Schwachstellen geschlossen werden, bevor sie jemals ausgenutzt werden.

#Tanium

Tags:Chatbot ChatGPT Cyber-Kriminelle Cybersecurity Cybersicherheit generative KI IT-Security Jailbreak Jailbreaking KI-Bot LLM Phishing Security Slashnex Sprachmodel Tanium

Einfluss von Jailbreaking auf KI-basierte Chatbots

Über 1000 Infografiken

Backgrounder zu Cybercrime

Wissenswertes zu Blockchain

Die interessantesten und größten Videowalls

Wissenswertes zu Social-Media

Just for fun

Partner von Netzpalaver

Netzpalaver-Podcasts

Paessler-Podcast

Einfluss von Jailbreaking auf KI-basierte Chatbots

Weitere interessante Beiträge

Cybersicherheit als KI-natives Verteidigungssystem

Warum KI-gestützte Schwachstellensuche das Patchen unter Druck setzt

Veeam erhält 2026 die „Great Place To Work Certification“ in 25 Ländern

Wachsendes Risiko für europäische Unternehmen durch beschleunigte KI-Adaption

Statements zum AI-Appreciation-Day von Boomi, Getronics, Ping Identity, Nexis, Omada Identity und Veeam

KI-Sicherheit erfordert kontinuierliches Red-Teaming

Über 1000 Infografiken

Backgrounder zu Cybercrime

Wissenswertes zu Blockchain

Die interessantesten und größten Videowalls

Wissenswertes zu Social-Media

Just for fun

Partner von Netzpalaver

Netzpalaver-Podcasts

Paessler-Podcast

Tag Cloud

Das IT- und Social-Media-Portal