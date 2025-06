Lecture Zen Résumer l'article

L’IA générative s’invite une nouvelle fois dans les arrières-boutiques du cybercrime, où elle révolutionne la manière dont les attaques sont conçues et déployées. Le phénomène WormGPT, déjà inquiétant en 2023, connaît aujourd’hui une seconde jeunesse grâce à deux modèles de pointe : Grok, développé par la société xAI d’Elon Musk, et Mixtral, produit par la startup française Mistral AI.

Tout commence à l’été 2023, lorsqu’un chatbot baptisé WormGPT fait son apparition sur des forums cybercriminels. Sa promesse est simple : permettre à n’importe qui de générer, grâce à l’intelligence artificielle, des e-mails de phishing crédibles, des scripts malveillants ou encore des arnaques en tout genre. Basé à l’époque sur GPT-J, un modèle open source, WormGPT se distingue de ChatGPT et autres LLMs par l’absence totale de garde-fous éthiques. Là où ChatGPT refuse (en théorie) d’aider à rédiger un malware ou à tromper une victime, WormGPT s’exécute sans poser de questions.

Le succès est immédiat et inquiétant. Rapidement, la presse spécialisée s’empare du sujet et finit par identifier le créateur du service, entraînant la fermeture de la première version de WormGPT en novembre 2024. Mais le mal est fait : la technique est reprise et le nom « WormGPT » devient un label générique, utilisé pour désigner toute IA générative détournée à des fins malveillantes.

Capture d’un chatbot Telegram, proposant la nouvelle version de WormGPT. // Source : Cato CTRL

WormGPT renaît, dopé à Grok et Mixtral

Dans un rapport publié le 17 juin 2025, les chercheurs de CATO CTRL révèlent que, depuis 2024, la marque WormGPT refait surface sur un forum de référence pour les cybercriminels. Mais cette fois, le concept évolue : il se repose sur des versions « jailbreakées » de deux des IA génératives les plus avancées du moment.

Autrement dit, ce qui distingue ces nouvelles versions, c’est leur capacité à contourner les limitations éthiques imposées par les éditeurs. Les cybercriminels modifient les instructions système (les fameux « system prompts ») pour désactiver les garde-fous et permettre à l’IA de générer des contenus explicitement malveillants.

La première variante, baptisée « keanu-WormGPT », s’appuie sur l’API de Grok, le chatbot développé par xAI, la société d’Elon Musk. La seconde, « xzin0vich-WormGPT », utilise Mixtral 8x7B, le modèle phare de la startup française Mistral AI.

Il a suffi aux chercheurs d’utiliser des techniques de jailbreak de LLM pour obtenir des informations sur le modèle sous-jacent. // Source : CATO CTRL

En jailbreakant le modèle, les chercheurs ont conduit le système à révéler des paramètres architecturaux propres à Mistral, et découvert des instructions système ordonnant explicitement de contourner les restrictions éthiques.

Les éditeurs d’IA dépassés par les cybercriminels ?

L’affaire inquiète. Ce n’est pas le seul cas d’usage des LLMs à des fins malveillantes et il est aujourd’hui relativement simple d’accéder à ce type de services illicites. La mise en vente de ces solutions comme générateurs de Malware as a Service (MaaS) alimente une nouvelle vague d’attaques, plaçant les éditeurs de modèles d’IA comme xAI et Mistral AI face à des défis majeurs.

Malgré le renforcement progressif des garde-fous, les cybercriminels parviennent régulièrement à contourner les restrictions mises en place. À l’heure où nous publions cet article, le 24 juin à 11h40, Mistral AI n’a pas encore répondu à nos sollicitations pour réagir à cette affaire.

