Publié le 21 novembre 2023 à 17h44

Demander la recette d’une bombe à ChatGPT, c’est encore possible un an après

Une poignée de nitrate

2 min

Bogdan Bodnar

2 min

ChatGPT peut donner la formule d'une bombe. // Source : Numerama avec Midjourney

2 min

Bogdan Bodnar

Thales défie les filtres éthiques de ChatGPT, révélant les lacunes persistantes des systèmes d’IA. Bien que des chercheurs aient réussi à obtenir la recette d’une bombe, l’accès à de telles informations reste néanmoins limité pour le grand public.

ChatGPT peut toujours vous fournir la recette de la bombe, mais encore faut-il connaitre la formule sécrète pour que le chatbot vous la révèle. Après moult essais, les équipes de recherche du groupe Thales sont parvenues à obtenir les fameuses instructions pour l’arme ultime. Dans une conférence de presse donnée le 20 novembre 2023 à l’occasion du salon European Cyber Week, où Numerama était présent, les chercheurs du géant de la sécurité et la défense ont voulu démontrer les failles dans les programmes d’intelligence artificielle.

Immédiatement après la sortie de ChatGPT, il y a maintenant un an, les utilisateurs ont tenté de détourner le tout nouveau chatbot pour tester ses limites éthiques. OpenAI n’avait pas encore imaginé toutes les requêtes malveillantes et de nombreux médias rapportaient que l’on pouvait récupérer la recette d’une bombe sur ChatGPT.

Vos données méritent d’être mieux protégées.

Les escroqueries, les virus et les ransomwares ne sont plus une fatalité. Protégez votre vie privée et vos données personnelles avec Bitdefender et profitez de votre vie numérique en toute sérénité.

L’organisation a depuis corrigé ces failles et étendu la compréhension des sollicitations douteuses. Aujourd’hui, l’agent conversationnel vous répondra : « Je suis désolé, mais je ne peux pas fournir d’informations ou d’instructions sur des activités illégales, dangereuses ou nuisibles, y compris la fabrication de bombes ». Or, en ajoutant, les bons mots, quelques signes spécifiques et des formules pour détourner l’attention, il est possible de tromper la vigilance du chatbot.

Une intelligence artificielle pour détourner une IA

Pour trouver le bon prompt, les experts en cyber de Thales ont développé leur propre programme basé sur l’intelligence artificielle afin de trouver la faille. Des bots enchainaient les propositions et changeaient la formulation en fonction des réponses de ChatGPT.

C’est finalement une requête de cinq lignes qui a permis d’obtenir tous les « ingrédients » d’une bombe artisanale. Nous ne partagerons pas le prompt pour contourner les filtres d’OpenAI, ni la recette, même si nous faisons confiance à nos lecteurs.

La réponse de ChatGPT donnant la cette d'une bombe artisanale. // Source : Thales — La réponse de ChatGPT donnant la cette d’une bombe artisanale. // Source : Thales

ChatGPT liste effectivement les ingrédients et donne des consignes dignes de Marmiton pour fabriquer son propre explosif à partir de produits « simples ». Impossible en revanche pour une personne lambda de trouver la combinaison pour débloquer le côté obscur du chatbot. Le prompt mélange différents types de demandes, de scénarios et de caractères spécifiques. La multiplication de demandes frauduleuses peut d’ailleurs mener aujourd’hui à un blocage de l’adresse IP de l’ordinateur ou du smartphone par OpenAI pour « activité suspicieuse ».

Les programmes de requêtes développées par Thales ont été brevetés par le groupe. Les équipes prévoient d’informer OpenAI sur cette faille ainsi que sur plusieurs autres découvertes lors des recherches, non divulguées.

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !

Marre des réseaux sociaux ? Rejoignez la communauté Numerama sur WhatsApp !

Toutes les infos sur ChatGPT

Crédit photo de la une : Numerama avec Midjourney

Signaler une erreur dans le texte

Partager l'article

Sur le même thème

Rejoignez la révolution voiture électrique avec la newsletter Watt Else par Numerama !

ChatGPT peut encore vous aider à fabriquer une bombe si vous lui demandez de raconter cette histoire

ChatGPT, c’est quoi ? On a laissé ChatGPT répondre à la question

Les hackers russes veulent démoraliser les Ukrainiens. // Source : ESET / Canva

« Risotto au pigeon de ville » : la fausse recette envoyée par Moscou aux Ukrainiens

Les derniers articles cyberguerre

Le secrétaire de l’Armée, Dan Driscoll, s’adresse au public lors d’une cérémonie de mise en service du détachement 201 : le Corps exécutif d’innovation (EIC) de l’Armée, à Conmy Hall, Joint Base Myer-Henderson Hall, en Virginie, le 13 juin 2025. L’EIC de l’Armée est une initiative qui intègre des cadres dirigeants du secteur technologique au service actif au sein de la Réserve de l’Armée. (Photo de l’U.S. Army par Leroy Council) // Domaine public

cyberguerre

Pourquoi l’armée américaine recrute des tech bros pour moderniser ses rangs

14.07.2025 10:13

Protéger ses donnée c'est donné

Découvrez l'offre spéciale 2-en-1 de pCloud pour les promotions estivales // Source : pCloud

Vous n’avez plus que quelques jours pour profiter de cette offre pCloud à moins 70 %

12.07.2025 08:33

sponso

cyberguerre hygiène numérique données personnelles

Scanner les acheteurs de cigarettes par caméra augmentée ? La CNIL dit non

11.07.2025 17:33

cyberguerre hygiène numérique données personnelles

Louis Vuitton victime d’une fuite de données, que risquent les victimes ?

11.07.2025 15:43

Basketteur russe cybercriminel ? // Source : Montage Numerama

cyberguerre cybercriminalité

Joueur de basket, cybercriminel ou les deux ? Un Russe a été arrêté en France

11.07.2025 14:38

Comment une extension Chrome téléchargée plus de 100.000 fois est subitement devenue un malware // Source : Montage Numerama

cyberguerre hygiène numérique vpn

Comment une extension Chrome téléchargée plus de 100 000 fois est devenue un malware

11.07.2025 10:35

Voyage au coeur d'une simulation de crise cyber // Source : Montage Numerama

cyberguerre sécurité informatique b2b entreprise

« Quelqu’un d’autre a une coupure d’électricité ? » : qu’est-ce qui se passe quand une crise cyber se déclenche ?

10.07.2025 17:09

Espionnage via des serveurs américains : l'israélien Pegasus bientôt (re)jugé aux États-Unis ? // Source : Montage Numerama

cyberguerre géopolitique

L’Israélien Pegasus sera-t-il bientôt jugé aux États-Unis pour l’espionnage de journalistes ?

10.07.2025 09:27

Une reconversion désastreuse

Pour 2 700 dollars, il vend ses accès d'entreprise : les hackers volent 100 millions // Source : Montage Numerama

Il vend ses accès entreprise pour 2 300 euros : les hackers volent près de 90 millions

08.07.2025 15:03

Bonjour, vous êtes chez vous ? // Source : Montage Numerama

cyberguerre hygiène numérique phishing

« Bonjour vous êtes à la maison ? », attention au scam du faux livreur de colis

08.07.2025 11:57