C’est un dialogue de sourds qui fait le tour du monde.
À gauche, Summer Yue, désormais directrice de l’AI Safety & Alignment chez Meta après un passage chez Google DeepMind et Scale AI. Pas le profil le plus simple à berner, donc.
À droite, OpenClaw, le framework open-source d’agents IA qui ne cesse de faire parler de lui, permettant d’automatiser des tâches complexes comme la gestion de mails.
À travers plusieurs captures d’écran partagées sur X le 23 février 2026, Summer Yue a publié sa discussion avec son agent IA, visiblement pris d’un brutal désalignement comportemental : il annonce supprimer l’ensemble des mails de sa boîte de réception n’étant pas sur sa keep list et datés d’avant le 15 février, alors même qu’il était initialement invité à confirmer toute action avant de s’exécuter.


Un couac après une phase de test
En commentaires, beaucoup s’interrogent : comment la responsable de l’alignement des IA chez Meta a-t-elle pu confier sa boîte mail à un agent autonome ? Si Summer Yue reconnaît une « rookie mistake », le déroulé de l’incident est plus complexe qu’une configuration maladroite de l’outil.
En réalité, Yue testait OpenClaw depuis des semaines sur une boîte de réception « test ». L’agent parvenait alors sans problème à trier et archiver les messages reçus, ce qui lui a donc inspiré confiance pour gérer son inbox principale.
Lors du passage vers sa vraie boîte Gmail, elle assure avoir explicitement indiqué : « Vérifie aussi cette boite de réception et suggère ce que tu archiverais ou supprimerais, n’agis pas sans mon ordre ».
Problème : selon les premières hypothèses de l’experte, la boîte réelle, trop volumineuse, a déclenché une compression qui a effacé l’instruction en mémoire. L’agent, interprétant alors son objectif comme « nettoyer l’inbox », a supprimé plus de 200 mails en bloc, ignorant les ordres répétés de s’arrêter, envoyés depuis son téléphone.
« J’ai veillé à supprimer toutes les instructions ‘sois proactif’ que j’avais pu trouver dans les fichiers .md avant que cela ne se produise. J’ai peut-être raté quelque chose, c’est ce que je n’ai pas encore compris », explique l’employée de Meta.
OpenClaw est scruté de près par les experts cybersécurité
Summer Yue a également expliqué n’avoir eu d’autre choix que d’employer la manière forte pour tuer le processus, la discussion sur son téléphone s’avérant impossible pour raisonner l’agent : « J’ai dû courir jusqu’à mon Mac mini, comme-ci je désamorçais une bombe. »
L’agent s’est (pour une fois) excusé après coup via son interface Telegram, reconnaissant la violation d’instruction et promettant que « ça n’arrivera plus ».
Reste que l’affaire ne va pas rassurer les experts en cybersécurité, qui appellent à une vigilance accrue lors de l’utilisation d’agents IA.
Meta a notamment interdit l’utilisation d’OpenClaw dans ses processus internes, rejoignant d’autres entreprises de la tech dans ce ban face aux risques d’accès non contrôlé.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Toute l'actu tech en un clin d'œil
Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !
Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer !












