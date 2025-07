Lecture Zen Résumer l'article

Fusion d’Operator et de Deep Research, ChatGPT Agent prend la forme d’une fenêtre dans une conversation ChatGPT. À l’intérieur, on voit différentes applications faire des choses automatiquement, comme un navigateur web ou un tableur. ChatGPT Agent explique à son utilisateur ce qu’il fait et peut lui demander d’intervenir, pour entrer des identifiants privés par exemple.

Après la révolution ChatGPT en 2022, la révolution ChatGPT Agent en 2025 ?

Jeudi 17 juillet, OpenAI a dévoilé une nouveauté majeure sur le secteur de l’intelligence artificielle générative : il va intégrer à son chatbot un mini-PC virtuel capable de faire des choses à votre place. Son concept est assez simple : dites à ChatGPT d’aller réserver vos vacances après avoir vérifié votre calendrier et contrôlé votre budget, il le fera en se connectant à des sites de comparaison, à votre compte en banque et en créant des documents de suivi. L’outil peut vous soliciter de temps en temps pour vous demander une confirmation ou un mot de passe mais est conçu pour être autonome.

ChatGPT Agent remplace Operator, le navigateur web expérimental intégré à ChatGPT depuis le début de l’année 2025. L’entreprise explique à Numerama avoir fusionné ses équipes Operator et Deep Research (son modèle qui fait de longues recherches) pour concevoir ce nouvel outil amené à révolutionner l’informatique moderne. ChatGPT Agent est disponible dès aujourd’hui pour les abonnés Pro et Plus, mais arrivera avec du retard dans l’Union européenne.

ChatGPT Agent : le début de la fin pour les navigateurs web ?

ChatGPT Agent est présenté comme un « agent universel » capable d’effectuer des tâches précieuses pour l’utilisateur.

Accessible en permanence depuis la vue principale à la manière de Deep Research, ou déclenchable avec la commande « /agent », il génère une fenêtre dans laquelle il se passe des choses. On voit ChatGPT déplacer le curseur de la souris et lancer des applications, avec du texte qui indique à l’écran ce qu’il est en train de faire.

Ici, ChatGPT navigue sur Internet et fait bouger la souris tout seul. En haut à droite, il indique à son utilisateur ce qu’il fait. // Source : OpenAI

Par rapport au mode Deep Research, qui se contentait de longues recherches synthétisées dans un seul document, ChatGPT Agent dispose de nombreux outils. Il peut aller explorer le web évidemment, mais aussi créer des fichiers, se connecter à des comptes, contrôler un terminal, générer des diaporamas, etc.

Une de ses particularités est de ne pas dépendre des extensions déjà disponibles dans ChatGPT (Google et Microsoft par exemple) et de pouvoir se connecter à n’importe quel site. Quand il a besoin d’un identifiant et d’un mot de passe, il laisse la main à son utilisateur. OpenAI explique à Numerama avoir conçu ChatGPT Agent pour qu’il ne fasse pas tout tout seul et demande à son utilisateur ce qu’il souhaite. Autre particularité : un curseur permet de remonter dans le temps pour voir tout ce que ChatGPT a fait. On peut ainsi comprendre tout son raisonnement.

En bas, la barre permet de choisir entre l’action en direct et le replay. // Source : OpenAI

Parmi les exemples montrés à Numerama par OpenAI : faire du shopping, remplir des formulaires compliqués (coucou les impôts), faire des réservations, vérifier son calendrier et trouver des disponibilités pour des restaurants, organiser un emploi du temps, compléter un document avec des données issues du web, etc. Il est évidemment possible de demander à ChatGPT Agent de faire plusieurs choses en même temps : il agit alors en tant que super Deep Research.

Laisser une IA contrôler ses données personnelles : une nouvelle ligne franchie ?

Évidemment, la question de la sécurité se pose. Avec ChatGPT Agent, OpenAI dévoile sa vision du futur : les ordinateurs vont s’automatiser. Une des prochaines étapes pourrait être le lancement d’un navigateur avec l’outil intégré, avant d’aller encore plus loin avec une nouvelle machine sans équivalent.

Pour rassurer sur ses intentions, OpenAI fait plusieurs promesses :

L’interaction est conçue pour être collaborative, comme si vous travailliez avec une personne. L’agent vous sollicite à chaque fois qu’il doit faire quelque chose d’important et peut être interrompu à tout moment. Il n’est pas conçu pour vous remplacer.

Quand il faut saisir un mot de passe, OpenAI laisse l’utilisateur contrôler l’ordinateur virtuel. ChatGPT n’enregistre pas ce que vous écrivez et ne fait pas de capture d’écran.

La fenêtre d’aperçu offre une transparence totale à l’utilisateur. Contrairement à Deep Research, ChatGPT Agent ne se contente pas d’un résumé de ce qu’il a fait : il le montre en temps réel.

Avant d’entreprendre des actions critiques (comme soumettre des formulaires ou effectuer un achat), l’agent demandera toujours une confirmation à l’utilisateur.

L’agent refusera d’effectuer une large catégorie de tâches définies par la politique d’OpenAI, incluant des actions nuisibles.

ChatGPT Agent n’a pas de mémoire. Contrairement au reste de ChatGPT, il ne se souvient pas de ce qu’il a fait dans de précédentes sessions (en tout cas au lancement).

Enfin, OpenAI a mis en place des mesures pour détecter l’injection de prompt malveillant, noter la fiabilité d’un site ou ne pas naviguer de lui-même sur des sites trop sensibles (messageries, banques…). Il indique que le taux d’hallucination est extrêmement faible avec ce mode.

Une souris dans ChatGPT : vous ne rêvez pas. // Source : OpenAI

Quand arrivera ChatGPT Agent dans l’Union européenne ? Nos interlocuteurs chez OpenAI expliquent que son lancement décalé n’est que provisoire, le temps de vérifier la légalité du système. Assez rapidement, l’outil devrait faire son apparition en France. Il est d’ores et déjà disponible aux États-Unis, en Suisse ou au Royaume-Uni (et avec un VPN). Prochaine étape pour l’entreprise : dévoiler le tant attendu GPT-5.

