Pour montrer les capacités de GPT-5, OpenAI a eu une idée : faire jouer son modèle d’IA à Pokémon Rouge. Il s’agit en fait surtout d’un affrontement avec Gemini et Claude, d’autres IA qui jouent également au jeu. Qui battra la Ligue Pokémon le plus rapidement ?

Ce 7 août 2025, OpenAI a présenté GPT-5, son nouveau grand modèle de langage. Il s’agit de la version la plus évoluée de GPT qu’on peut déjà essayer sur ChatGPT gratuitement. Pour OpenAI, c’est une évolution majeure de son modèle d’IA. Pour le prouver, l’entreprise a notamment décidé de le faire jouer à Pokémon Rouge en direct sur Twitch.

GPT-5 joue à Pokémon en direct sur Twitch

Depuis le lancement de GPT-5, OpenAI a lancé une chaîne Twitch avec un live en continu. L’entreprise avait déjà tenté l’expérience avec GPT-o3 il y a quelques mois. On y voit une partie de Pokémon Rouge/Bleu, mais ce n’est pas un humain qui joue. C’est GPT-5 qui tente d’arriver au bout du jeu, de capturer des Pokémon et de traverser la région de Kanto.

La chaîne Twitch GPT_Plays_Pokemon. // Source : Capture Numerama

Pour le moment, GPT-5 a collecté 4 badges d’arène (leur obtention est une étape clé dans le jeu) en 3 799 « étapes » (mouvements dans le jeu, que ce soit sur la carte ou dans les menus). L’obtention du quatrième badge avait nécessité plus de 10 000 étapes à o3, le progrès est donc significatif.

GPT-5 a obtenu quatre badges pour l’instant, en bien moins de temps qu’o3. // Source : Capture Numerama

OpenAI n’est pas la première entreprise d’IA à faire jouer son modèle à Pokémon. Chez la concurrence, on trouve Anthropic qui avait fait jouer Claude 3.5 Sonnet. Trois mois plus tard, rebelote avec Claude 4, un bien meilleur dresseur Pokémon. Google n’est pas en reste avec Gemini 2.5 Pro qui défie le jeu lui aussi. Des aventures systématiquement retransmises en direct sur Twitch, pour montrer au monde entier les prouesses de ces IA.

Comment une IA joue à Pokémon : OpenAI dit (presque) tout

Pour comprendre un peu plus comment GPT-5 analyse le jeu et « réfléchit », les développeurs d’OpenAI ont mis en place une page où l’on peut consulter des informations sur la réflexion de l’IA. Il y a, par exemple, un fil où GPT-5 reçoit des captures d’écran du jeu. À chaque mouvement à effectuer, il en reçoit une, ce qui lui permet d’analyser la situation et de réfléchir sur la meilleure action à réaliser et les touches à actionner.

Pour s’y retrouver dans sa partie, GPT-5 prend des notes. // Source : Capture Numerama

Mais le plus grand défi pour une IA comme celle-ci, c’est de se souvenir du chemin parcouru. Sans mémoire, l’IA pourrait finir par tourner sur elle-même pendant des dizaines d’heures : c’est ce qui était arrivé à Claude 3.5 Sonnet. Pour ça, GPT-5 prend des notes, qu’il garde en mémoire, comme les effets d’une attaque, l’emplacement d’un centre Pokémon, etc.

GPT-5 est l’heureux propriétaire d’un Dracaufeu niveau 44. // Source : Capture Numerama

OpenAI a également mis en place un système d’autocritique : GPT-5 génère un retour sur ses actions pour déterminer si elles étaient bonnes. Les développeurs ont d’ailleurs ajouté les prompts pour tous ces systèmes, de quoi comprendre comment faire jouer GPT-5 à Pokémon Rouge.

