OpenAI présentait ce 7 août 2025 GPT-5, son nouveau modèle de langage de pointe. Sauf que les graphiques appuyant ses performances n’étaient pas tout à fait à l’échelle : l’entreprise s’est fait épingler sur les réseaux sociaux.

OpenAI a franchi une nouvelle étape dans son histoire avec GPT-5, son nouveau grand modèle de langage. Il est déjà disponible sur ChatGPT, depuis le 7 août 2025, et tout le monde peut l’essayer. L’entreprise présente GPT-5 comme une avancée vers l’intelligence artificielle générale, bien meilleure que ses précédents modèles. Durant la présentation, les employés d’OpenAI ont multiplié les graphiques pour montrer les performances de GPT-5. Cependant, certains d’entre eux étaient trompeurs.

Les graphiques d’OpenAI sont bons, mais pas à l’échelle

OpenAI n’est pas accusée d’avoir donné de fausses informations, mais de les avoir données de manière trompeuse. La première erreur se trouve à la cinquième minute de la conférence. OpenAI détaille les performances de GPT-5 en matière de développement informatique, et ce, dans plusieurs langages de programmation. Les graphiques comparent GPT-5 à GPT-o3 et GPT-4o, mais les pourcentages ne sont pas à l’échelle. Ce qui avantage grandement GPT-5, si l’on ne regarde pas de près les graphiques.

OpenAI n'a pas respecté les échelles de ses graphiques, ce qui l'arrange bien // Source : Capture Numerama
OpenAI n’a pas respecté les échelles de ses graphiques, ce qui l’arrange bien. // Source : Capture Numerama

Sur ce même graphique, les scores d’o3 et de 4o sont très différents (69,1% pour l’un, 30,8% pour l’autre). Sauf que les rectangles qui correspondent à ces chiffres sont de taille égale. Une autre erreur d’inattention d’OpenAI.

Dans un autre graphique, ce n’est pas un souci d’échelle, mais bien une faute totale. OpenAI compare les erreurs entre modèles et GPT-5 (avec réflexion) obtient un taux de « tromperie » de 50 %. Un chiffre comparé avec le score d’o3, de 47,4% ; néanmoins, la barre correspondante sur le graphique est plus grande que celle de GPT-5. Le taux d’erreur de GPT-5 est en réalité de 16,5 %.

OpenAI s’excuse et corrige le tir

Des problèmes qu’on ne constate que dans la conférence diffusée en direct par OpenAI sur YouTube. Sur le billet de blog qui présente GPT-5, on trouve les mêmes graphiques, avec le respect des échelles. Peut-être les chargés de la présentation ont-ils fait faire les graphiques à ChatGPT, mais n’ont pas relu suffisamment les diapositives avant de les envoyer. OpenAI n’a pas fait de communiqué officiel pour réagir.

Sur X, Sam Altman a rapidement répondu aux critiques en reconnaissant ces erreurs, rappelant que les graphiques sont corrects sur le blog d’OpenAI. Même chose du côté d’un responsable marketing d’OpenAI, Pranav Deshpande : « Toutes nos excuses pour le crime de graphique involontaire. »

Découvrez les bonus

+ rapide, + pratique, + exclusif

Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.

Découvrez les nombreux avantages de Numerama+.

S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+
Toute l'actu tech en un clien d'oeil

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !


Pour de l’actu en petit comité, rejoignez la communauté Numerama sur WhatsApp !