OpenAI a été malhonnête avec sa présentation de GPT-5

Résumé par IA, vérifié par Numerama

OpenAI a dévoilé son modèle de langage avancé GPT-5, disponible sur ChatGPT, affirmant des progrès vers l'intelligence artificielle générale.
Des erreurs d'échelle dans les graphiques de présentation ont conduit à des critiques, les pourcentages ne reflétant pas fidèlement les performances des modèles comparés.
En réponse aux critiques, OpenAI a corrigé les graphiques sur son blog et s'est excusée publiquement pour ces inexactitudes dans sa conférence.

Recevez tous les soirs un résumé de l’actu importante avec Le Récap’

OpenAI présentait ce 7 août 2025 GPT-5, son nouveau modèle de langage de pointe. Sauf que les graphiques appuyant ses performances n’étaient pas tout à fait à l’échelle : l’entreprise s’est fait épingler sur les réseaux sociaux.

OpenAI a franchi une nouvelle étape dans son histoire avec GPT-5, son nouveau grand modèle de langage. Il est déjà disponible sur ChatGPT, depuis le 7 août 2025, et tout le monde peut l’essayer. L’entreprise présente GPT-5 comme une avancée vers l’intelligence artificielle générale, bien meilleure que ses précédents modèles. Durant la présentation, les employés d’OpenAI ont multiplié les graphiques pour montrer les performances de GPT-5. Cependant, certains d’entre eux étaient trompeurs.

Les graphiques d’OpenAI sont bons, mais pas à l’échelle

OpenAI n’est pas accusée d’avoir donné de fausses informations, mais de les avoir données de manière trompeuse. La première erreur se trouve à la cinquième minute de la conférence. OpenAI détaille les performances de GPT-5 en matière de développement informatique, et ce, dans plusieurs langages de programmation. Les graphiques comparent GPT-5 à GPT-o3 et GPT-4o, mais les pourcentages ne sont pas à l’échelle. Ce qui avantage grandement GPT-5, si l’on ne regarde pas de près les graphiques.

OpenAI n'a pas respecté les échelles de ses graphiques, ce qui l'arrange bien // Source : Capture Numerama — OpenAI n’a pas respecté les échelles de ses graphiques, ce qui l’arrange bien. // Source : Capture Numerama

Sur ce même graphique, les scores d’o3 et de 4o sont très différents (69,1% pour l’un, 30,8% pour l’autre). Sauf que les rectangles qui correspondent à ces chiffres sont de taille égale. Une autre erreur d’inattention d’OpenAI.

who's making these graphs pic.twitter.com/Zt6yhZuUoo
— Shrey Kothari (@shreyk0) August 7, 2025

Dans un autre graphique, ce n’est pas un souci d’échelle, mais bien une faute totale. OpenAI compare les erreurs entre modèles et GPT-5 (avec réflexion) obtient un taux de « tromperie » de 50 %. Un chiffre comparé avec le score d’o3, de 47,4% ; néanmoins, la barre correspondante sur le graphique est plus grande que celle de GPT-5. Le taux d’erreur de GPT-5 est en réalité de 16,5 %.

OpenAI s’excuse et corrige le tir

Des problèmes qu’on ne constate que dans la conférence diffusée en direct par OpenAI sur YouTube. Sur le billet de blog qui présente GPT-5, on trouve les mêmes graphiques, avec le respect des échelles. Peut-être les chargés de la présentation ont-ils fait faire les graphiques à ChatGPT, mais n’ont pas relu suffisamment les diapositives avant de les envoyer. OpenAI n’a pas fait de communiqué officiel pour réagir.

Sur X, Sam Altman a rapidement répondu aux critiques en reconnaissant ces erreurs, rappelant que les graphiques sont corrects sur le blog d’OpenAI. Même chose du côté d’un responsable marketing d’OpenAI, Pranav Deshpande : « Toutes nos excuses pour le crime de graphique involontaire. »

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !

Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer !

Toutes les infos sur ChatGPT