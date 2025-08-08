OpenAI a franchi une nouvelle étape dans son histoire avec GPT-5, son nouveau grand modèle de langage. Il est déjà disponible sur ChatGPT, depuis le 7 août 2025, et tout le monde peut l’essayer. L’entreprise présente GPT-5 comme une avancée vers l’intelligence artificielle générale, bien meilleure que ses précédents modèles. Durant la présentation, les employés d’OpenAI ont multiplié les graphiques pour montrer les performances de GPT-5. Cependant, certains d’entre eux étaient trompeurs.
Les graphiques d’OpenAI sont bons, mais pas à l’échelle
OpenAI n’est pas accusée d’avoir donné de fausses informations, mais de les avoir données de manière trompeuse. La première erreur se trouve à la cinquième minute de la conférence. OpenAI détaille les performances de GPT-5 en matière de développement informatique, et ce, dans plusieurs langages de programmation. Les graphiques comparent GPT-5 à GPT-o3 et GPT-4o, mais les pourcentages ne sont pas à l’échelle. Ce qui avantage grandement GPT-5, si l’on ne regarde pas de près les graphiques.
Sur ce même graphique, les scores d’o3 et de 4o sont très différents (69,1% pour l’un, 30,8% pour l’autre). Sauf que les rectangles qui correspondent à ces chiffres sont de taille égale. Une autre erreur d’inattention d’OpenAI.
Dans un autre graphique, ce n’est pas un souci d’échelle, mais bien une faute totale. OpenAI compare les erreurs entre modèles et GPT-5 (avec réflexion) obtient un taux de « tromperie » de 50 %. Un chiffre comparé avec le score d’o3, de 47,4% ; néanmoins, la barre correspondante sur le graphique est plus grande que celle de GPT-5. Le taux d’erreur de GPT-5 est en réalité de 16,5 %.
OpenAI s’excuse et corrige le tir
Des problèmes qu’on ne constate que dans la conférence diffusée en direct par OpenAI sur YouTube. Sur le billet de blog qui présente GPT-5, on trouve les mêmes graphiques, avec le respect des échelles. Peut-être les chargés de la présentation ont-ils fait faire les graphiques à ChatGPT, mais n’ont pas relu suffisamment les diapositives avant de les envoyer. OpenAI n’a pas fait de communiqué officiel pour réagir.
Sur X, Sam Altman a rapidement répondu aux critiques en reconnaissant ces erreurs, rappelant que les graphiques sont corrects sur le blog d’OpenAI. Même chose du côté d’un responsable marketing d’OpenAI, Pranav Deshpande : « Toutes nos excuses pour le crime de graphique involontaire. »
