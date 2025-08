Lecture Zen Résumer l'article

Pour la première fois depuis 2019, OpenAI publie de nouveaux modèles de langage ouverts. Il s’agit de modèles de raisonnement dérivés d’o3 déclinés en deux versions (20B et 120B). De quoi faire taire les critiques récurrentes d’Elon Musk sur le manque d’ouverture d’OpenAI ?

Dans le nom d’OpenAI, il est fait mention d’intelligence artificielle (IA), mais il est surtout question d’ouverture (open). Or, l’ouverture chez OpenAI s’est fait très discrète ces dernières années, ce qui a offert un formidable angle d’attaque à Elon Musk lors de ses diatribes contre Sam Altman, le fondateur d’OpenAI, avec lequel il s’est brouillé. Elon Musk reproche à OpenAI d’être devenue une entreprise fermée avec des modèles propriétaires réservés à ChatGPT.

Depuis plusieurs mois, OpenAI promet régulièrement qu’il va revenir à l’open source. Sa promesse a été tenue le 5 août 2025, avec des modèles que tout le monde peut télécharger, installer et exécuter localement, sans besoin d’Internet ou d’utiliser une application ChatGPT.

Elon Musk et Sam Altman se sont régulièrement pris le bec, y compris sur l’ouverture des modèles de langage. // Source : Création Numerama

OpenAI se rappelle qu’il y a « ouvert » dans son nom : voici gpt-oss

Le 5 août 2025, OpenAI a dévoilé deux modèles de raisonnement que tout le monde peut télécharger et exécuter sur ses propres appareils : gpt-oss-120B et gpt-oss-20B. Ces modèles ouverts (oss est un acronyme qui renvoie à open source software) sont publiés sous licence Apache, l’une des licences les plus en vogue en matière d’open source et de logiciel libre.

La sortie gpt-oss-120B et gpt-oss-20B était anticipée depuis quelques semaines. On savait que l’entreprise avait l’intention de sortir de nouveaux modèles ouverts — une première depuis 2019 et GPT-2 –, signe que la défiance à l’égard de l’open source n’avait plus court. En 2023, pourtant, OpenAI disait rejeter cette ouverture.

Les modèles annoncés. // Source : OpenAI

Mais cette annonce pourrait rapidement être éclipsée par une autre actualité : celle de la sortie de GPT-5. En effet, la future grande évolution de ChatGPT pourrait advenir dès le mois d’août, selon les rumeurs les plus récentes (une autre piste est à envisager en octobre, durant une conférence s’adressant aux développeurs). OpenAI tease une annonce en fin de semaine.

Avec gpt-oss, OpenAI lance un modèle aux 120 milliards de paramètres « égale » au modèle o4-mini (sorti en avril 2025) sur les principales évaluations, tout en tournant sur un seul GPU de 80 Go. Quant au modèle aux 20 milliards de paramètres, il peut tourner sur un appareil local (un PC, un smartphone, un serveur…) ayant au minimum 16 Go de mémoire vive. Les PC les plus performants pourront faire tourner les deux, les autres se contenteront de la version allégée.

Avec ce modèle, des entreprises pourraient créer leur propre chatbot et le faire tourner sur leurs propres serveurs. C’est la principale différence avec les autres modèles propriétaires d’OpenAI.

Une sortie qui aurait dû avoir lieu plus tôt, mais retardée pour des raisons de sécurité

Pour OpenAI, les choses sont claires : ce sont ses modèles de raisonnement à poids ouverts (open-weight) les plus performants à ce jour. C’était simple d’atteindre cette première place, puisque l’entreprise n’avait jamais publié de modèle de raisonnement en open-weight avant. L’ère du raisonnement chez OpenAI a débuté en 2024 avec o1.

Si la publication de modèles de langage en modèle ouvert est très rare chez OpenAI (le dernier réellement ouvert a été GPT-2 en 2019), la dernière ligne droite avant la sortie de gpt-oss-120B et gpt-oss-20B n’a cependant pas été de tout repos. La publication était prévue plus tôt cette année, avant que l’on s’aperçoive que la date visait était trop tôt.

Des modèles ouverts que l’on peut faire tourner localement. // Source : Numerama

« Nous avions prévu de lancer notre modèle à poids ouvert la semaine [du 14 juillet]. Nous reportons cette date ; nous avons besoin de temps pour effectuer des tests de sécurité supplémentaires et examiner les zones à haut risque. Nous ignorons encore combien de temps cela nous prendra », avait écrit Sam Altman sur X (ex-Twitter), le 12 juillet.

Ce report semble avoir été bénéfique. En tout cas, OpenAI publie aussi de la documentation détaillant le protocole « qui simule des usages malveillants dans les domaines bio et cyber ». Un travail en coopération avec des experts externes pour examiner la méthodologie. Le code d’évaluation, les grilles de notation et les prompts liés sont publiés aussi.

Sam Altman n’a pas manqué de promouvoir gpt-oss-120B et gpt-oss-20B. Peu avant l’annonce, il disait même avoir « beaucoup de nouveautés » à présenter « dans les prochains jours ». On a compris qu’il faisait référence à ces modèles ouverts dans la première partie du message. Quant à la suite (la « grosse mise à niveau » prévue après), qu’espérer, sinon GPT-5 ?

Le message Sam Altman. // Source : Capture d’écran

