La dernière nouveauté des 12 jours d’OpenAI s’appelle o3. Il s’agit d’un « frontier model » capable de raisonner et de résoudre des énigmes compliquées, avec des performances inédites pour une intelligence artificielle générative selon l’entreprise. Il sera disponible dans ChatGPT en 2025, après de premiers tests de sécurité.

Le 1ᵉʳ jour de son calendrier de l’avent, le 5 décembre 2024, OpenAI a lancé o1. Ce nouveau modèle capable de « réfléchir », qui était en test depuis plusieurs mois, est désormais disponible dans ChatGPT.

Le 20 décembre 2024, pour le 12ᵉ et dernier jour de son opération, OpenAI a fait un choix étonnant : présenter o3, le successeur d’o1, qui sera disponible en 2025. Où est passé le 2 ? OpenAI a décidé d’éviter le conflit juridique avec l’opérateur anglais O2. Et puis, comme le reconnaît Sam Altman, « nous sommes très mauvais avec les noms chez OpenAI. ».

Avec o3, OpenAI veut résoudre des énigmes

Selon OpenAI, o3 appartient à la catégorie des « Frontier Model », ou modèle d’avant-garde en français.

L’entreprise entend par là qu’il ne s’agit pas d’une simple version plus moderne de GPT-4o, qui est un LLM (grand modèle de langage), mais d’une technologie complètement différente. Un modèle comme o3 dispose de capacités avancées de raisonnement et de traitement de données, d’une meilleure précision et peut gérer des tâches complexes et multimodales.

GPT-4o, lui, est fondamentalement conçu pour prédire quel mot va après le précédent, pas réfléchir à d’autres types d’associations.

Sur des tâches compliquées, o3 serait infiniment plus fiable qu’o1. OpenAI le présente comme une immense évolution pour l’intelligence artificielle. // Source : OpenAI

Dans le meilleur des cas, OpenAI publiera ses nouveaux modèles à la fin du mois de janvier 2025. En plus d’o3, l’entreprise prévoit de lancer trois versions d’o3 mini, qui seront conçues pour répondre beaucoup plus rapidement (et qui coûteront moins cher pour les développeurs).

Durant sa présentation du 20 janvier, qui s’est avérée plus technique que commerciale, OpenAI a présenté plusieurs benchmarks réalisés avec des versions expérimentales d’o3. Le modèle d’avant-garde excelle notamment avec le code et avec les problèmes mathématiques, un secteur sur lequel o1 s’en sortait déjà mieux que ses concurrents. Sa principale cible n’est pas l’utilisateur lambda de ChatGPT qui veut poser des questions générales, mais les scientifiques.

Tests mathémathiques réalisés par o1 et o3. // Source : OpenAI

Selon OpenAI, o3 a battu plusieurs records durant ses tests internes. Le modèle se rapprocherait progressivement d’un raisonnement humain, ce qui représente le rêve ultime d’OpenAI. o3 pourrait déduire des réponses qui ne découlent pas juste d’un enchaînement statistique avec une précision inédite pour un modèle du genre.

o3 entre en phase de « Public Safety Testing » aujourd’hui, ce qui veut dire que des chercheurs et des membres d’un programme sur inscription pourront jouer avec durant les prochaines heures.

o3 mini décliné en trois versions : le futur modèle vedette de ChatGPT ?

En plus d’o3, qui sert avant tout de vitrine à OpenAI, ChatGPT supportera bientôt o3-mini, un modèle lui-même décliné en trois sous-modèles :

o3-mini (low)

o3-mini (medium)

o3-mini (high)

Pourquoi décliner o3-mini en trois versions ? Pour une question de rapidité. o3-mini (low) va quasiment aussi vite que GPT-4o (il est deux fois plus lent), alors que la version la plus puissante (high) met plusieurs secondes à répondre (il est 46 fois plus lent).

La version low d’o3 mini génère du texte deux fois plus lentement que gpt-4o, malgré des réponses plus justes. La versions high va 46 fois moins vite. // Source : OpenAI

Avec o3-mini dans sa version medium, OpenAI dit proposer des résultats aussi satisfaisants qu’o1, qui est pourtant un modèle beaucoup plus exigeant en ressources. La version high est même plus puissante, mais son temps de réponse est bien moins satisfaisant.

Les différentes versions d’o3 mini sont plus performantes que GPT-4o et o1 d’après ces benchmarks. // Source : OpenAI

Avec o3 et o3-mini, OpenAI fait un pas de plus vers l’AGI, l’intelligence artificielle générale qui égalerait enfin le cerveau humain.

Dommage d’avoir oublié ses produits les plus grand public comme GPT (texte) et DALL-E (image) durant ses 12 jours de présentation, alors que Google a accéléré sur ce sujet. o3 est très certainement impressionnant, mais ce n’était pas vraiment l’annonce qu’attendaient les suiveurs d’OpenAI.

