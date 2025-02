Lecture Zen Résumer l'article

La société Anthropic dévoile un tout nouveau modèle de langage appelé 3.7 Sonnet, qui vient renforcer les capacités en IA générative du chatbot Claude. Pour la première fois, un mode « hybride » fait son apparition.

La course à l’intelligence artificielle générative est avant tout une guerre de modèles. À ce jeu, l’entreprise Anthropic vient de marquer des points supplémentaires le 24 février 2025, en présentant une nouvelle version de Sonnet, l’un de ses principaux modèles de langage avec Opus (le plus large) et Haiku (le plus petit).

Sonnet, un modèle de taille intermédiaire, passe désormais en version 3.7 et succède à Sonnet 3.5, qui avait fait ses débuts en juin 2024. Déjà à l’époque, Anthropic clamait sa supériorité face à OpenAI, qui avait dévoilé un mois plutôt GPT-4o, qui était alors son dernier projet et, surtout, le nec-plus-ultra de ce qu’elle pouvait faire à l’époque. Claude 3.5 Sonnet est encore aujourd’hui considéré comme un des meilleurs modèles, notamment pour le code, malgré sa plus faible notoriété.

Claude 3.7 Sonnet dépasse OpenAI o1, o3-mini et DeepSeek R1, selon Anthropic

Huit mois plus tard, rebelote. OpenAI, qui fait figure de mètre-étalon dans l’IA générative en raison de la place considérable qu’occupe ChatGPT sur le marché, a présenté deux nouveaux modèles, OpenAI o1 en décembre 2024, suivi d’OpenAI o3-mini en janvier 2025 — bien qu’il ait été évoqué un mois plutôt.

Sans surprise, le nouveau Sonnet 3.7 d’Anthropic affirme que cette mouture surclasse non seulement l’ancienne version (Sonnet 3.5), mais aussi o1 et o3-mini d’OpenAI, ainsi que le modèle chinois DeepSeek R1, qui a fait sensation en début d’année. Pour le prouver, divers graphiques ont été partagés, présentant les performances des uns et des autres.

Les benchmarks choisis par Anthropic pour démontrer la supériorité de Claude 3.7 Sonnet. // Source : Anthropic

Selon Anthropic, leur « modèle le plus intelligent à ce jour », mais surtout le « première modèle de raisonnement hybride sur le marché ». Par hybride, la startup fait référence à la capacité de Claude, son chatbot rival de ChatGPT, de produire soit des réponses pratiquement instantanées, soit de prendre davantage de temps pour « réfléchir » pas à pas.

La tendance récente dans l’IA générative est de développer des modèles qui sont capables de « raisonner », notamment en présentant à l’internaute les étapes qui amènent au résultat final. Plusieurs entreprises comme OpenAI (avec o1 et o3), Grok (avec Grok 3) ou encore DeepSeek (avec R1) se sont engagées dans cette direction dernièrement.

Des services et des produits de plus en plus spécialisés

Le travail d’un modèle d’IA avec raisonnement peut être un peu plus long, mais il peut être utile lorsque le chatbot est confronté à des questions plus complexes qu’à l’accoutumée. Par exemple, le mode de réflexion étendu sur Sonnet 3.7 est, d’après Anthropic, idéal pour les questions relatives aux mathématiques et à la programmation informatique.

C’est d’ailleurs là dessus que la firme met l’accent : « Sonnet 3.7 montre des améliorations vraiment importantes dans l’écriture de code informatique et dans le développement web ». D’ailleurs, il est aussi lancé Claude Code, « un outil de ligne de commande pour le codage agentique », c’est-à-dire pour les agents IA autonomes — Anthropic est un précurseur.

Ces progrès obtenus avec Sonnet 3.7 devraient toutefois être très vite défiés par toute la scène de l’IA générative, dans les semaines à venir. En effet, les avancées que revendiquent telle ou telle startup ne tiennent pas longtemps. Bien vite, un rival dévoilera une mise à jour d’un de ses modèles qui prétendra surclasser Sonnet 3.7. Les rumeurs s’accordent notamment sur le lancement imminent de GPT-4.5, par OpenAI.

Ces percées apparaissent par ailleurs de plus en plus spécialisées, avec des services qui s’adressent à une clientèle plus experte, et non plus au tout venant — on le voit avec les annonces autour de la programmation informatique, des agents autonomes ou des facultés de raisonnement, qui vont de simples questions / réponses générales.

