« Et ensuite ? » Anthropic dévoile Opus 4.8 mais tous les yeux sont rivés ailleurs

Résumé par IA, vérifié par Numerama

Opus 4.8, lancé par Anthropic, montre des améliorations notables en matière de codage, de raisonnement multidisciplinaire et d'analyse financière, tout en offrant un nouveau Dynamic Workflow pour gérer des tâches complexes.
Anthropic annonce que cette version est quatre fois plus fiable qu'Opus 4.7 et introduit un contrôle de l'intensité de réflexion, rendant le modèle plus rapide et moins coûteux en mode rapide.
Malgré ces avancées, le communiqué laisse présager une prochaine évolution majeure avec le modèle Mythos, actuellement en tests préliminaires, qui promet de surpasser Opus et de révolutionner le secteur grâce à des fonctionnalités avancées à moindre coût.

Recevez tous les soirs un résumé de l’actu importante avec Le Récap’

Anthropic a mis à jour son modèle phare avec Opus 4.8, sorti le 28 mai. Les benchmarks sont au rendez-vous. Mais le communiqué officiel laisse entendre que cette version n’est peut-être qu’une transition avant un saut d’échelle inédit.

41 jours. C’est le temps qu’il aura fallu à Anthropic pour déployer un nouveau modèle.

Un cycle particulièrement court, alors que Opus 4.7, sorti le 16 avril, avait reçu un accueil mitigé : verbosité excessive, appels d’outils maladroits, tendance à affirmer des choses sans les étayer.

Claude Opus 4.8, disponible depuis le 28 mai 2026, est donc venu rectifier le tir. Du côté des benchmarks, Anthropic coche les cases attendues : progression sur le coding agentique, le raisonnement multidisciplinaire, l’utilisation autonome d’un ordinateur, l’analyse financière.

Seul bémol : GPT-5.5 conserve l’avantage sur le coding en terminal. C’est la séquence désormais routinière des sorties de grands modèles, une démonstration de force chiffrée, suivie d’un communiqué peuplé de témoignages de partenaires enthousiastes.

Benchmark comparatif // Source : Anthropic

Ce qu’apporte concrètement Opus 4.8

Au-delà des benchmarks, deux apports ressortent du lancement.

Le premier est comportemental. Anthropic affirme qu’Opus 4.8 est environ quatre fois moins susceptible qu’Opus 4.7 de laisser passer des erreurs dans le code produit sans les signaler. Le modèle serait également plus enclin à exprimer ses incertitudes plutôt qu’à « foncer ».

Le second apport est fonctionnel. Anthropic lance en parallèle Dynamic Workflows dans Claude Code : le modèle peut désormais planifier une tâche complexe, déployer des centaines de sous-agents en parallèle, puis vérifier les résultats avant de rendre la main. Selon Anthropic, cela permet de mener des migrations de code sur des centaines de milliers de lignes, du lancement jusqu’au merge. La fonctionnalité est disponible pour les abonnements Enterprise, Team et Max.

Un contrôle d’effort fait aussi son apparition sur claude.ai : les abonnés peuvent désormais régler l’intensité de réflexion du modèle, d’un mode rapide (Low) à un mode maximal (Max). Anthropic indique que le mode rapide d’Opus 4.8 est 2,5 fois plus véloce et trois fois moins cher qu’avant.

Le vrai message est ailleurs

Mais le passage le plus significatif du communiqué n’est pas celui qui décrit Opus 4.8. C’est celui glissé dans la section « Et ensuite ? ».

Anthropic reconnaît qu’Opus 4.8 « représente une amélioration modeste mais tangible par rapport à la version précédente. » L’entreprise américaine met davantage l’accent sur le futur proche : « Nous travaillons actuellement au développement et à la commercialisation de modèles offrant des fonctionnalités similaires à celles d’Opus, à un coût moindre. De plus, nous prévoyons de lancer une nouvelle génération de modèles encore plus performants qu’Opus. »

Cette nouvelle génération a un nom : Mythos. Dans le cadre du projet Glasswing, un petit nombre d’organisations utilisent depuis plusieurs semaines Claude Mythos Preview pour des travaux de cybersécurité. Le modèle n’est pas encore accessible au grand public. Les modèles à ce niveau de performance, explique Anthropic, nécessitent des mesures de sécurité renforcées avant leur diffusion à grande échelle. Mais la promesse est formulée : « Nous progressons rapidement dans le développement de ces mesures et prévoyons de proposer les modèles de classe Mythos à tous nos clients dans les prochaines semaines. »

Opus 4.8 pourrait donc être le dernier modèle du cycle que l’on connaît, celui où les acteurs du secteur s’affrontent à coups de fractions de pourcentage sur des benchmarks standardisés, à intervalles de quelques semaines. Avant un saut d’une autre nature.

C’est en tout cas la promesse d’Anthropic. Et si Mythos tient ses engagements, il y a fort à parier qu’OpenAI, Google et les autres ne tarderont pas à annoncer leur propre rupture, relançant une nouvelle vague de promesses, plus ou moins tenues.

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !

Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer !