Anthropic a mis à jour son modèle phare avec Opus 4.8, sorti le 28 mai. Les benchmarks sont au rendez-vous. Mais le communiqué officiel laisse entendre que cette version n’est peut-être qu’une transition avant un saut d’échelle inédit.

41 jours. C’est le temps qu’il aura fallu à Anthropic pour déployer un nouveau modèle.

Un cycle particulièrement court, alors que Opus 4.7, sorti le 16 avril, avait reçu un accueil mitigé : verbosité excessive, appels d’outils maladroits, tendance à affirmer des choses sans les étayer.

Claude Opus 4.8, disponible depuis le 28 mai 2026, est donc venu rectifier le tir. Du côté des benchmarks, Anthropic coche les cases attendues : progression sur le coding agentique, le raisonnement multidisciplinaire, l’utilisation autonome d’un ordinateur, l’analyse financière.

Seul bémol : GPT-5.5 conserve l’avantage sur le coding en terminal. C’est la séquence désormais routinière des sorties de grands modèles, une démonstration de force chiffrée, suivie d’un communiqué peuplé de témoignages de partenaires enthousiastes.

Benchmark comparatif // Source : Anthropic
Benchmark comparatif // Source : Anthropic

Ce qu’apporte concrètement Opus 4.8

Au-delà des benchmarks, deux apports ressortent du lancement.

Le premier est comportemental. Anthropic affirme qu’Opus 4.8 est environ quatre fois moins susceptible qu’Opus 4.7 de laisser passer des erreurs dans le code produit sans les signaler. Le modèle serait également plus enclin à exprimer ses incertitudes plutôt qu’à « foncer ».

Le second apport est fonctionnel. Anthropic lance en parallèle Dynamic Workflows dans Claude Code : le modèle peut désormais planifier une tâche complexe, déployer des centaines de sous-agents en parallèle, puis vérifier les résultats avant de rendre la main. Selon Anthropic, cela permet de mener des migrations de code sur des centaines de milliers de lignes, du lancement jusqu’au merge. La fonctionnalité est disponible pour les abonnements Enterprise, Team et Max.

Un contrôle d’effort fait aussi son apparition sur claude.ai : les abonnés peuvent désormais régler l’intensité de réflexion du modèle, d’un mode rapide (Low) à un mode maximal (Max). Anthropic indique que le mode rapide d’Opus 4.8 est 2,5 fois plus véloce et trois fois moins cher qu’avant.

Le vrai message est ailleurs

Mais le passage le plus significatif du communiqué n’est pas celui qui décrit Opus 4.8. C’est celui glissé dans la section « Et ensuite ? ».

Anthropic reconnaît qu’Opus 4.8 « représente une amélioration modeste mais tangible par rapport à la version précédente. » L’entreprise américaine met davantage l’accent sur le futur proche : « Nous travaillons actuellement au développement et à la commercialisation de modèles offrant des fonctionnalités similaires à celles d’Opus, à un coût moindre. De plus, nous prévoyons de lancer une nouvelle génération de modèles encore plus performants qu’Opus. »

Cette nouvelle génération a un nom : Mythos. Dans le cadre du projet Glasswing, un petit nombre d’organisations utilisent depuis plusieurs semaines Claude Mythos Preview pour des travaux de cybersécurité. Le modèle n’est pas encore accessible au grand public. Les modèles à ce niveau de performance, explique Anthropic, nécessitent des mesures de sécurité renforcées avant leur diffusion à grande échelle. Mais la promesse est formulée : « Nous progressons rapidement dans le développement de ces mesures et prévoyons de proposer les modèles de classe Mythos à tous nos clients dans les prochaines semaines. »

Opus 4.8 pourrait donc être le dernier modèle du cycle que l’on connaît, celui où les acteurs du secteur s’affrontent à coups de fractions de pourcentage sur des benchmarks standardisés, à intervalles de quelques semaines. Avant un saut d’une autre nature.

C’est en tout cas la promesse d’Anthropic. Et si Mythos tient ses engagements, il y a fort à parier qu’OpenAI, Google et les autres ne tarderont pas à annoncer leur propre rupture, relançant une nouvelle vague de promesses, plus ou moins tenues.

une comparateur meilleur vpn numerama

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+
Toute l'actu tech en un clien d'oeil

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !


Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer !