En attendant Gemini 3.1 Pro ou Gemini 3.5 Pro, que les rumeurs annoncent pour le premier semestre 2026, Google met à jour Gemini Deep Think, son super-modèle à destination des scientifiques. Le principe est toujours le même : Deep Think étudie plusieurs chaînes de raisonnement simultanément pour résoudre des problèmes complexes. Mais cette nouvelle version, dévoilée le 12 février, réalise l’impensable pour une IA dans plusieurs épreuves mathématiques sérieuses.

Google prend beaucoup d’avance sur Anthropic et sur lui-même
À la fin de l’année 2025, Google avait frappé fort avec le duo Gemini 3 Pro et Deep Think. Ces deux modèles lui avaient permis de prendre de l’avance sur tous ses concurrents : Google semblait désormais leader de la révolution IA.
Le 5 février 2026, Anthropic a lancé Claude Opus 4.6, le premier modèle devant Gemini 3 Pro dans de nombreux benchmarks. Les deux LLM jouent dans la même cour, mais Anthropic est meilleur sur de nombreux aspects.

Avec la mise à jour de Gemini Deep Think du 12 février, Google reprend largement l’ascendant.
Sur le benchmark ARC-AGI-2, un des plus complexes du milieu, le modèle est passé d’un score de 45 % à près de 85 % en trois mois. Avec un score aussi élévé, Google approche des limites du test : son modèle a désormais les capacités des meilleurs humains de la planète réunis. Même chose sur le très exigeant Humanity’s Last Exam : le nouveau Deep Think atteint les 48,4 % sans outils, contre 41 % pour l’ancienne version. Google prend de l’avance sur Claude Opus 4.1, qui est le premier modèle général avec un score de 40 %.
| Benchmark | Gemini 3 Deep Think (Déc. 2025) | Claude Opus 4.6 (Fév. 2026) | Gemini 3 Deep Think (Fév. 2026) |
|---|---|---|---|
| ARC-AGI-2 (Raisonnement visuel) | 45,1 % | 68,8 % | 84,6 % |
| Humanity’s Last Exam (Connaissances académiques) | 41,0 % | 40,0 % | 48,4 % |
| Olympiades mathématiques 2025 | 60,7 % (préversion) | – | 81,5 % |
| Codeforces (Programmation compétitive) | – | 2352 Elo | 3455 Elo |
| MMMU-Pro (Multimodal) | – | 73,9 % | 81,5 % |
Autre impressionnant : le score Elo sur Codeforces. Avec 3455 points, Deep Think se classe dans le top 0,01 % des programmeurs mondiaux. L’écart avec Claude Opus 4.6 (2352 points) est immense. Google est aussi très fort aux Olympiades internationales de Mathématiques, avec un score record de 81,5 % équivalent à une médaille d’or.
Un modèle toujours réservé à des utilisateurs bien spécifiques
Contrairement à Claude Opus 4.6, qui se destine à tous les utilisateurs, y compris celles et ceux qui n’ont pas besoin de toutes ses capacités, Gemini 3 Deep Think est un modèle spécialisé.
Google le positionne comme un assistant de recherche fondamentale. Ses prouesses le destinent aux laboratoires, aux ingénieurs en aéronautique ou aux mathématiciens. Deep Think n’a aucun intérêt pour structurer de longues notes. Il faut toujours l’abonnement Google AI Ultra à 275 euros par mois pour lui parler, le tout avec une latence plus élevée, puisque son raisonnement prend du temps.
Au-delà des benchmarks, la prouesse la plus significative de cette mise à jour est peut-être invisible pour l’utilisateur, mais cruciale pour l’industrie : son coût. Selon les premières analyses techniques, Google a réussi l’exploit de doubler la précision de son modèle tout en divisant ses prix par cinq.

Pour résoudre une tâche complexe du benchmark ARC-AGI, l’ancienne version de Deep Think coûtait environ 77 dollars en puissance de calcul. La nouvelle version ? Seulement 13,62 dollars. C’est cette chute drastique des coûts qui permettra, à terme, à cette intelligence d’intégrer les modèles du quotidien.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Toute l'actu tech en un clin d'œil
Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !
Pour ne rien manquer de l’actualité, suivez Numerama sur Google !











