Google dévoile Gemini 3.5 Flash : aussi intelligent que Opus 4.6, mais 4 fois plus rapide

Résumé par IA, vérifié par Numerama

Recevez tous les soirs un résumé de l’actu importante avec Le Récap’

Le 19 mai 2026, lors de la Google I/O, la firme a dévoilé Gemini 3.5 Flash, la dernière version de sa gamme de modèles les plus rapides et moins chers. Celui-ci bat Gemini 3.1 Pro sur la plupart des benchmarks, et même Claude Opus 4.7 — le modèle le plus puissant d’Anthropic — sur certains.

Alors que Google a multiplié les annonces lors de l’Android Show, il ne faisait guère de doute que la firme de Mountain View gardait ses principales nouveautés autour de Gemini pour la Google I/O 2026. L’entreprise a ainsi dévoilé le 19 mai 2026 Gemini 3.5 Flash, la dernière version de sa gamme de modèles les plus rapides et moins chers.

Celui-ci « offre des performances de pointe pour les agents et le code, en excellant dans les tâches complexes de longue haleine ayant une utilité concrète dans le monde réel », assure Google. Sur les tâches dites « agentiques » et sur le code, Gemini 3.5 Flash dépasserait même Gemini 3.1 Pro, le modèle phare de la gamme. Ce dernier cible les tâches les plus exigeantes — raisonnement avancé, synthèses complexes, ou encore les projets créatifs d’envergure.

En clair, le plus petit modèle de Google rivalise désormais sur de nombreux benchmarks avec son propre modèle le plus puissant, mais aussi avec ceux de ses concurrents.

Gemini 3.1 Pro vs Gemini 3.5 Flash // Source : Google

Gemini 3.5 Flash bat Gemini 3.1 Pro dans la plupart des benchmarks

Sur plusieurs benchmarks de référence servant à évaluer les capacités des IA, le modèle affiche des performances parmi les meilleures du secteur :

Terminal-Bench 2.1, qui mesure la capacité d’une IA à accomplir des tâches complexes sur un terminal informatique : Gemini 3.5 Flash obtient 76,2 %, contre 70,3 % pour Gemini 3.1 Pro. GPT-5.5 lui, reste en tête avec 78,2 %
GDPval-AA Elo, qui classe les modèles d’IA selon leur capacité à accomplir des tâches de travail : Gemini 3.5 Flash obtient un classement de 1656, contre 1204 pour Gemini 3.1 Pro et 1753 pour Opus 4.7. GPT-5.5 mène à 1769.
MCP Atlas, centré sur l’utilisation d’outils et d’API : Gemini 3.5 Flash obtient 83,6 %, contre 78,2 % pour Gemini 3.1 Pro et 79,1 % pour Opus 4.7. GPT-5.5, lui, obtient 75,3 %.
CharXiv Reasoning, un test évaluant la compréhension de figures et documents scientifiques complexes : Gemini 3.5 obtient 84,2 %, contre 83,3 % pour Gemini 3.1 Pro et 82,1 % pour Claude Opus 4.7. GPT-5.5 lui, obtient 84,1 %

L’un des gros arguments mis en avant par Google est la vitesse du modèle : selon la firme, Gemini 3.5 Flash génère ses réponses jusqu’à quatre fois plus vite que les autres IA de pointe. Dans le détail, celui-ci pourrait générer 300 tokens/seconde, contre 40 pour Claude Opus 4.7, et 50 pour Gemini 3.1 Pro. Et ce, pour un tiers du prix des concurrents.

En clair, si Gemini 3.5 Flash a d’abord pour vocation d’être rapide et économe, il peut s’imposer comme une alternative crédible aux LLM les plus puissants, malgré son prix plus petit. Il fait jeu égal avec GPT-5.5 d’OpenAI et Claude Opus 4.7 d’Anthropic.

Le benchmark publié par Google pour Gemini 3.5 Flash. // Source : Google

Gemini 3.5 Flash s’impose au sein des agents IA

Gemini 3.5 Flash serait particulièrement taillé pour les tâches complexes et longues réalisées par des agents IA autonomes. Selon l’entreprise, là où certaines tâches pouvaient auparavant demander plusieurs jours de travail à un développeur — ou plusieurs semaines à un auditeur — son modèle pourrait désormais aider à les accomplir « en une fraction du temps », souvent pour moins de la moitié du coût des autres IA de pointe.

Parmi les autres points clés : celui-ci serait également capable de planifier rapidement, de développer puis d’itérer pour résoudre des problèmes concrets : création d’applications, maintenance de bases de code ou encore préparation de documents financiers.

Associé à la nouvelle infrastructure Antigravity, Gemini 3.5 Flash peut aussi orchestrer plusieurs sous-agents IA collaboratifs afin de traiter des tâches à grande échelle. Sous supervision humaine, il serait ainsi capable d’exécuter de manière fiable des process complexes et des tâches de programmation en plusieurs étapes, tout en conservant « des performances de très haut niveau », selon la firme.

Enfin, en s’appuyant sur les capacités multimodales de Gemini 3, le modèle peut générer des interfaces web « plus riches et interactives », ainsi que des éléments graphiques plus avancés.

En plus de l’application Gemini, 3.5 Flash devient le modèle par défaut dans le moteur de recherche et le AI Mode, disponible dans le monde entier sauf la France. Le Gemini Spark, le nouvel agent IA personnel de Google, utilisera lui aussi Gemini 3.5 Flash.

Le modèle est disponible dès maintenant dans Google AI Studio / Android Studio, sur la plateforme Google Antigravity, ainsi que sur Gemini Enterprise et l’app Gemini. S’il ne fait nul doute que celui-ci est très prometteur, on peut aussi supposer que Google n’a pas voulu trop perdre de temps en attendant la sortie du prochain modèle de sa gamme Pro — alors même que ses concurrents Anthropic (Claude) et OpenAI (ChatGPT) ont eux aussi accéléré la cadence.

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !

Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer !

Tous nos articles sur la Google I/O 2026