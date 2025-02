Lecture Zen Résumer l'article

Monopolisée par le DeepSeek et OpenAI, la course à l’intelligence artificielle générative avait un peu laissé de côté Google ces dernières semaines, alors que le géant du web intègre ses IA à ses services et à de nombreux appareils Android. Le lancement officiel des trois premiers modèles Gemini 2.0 relance l’entreprise.

La règle numéro 1 dans la Silicon Valley est qu’il ne faut jamais enterrer Google.

Initialement distancé dans la course à l’intelligence artificielle générative, même si les modèles de langage modernes n’auraient jamais pu voir le jour sans les inventions de ses chercheurs, Google a su rattraper son retard en 2024. Son IA Gemini intègre désormais la quasi-totalité de ses services, tandis que ses modèles de génération d’images et de vidéo, Imagen 3 et Veo 2, font partie des meilleurs de l’industrie.

Le 5 février 2025, Google a annoncé le lancement de son nouveau modèle de langage, Gemini 2.0 Flash. Plus efficace que Gemini 1.5 Pro, il se distingue par la rapidité de ses réponses et son faible coût d’utilisation. D’une certaine manière, Google répond à DeepSeek et à OpenAI qui, avec leurs modèles respectifs (DeepSeek-R1 et o3-mini), jouent aussi la carte du coût efficacité/prix (même si Gemini 2.0 Flash n’est pas encore un modèle de raisonnement).

Gemini 2.0 Flash disponible pour tous les utilisateurs

Gemini 2.0 Flash avait déjà été annoncé en décembre, au moment du calendrier de l’avent d’OpenAI.

La nouveauté du 5 février est qu’il est disponible pour tous les utilisateurs depuis le site ou l’application Gemini, mais aussi pour les développeurs qui souhaitent l’intégrer grâce à une API. C’est la première fois que des services tiers comme Perplexity intègrent un modèle Google, ce qui ouvre la porte à une plus grande ouverture de Google vis-à-vis des startups de l’IA.

Gemini 2.0 Flash est le premier LLM Google disponible dans des services rivaux comme Perplexity. // Source : X

Gemini 2.0 Flash n’est pas encore capable de générer des images ou d’être sollicité en mode voix, mais Google promet une mise à jour prochainement. Gemini 2.0 Flash est bel et bien un modèle multimodal, qui a donc tout intérêt à devenir le LLM par défaut dans les services Google.

Selon Google, Gemini 2.0 Flash serait plus performant que tous ceux précédemment proposés dans ses services, malgré sa « légèreté ». Son modèle resterait inférieur à GPT-4o, mais son coût d’utilisation plus faible le rend plus intéressant pour de nombreux usages. Il faut voir en Gemini 2.0 Flash une sorte de version boostée de GPT-4o-mini.

Google prépare deux versions dérivées de Gemini 2.0

En plus de Gemini 2.0 Flash, qui est disponible dès aujourd’hui, Google a annoncé le lancement de deux nouveaux modèles expérimentaux destinés à arriver plus tard en 2025 :

Gemini 2.0 Pro est la version plus aboutie du modèle, avec une fenêtre de 2 millions de tokens et une bien meilleure compréhension du code et des prompts complexes. Ses performances se rapprochent pour le coup plus de GPT-4o que de GPT-4o mini, même si Google ne partage pas de détails sur ses caractéristiques (nombre de paramètres, etc.)

est la version plus aboutie du modèle, avec une fenêtre de 2 millions de tokens et une bien meilleure compréhension du code et des prompts complexes. Ses performances se rapprochent pour le coup plus de GPT-4o que de GPT-4o mini, même si Google ne partage pas de détails sur ses caractéristiques (nombre de paramètres, etc.) Gemini 2.0 Flash-Lite est un modèle encore plus petit, conçu pour des réponses peu coûteuses et ultra-rapides. Google le présente comme le successeur de Gemini 1.5 Flash, son modèle destiné aux développeurs lancé mi-2024.

Benchmarks réalisés par Google pour comparer les différentes versions de Gemini. L’entrepriese ne mentionne pas les modèles concurrents. // Source : Google

Les modèles de réflexion attendront

Quid des modèles de réflexion, parfois appelés modèles d’avant-garde, capables d’imiter un raisonnement humain et d’argumenter sur l’avancée de leurs recherches ? o1 et o3 sont les plus connus chez OpenAI, tandis que DeepSeek a provoqué un séisme technologique avec son modèle R1.

Étrangement, Google ne profite pas du lancement de Gemini 2.0 Flash pour sortir de bêta son modèle Gemini 2.0 Flash Thinking, accessible en test depuis l’interface Gemini. Il est probable que ces nouveaux modèles plus capables soient présentés un peu plus tard, quand Google aura vraiment rattrapé OpenAI et DeepSeek.

Tous les modèles actuellement disponibles dans Gemini, dont les modèles de réflexion. // Source : Numerama

En lançant officiellement Gemini 2.0, Google ne prend pas encore la première place dans la course à l’intelligence artificielle. Il propose néanmoins un outil abordable pour les développeurs, tout en l’intégrant à ses propres services, ce qui en fait un acteur redoutable sur le marché de l’IA générative. Un des gros bémols est l’absence de transparence sur le développement de ces modèles : comme OpenAI, Google dissimule une grande partie des caractéristiques de ses LLM.

