« Et si vous pouviez non seulement regarder une vidéo générée, mais aussi l’explorer ? » C’est en ces termes que Google DeepMind a dévoilé le 5 août 2025 un nouveau modèle d’intelligence artificielle (IA), baptisé Genie 3. Sa particularité ? « Créer des environnements interactifs et jouables à partir d’un seul prompt de texte », décrit l’entreprise.
Cette nouveauté marque une progression notable par rapport au modèle Génie 2 révélé en décembre 2024. Dorénavant, Genie 3 est présenté par DeepMind comme le premier modèle permettant une interaction en temps réel. L’entreprise indique que la cohérence et le réalisme sont améliorés par rapport à Genie 2.
24 images par seconde, une cohérence de plusieurs minutes
« Aujourd’hui, nous annonçons Genie 3, un modèle mondial polyvalent capable de générer une diversité d’environnements interactifs sans précédent », s’enthousiasme DeepMind, la filiale de Google spécialisée dans l’IA, dans son communiqué. Et de souligner spécifiquement que tout part d’une banale instruction donnée par l’internaute.


« Genie 3 peut générer des mondes dynamiques dans lesquels vous pouvez naviguer en temps réel à 24 images par seconde, en conservant une cohérence pendant quelques minutes à une résolution de 720p », soit du HD Ready, c’est-à-dire une qualité d’image juste un cran en dessous de la haute définition (1080p). Chaque image est créée par le modèle en réponse aux actions entreprises par l’utilisateur.
Genie 2 | Genie 3 | |
---|---|---|
Résolution | 360p | 720p |
Domaine | Environnements 3D | Usage général |
Contrôle | Actions limitées avec le clavier et la souris | Navigation ; prompts pour créer des mondes interactifs |
Horizon d’interactions | 10 à 20 secondes | Plusieurs minutes |
Latence d’interactions | Pas en temps réel | Temps réel |
DeepMind liste plusieurs capacités de son nouveau modèle :
- modéliser des mondes avec leurs propriétés physiques (eau, lumière) ;
- simuler des mondes naturels, tels des écosystèmes animaux ou végétaux ;
- créer des animations et de la fiction (scénarios, personnages aminés) ;
- explorer des lieux et des contextes historiques, y compris révolus.
Pour atteindre ce niveau d’interactivité et d’immersion en temps réel, DeepMind a dû lutter contre la tendance de l’IA à accumuler des imprécisions au fil du temps.
Il a fallu préserver la cohérence des environnements créés au fur et à mesure. Ainsi, Genie 3 conserve « une mémoire visuelle remontant jusqu’à une minute auparavant ». Si l’utilisateur revisite un lieu déjà exploré il y a une minute ou moins, le modèle puise dans sa mémoire pour rester cohérent — tout cela étant évidemment possible au prix de calculs complexes.

Genie 3 de DeepMind est « autorégressif »
Genie 3 est un modèle « autorégressif », selon Shlomi Fruchter, directeur de recherches chez DeepMind, interrogé par TechCrunch. Il génère une image à la fois, et « doit se référer à ce qui a été généré auparavant pour décider de ce qui va se passer ensuite. C’est un élément clé de l’architecture », a-t-il souligné. En résumé, le modèle apprend par lui-même comment l’environnement fonctionne — par exemple, comment ses objets se déplacent.
En plus de permettre de naviguer dans ces environnements, Genie 3 peut tenir compte des consignes de l’utilisateur pour faire évoluer le monde en temps réel, que ce soit un changement dans la météo, ou bien en intégrant de nouveaux protagonistes au scénario. Les possibilités d’actualisation sont nombreuses et dépendent de l’inventivité du prompt, en somme.
DeepMind reconnait toutefois des limites à Genie 3, notamment sa « durée d’interaction limitée ». « Le modèle peut actuellement prendre en charge quelques minutes d’interactions continue, plutôt que plusieurs heures. » Autre faiblesse : Genie 3 est incapable de simuler des lieux du monde réel. Quant à sa compréhension de la physique, quoique déjà impressionnante, elle reste encore à parfaire.
Quand pourra-t-on tester ce nouveau modèle ? On l’ignore. Actuellement, seules quelques rares personnes ont accès à Genie 3, précise DeepMind, principalement des créateurs et des universitaires.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

Toute l'actu tech en un clin d'œil
Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !
Pour de l’actu en petit comité, rejoignez la communauté Numerama sur WhatsApp !