Google DeepMind vient de lancer le « Project Genie ». Ce prototype de recherche permet de créer, modifier et explorer des « mondes virtuels » de façon interactive à partir de simples instructions.

Google va transformer vos rêves en réalité. Le 29 janvier 2026, le laboratoire DeepMind a dévoilé Project Genie, un prototype de recherche qui permet de créer, de modifier et d’explorer des mondes virtuels de façon interactive à partir de simples instructions écrites.

Si ce n’est pas la première fois qu’une entreprise s’aventure sur ce terrain, à l’image de Marble, développé par World Labs, et de ses mondes en 3D, l’outil de Google va bien plus loin. Il propose une véritable mini « expérience jouable en temps réel » qui se rapproche davantage d’un court jeu vidéo que d’une simple démonstration technique.

Comme en témoignent plusieurs messages publiés sur X, les possibilités offertes sont aussi nombreuses que bluffantes. De quoi illustrer les capacités de son modèle Genie 3 annoncé en août 2025.

Que peut-on faire avec le Project Genie de Google ?

L’outil permet de générer des environnements et des personnages à partir d’instructions textuelles et visuelles. Pour cela, il faut décrire l’environnement souhaité (forêt, ville futuriste, planète alien, etc.), ainsi que le personnage et son mode de déplacement (humain, animal, véhicule, objet…). Nano Banana Pro génère alors un premier aperçu que vous pouvez ensuite modifier avant de passer à la suite. Vous pouvez aussi cliquer sur « Roll the dice » (lancer le dé) pour laisser Genie 3 proposer un monde surprise. Ensuite, l’outil vous laisse choisir la vue « First person » (vue FPS) ou « Third person » (caméra derrière le personnage).

Avant d’entrer dans le monde, Genie génère une image fixe qui sert de croquis. Il est possible de modifier cette image (ajouter ou retirer des éléments, ajuster le style), puis de relancer la prévisualisation pour affiner le rendu. Vous pouvez également partir d’une image existante pour que Genie en fasse un monde explorable. La vidéo d’illustration montre, par exemple, qu’à partir d’une photo de votre chat, vous pouvez générer un monde dans lequel vous contrôlez ses déplacements dans votre appartement.

Google rend votre animal de compagnie jouable.  // Source : Google DeepMind
Google rend votre animal de compagnie jouable. // Source : Google DeepMind

Une fois que le croquis vous convient, un clic sur « Next » lance la génération du monde. Genie 3 crée alors l’environnement en temps réel, au fur et à mesure des déplacements du joueur, à environ 20-24 images par seconde en 720p. Les contrôles clavier par défaut sont les suivants : WASD pour se déplacer, Espace pour sauter ou monter, et les flèches directionnelles (ou la souris) pour orienter la caméra.

Vous disposez de 60 secondes pour explorer ce monde avant la fin de la session. Une fois celle‑ci terminée, vous pouvez réutiliser le même prompt afin de recréer un monde à partir des mêmes descriptions, ce qui peut générer une variante différente. Il est également possible de régénérer et revisiter le monde pour une nouvelle session d’exploration, ou de le « remixer » en partant d’un monde existant (le vôtre ou un monde de la galerie) et en modifiant le prompt ou l’image pour créer une nouvelle version. Enfin, vous pouvez télécharger une vidéo de votre session d’exploration.

L’utilisateur @TheoMediaAI a, par exemple, généré, via une invite « Text to World », un homme marchant sur Hollywood Boulevard, en contrôlant à la fois ses mouvements et la caméra.

Comment fonctionne le Project Genie de Google et qui y a accès ?

Sur le plan technique, Project Genie s’appuie sur Genie 3, un modèle de world modeling de Google DeepMind. Celui-ci apprend une véritable « physique du monde » à partir de grandes quantités de vidéos et se montre capable de générer des environnements interactifs cohérents.

À titre de comparaison, Genie 2 avait marqué une étape en permettant la création de mondes 3D jouables, mais avec des horizons encore courts et une qualité largement expérimentale. Genie 1, de son côté, posait surtout les bases du concept : une IA ne se contentant plus de générer des vidéos, mais des environnements interactifs à partir de données vidéo.

Project Genie s'appuie notamment sur Genie 3.  // Source : Google DeepMind
Project Genie s’appuie notamment sur Genie 3. // Source : Google DeepMind

Genie 3 se révèle ainsi particulièrement intéressant pour le prototypage de jeux vidéo. Des journalistes ont notamment montré qu’il était possible de recréer rapidement des vibes à la Zelda ou Mario, faisant du modèle un véritable bac à sable pour tester des idées de niveaux, d’ambiances ou de mécaniques, sans passer par un moteur 3D classique.

Mais, pour Google, son utilité ne se résume pas aux jeux vidéo. DeepMind met en avant son potentiel dans l’éducation, en évoquant par exemple la possibilité de visiter la Rome antique, d’explorer des écosystèmes ou de visualiser des phénomènes physiques au sein de mondes interactifs, afin de rendre l’apprentissage plus immersif. La firme souligne également son intérêt pour la création de contenus : Genie 3 peut servir à visualiser rapidement des scènes pour le cinéma, l’animation, la publicité ou la XR, en générant des environnements animés à partir de simples descriptions textuelles ou de concept art.

Enfin, Google insiste sur l’apport potentiel de Genie 3 pour la recherche sur les agents incarnés, c’est‑à‑dire des agents d’IA dotés d’un « corps » dans un environnement, capables d’y percevoir et d’y accomplir des actions. Le modèle peut générer à la volée des environnements variés et physiquement cohérents, utiles pour entraîner des agents (comme SIMA) ou des systèmes autonomes, et pour tester des edge cases (piéton inattendu, animal sur la route, etc.)

La marque le rappelle néanmoins : l’outil reste expérimental et loin d’être parfait. Le modèle ne peut pour l’instant supporter que quelques minutes d’interaction continue ; au-delà, la cohérence des mondes générés tend à se dégrader. Ceux-ci ne sont pas photoréalistes et ne respectent pas toujours fidèlement le prompt, l’image de référence ou la physique réelle. Genie 3 peine également à reproduire avec précision des lieux réels (géographie exacte, architecture fidèle) et génère souvent du texte peu lisible ou maladroitement intégré dans les scènes.

L’espace d’actions demeure limité : il s’agit principalement de navigation (se déplacer, tourner, sauter), tandis que les interactions plus riches — multi-agents, combats complexes ou gameplay précis — restent difficiles à stabiliser. À noter enfin que le système applique des politiques strictes : les contenus violents ou adultes sont bloqués et il est impossible de générer certains univers issus de licences protégées (type Disney ou Nintendo).

Autre contrainte notable : la disponibilité. Project Genie nécessite un abonnement Google AI Ultra, facturé environ 250 dollars par mois, soit le niveau le plus élevé de l’offre IA de Google. L’outil n’est pour l’instant accessible qu’aux États-Unis et réservé aux personnes âgées d’au moins 18 ans. L’accès se fait via Google Labs, avec un compte Google personnel éligible. Si la firme indique que le déploiement doit s’étendre à d’autres territoires à terme, aucun calendrier public précis n’a encore été communiqué.


Découvrez les bonus

+ rapide, + pratique, + exclusif

Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.

Découvrez les nombreux avantages de Numerama+.

S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+
Toute l'actu tech en un clien d'oeil

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !


Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer !