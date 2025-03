Lecture Zen Résumer l'article

Aujourd’hui cantonnée à des interfaces virtuelles, l’intelligence artificielle pourrait un jour avoir un corps, grâce aux robots. Google, par l’intermédiaire de sa filiale DeepMind, annonce deux nouveaux modèles destinés à donner des capacités de raisonnement à un humanoïde.

Il y a quelques années, avec son ancienne filiale Boston Dynamics, Google avait pris beaucoup d’avance en robotique. L’entreprise a depuis revendu cette activité à SoftBank, qui l’a lui même cédé à Hyundai. Google est devenu un acteur plus petit de la robotique, mais pourrait rapidement changer la dynamique.

Dans un billet de blog publié le 12 mars, Google annonce deux innovations majeures dans la course aux robots. L’entreprise californienne va lancer Gemini Robotics et Gemini Robotics-ER, deux modèles conçus pour donner de « l’intelligence » à des robots.

Gemini Robotics : l’IA sort des écrans pour contrôler les robots

Dans un futur plus ou moins proche, plusieurs acteurs de la Silicon Valley croient en une explosion du marché de la robotique. Nvidia et Tesla, par exemple, sont convaincus que tous les foyers possèderont leur robot domestique. Ce robot pourrait s’occuper du rangement, de la cuisine et de la surveillance de la maison.

Il y a néanmoins un obstacle de taille : comment rendre un robot intelligent ? C’est ici que Google DeepMind intervient. L’entreprise ne veut plus fabriquer ses propres robots, mais leur donner un moteur visuel. Elle lance deux projets simultanément :

Gemini Robotics , qui est un « VLA », un modèle « Vision-Language-Action ». Dérivé de Gemini 2.0, il vise à donner des instructions physiques au robot. Là où une IA a pour habitude de répondre avec des mots, Gemini Robotics peut faire des choses. Google le présente comme généraliste (capable de discuter de tout), interactif (capable de deviner ce qu’on attend de lui) et minutieux (il doit pouvoir manipuler avec précaution des objets, en donnant des consignes avce plusieurs étapes).

Ces bras robotiques utilisent Gemini Robotics pour manipuler des objets sans téléguidage manuel. // Source : Google DeepMind

En plus des robots humanoïdes, qui ont pour avantage de pouvoir s’adapter aux espaces des humains, Gemini Robotics peut contrôler plus généralement n’importe quel robot avec des « bras » — ce qui est, on ne va pas se mentir, le gros de l’industrie. L’entreprise annonce un partenariat avec Apptronik pour créer des robots humanoïdes, mais compte aussi partager Gemini Robotics-ER avec Agile Robots, Boston Dynamics et Enchanted Tools.

Quid des enjeux sociétaux et de la peur de Terminator ? Google insiste sur sa prudence, avec notamment un conseil d’experts pour délimiter les usages. L’idée avec Gemini Robotics est d’encadrer les robots, pas de les libérer.

Gemma 3 : Google lance un modèle open source

Parallèlement à l’annonce de Gemini Robotics, qui est un modèle propriétaire comme l’ensemble de la famille Gemini, Google a annoncé Gemma 3, la nouvelle version de son modèle open source. Cette réponse à DeepSeek-R1, que n’importe qui peut installer, se décline en quatre modèles avec 1, 4, 12 ou 27 milliards de paramètres. Google annonce des résultats parmi les meilleurs du marché, avec de nombreux usages possibles en local.

Gemma 3 est juste derrière DeepSeek-R1 selon de premiers tests. // Source : Google

Gemma 3 peut être téléchargé par n’importe qui avec une machine suffisamment puissante, sur Hugging Face notamment.

