Développé par Google DeepMind, « Project Astra » est une démonstration du futur des assistants intelligents. L’objectif de Google est de concevoir un outil multimodal capable d’écrire, de parler et de voir. Certaines fonctions seront intégrées à l’app Gemini.

Quelques minutes avant qu’OpenAI présente la nouvelle version de ChatGPT Voice, capable de parler naturellement, de changer de ton et de commenter des images en temps réel grâce au modèle GPT-4o, Google a publié la vidéo d’une application inconnue, capable de parler et de voir grâce à l’appareil photo d’un smartphone.

24 heures plus tard, cette application a un nom. Développée par DeepMind, le laboratoire de recherche de Google, « Project Astra » est une démonstration « du futur des assistants IA » basé sur le modèle Google Gemini. Il peut, lui aussi, commenter le monde en temps réel.

Google contre OpenAI : le projet Astra est-il aussi abouti que ChatGPT Voice ?

Sans surprise, le projet Astra est la vedette de la Google I/O, la grande conférence de Google largement dominée par l’intelligence artificielle générative en 2024.

Il prend la forme d’une application Android à l’interface très simple. Un bouton permet d’activer la caméra, un autre de dessiner pour entourer un objet. Le reste se fonde sur une interaction vocale continue entre l’humain et Gemini, qui nous rappelle la première démo du modèle de langage fin 2023 (qui était, rappelons-le, truquée).

L'interface du Project Astra.
L’interface du Project Astra. // Source : Google

Comme ChatGPT Voice, Astra répond rapidement aux questions. Il analyse le contexte et les images du vrai monde pour fournir des réponses plus justes. Il peut répondre à plusieurs questions et analyser du texte, comme du code informatique.

D’une certaine manière, l’annonce du projet Astra aurait été plus impressionnante si OpenAI n’avait pas dévoilé un projet similaire 24 heures plus tôt. La voix de synthèse de Google semble moins humaine, ne peut pas changer de ton et correspond à un « projet », là où OpenAI affirme que son service est prêt à être diffusé. Quoi qu’il en soit, Google répond aux personnes qui pensent le géant dépassé : il est le seul concurrent crédible d’OpenAI aujourd’hui.

Pas besoin de copier-coller du code, la reconnaissance de texte suffit.
Pas besoin de copier-coller du code, la reconnaissance de texte suffit. // Source : Google

Des lunettes de réalité augmentée : le projet Astra ne se limite pas au smartphone

Le project Astra, en tant que tel, ne verra probablement jamais le jour. À la place, Google compte intégrer dès cette année certaines de ses fonctions à l’application Gemini, qui remplace Google Assistant sur Android (et probablement bientôt sur iOS).

Le principal enjeu de DeepMind est de réduire le temps de réponse, qui est crucial pour créer une conversation naturelle. OpenAI dit y être parvenu, mais personne en dehors de l’entreprise n’a encore testé l’outil — les pincettes sont de rigueur.

Google réfléchit aussi à l’intégration de l’IA générative sur le long terme. Quelques années après avoir abandonné les Google Glass, le géant du web dit tester une version de son projet Astra pour lunettes connectées. L’idée serait d’utiliser une caméra pour que l’IA voit la même chose qu’un humain, pour lui donner des conseils sur ce qu’il faut faire. Cette approche rappelle celle de Meta avec ses Ray-Ban connectées (ou celle de Rabbit et Humane avec leurs gadgets dispensables).

Un problème mathématique ? Des lunettes reliées à Gemini pourraient y répondre.
Un problème mathématique ? Des lunettes reliées à Gemini pourraient y répondre. // Source : Google

Qui d’OpenAI ou de Google gagnera la guerre de l’IA ? L’annonce de GPT-4o la veille de la présentation du projet Astra n’est pas anodine. Les deux entreprises se disputent le trône de l’intelligence artificielle. Pour y parvenir, Google peut s’appuyer sur ses services, tandis qu’OpenAI mise tout sur sa capacité à tout casser.

Découvrez les bonus

+ rapide, + pratique, + exclusif

Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.

Découvrez les nombreux avantages de Numerama+.

S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+

Vous voulez tout savoir sur la mobilité de demain, des voitures électriques aux VAE ? Abonnez-vous dès maintenant à notre newsletter Watt Else !