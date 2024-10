Lecture Zen Résumer l'article

Google a déployé Gemini Live en France et en français ce jeudi 3 octobre. La fonctionnalité n’est plus réservée aux smartphones Pixel, mais est disponible sur tous les modèles Android. Cet assistant vocal d’un nouveau genre sera prochainement déployé sur iOS.

Gemini Live est disponible dans les pays anglophones depuis la sortie des Pixel 9, les derniers smartphones de Google. Cet assistant vocal d’un nouveau genre, capable de parler de manière fluide, parle parfaitement français… malgré son indisponibilité en France. Il faut passer son smartphone en anglais pour l’activer, puis lui parler en français.

Jeudi 3 octobre, Google a annoncé la fin de cette différenciation : Gemini Live est désormais disponible en France, avec le support natif du français. Il s’agit du rival du nouveau ChatGPT Voice Advanced, pour l’instant bloqué dans l’Union européenne.

Un assistant vocal beaucoup plus fort que Google Assistant

Depuis l’annonce d’Assistant with Bard il y a près d’un an (deux mois avant l’annonce de Gemini), la mort programmée de Google Assistant semble inévitable. Google fusionne peu à peu ces deux assistants vocaux, pour permettre à Gemini, qui est basé sur un LLM (grand modèle de langage), d’effectuer des actions classiques (comme un minuteur ou un appel).

Avec Gemini Live, l’entreprise va encore plus loin. On peut discuter de manière « naturelle » avec le chatbot de Google, et ce gratuitement.

D'ailleurs, et c'est assez étonnant, Gemini Live parle parfaitement français sans accent (contrairement à ChatGPT). Mais si vous ne passez pas le Pixel 9 en anglais, en supprimant le français dans les réglages de Gemini, ça ne fonctionne pas. pic.twitter.com/SKDKSxhvFn — Nicolas Lellouche (@LelloucheNico) August 21, 2024

BFM Tech&Co a pu tester la fonctionnalité, qui permet de choisir parmi dix voix (cinq féminines et cinq masculines). L’application Gemini voit apparaître une icône en bas à droite de l’écran pour démarrer l’interaction avec le chatbot, comme si c’était un appel vocal. On peut donc discuter avec lui, lui poser des questions, l’interrompre, lui demander des précisions, comme si l’on écrivait à Gemini. Il s’agit de la même interface que dans la version anglaise qui, rappelons-le, parlais déjà français.

Françoise Beaufays, chercheuse chez Google en charge de l’apprentissage automatique pour les modèles de voix, interrogée par nos confrères, précise que « Le modèle de base est multilingue et optimisé pour les langues qu’on présente aux utilisateurs. Tout est adapté pour le français : la reconnaissance vocale, le modèle, les réponses qu’il produit et évidemment les voix ». Il est même possible de changer de langue à la volée. À terme, il devrait être possible de demander à Gemini Live d’analyser des documents et des photos, comme c’est le cas pour la version écrite actuellement. À la fin d’une discussion, Gemini rédige une synthèse de la discussion que vous avez eue avec lui.

Les étapes pour activer Gemini Live // Source : Google

Gemini Live est en déploiement sur les smartphones Android, mais c’est une opération qui va prendre plusieurs semaines, comme l’a indiqué Google. Si vous n’avez pas encore accès à la fonctionnalité, c’est tout à fait normal : il suffit de patienter.

La guerre des chatbots vocaux est lancée

Dans le même temps, OpenAI a lancé il y a quelques jours le nouveau mode vocal de ChatGPT, Voice Advanced, basé sur GPT-4o. Il n’est toujours pas disponible en France, mais peut être testé via un VPN en se localisant virtuellement aux États-Unis. Lui aussi offre de grandes capacités de parole, avec de l’émotion dans la voix et la capacité de comprendre vos intonations.

@numerama On a essayé le nouveau ChatGPT en français avec le mode "Voice Advanced" : c'est aussi hilarant que flippant 😂 Vous allez adorer le voir rapper, nous crier dessus en pirate… ou parler français avec un accent espagnol 😬 #numerama #chatgpt #chatgptvoice #humour #tech #technologie #techtok ♬ son original – Numerama – Numerama

Le 1ᵉʳ octobre, Microsoft a aussi annoncé tout un tas de nouveautés pour son chatbot, Copilot, basé sur GPT. Parmi elles, Copilot Voice, qui vise à faciliter « l’interaction avec votre compagnon IA ». Microsoft se base sur la même technologie qu’OpenAI pour réinventer les conversations vocales, avec pour pari que vous « téléphonerez » bientôt à son assistant vocal pendant des heures.

Une démonstration de Copilot Voice // Source : Microsoft

OpenAI, Google et Microsoft se positionnent sur les interactions vocales avec les chatbots basés sur des LLM, pendant qu’Apple peaufine son nouveau Siri (lui aussi avec un LLM, mais avec des tâches dédiées). Le futur de l’IA pourrait passer par l’avènement de ces nouveaux assistants vocaux.

