Gemini est la réponse de Google à ChatGPT. Lancé en 2023 sous le nom de Bard, l’outil est devenu Gemini en février 2024, pour refléter la volonté de Google d’en faire le nouvel assistant par défaut de son écosystème. Gemini est considéré comme l’une des meilleures solutions parmi les outils de génération de texte — y compris face au chatbot d’OpenAI. Depuis son lancement, cet agent conversationnel a changé régulièrement de modèle de langage, passant de LaMDA à PaLM, puis enfin Gemini.
C’est quoi l’application Gemini ?
Google Gemini est un chatbot, c’est-à-dire un agent conversationnel, semblable au ChatGPT d’OpenAI. Comme son nom l’indique, il est conçu par Google. Son rôle est de générer des réponses aux questions ou aux instructions que l’internaute lui donne — ces commandes sont appelée des « prompts », autrement dit des ordres qu’on lui passe.
Comme d’autres chatbots, Gemini est qualifié « d’intelligence artificielle ». C’est une formulation admise dans le langage courant, mais qui n’est pas exacte sur un plan technique. Bien sûr, Gemini mobilise des algorithmes et des procédés provenant du champ de recherche sur l’intelligence artificielle. Cependant, ce n’est pas une vraie IA, à l’image de Skynet, Jarvis, HAL 9000 ou C-3PO.
Gemini est spécialisé dans la génération de contenu sous la forme de texte (il existe d’autres outils qui sont taillés pour produire autre chose, comme de la musique ou des images). Il s’appuie sur le modèle de langage LaMDA et, grâce à son accès à Internet, il peut exploiter des informations les plus récentes pour répondre aux requêtes du public.
Dans les plans de Google, Gemini doit être intégré prochainement dans son moteur de recherche, peut-être à la place du bouton « J’ai de la chance » sur la page d’accueil. Aujourd’hui, le chatbot est encore en phase de rodage, afin de s’assurer du bon comportement de l’outil. Ce serait terrible de proposer un chatbot enchaînant les erreurs ou des réponses absurdes.
Est-ce que Google Gemini est gratuit ?
Oui, l’utilisation de Gemini est gratuite. Il vous faut néanmoins un compte Google pour discuter avec le chatbot.
Comment utiliser Gemini sur Google ?
Vous devez vous rendre sur le site dédié Gemini.Google.com.
Pourquoi Bard est devenu Gemini ?
Le 9 février 2024, un an après avoir lancé Google Bard, Google a annoncé renommer son intelligence artificielle. Le service s’appelle désormais Gemini, comme le modèle de langage qu’il utilise.
Avec ce nouveau nom, Google souhaite imposer une marque dans l’imaginaire des utilisateurs. Quand Gemini est présent dans un produit, cela veut dire qu’il peut utiliser l’intelligence artificielle.
Pourquoi avoir choisi Bard en premier nom pour le chatbot ?
Google n’a pas opté pour un nom complexe, comme ChatGPT, qui est un mot-valise combinant « tchat » pour évoquer une discussion et GPT, un acronyme décrivant la technique utilisée par OpenAI pour diriger son chatbot. Le géant de la recherche a plutôt convoqué l’imaginaire collectif, en s’inspirant des… bardes, ces poètes et conteurs issus de la culture gaélique.
Le New York Times a rapporté le 6 février que Bard avait été retenu en tant que « conteur d’histoires ». Le nom est élégant, mais peut-être légèrement en décalage avec ce que l’on attend d’un outil du genre. On ne veut pas tant lire des histoires ou des fables, mais avoir accès à des informations fiables.
Quand cette IA de Google a-t-elle été officialisée ?
Google a officialisé l’existence de Bard dans la semaine du 6 février et, dans la foulée, le géant de la recherche a organisé une conférence autour de l’intelligence artificielle le 8 février, à Paris. C’était une semaine très dense sur l’IA, car outre l’officialisation de Bard et l’évènement dans la capitale, Microsoft enchaînait les annonces avec ChatGPT et OpenAI le 7 février.
L’existence de Bard avait été éventée par la presse quelques jours plus tôt. En effet, des médias avaient pu, dès la fin janvier, observer le fonctionnement du chatbot. Son nom final était déjà pratiquement trouvé — on le désignait sous « Apprentice Bard » — et des différences avec ChatGPT avaient été observées, notamment sur la fraicheur des informations.
Cette semaine a toutefois tourné au cauchemar pour Google. Le 6 février, une démonstration de Bard a affiché une erreur factuelle, alors qu’elle aurait pu être contrôlée en amont (une découverte en astronomie a été attribuée à tort au télescope James Webb). Et le 8 février, la conférence a très peu parlé de Bard, Google mettant l’accent sur d’autres choses.
L’évènement a laissé un goût d’inachevé pour bon nombre d’observateurs, car la firme de Mountain View semblait manquer d’entrain pour Bard. Par contraste, les annonces de Microsoft avec ChatGPT étaient autrement spectaculaires. Ces trois facteurs (erreur de Bard, conférence faible, rival dynamique) ont fait plonger le cours de Google en bourse, effaçant 100 milliards de dollars.
Comment fonctionne Google Gemini ?
Gemini s’appuie sur un modèle de traitement automatique du langage. C’est ce qui lui sert de « moteur », pour comprendre le sens d’une demande et pour savoir de quelle manière répondre. Plusieurs modèles de langage se sont succédé en 2023 pour faire tourner Gemini — signe des efforts déployés par Google pour obtenir un chatbot à la hauteur.
Le premier a été LaMDA, acronyme pour Language Model for Dialogue Applications. Conçu par Google, il a été présenté au public pour la première fois en 2021. Depuis, une nouvelle version a été développée, plus aboutie. LaMDA mobilise un réseau de neurones artificiels, Transformer, mis au point en 2017, et sur des recherches en IA datant de 2020.
Au départ, Google a employé une version allégée de LaMDA. « Ce modèle, plus petit et nécessitant une puissance de calcul moindre, nous permet de nous déployer à un plus grand nombre d’utilisateurs et de traiter un volume plus important de retours », expliquait l’entreprise américaine, au moment de présenter son agent conversationnel.
Par la suite, Google a basculé Gemini sur PaLM (Pathways Language Model), qui était en gestation depuis avril 2022. Le modèle a été activé en mars 2023. À l’occasion de la keynote Google I/O de cette même année, Google a dévoilé PaLM 2. Au mois de décembre, Google a annoncé Gemini pour Bard — ce dernier modèle est décliné en trois versions.
Par ailleurs, Gemini est connecté à Internet pour avoir des données récentes. Les gérants de sites web peuvent imposer à Google de ne pas lire leurs pages pour entraîner le chatbot — ce que font par exemple certains sites de presse au nom de leur droit d’auteur. Par le passé, Google s’était déjà retrouvé accusé d’entraîner ses IA avec les outils de la concurrence. Ce que le groupe a démenti.
Pourquoi Google a-t-il dévoilé Gemini ?
Depuis la présentation de ChatGPT en novembre 2022, Google donne l’impression d’être sur la défensive et à la traîne sur les intelligences artificielles génératrices de contenu. Ce sentiment est exacerbé par l’immense intérêt du public et des médias pour le chatbot d’OpenAI, depuis accentué par l’investissement massif de Microsoft dans OpenAI et toutes les annonces passées.
La sensation que Gemini (Bard à l’époque) a été annoncé précipitamment, en réaction à ChatGPT, est renforcée par le fait que Google a peu reparlé de LaMDA (le modèle de langage sur lequel repose son chatbot) et de ses projets en matière d’IA et de chatbot. Certes, LaMDA a été dévoilé en mai 2021, et actualisé l’année suivante. Mais le géant du web ne paraît pas très pressé.
À cela s’ajoutent les échos et l’analyse des médias.
On sait que Microsoft voit en ChatGPT un levier extraordinaire pour « tuer » Google sur le marché de la recherche (ou, du moins, pour l’affaiblir). Le New York Times a évoqué une sorte « d’alerte rouge » chez Google depuis la sortie de ChatGPT. On a même rapporté que les deux fondateurs, Larry Page et Sergey Brin, ont été rappelés en urgence. Bref, il y a de l’inquiétude dans l’air.
La prochaine conférence annuelle de Google I/O, attendue ce printemps, pourrait être l’occasion pour Google de sortir l’artillerie lourde, afin de reprendre un peu l’initiative — et la lumière médiatique. Les bruits de couloir suggèrent que le géant du net aurait sur les rails une vingtaine de produits et de services embarquant de l’intelligence artificielle.
Google Gemini est-il disponible en France ?
Le lancement de Bard en France est effectif depuis le 12 juillet 2023. Jack Krawczyk, le directeur produit en charge du chatbot, l’a indiqué à Numerama. Une sortie qui a eu lieu quatre mois après les États-Unis et le Royaume-Uni et deux mois après une vague générale de 180 pays. L’Union européenne a été servie plus tard, en raison de sa législation plus stricte sur les données.
L’intelligence artificielle de Google fait-elle mieux que ChatGPT ?
La première impression laissée par Gemini, à son lancement en France, était celle d’un chatbot un peu nigaud, capable de raconter beaucoup de bêtises. Dans le jargon, on dit qu’une IA hallucine lorsqu’elle dit n’importe quoi. Les premières comparaisons face à ChatGPT donnaient clairement un avantage à l’agent conversationnel conçu par OpenAI. Numerama en a fait une vidéo :
Depuis, l’entreprise américaine a fait des efforts. Elle a étendu les capacités de son chatbot grâce à des extensions qui lui permettent de communiquer avec les autres services de Google. Des efforts ont été faits pour qu’il garde le fil durant un échange. Enfin, Gemini est aussi arrivé dans l’assistant virtuel de la firme de Mountain View.
Mais c’est surtout le plan de bataille secret « Gemini », mis en place pour renverser ChatGPT d’OpenAI, qui a constitué la principale riposte du groupe. Après des mois de développement, le nouveau modèle de langage Gemini a été officialisé début décembre (mais elle est indisponible en France à date). Google a commencé à la déployer, non sans récolter une polémique au passage.
Bien entendu, Google argue faire mieux que GPT-4 (le modèle de langage le plus avancé d’OpenAI) dans sept des huit critères d’évaluation — traduction, maths, code… Gemini aurait aussi satisfait 90 % des problèmes issus de 57 sujets, allant du droit à l’éthique, en passant par les mathématiques, l’histoire, la médecine ou encore la physique. Mais OpenAI améliore aussi ChatGPT.
Pourquoi Google craint ChatGPT, et ne veut pas aller trop loin avec Gemini ?
Microsoft, aujourd’hui, n’a quasiment aucune position dans la recherche en ligne — son moteur maison, Bing, n’occupe que quelques pourcents dans le monde. Pour le géant des logiciels, cette activité n’est pas stratégique. En tout cas, pas autant que pour Google. Or, les chatbots pourraient bouleverser la manière dont les internautes accèdent à l’information.
Pour le dire vite, il existe une possibilité que dans un avenir plus ou moins lointain, les moteurs de recherche deviennent obsolètes — on demanderait juste à un chatbot de nous trouver l’information. Or aujourd’hui, Google exerce sa domination sur le web, car il en est devenu la porte d’entrée centrale pour la majorité des internautes. Et c’est avec elle qu’il gagne de l’argent, via la publicité.
Microsoft, lui, n’a rien à perdre. C’est une occasion unique, à la fois de bouleverser le web avec ChatGPT et de prendre l’ascendant sur Google. Ce serait une première en vingt ans. On comprend donc pourquoi Google tente d’empêcher la révolution qu’est ChatGPT. C’est sa domination sur la recherche qui est en péril et peut-être même son existence à long terme.
Bref, la guerre de l’intelligence artificielle — en tout cas des chatbots, de Gemini vs ChatGPT et de Microsoft vs Google — débute à peine. Les hostilités démarrent tout juste et on ne sait pas quand et comment ce conflit se terminera, s’il y aura d’autres belligérants (comme Amazon ou Apple ?), ni quelles seront les victimes. Et du côté du web, il y aura peut-être des dommages collatéraux.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Vous voulez tout savoir sur la mobilité de demain, des voitures électriques aux VAE ? Abonnez-vous dès maintenant à notre newsletter Watt Else !