Google voulait organiser une conférence sur l’intelligence artificielle le 8 février 2023 ? Qu’à cela ne tienne, Microsoft organisera la sienne le… 7 février. Le géant des logiciels vient d’inviter la presse à son quartier général, aux États-Unis, pour parler de « l’avancement de quelques projets passionnants ». Bien sûr, il s’agira aussi d’algorithmes d’IA et de chatbots.
Preuve en est : le 6 février, Sam Altman se prenait en photo avec Satya Nadella, le patron de Microsoft, en expliquant être « impatient de participer à l’événement de demain ». Sam Altman n’est pas n’importe qui : il est le patron de la société OpenAI, qui est derrière quelques-uns des projets en IA les plus en vue du moment, comme ChatGPT, DALL-E ou encore Copilot.
La présence du patron d’OpenAI n’est évidemment pas une surprise, quand on sait à quel point Microsoft mise sur cette jeune société. En 2019, elle y investissait un milliard de dollars. En 2023, changement d’échelle avec une mise à 10 milliards. En janvier, la firme de Redmond indiquait que cet effort ferait émerger de nouvelles « expériences numériques ».
Justement, on aura peut-être un aperçu de ces expériences ce 7 février, à 19 heures (heure de Paris). Parmi les perspectives plausibles qui seront peut-être esquissées, on attend des nouvelles d’une intégration de ChatGPT dans le moteur de recherche de Microsoft (Bing), mais aussi dans certains logiciels phares du groupe, comme Word ou Outlook.
L’interfaçage de Bing et de ChatGPT pourrait constituer à long terme un risque pour Google, s’il ne réagit pas. Le chatbot d’OpenAI peut fournir des réponses directement, là où Google renvoie « juste » une liste de liens dans ses résultats. Si le chatbot parvenait à être pertinent, ce serait pour les internautes un gain de temps et de clics, leur évitant de chercher de page en page.
Google, évidemment, ne reste pas les bras ballants. Ces dernières semaines, on a eu vent d’un « ChatGPT de la musique » imaginé par le géant de la recherche. Surtout, Google a annoncé Bard, son IA concurrente de ChatGPT, le… 6 février, comme pour donner le change. L’existence de Bard, qui repose sur un autre modèle de langage que ChatGPT, avait fuité jours plus tôt.
Le télescopage des annonces et des conférences entre Google et Microsoft, qu’il soit le fruit du hasard ou non, montre l’énorme enjeu que sont devenus les outils basés sur les algorithmes d’intelligence artificielle. Les investissements sont considérables — pour Bard, on parle d’un investissement de Google autour des 400 millions de dollars.
GPT-4, ChatGPT dans Bing… que prévoient Microsoft et OpenAI ?
Particularité de la conférence de Microsoft : elle ne sera pas diffusée en direct, ce qui donne le sentiment qu’elle a été organisée précipitamment. Quant au contenu de ce qui sera annoncé, l’heure est aux spéculations :
- Une mise à jour de ChatGPT, pour inclure des informations après 2021 (le chatbot d’OpenAI ne gère pas les données récentes, aujourd’hui) ?
- L’amélioration du fonctionnement (et des réponses) de ChatGPT ?
- Une intégration de ChatGPT au moteur de recherche Bing ?
- Une intégration de ChatGPT aux autres outils de Microsoft (Word, Outlook…) ?
- La présentation d’un tout nouveau projet chez ChatGPT, en plus de ChatGPT, DALL-E, Copilot, etc. ?
- La présentation de GPT-4 ?
Clippy + ChatGPT ?
GPT-4 est le nom donné à la prochaine évolution du modèle de langage sur lequel repose ChatGPT, entre autres. ChatGPT se base sur une version de GPT numérotée 3.5. Beaucoup de rumeurs circulent sur la version 4 de ce « Generative Pre-trained Transformer » (« Transformateur génératif pré-entraîné »), notamment sur ses performances.
GPT-3 repose sur 175 milliards de paramètres, par exemple. Depuis des mois, il est dit que GPT-4 en aurait 571 fois plus (cent billions), mais le fondateur d’OpenAI a démenti ce bruit de couloir. GPT-4 aurait un même volume de paramètres, mais ceux-ci seraient nettement optimisés pour traiter les données. Ainsi, les réponses seraient plus pertinentes.
Autre rumeur avec GPT-4 : sa capacité à aller au-delà du texte, pour traiter aussi du son, de l’image et de la vidéo. En clair, il serait multimodal. C’est plausible : après tout, DALL-E génère de l’image en reposant sur GPT-3. La manipulation de données plus récentes est aussi attendue. Mais, pour en avoir le cœur net, il faudra patienter jusqu’à la fin de la journée.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Marre des réseaux sociaux ? Rejoignez-nous sur WhatsApp !