Un évènement sur l’intelligence artificielle, organisé par Microsoft, est prévu le 16 mars. Ce devrait être la présentation de GPT-4, la prochaine génération du modèle de langage d’OpenAI. ChatGPT fonctionne avec GPT-3.5.

Mise à jour du 14 mars : Ça y est, GPT-4 est arrivé ! Avec un bon lot de nouveautés et d’améliorations, qui devraient rendre ChatGPT encore plus intelligent.

Vous aviez trouvé ChatGPT fascinant, malgré toutes ses imperfections ? La suite arrive très bientôt. La prochaine génération du modèle de langage conçu par la société américaine spécialisée dans l’intelligence artificielle OpenAI, GPT-4, doit être présentée à la mi-mars, selon Heise Online, qui s’appuie sur des déclarations des responsables de Microsoft Allemagne.

Un modèle de langage est un modèle statistique, qui détermine l’agencement des mots dans une phrase, la façon dont ils s’articulent les uns les autres, mais aussi les termes les plus susceptibles d’apparaître après une séquence précise. En clair, un modèle de langage modélise cette distribution en s’appuyant sur des algorithmes et des mathématiques.

ChatGPT peut-il vraiment devenir écrivain ?  // Source : Claire Braikeh pour Numerama
ChatGPT répondant par écrit à une demande d’internaute. Allégorie. // Source : Claire Braikeh pour Numerama

Spécialisé dans la génération de texte, ChatGPT repose sur une version améliorée de GPT-3 (la troisième version du modèle de langage d’OpenAI), appelée GPT-3.5. GPT-3 mobilise 175 milliards de paramètres et parvient à imiter le langage naturel avec un certain brio : on pourrait croire que l’on discute avec une autre personne par écrans interposés.

Quelles nouveautés pour GPT-4 ?

GPT-4 fait l’objet de grosses rumeurs depuis 2022. On dit qu’il aurait encore plus de paramètres (ce qui est faux, selon Sam Altman, le fondateur d’OpenAI). Toutefois, le modèle de langage serait énormément affiné et des progrès sont à attendre du côté du traitement des « prompts ». GPT-4 devrait aussi manipuler des données plus récentes.

Mais la principale transformation de GPT-4 serait une capacité multimodale ; à l’heure actuelle, ChatGPT ne peut manipuler que du texte (on lui écrit une demande, il répond en tapant ce qu’il a trouvé). Avec GPT-4, il devrait être possible aussi de lui faire manipuler des images, des vidéos, du son, etc, peut-être aussi bien en entrée (on lui montre) qu’en sortie (il génère).

Le détail de cette quatrième génération de GPT (acronyme de Generative Pre-trained Transformer) est un mystère. Cité par Heise Online, le directeur technique de Microsoft Allemagne, Andreas Braun, a déclaré que « nous présenterons GPT-4, qui proposera des modèles multimodaux offrant des possibilités totalement différentes, par exemple des vidéos. »

La confidence de Microsoft sur la date de présentation de GPT-4 n’est pas tout à fait surprenante — le géant des logiciels s’est fortement rapproché d’OpenAI ces dernières années. En 2019, la firme de Redmond investissait un milliard de dollars dans la startup. Cette année, l’investissement est monté à 10 milliards. Et ChatGPT est en cours d’intégration dans l’écosystème Microsoft.

Il s’avère que Microsoft doit d’ailleurs tenir un évènement autour de l’IA le 16 mars. De toute évidence, c’est à ce moment-là que l’on en saura plus sur GPT-4. Le saut qualitatif sera scruté de très près. Si GPT-4 va manifestement acomplir des progrès dans la variété des traitements, la justesse de son travail restera le principal mètre-étalon. Pour OpenAI, ça sera le principal challenge, car ChatGPT a vite montré certaines limites.

Nouveauté : Découvrez

La meilleure expérience de Numerama, sans publicité,
+ riche, + zen, + exclusive.

Découvrez Numerama+

Si vous avez aimé cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à Numerama sur Google News.