OpenAI sort GPT-4 plus tôt que prévu. Il s’agit de la nouvelle version du modèle de langage GPT, qui fait fonctionner le chatbot ChatGPT (qui tourne sur GPT-3.5).

C’est la surprise avant l’heure. Attendue initialement pour le 16 mars à l’occasion d’une conférence autour de l’intelligence artificielle, la présentation de GPT-4 vient d’avoir lieu deux jours plus tôt, le 14 mars. OpenAI, l’entreprise derrière ce projet, a mis en ligne une longue page décrivant les avancées avec cette nouvelle mouture du modèle de langage.

GPT-4 est disponible et peut manipuler des images

Comme on s’y attendait, GPT-4 est multimodal : en clair, il est capable d’aller au-delà du texte, en entrée et en sortie. Dans cette version, indique Greg Brockman, le président et cofondateur d’OpenAI, GPT-4 peut gérer en entrée (c’est-à-dire les données qu’on lui envoie) du texte et de l’image. De son côté, GPT-4 fournit du texte en sortie.

Autre surprise : GPT-4 va être disponible rapidement, à condition de passer par la formule payante ChatGPT Plus (ChatGPT+). L’accès se fera via chat.openai.com, avec un plafond ‘utilisation. Ce seuil, indique OpenAI, sera ajusté par la suite selon les demandes et les performances du système lorsqu’il sera utilisé en conditions réelles par les internautes.

Selon OpenAI, la différence entre GPT-3.5 (qui alimente ChatGPT) et GPT-4 ne sera pas nécessairement perceptible. L’entreprise évoque une distinction « subtile » dans le cadre d’une conversation informelle entre l’internaute et ChatGPT. Par contre, les capacités de GPT-4 sauteront davantage aux yeux « lorsque la complexité de la tâche atteint un seuil suffisant ».

GPT-3.5 (en bleu) contre GPT-4 (en vert) Source : OpenAI

Pour le démontrer, OpenAI a partagé un graphique comparant les résultats de GPT-3.5 et GPT-4 sur différents types d’examens. Dans certains cas, l’écart entre les deux modèles de langage est immense. « GPT-4 est plus fiable, plus créatif et capable de gérer des instructions beaucoup plus nuancées que GPT-3.5 », se félicite OpenAI.

Cela étant, Greg Brockman comme Sam Altman, autre cofondateur d’OpenAI, anticipent les éventuelles critiques qui pourraient surgir : « Il est encore limité à bien des égards », dit le premier. « Il est toujours imparfait, toujours limité, et il semble toujours plus impressionnant à la première utilisation qu’il ne l’est après avoir passé plus de temps avec lui », ajoute le second.

L’existence de GPT-4 était évoqué depuis plusieurs mois et le nouveau modèle de langage d’OpenAI faisait l’objet de bien des rumeurs et de fantasmes — notamment sur le nombre de paramètres pour fonctionner. Néanmoins, on le disait déjà capable d’être multimodal (à l’époque, l’étendue de ses facultés n’était pas claire : on parlait aussi de vidéo et de son, en plus de l’image et du texte).

La présentation, le 14 mars, de GPT-4, deux jours avant l’évènement organisé par Microsoft sur l’IA peut être une manière pour les deux partenaires d’évoquer leurs projets en deux temps. D’abord, la dimension technique de l’outil, avec un papier de recherche, pour montrer les spécificités de cette nouvelle génération. Ensuite, une dimension plus commerciale, avec une intégration… dans les outils de Microsoft ?

(actualité en cours de développement)

