Dévoilé le 6 novembre, le nouveau modèle de langage GPT-4 Turbo d’OpenAI dispose d’une base de connaissances qui s’arrête en avril 2023, alors que la précédente version se contentait d’un savoir limité à septembre 2021. ChatGPT n’a pas encore accès à l’information en temps réel, mais il dispose au moins de données sur sa propre éclosion.

« Ma base de données s’arrête en septembre 2021, donc toutes les informations que je fournirai seront basées sur des données disponibles jusqu’à cette période ». Cette phrase, les 100 millions d’utilisateurs hebdomadaires de ChatGPT la connaissent bien. L’intelligence artificielle générative d’OpenAI, qui est sans doute la plus grande réussite technologique de l’année, n’est pas reliée à Internet. Pour l’empêcher d’extrapoler sur l’actualité chaude, OpenAI a entraîné son modèle de langage GPT sur une base de données fermée. Il existe des options pour permettre à ChatGPT d’effectuer une recherche sur Bing avant de répondre, mais le comportement par défaut n’analyse que des données stockées localement. C’est aussi ce qui contribue à rend GPT aussi efficace dans ses réponses.

Le 6 novembre, à l’occasion de sa première grande conférence pour les développeurs, OpenAI a dévoilé plusieurs nouveautés pour ChatGPT. Parmi elles, une nouvelle base de données étendue à tout ce qu’il s’est passé dans le monde entre septembre 2021 et avril 2023.

La France a perdu la Coupe du monde de football, c’est officiel

Allez savoir pourquoi, le premier exemple qui nous est venu en tête pour vérifier si le nouveau modèle de langage GPT-4 Turbo avait remplacé GPT-4 est la Coupe du monde de football. Jusqu’au 6 novembre, ChatGPT était incapable de répondre à cette question, sous prétexte que l’événement n’avait pas encore eu lieu. Désormais, et beaucoup plus rapidement qu’auparavant (d’où le « Turbo »), ChatGPT peut répondre que l’Argentine a battu la France. Ça fait toujours aussi mal, mais c’est la triste vérité. En revanche, il pense que la Coupe du monde de rugby n’a pas commencé.

Cette conversation aurait été impossible avant le lancement de GPT-4 Turbo, à moins d'activer la recherche Bing avant (avec le risque de lui faire lire des bêtises).
Cette conversation aurait été impossible avant le lancement de GPT-4 Turbo, à moins d’activer la recherche Bing avant (avec le risque de lui faire lire des bêtises). // Source : Numerama

Si le modèle GPT-4 lancé en mars 2023 n’est plus disponible (car remplacé), OpenAI propose toujours d’utiliser GPT-3.5, le seul LLM accessible dans sa version gratuite. Ici, les informations s’arrêtent en janvier 2022. ChatGPT ne sait donc pas que la France a perdu la Coupe du monde de football. La logique voudrait que ce modèle soit progressivement abandonné.

GPT-3.5 n'a pas eu de mise à jour de sa base de données.
GPT-3.5 n’a pas eu de mise à jour de sa base de données. // Source : Numerama

Bing, Bard et Grok (Elon Musk) : que font les concurrents de ChatGPT ?

L’extension des connaissances de ChatGPT jusqu’en avril 2023 est une bonne nouvelle pour les utilisateurs, qui devraient se confronter à moins d’obstacles lorsqu’ils poseront des questions (notamment lorsqu’il l’interroge sur lui-même ou sur les autres IA, puisque ChatGPT ne répondait alors que très théoriquement).

ChatGPT n’est peut-être pas au courant des derniers détails sur la guerre israélo-palestinienne, sur l’iPhone 15 ou sur le retour de la Star Academy, mais il vient de gagner de nombreuses données sur ce qu’il s’est passé d’important dans le monde ces dernières années (le Covid-19 notamment ou la guerre Russie-Ukraine).

ChatGPT sait désormais quand il est sorti. Il peut aussi résumer l'actualité jusqu'en avril 2023.
ChatGPT sait désormais quand il est sorti. Il peut aussi résumer l’actualité jusqu’en avril 2023. // Source : Numerama

Cependant, l’approche d’OpenAI reste assez isolée. Tous les autres acteurs majeurs (Microsoft avec Bing, Google avec Bard, Elon Musk avec Grok) misent sur des IA connectées à Internet, qui ne répondent qu’à partir de données qu’elles viennent de trouver en ligne. Les deux premières fouillent sur leurs moteurs de recherche respectifs, celle d’Elon Musk a accès aux données de Twitter. L’approche prudente d’OpenAI, qui limite les capacités d’hallucination et de non-vérification de son IA, n’est suivie par personne. Sans surprise, ChatGPT est celui qui fournit les réponses les plus complètes et les plus « intelligentes ». Bard répond souvent, par exemple, des choses complètement fausses quand on l’interroge sur l’actualité.

Ici, Google Bard hallucine complètement et affirme que la guerre entre Israël et le Hamas s'est terminée le 5 novembre. Aussi faux que dangereux.
Ici, Google Bard hallucine complètement et affirme que la guerre entre Israël et le Hamas s’est terminée le 5 novembre. Aussi faux que dangereux. // Source : Numerama

Avec son module Bing, qui s’active manuellement, OpenAI permet à ChatGPT de donner des informations sur l’actualité récente, qu’il source alors beaucoup. À terme, OpenAI veut apprendre à ChatGPT à aller lui-même faire une recherche sur Bing, s’il le juge nécessaire. Mais pour l’instant, son approche reste la plus sage, afin d’éviter de faire raconter de grosses bêtises à son IA.

Nouveauté : Découvrez

La meilleure expérience de Numerama, sans publicité,
+ riche, + zen, + exclusive.

Découvrez Numerama+

Si vous avez aimé cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à Numerama sur Google News.