GPT-4 montrerait des signes de raisonnement humain, affirment des chercheurs de Microsoft. Le dernier modèle d’OpenAI constituerait une avancée majeure vers l’AGI, une IA aussi intelligente que le cerveau humain.

ChatGPT, GPT-3, GPT-4… Ces derniers mois, OpenAI n’a cessé d’innover rapidement en proposant au public des modèles d’intelligence artificielle poussés, capables d’effectuer des tâches de plus en plus complexes. Une accélération de la recherche dans l’IA qui pousse de nombreux chercheurs à s’intéresser aux nouvelles prouesses permises par cette technologie.

En 2022, alors que le grand public ne connaissait pas encore l’existence d’OpenAI, des chercheurs de Microsoft étaient déjà en train d’étudier les prouesses du modèle GPT-4. Les scientifiques ont analysé les réponses de l’IA à une multitude de problèmes nécessitant un raisonnement humain. Une étude dont les conclusions ont été publiées le 13 avril 2023, au sein d’un article scientifique de plus de 150 pages relayé par le New York Times.

Une logique à toute épreuve

Au fil de leur étude, les scientifiques de Microsoft démontrent le raisonnement ambitieux de GPT-4, parfois similaire à celui du cerveau humain. Le dernier modèle de la start-up californienne y est décrit comme une avancée significative vers l’intelligence artificielle générale. Des conclusions déjà largement critiquées dans la sphère scientifique.

Problèmes mathématiques, programmation, géométrie, diagnostic médical, psychologie.… Pour démontrer les capacités de raisonnement avancées de GPT-4, les chercheurs ont mené une batterie de tests, en soumettant des prompts complexes à l’IA.

Parmi les nombreux défis lancés au modèle, les employés de Microsoft ont soumis un problème de logique épineux : empiler de manière stable « 9 œufs, un ordinateur portable, une bouteille et un clou. » L’IA a alors trouvé facilement une méthode très ingénieuse. « Placez l’ordinateur portable sur les œufs, l’écran vers le bas et le clavier vers le haut. L’ordinateur portable s’insérera parfaitement dans les limites du livre et des œufs, et sa surface plane et rigide constituera une plate-forme stable pour la couche suivante », explique notamment GPT-4.

La première version de GPT-4 peut résoudre des problèmes (très) complexes. // Source : Microsoft Research
La première version de GPT-4 peut résoudre des problèmes (très) complexes. // Source : Microsoft Research

Une première mouture d’AGI ?

La réponse brillante au problème d’empilement a mené les scientifiques à envisager la possibilité que l’IA fasse preuve d’un raisonnement similaire à l’humain sur certains points. Les auteurs de l’étude notent toutefois que la version de GPT-4 utilisée dans le cadre de l’étude était plus avancée que celle actuellement proposée au public. Un bridage artificiel des performances expliqué en partie par le rodage grand public de l’IA destiné à limiter les contenus malveillants.

« Les performances du GPT-4 sont étonnamment proches de celles d’un être humain et dépassent souvent largement les modèles antérieurs. Compte tenu de l’étendue et de la profondeur des capacités de GPT-4, nous pensons qu’il peut raisonnablement être considéré comme une première version (encore incomplète) d’une intelligence générale artificielle (AGI) », affirment les scientifiques de Microsoft.

Une étude biaisée par l’humain ?

De premières conclusions qui soulèvent dans la communauté scientifique de l’IA de nombreuses critiques et réflexions sur la méthodologie de l’étude. Plusieurs spécialistes affirment que l’article repose sur un biais profondément humain : l’anthropomorphisme, l’attribution de caractéristiques humaines à un objet ou un concept (ici à GPT-4).

Les scientifiques ont généré le dessin d'une licorne avec TiKZ plusieurs fois pendant la phase d'apprentissage de GPT-4. // Source : Capture d'écran
Les scientifiques ont généré le dessin d’une licorne avec TiKZ (un langage graphique) plusieurs fois pendant la phase d’apprentissage de GPT-4. // Source : Capture d’écran

De leur côté, les chercheurs de Microsoft reconnaissent que leur approche est « quelque peu subjective et informelle, et qu’elle peut ne pas satisfaire aux normes rigoureuses de l’évaluation scientifique. » Ils soulignent toutefois le besoin d’une première étape scientifique en la matière afin d’ « apprécier les capacités et les défis remarquables » posés par GPT-4.

Restez à jour sur l’intelligence artificielle avec la newsletter gratuite de Numerama, « Artificielles ». Rédigée par ChatGPT et vérifiée par notre équipe, elle vous offre les dernières actualités. Inscrivez-vous en utilisant ce formulaire :


Vous voulez tout savoir sur la mobilité de demain, des voitures électriques aux VAE ? Abonnez-vous dès maintenant à notre newsletter Watt Else !