Le nouveau modèle GPT-4o arrive dans ChatGPT, gratuitement. Il est en cours de déploiement sur la plateforme. Voici la marche à suivre pour y accéder.

C’était l’une des annonces saillantes de la conférence organisée le 13 mai par OpenAI : GPT-4o est un nouveau modèle de langage conçu par les créateurs de ChatGPT, l’agent conversationnel de référence en matière d’intelligence artificielle générative. Il est d’ores et déjà disponible sur la plateforme d’utilisation du célèbre chatbot.

Selon OpenAI, GPT-4o est capable de « raisonner sur l’audio, la vision et le texte en temps réel. » Prochainement, il est prévu de remplacer GPT-3.5 (proposé gratuitement sur le site) par GPT-4o (qui est également accessible sans frais). GPT-4 sera également mis à l’écart, ce qui suggère qu’OpenAI prépare le terrain à GPT-5.

Comme Numerama l’indiquait lors de son suivi de la conférence, GPT-4o est d’abord être mis à disposition des clients ChatGPT Plus, à partir du 13 mai. Le déploiement plus général suivra une fois cette phase achevée. Idem pour la fonctionnalité dédiée à la gestion de la voix et de la vision, prévue plus tard, avec une priorité donnée à la clientèle payante.

Comment accéder à GPT-4o ?

L’accès à GPT-4o est très simple, si l’on est dans la vague de déploiement, à partir du moment où l’on dispose d’un compte sur le site de ChatGPT.

Rendez-vous sur le site chatgpt.com ;

Connectez-vous à votre compte si ce n’est pas le cas ;

Ouvrez le menu déroulant en haut à gauche de l’écran ;

Sélectionnez la première ligne « GPT-4o » ;

C’est tout ; vous pouvez commencer à taper vos prompts.

Le menu de sélection des modèles de langage. // Source : Capture d’écran

Ce nouveau modèle avancé d’OpenAI inclut des fonctionnalités pratiques, comme la possibilité d’interrompre le chatbot pendant une conversation. Il peut aussi produire des réponses en temps réel, sans délai notable (s’il y a des traitements sur une photo, un temps d’attente peut être observé), et une meilleure génération vocale, avec un ton plus naturel.

Les premières impressions de GPT-4o sont en tout cas remarquables ; sur une même photo et un même prompt, la compréhension de l’image est plus fine avec le nouveau modèle. Il identifie la surface sur laquelle le sujet se trouve (GPT-4, lui, livre un ressenti de l’image). Il devine aussi l’endroit où le cliché a été pris, avec justesse.

Travail avec GPT-4… Et GPT-4o

