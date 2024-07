Lecture Zen Résumer l'article

OpenAI a sorti un nouveau modèle de génération par intelligence artificielle, remplaçant officiellement le vieillissant GPT-3.5. Dites bonjour à GPT-4o mini !

C’est avec GPT-3.5 que le monde a découvert ChatGPT. Le modèle, sorti en novembre 2022, a accompagné le monde vers des usages nouveaux, amenant réellement l’intelligence artificielle générative au grand public. Le 18 juillet 2024, OpenAI a lancé GPT-4o mini et a signé la retraite (ou la préretraite) de GPT-3.5.

GPT-4o mini, le nouveau modèle pas cher d’OpenAI

GPT-4o mini est en effet un modèle à très faible coût d’usage et d’opération, décliné de GPT-4o, la star du moment. Sur la page de lancement du modèle, OpenAI le définit ainsi : « Aujourd’hui, GPT-4o mini prend en charge le texte et la vision via l’API, et sera capable dans le futur de lire et d’écrire du texte, de l’image, de la vidéo et de l’audio. Le modèle dispose d’une fenêtre de contexte de 128 000 tokens, prend en charge jusqu’à 16 000 tokens de sortie par demande/ Sa base de connaissance s’arrête en octobre 2023. Grâce au tokenizer amélioré partagé avec GPT-4o, la gestion des textes non anglophones est désormais encore plus rentable. »

En bref, il sait déjà parler français, mais son corpus de connaissances ne lui permet pas de savoir que la France a été éliminée de l’Euro 2024. Ce modèle est clairement une version simplifiée de GPT-4o accessible à moindre coût. Elle ne sera pas meilleure que GPT-4o, mais pourra servir d’environnement de test pour des projets ou pour exécuter des prompts qui demandent beaucoup de ressources.

Mieux encore, c’est GPT-4o mini qui remplacera désormais GPT-3.5 dans la version gratuite de ChatGPT. Avant cela, un compte gratuit pouvait utiliser GPT-4o pour quelques requêtes et était ensuite bridé, limité à GPT-3.5, un modèle qui a près de 2 ans et dont les résultats ne sont plus forcément à la hauteur. C’est donc une bonne nouvelle pour le grand public qui pourra profiter en permanence d’une meilleure version de ChatGPT sans avoir à débourser un centime.

Les résultats de GPT-4o mini sur des benchmarks classiques comparés aux autres modèles // Source : Capture d’écran Numerama

Côté tarification, pour les développeurs utilisant GPT-4o mini via l’API, on peut dire que c’est plutôt bas : 15 centimes pour 1 million de tokens d’entrée et 60 centimes pour 1 million de jetons de sortie, soit à peu près 2 500 pages d’un livre, précise OpenAI.

La différence entre GPT-4o et GPT-4o mini sur un prompt de la newsletter Artificielles

Nous avons comparé GPT-4o et GPT-4o mini sur le prompt de notre newsletter Artificielles. Nous avons demandé de résumer en deux phrases un article de Numerama sur Kyutai, de trouver un titre alternatif et d’ajouter un emoji. Le résultat est le suivant :

GPT-4o

🎙️ Xavier Niel révolutionne l’assistant vocal en temps réel

Kyutai, le laboratoire de Xavier Niel, a dévoilé Moshi, un assistant vocal ultra rapide capable de traiter la voix en temps réel avec seulement 160 ms de latence. Moshi peut prédire et répondre naturellement à vos paroles tout en reconnaissant et imitant jusqu’à 70 émotions.

GPT-4o mini

🚀 Xavier Niel dépasse OpenAI avec son assistant vocal révolutionnaire

Xavier Niel lance Moshi, un assistant vocal qui bat des records avec une latence de seulement 160 ms, offrant des conversations en temps réel et la capacité d’imiter 70 émotions. Kyutai, le laboratoire derrière Moshi, marque un tournant en se concentrant sur la voix plutôt que sur le texte, défiant les géants technologiques comme OpenAI et Google.

On remarque que, comme GPT-3.5, GPT-4o mini est un poil plus verbeux et a tendance à allonger ses phrases. Le sujet est résumé différemment, le premier ayant choisi de décrire l’assistant dévoilé par Xavier Niel, quand le second a mis l’accent sur le contexte expliqué par Nicolas Lellouche dans l’article.

