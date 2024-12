Lecture Zen Résumer l'article

Du 5 au 20 décembre, OpenAI organise une conférence par jour, avec à chaque fois une ou plusieurs nouveautés. Cet article vous résume les 12 annonces du créateur d’OpenAI, si vous n’avez pas le temps de suivre le rendez-vous quotidiennement.

Pour fêter les deux ans de ChatGPT, OpenAI ne s’est pas offert une grande conférence de presse, comme les rumeurs le suggéraient, mais 12 mini-événements. Le géant de l’intelligence artificielle, qui aime se faire remarquer, s’est lancé dans une opération appelée « 12 days of OpenAI », qui n’est plus ni moins qu’un calendrier de l’avent. Tous les jours à 19 heures (hors week-end), du 5 au 20 décembre, il organise un live-stream de 10 à 15 minutes depuis ses bureaux de San Francisco, avec à chaque fois une ou plusieurs nouveautés. Google lui a répondu avec une mise à jour majeure de Gemini, tandis que xAI a rendu Grok gratuit.

Dans cet article, Numerama vous propose un bref récapitulatif des 12 conférences d’OpenAI, au cas où vous n’auriez pas le temps de vous connecter tous les soirs pour écouter Sam Altman et ses amis. Il sera mis à jour tous les soirs, jusqu’au 20 décembre. (Sont encore attendus un nouveau modèle de génération d’images ainsi que GPT-4.5, évolution majeure de GPT-4).

Jour 7 : des dossiers pour organiser ses conversations dans ChatGPT

Le vendredi 13 décembre, OpenAI a dévoilé l’arrivée d’une nouvelle section « Projets » sur la page d’accueil de ChatGPT. Il s’agit globalement de simples dossiers, qui permettent de ranger ses conversations importantes, afin de les retrouver plus tard (la planification d’un voyage ou des travaux dans un appartement par exemple). Chaque projet peut disposer de fichiers en commun, ainsi que d’éléments de contexte partagés entre les conversations.

La fonctionnalité est déjà disponible avec les abonnements payants et arrivera plus tard dans le ChatGPT gratuit.

L’interface des projets dans ChatGPT. // Source : Numerama

Jour 6 : un mode caméra dans ChatGPT Voice et le père Noël

Le jeudi 12 décembre, OpenAI a dévoilé plusieurs nouveautés pour le mode « voix avancé » de ChatGPT Voice, le service qu’il a lancé en octobre 2024 avec une voix ultra-réaliste capable d’imiter des émotions.

La nouveauté la plus impressionnante concerne l’ajout d’un mode vidéo, qui permet de parler à ChatGPT avec la caméra allumée. L’assistant réalise des captures d’écran régulières du flux, analyse le contenu à l’image et peut répondre à des questions spécifiques comme « est-ce que je suis bien habillé », « comment réparer ce meuble » ou « est-ce que ce plat est cuit », le tout sans quitter le mode voix.

Avec la caméra activée, ChatGPT peut dire à son utilisateur comment faire quelque chose. Ici remplir une cafetière. // Source : Capture OpenAI

Autre nouveauté pour le mode voix : un mode père Noël, qui dispose de consignes particulières. Il répond à toutes les questions en imitant vocalement le boss du Pôle Nord et ramène toutes vos demandes à la bonne humeur de Noël. Une vraie révolution pour l’intelligence artificielle !

Jour 5 : Apple Intelligence et ChatGPT

L’annonce du mercredi 11 décembre n’en est pas une, puisque OpenAI a profité de la sortie publique d’iOS 18.2 pour revenir sur son partenariat avec Apple. L’entreprise a montré comment un iPhone avec Apple Intelligence activé pouvait désormais poser des questions à ChatGPT avec Siri, résumer des documents simplement, générer du texte ou analyser une image.

Jour 4 : Canvas, le Google Docs d’OpenAI

Mardi 10 décembre, OpenAI a dévoilé une mise à jour de Canvas, son interface dédiée à l’écriture de code ou de texte long. Ce mode, qui est accessible depuis la page d’accueil de ChatGPT, vise à faciliter le quotidien des personnes qui écrivent avec l’IA générative. Le texte généré apparaît à droite de l’écran, la discussion avec l’IA reste à gauche. L’idée est d’utiliser ChatGPT en assistant pour modifier un texte ou pour se faire suggérer des corrections, sans avoir à tout copier-coller à chaque fois.

L’interface de ChatGPT en mode Canvas. // Source : OpenAI

Jour 3 : Sora, l’outil pour générer des vidéos est enfin arrivé

Pour l’instant, l’annonce du lundi 9 décembre est, de loin, la plus spectaculaire. OpenAI a enfin lancé Sora, son outil pour générer des vidéos réalistes, dix mois après sa première annonce. Sora est disponible dans plus de 100 pays, mais pas encore ceux de l’Union européenne. Heureusement, il est possible de tricher avec un VPN pour l’essayer en France.

Il suffit d’une phrase pour faire générer une vidéo à Sora. // Source : Numerama

Selon nos premiers tests, Sora est excellent pour générer des choses simples, mais faiblit dès qu’il y a trop de mouvement. L’outil est néanmoins impressionnant, puisqu’il peut transformer n’importe quelle phrase en une vidéo en seulement quelques secondes. Il n’est pas le meilleur de sa catégorie (du côté de l’open source, il y a plusieurs modèles très performants qu’il faut les faire tourner localement), mais pourrait s’imposer comme une solution très populaire à l’avenir, notamment pour animer une image fixe.

Autre limite importante : Sora nécessite un abonnement payant. La plupart des options sont exclusives à l’abonnement ChatGPT Pro, avec les services de base dans l’abonnement ChatGPT Plus.

Jour 2 : du fine-tuning, une annonce pour les développeurs

Le vendredi 6 décembre, OpenAI a sans doute fait l’annonce la moins grand public de son calendrier de l’avent. L’entreprise lancé un programme de recherche sur le « Reinforcement Fine-Tuning », une technique de personnalisation des modèles d’IA pour qu’ils excellent dans des tâches complexes et spécifiques à un domaine. Les participants ont accès à une API expérimentale pour entraîner les modèles sur leurs propres données, en évaluant les réponses et en renforçant les performances sur des problèmes similaires. Ce programme s’adresse aux instituts de recherche, universités et entreprises dans des secteurs comme le droit, la santé ou la finance.

Jour 1 : o1 et ChatGPT Pro

Le jeudi 5 décembre, OpenAI a ouvert la première case de son calendrier de l’avent. Sa première nouveauté est l’arrivée de la version finale du modèle o1, qui est un LLM capable de raisonner. OpenAI entend par là qu’o1 est capable de se poser des questions à partir de votre question, afin de proposer une réponse plus complexe, qui passe par la résolution de plusieurs problèmes. o1 est disponible dans ChatGPT.

Le modèle o1 permet à ChatGPT de résoudre des problèmes compliqués, notamment mathématiques. // Source : OpenAI

En plus du modèle o1, OpenAI a dévoilé ChatGPT Pro, un nouvel abonnement payant à 200 dollars par mois. À ce prix, il n’y a plus aucune limite dans les questions, ainsi qu’une version encore plus sophistiquée d’o1. ChatGPT Pro intègre aussi plus d’options dans Sora (annoncé en jour 3) et pourrait être essentiel pour les annonces de la dernière semaine.

