Pour démontrer les capacités de Sora, le modèle de génération en vidéo d’OpenAI, le fondateur de l’entreprise américaine, Sam Altman, a challengé les internautes. Ces derniers lui envoient des prompts et reçoivent en échange le résultat généré par l’IA.

C’est indéniablement une nouvelle claque stupéfiante dans le domaine de l’intelligence artificielle. Déjà connue dans le monde entier pour avoir lancé le fameux agent conversationnel ChatGPT, l’entreprise américaine OpenAI a créé la surprise dans la soirée du 15 février avec la présentation de Sora, son modèle de génération de vidéos.

Sora ou le « ChatGPT de la vidéo »

Avec Sora, OpenAI ajoute une nouvelle corde à son arc. Dans le domaine de la génération du texte, on connaissait déjà ChatGPT. Du côté du dessin et de la peinture, on peut compter sur Dall-E. Des projets plus expérimentaux ont aussi existé, comme MuseNet, un outil de création musicale, ou Whisper, pour retranscrire de la voix en texte.

Sora a une capacité multimodale : il transforme du texte et de l’image en vidéo. La durée actuelle de chaque séquence générée atteint la minute. Ces scènes incluent, selon OpenAI, « des scènes très détaillées, des mouvements de caméra complexes et de multiples personnages aux émotions marquées. »

D’après l’entreprise, Sora peut développer des vidéos pour des écrans de grande taille, en 1920 par 1080 pixels, des vidéos verticales en 1080 par 1920 pixels, et tout ce qui se trouve entre ces deux formats. Sora peut ainsi « créer du contenu pour différents appareils directement compatible avec leur format d’origine. ».

Un papier de recherche accompagne l’annonce de Sora, mais OpenAI et Sam Altman ont bien compris que ce sont les vidéos qui marqueront avant tout les esprits. Depuis l’annonce du modèle, l’entreprise et son fondateur publients plusieurs démonstrations sur X (ex-Twitter), avec leurs propres prompts ou en répondant à des requêtes de tiers.

Sam Altman génère des vidéos avec Sora pour les internautes

Sora n’est pas encore accessible. C’est pourquoi Sam Altman a proposé de générer pour les internautes quelques visuels. « Nous aimerions vous montrer ce que Sora peut faire, merci de répondre avec des légendes pour les vidéos que vous aimeriez voir et nous commencerons à en faire ! Ne vous retenez pas sur les détails ou la difficulté ! ».

Plusieurs autres démonstrations ont été partagées également sur le compte officiel d’OpenAI sur X :

Nouveauté : Découvrez

La meilleure expérience de Numerama, sans publicité,
+ riche, + zen, + exclusive.

Découvrez Numerama+

Abonnez-vous à Numerama sur Google News pour ne manquer aucune info !