Toutes les vidéos dans cet article ont été générées par Sora

Résumé par IA, vérifié par Numerama

OpenAI a révélé Sora, une IA multimodale surnommée « ChatGPT de la vidéo », qui génère des séquences vidéo d'une minute à partir de textes, d'images et de vidéos.
Sam Altman, fondateur d'OpenAI, a lancé un défi interactif sur les réseaux sociaux, invitant les utilisateurs à proposer des idées de vidéos pour que l'IA de Sora les réalise.
Sora peut produire du contenu pour divers formats d'écran, y compris des vidéos de grande qualité allant jusqu'à 1920x1080 pixels, élargissant les possibilités pour différents appareils.

Recevez tous les soirs un résumé de l’actu importante avec Le Récap’

Pour démontrer les capacités de Sora, le modèle de génération en vidéo d’OpenAI, le fondateur de l’entreprise américaine, Sam Altman, a challengé les internautes. Ces derniers lui envoient des prompts et reçoivent en échange le résultat généré par l’IA.

C’est indéniablement une nouvelle claque stupéfiante dans le domaine de l’intelligence artificielle. Déjà connue dans le monde entier pour avoir lancé le fameux agent conversationnel ChatGPT, l’entreprise américaine OpenAI a créé la surprise dans la soirée du 15 février avec la présentation de Sora, son modèle de génération de vidéos.

Sora ou le « ChatGPT de la vidéo »

Avec Sora, OpenAI ajoute une nouvelle corde à son arc. Dans le domaine de la génération du texte, on connaissait déjà ChatGPT. Du côté du dessin et de la peinture, on peut compter sur Dall-E. Des projets plus expérimentaux ont aussi existé, comme MuseNet, un outil de création musicale, ou Whisper, pour retranscrire de la voix en texte.

Et votre vie numérique devient sereine

Bitdefender Premium Security est une solution de cybersécurité européenne qui vous protège automatiquement contre les pirates et toutes les menaces du web. Profitez de vos activités en ligne en toute tranquillité

Sora a une capacité multimodale : il transforme du texte et de l’image en vidéo. La durée actuelle de chaque séquence générée atteint la minute. Ces scènes incluent, selon OpenAI, « des scènes très détaillées, des mouvements de caméra complexes et de multiples personnages aux émotions marquées. »

D’après l’entreprise, Sora peut développer des vidéos pour des écrans de grande taille, en 1920 par 1080 pixels, des vidéos verticales en 1080 par 1920 pixels, et tout ce qui se trouve entre ces deux formats. Sora peut ainsi « créer du contenu pour différents appareils directement compatible avec leur format d’origine. ».

Un papier de recherche accompagne l’annonce de Sora, mais OpenAI et Sam Altman ont bien compris que ce sont les vidéos qui marqueront avant tout les esprits. Depuis l’annonce du modèle, l’entreprise et son fondateur publients plusieurs démonstrations sur X (ex-Twitter), avec leurs propres prompts ou en répondant à des requêtes de tiers.

Sam Altman génère des vidéos avec Sora pour les internautes

Sora n’est pas encore accessible. C’est pourquoi Sam Altman a proposé de générer pour les internautes quelques visuels. « Nous aimerions vous montrer ce que Sora peut faire, merci de répondre avec des légendes pour les vidéos que vous aimeriez voir et nous commencerons à en faire ! Ne vous retenez pas sur les détails ou la difficulté ! ».

https://t.co/SOUoXiSMBY pic.twitter.com/JB4zOjmbTp
— Sam Altman (@sama) February 15, 2024

https://t.co/WJQCMEH9QG pic.twitter.com/Qa51e18Vph
— Sam Altman (@sama) February 15, 2024

https://t.co/rPqToLo6J3 pic.twitter.com/nPPH2bP6IZ
— Sam Altman (@sama) February 15, 2024

here is a better one: https://t.co/WJQCMEH9QG pic.twitter.com/oymtmHVmZN
— Sam Altman (@sama) February 15, 2024

https://t.co/P26vJHlw06 pic.twitter.com/AW9TfYBu3b
— Sam Altman (@sama) February 15, 2024

https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP
— Sam Altman (@sama) February 15, 2024

https://t.co/rmk9zI0oqO pic.twitter.com/WanFKOzdIw
— Sam Altman (@sama) February 15, 2024

https://t.co/qbj02M4ng8 pic.twitter.com/EvngqF2ZIX
— Sam Altman (@sama) February 15, 2024

Plusieurs autres démonstrations ont été partagées également sur le compte officiel d’OpenAI sur X :

Introducing Sora, our text-to-video model.

Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W

Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024

Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024

Prompt: “A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.” pic.twitter.com/0JzpwPUGPB
— OpenAI (@OpenAI) February 15, 2024

Prompt: “A gorgeously rendered papercraft world of a coral reef, rife with colorful fish and sea creatures.” pic.twitter.com/gzEE8SwP81
— OpenAI (@OpenAI) February 15, 2024

Prompt: “Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. the art style is 3d and realistic, with a focus on lighting and texture. the mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with… pic.twitter.com/aLMgJPI0y6
— OpenAI (@OpenAI) February 15, 2024

Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !

Anticipez le futur en vous inscrivant gratuitement à ToujoursPlus, la newsletter tech de référence.

Tout comprendre à La guerre de l’IA