Google a peut-être gagné une longueur d’avance sur le rival de Veo 3, Sora d’OpenAI. La firme a présenté en grande pompe son nouveau modèle de génération de vidéos. C’est d’ailleurs avec lui que Google a réalisé son générique d’introduction de la Google I/O. Mais les démonstrations impressionnantes sont surtout à découvrir du côté des premiers usagers de Veo 3.
Les vidéos générées gagnent le son… et la parole
La première innovation de Veo 3, c’est sa capacité à sonoriser les vidéos. On peut y ajouter les bruitages que l’on souhaite en le précisant dans le prompt. L’IA va même plus loin : on peut lui demander d’ajouter des paroles. Un dialogue entre deux personnages, une chanson et même une blague humoristique.
Sur l’exemple ci-dessus, l’utilisateur a simplement indiqué « un homme faisant du stand-up dans une petite salle raconte une blague (incluez la blague dans le dialogue) ». Certaines scènes créées semblent tout droit sorties, d’une vidéo ASMR, d’un reportage télévisé, d’une publicité ou d’un film. Il y a évidemment des défauts, mais les résultats sont très prometteurs. La principale limite avec Veo 3, c’est la durée des vidéos : elles durent seulement 10 secondes.
Veo 3 peut recréer des scènes de jeux vidéo
Chose étonnante, Veo 3 est capable de recréer des scènes de jeux vidéo, des actions en jeu et des interfaces. On imagine que le modèle a été entraîné grâce à énormément de vidéos sur YouTube et ça tombe bien, la plateforme n’en manque pas.
On peut ainsi reconstituer Fortnite, mais ça peut tout aussi bien fonctionner avec Minecraft. Cela fonctionne avec des vidéos façon Live Twitch avec un faux streamer, mais pas que. Il est tout à fait possible de « simuler » un jeu vidéo tout seul.
Le problème avec Veo 3, c’est qu’on peut le manipuler
Le souci avec la capacité de Veo 3 à recréer des scènes de jeux vidéo, c’est que ce n’était pas prévu. Les titres en question sont effectivement protégés par le droit d’auteur et Google n’est pas censé pouvoir permettre d’en reproduire. Un expert et chef d’entreprise dans l’intelligence artificielle a par exemple pu « reproduire » Fortnite, en écrivant « un streamer obtient une victoire royale juste avec sa pioche ». Sauf que Fortnite est le seul battle royale où l’on dispose d’une pioche. Veo 3 s’est fait piéger : l’utilisateur a pu contourner les filtres mis en place par Google pour simuler une partie dans le jeu.
Du côté des deepfakes en revanche, aucune vidéo imitant le visage d’une personnalité ne semble voir été générée (ou du moins relayée sur les réseaux sociaux). Il en est de même pour les vidéos générées dans un certain style. En mars dernier, le nouveau générateur d’images de ChatGPT faisait polémique ; les utilisateurs lui faisaient massivement imiter le style des films du Studio Ghibli.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

Toute l'actu tech en un clin d'œil
Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !
Marre des réseaux sociaux ? Rejoignez la communauté Numerama sur WhatsApp !