Signaler une erreur dans le texte | Cette IA sait (un peu) générer la vidéo qui pourrait suivre une photo

Cette IA sait (un peu) générer la vidéo qui pourrait suivre une photo

Des chercheurs américains ont commencé à concevoir une intelligence artificielle qui sait générer une vidéo à partir d'une photo, en devinant ce qui doit se passer ensuite.

Comment pense un humain ? Pour parvenir à l'intelligence artificielle, les chercheurs en IA doivent se rapprocher de la manière dont l'Homme appréhende son environnement. Or l'une des caractéristiques essentielles de l'intelligence humaine est qu'elle est faite d'anticipation.

On n'y pense peu, mais voir une photo, c'est souvent inconsciemment s'imaginer la suite immédiate, en profitant de toute l'expérience acquise depuis la petite enfance, et en réalisant des calculs extrêmement complexes à une vitesse incroyable. On aura immédiatement compris et « vu » dans les images ci-dessous que le vin va progressivement remplir le verre, que la balle de tennis va rebondir avant d'être frappée d'un coup de raquette qui fera passer le bras droit devant le bras de gauche, ou que le chien va continuer à secouer ses poils d'un côté et de l'autre en projetant de nombreuses gouttelettes d'eau.

vin-rempli

balle-tennis

chien

Or si l'humain est capable de s'imaginer tout cela, et si les plus talentueux d'entre eux seraient même capables de le dessiner image par image, il n'y a pas de raison qu'une intelligence artificielle ne le soit pas aussi. C'est donc exactement ce que se sont dits Carl Vondrick, Hamed Pirsiavash et Antonio Torralba, trois universitaires américains qui ont mis au point un algorithme open-source pour générer des vidéos à partir de photos.

Comme le rapporte The Verge, ces trois chercheurs en informatique ont commencé par éduquer leur intelligence artificielle en lui faisant regarder 2 millions de vidéos téléchargées sur Flickr, dans quatre catégories thématiques : des parcours de golf, des scènes à la plage, des gares ferroviaires, et des hôpitaux (pour les vidéos de nouveaux nés).

Une fois cet apprentissage réalisé, ils ont soumis des photos de ces mêmes thèmes à leur IA, en lui demandant d'imaginer la suite pendant une seconde. Il en résulte d'immenses galeries de vidéos qui, certes, sont encore très loin de flouer l'humain ou de s'approcher du réalisme, mais évoquent des mouvements qui sont tout à fait ceux qu'un humain pourrait attendre. Les trains avancent, la mer sur le sable fait des vagues qui génère de la mousse, les hommes avancent sur les terrains de golf...

animation

Une erreur dans le texte ?

Etape 1

Cette IA sait (un peu) générer la vidéo qui pourrait suivre une photo