Spécialiste de l’intelligence artificielle, Nvidia vient de dévoiler une collection d’outils censée rendre nos réunions en visioconférence moins pénibles. En utilisant deux réseaux de neurones, l’entreprise est capable de changer la direction de votre regard, et de répliquer vos mouvements de tête sur un avatar virtuel.

Nvidia veut changer la façon dont on fait de la vidéoconférence. Le fabricant de cartes graphiques et spécialiste de l’IA a dévoilé le 24 juin de nouvelles avancées dans le domaine, avec un tas d’outils censés améliorer nos réunions vidéo.

L’entreprise a fait la démo d’une intelligence artificielle capable d’analyser votre visage en temps réel afin d’apparaître impeccable pendant tous vos appels, même si vous venez de sortir du lit et que vous êtes encore en pyjama.

Vid2Vid Cameo, de son petit nom, est en fait capable de répliquer vos mouvements de tête et d’animer en temps réel votre avatar, pour faire croire à vos interlocuteurs que vous êtes parfaitement attentif. Ainsi, si vous regardez la télé depuis chez vous pendant une réunion en visio, il vous suffira de hocher de la tête ponctuellement pour que votre avatar apparaisse impliqué et sérieux, en regardant droit dans les yeux de vos interlocuteurs et interlocutrices.

Testez l’outil sur une de vos photos

Dans son article de recherche, Nvidia explique utiliser une technique nommée « redirection faciale » qui va en quelque sorte redresser l’angle de votre visage pour que vous apparaissiez regarder droit dans la caméra, même si votre visage est en réalité de biais. Le réseau de neurones derrière l’outil va d’une certaine façon animer une photo de vous avec vos mouvements d’yeux, de mâchoire et de tête pour que vous apparaissiez le plus naturel possible.

Un outil a été mis à disposition par Nvidia pour mieux comprendre le fonctionnement de tout cela. En envoyant un simple portrait de vous, vous pourrez modifier l’image en vous faisant lever les yeux au ciel, tourner la tête à droite ou baisser les yeux, tout ça en quelques secondes sans toucher à Photoshop. Le résultat est loin d’être impeccable pour le moment. La photo modifiée manque de détail et arbore des artefacts notables, mais au-delà de la qualité brute du cliché, le travail sur la rotation du visage et des yeux est assez bluffant. L’IA parvient sans peine à vous faire lever et baisser la tête de façon relativement réaliste. La démonstration en temps réel est encore plus saisissante.

Une photo entièrement redressée par IA // Source : Nvidia

Autre avantage notable de cette technique : elle réduit considérablement la bande passante nécessaire pour passer un coup de fil en visio. Plutôt que d’envoyer le flux vidéo brut de votre caméra, il est possible de n’envoyer que les informations sur le mouvement du visage et donc de réduire la bande passante exigée pour un coup de fil fluide.

10 fois moins de bande passante

« En comprimant et en envoyant uniquement la position de la tête et les points clés dans les deux sens, au lieu du flux vidéo complet, cette technique permet de réduire par 10 les besoins en bande passante pour les vidéoconférences, offrant ainsi une expérience plus fluide », indique Nvidia.

Toutes ces avancées en sont encore au stade expérimental, mais la démonstration de Nvidia laisse voir un futur ou la visio sera moins pénible qu’aujourd’hui. Il ne reste plus qu’à convaincre les utilisateurs et utilisatrices de laisser un réseau neuronal analyser leurs expressions du visage, et comme avec tout ce qui touche à la reconnaissance faciale, cela ne s’annonce pas aisé.

Partager sur les réseaux sociaux

La suite en vidéo