Chat YouTube permet d’obtenir le résumé d’une vidéo, de poser des questions sur les sujets abordés ou d’interroger virtuellement son auteur grâce à une intelligence artificielle. Une démonstration bluffante qui laisse imaginer le futur de la vidéo.

Vous rêviez de pouvoir échanger un jour avec Steve Jobs ? C’est aujourd’hui possible. Chat YouTube révolutionne la manière de visionner des vidéos. Lancé en mars 2023 par Justin Liang, un ingénieur SRE (ingénierie de la fiabilité des sites), le service connaît un franc succès avec des milliers de vidéos déjà analysées. Originaire du Texas aux États-Unis, Justin expérimente et lance des projets qui utilisent de grands modèles de langage.

Chat YouTube est un concept très simple. L’utilisateur donne l’URL d’une vidéo YouTube sur l’unique formulaire du site. Le système télécharge alors les sous-titres de la vidéo et les transmet comme source principale à un chatbot. L’IA comprend ainsi l’ensemble des paroles et le contexte global de la vidéo. L’opération peut être réalisée à la main, avec ChatGPT, mais demande plus d’étapes. Chat YouTube simplifie la tâche à ses utilisateurs.

Bonjour Steve Jobs

Chat YouTube propose plusieurs fonctionnalités intéressantes. Il est possible de demander au chabot de résumer le contenu d’une vidéo, de lui poser des questions sur les thématiques abordées ou plus incongru, de demander à l’IA de se faire passer pour l’auteur de la vidéo, et de répondre à vos questions comme telles.

Nous avons fourni à Chat YouTube un discours de Steve Jobs datant de 2005. Le fondateur d’Apple s’adresse à des étudiants lors de la 114e cérémonie de remise des diplômes de l’université de Stanford. Il évoque longuement les moments marquants de sa vie et dévoile plusieurs anecdotes personnelles.

Classiquement, l’IA peut résumer la vidéo et les 5 points marquants de l’intervention de Jobs. En demandant au chatbot de répondre comme Steve, il est aussi possible de se faire coacher directement par l’entrepreneur à succès.

Résumer une vidéo n'a jamais été aussi simple. // Source : Capture d'écran
Résumer une vidéo n’a jamais été aussi simple. // Source : Capture d’écran

« J’ai suivi ma passion et elle m’a mené au succès »

Chat YouTube, qui se fait passer pour Steve Jobs

Nous avons demandé à Steve Jobs (via Chat YouTube) d’évoquer ses 5 conseils pour réussir dans la vie, illustrés d’exemples personnels. L’IA répond rapidement et avec pertinence. « Suivez votre passion : lorsque j’ai créé Apple avec Steve Wozniak, je savais que le marché de l’ordinateur personnel était incertain, mais j’étais passionné par l’idée de mettre un ordinateur entre les mains des gens. J’ai suivi ma passion et elle m’a mené au succès », explique-t-il notamment. Et de poursuivre avec divers préceptes : « Soyez curieux et créatifs », « Ne vous contentez pas de la moyenne », « Ayez confiance en vous », « Ne craignez pas l’échec. »

Difficile de savoir si ses conseils s’appuient en totalité sur la vidéo fournie à Chat YouTube ou également sur les divers écrits de Jobs emmagasinés par l’IA. Le respect de la vidéo source dépend de nombreux paramètres, et notamment la longueur de la vidéo source. Un discours de plusieurs heures donnera des réponses plus pertinentes qu’une discussion de quelques minutes.

Des conseils bien avisés. // Source : Capture d'écran
Des conseils bien avisés. // Source : Capture d’écran

Une technologie basée sur GPT-3

Nous avons aussi envoyé à Chat YouTube une vidéo où Sam Altman, l’actuel PDG de OpenAI, échange pendant plus de 2h20 avec Lex Fridman, enseignant au Massachusetts Institute of Technology, dans un format podcast. En demandant à l’IA de répondre comme Altman, nous lui avons demandé d’écrire un discours de présentation de GPT-5 (entièrement fictif). Le chatbot se base alors sur les paroles prononcées par le PDG d’OpenAI dans la vidéo et invente un texte crédible, que pourrait prononcer Sam Altman (l’IA voit cependant GPT-5 comme un modèle ouvert, ce qui semble assez peu probable).

Quel discours pourrait prononcer Sam Altman pour présenter GPT-5 ? // Source : Capture d'écran
Le futur discours d’annonce de GPT-5, généré par GPT-3. // Source : Capture d’écran

Côté technique, Chat YouTube se base sur le modèle GPT-3 pour générer les réponses. Le système se fonde également en partie sur Promptable.ai, une bibliothèque JavaScript dotée de nombreux outils IA. Grâce à la flexibilité offerte par les modèles d’OpenAI, Chat YouTube comprend les vidéos en Français.

Ce nouveau service assez inédit pourrait bien vous faire gagner de précieuses minutes tout en stimulant votre créativité. Il laisse aussi imaginer un futur où les contenus, que l’on a l’habitude de regarder passivement, pourraient tous devenir bien plus interactifs.


Vous voulez tout savoir sur la mobilité de demain, des voitures électriques aux VAE ? Abonnez-vous dès maintenant à notre newsletter Watt Else !