Modifier une vidéo en parlant simplement à une IA ? C’est la promesse de Gemini Omni, le tout nouveau modèle de Google. Dommage pour nous : l’Europe est encore laissée sur la touche.

C’est, selon Google, la rencontre de la capacité de raisonner avec la faculté de créer. À l’occasion de la conférence Google I/O, qui s’est déroulée le 19 mai 2026, l’entreprise américaine a dévoilé un énième projet reposant sur l’intelligence artificielle : Gemini Omni. Et l’outil, évidemment, porte bien son nom, puisqu’il est pensé pour être omnimodal.

Concrètement, cette dimension omnimodale fait que l’outil est capable de traiter simultanément des fichiers de nature variée : image, vidéo, son et texte. Tout cela peut servir de point d’entrée pour, ensuite, servir à générer ou bien modifier des vidéos en haute définition à la volée. Car c’est bien là la finalité d’Omni : la vidéo.

En somme, la logique d’Omni est de prolonger Gemini, que les internautes connaissent — c’est le chatbot de Google pour défier ChatGPT, et depuis lequel on a accès à une variété de modèles. « D’emblée, nous avons conçu Gemini pour qu’il soit multimodal dès sa conception, et nous franchissons aujourd’hui une nouvelle étape », commente le groupe.

Un internaute peut ainsi fournir une image de référence, préciser le style visuel, inclure une piste audio et rajouter une consigne textuelle (prompt). Omni rassemble alors le tout, fusionne les éléments entre eux avec la promesse de fournir un clip cohérent. On peut aussi partir depuis une vidéo déjà existante pour la modifier, ou la prolonger.

Source : Capture d'écran
Source : Capture d’écran

Modifier une vidéo en lui parlant

La conférence I/O a aussi été l’occasion de présenter d’autres services et produits : Gemini Spark, Gemini 3.5 Flash et un relooking du chatbot de Google.

Après avoir investi le terrain de l’image l’an dernier avec le modèle Nano Banana, Google passe donc à l’étape d’après. Pour concrétiser sa vision, la firme de Mountain View déploie un premier modèle baptisé Gemini Omni Flash — signe que d’autres arriveront par la suite, à mesure des avancées en matière d’algorithmes et de calculs.

La principale force de Gemini Omni Flash, à en croire Google, est la faculté d’éditer une vidéo « naturellement », en tenant une conversation. Il n’y aurait en somme plus besoin de maîtriser vraiment des logiciels de montage avec leurs réglages parfois techniques : l’internaute peut modifier son clip par un simple dialogue avec l’IA.

Le modèle promet bien sûr de maintenir la cohérence des scènes et des personnages au fil des requêtes. Dans ce cadre, Google affirme qu’Omni s’appuie sur une bonne compréhension de la physique (gravité, énergie cinétique, dynamique des fluides) et sur les connaissances du monde de Gemini pour conserver réalisme et homogénéité tout au long du clip.

Source : Capture d'écran
Source : Capture d’écran

Pas de lancement en Europe pour l’instant

Envie de mettre la main dessus ? Il y a hélas un hic : si Google annonce un déploiement immédiat pour ses abonnés payants (AI Plus, Pro, Ultra) et une intégration gratuite sur YouTube Shorts, le public européen se retrouve mis de côté pour une durée indéterminée. C’est tout particulièrement le cas de la fonction permettant d’utiliser une vidéo en entrée.

Les raisons de ce blocage sont certainement réglementaires — le géant du web n’a pas explicité les obstacles qui l’incitent à retenir cet outil. Cela dit, on observe depuis quelques années maintenant un découplage de la sortie de certaines nouveautés entre les USA et l’Europe en raison des règles de l’UE, et cela touche souvent les sujets d’IA.

Au-delà de ces considérations juridiques, Google a prévu d’emblée d’inclure la technologie SynthID dans toutes les vidéos conçues avec Omni. Il s’agit d’un filigrane numérique invisible à l’œil nu qui sert à vérifier et à identifier si un contenu est synthétique, c’est-à-dire altéré ou créé par IA. On retrouve ce système sur d’autres outils de Google, comme Lyria, Veo ou Nano Banana.

Découvrez les bonus

+ rapide, + pratique, + exclusif

Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.

Découvrez les nombreux avantages de Numerama+.

S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+
Toute l'actu tech en un clien d'oeil

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !


Pour ne rien manquer de l’actualité, suivez Numerama sur Google !