Comment va-t-on empêcher les IA de voler des images ?

Résumé par IA, vérifié par Numerama

Des artistes et des agences, telles que Getty Images, intègrent des poursuites judiciaires contre les créateurs d'IA pour utilisation non autorisée d'images protégées par le droit d'auteur pour entraîner leurs systèmes.
Des chercheurs de l'Université de Chicago ont conçu Nightshade, un outil qui empoisonne les modèles d'IA en altérant subtilement des images de façon à troubler la reconnaissance visuelle par ces systèmes.
PhotoGuard, développé par le MIT, protège les images contre tout traitement malveillant par les IA, en rendant inefficaces les tentatives de manipulation numérique.

Recevez tous les soirs un résumé de l’actu importante avec Le Récap’

Nos images en ligne, même sous droit d’auteur, sont attractives face aux systèmes d’intelligence artificielle : que ce soit pour les entraîner ou pour la création de deepfakes. Face à ce phénomène, les premiers outils de protection des photos émergent de la recherche.

Mi-janvier 2023, les premières plaintes tombent contre les systèmes d’IA génératrices d’images, seulement quelques mois après leur diffusion. Trois artistes, Sarah Andersen, Kelly McKernan et Karla Ortiz, portent plainte contre Midjourney, Stability AI et DeviantArt, pour avoir « enfreint le droit d’auteur de millions d’artistes, sans leur consentement. » Ces entreprises sont à l’origine de générateurs d’images (Stable Diffusion, Midjourney, DreamUp) qui auraient été entraînés en récupérant du contenu sous copyright sur internet sans permission et sans rétribution pour les artistes. Le lendemain, c’est au tour de l’agence de photos Getty Images de s’élever contre Stable Diffusion pour les mêmes raisons.

Les systèmes génératifs d’images ont besoin de grandes quantités de contenus visuels pour être entraînés et à leur tour pouvoir produire des images. Face à leurs griffes, de quels moyens dispose-t-on pour protéger nos contenus en ligne ? L’heure de la revanche a peut-être sonné. Dans une étude mise en ligne en octobre 2023, encore non relue par les pairs, des chercheurs de l’Université de Chicago proposent un outil pour les empoisonner.

Une baie empoisonnée

Cet algorithme, les chercheurs l’ont baptisé Nightshade, qu’on peut traduire par belladone en français, c’est-à-dire une plante à baies noires toxique. L’outil porte bien son nom : si un modèle génératif d’images se nourrit de ces baies noires attrayantes d’internet, il sera rendu malade et verra la qualité de ses sorties diminuées. Par exemple, pour lui un chien ressemblera à un chat.

Tout repose sur un constat simple : « Les humains et les machines voient les images de façon différente », explique Shawn Shan, co-auteur de l’étude. Ainsi, il est possible d’apporter à une image de subtiles modifications des pixels (changement de couleur, échange), imperceptibles pour l’humain, mais qui sont une véritable source de confusion pour la machine.

« Notre attaque, qui est dite d’empoisonnement, va cibler des concepts assez précis, comme un chien, un sac à main, le style cubique…», détaille Shawn Shan. Prenons l’exemple du chien : il s’agit de modifier les images présentant nos amis canidés de sorte que, dans l’espace où le modèle perçoit les images, celui-ci y retrouve les caractéristiques d’une image de chat. Pour nous, par contre, le chien continue de ressembler à un chien.

Exemples de sorties du modèles quand celui-ci n’est pas empoisonné (clean model) ou après son entraînement sur 50, 100 ou 300 exemples empoisonnés par Nightshade // Source : S. Shan et al, Prompt-Specific Poisoning Attacks on Text-to-Image Generative Models, 2023

Un modèle d’IA n’aurait besoin que d’entre 50 et 100 exemples d’images de chien modifiées par Nightshade pendant son entraînement, pour ne plus être capable de le dessiner. Il se passe la même chose pour le style cubique : après une cinquantaine d’exemples empoisonnés, le système renvoie une image sous un style d’animé au lieu de suivre les caractéristiques du mouvement cubique.

Les chercheurs ont introduit cette attaque pour obliger les entreprises créatrices d’IA à respecter le droit d’auteur. « Nous imaginons que le cas d’usage de cet outil sera les artistes ou toute personne qui met du contenu sur internet mais qui ne veut pas que celui-ci serve à l’entraînement des modèles. Je pense notamment aux entreprises — comme Disney par exemple — qui en plus auront suffisamment de ressources computationnelles pour le faire », note le chercheur.

Pour aller plus loin

« Les IA génèrent des images, mais pas de l’art »

Glaze : une protection du style des artistes

Moins dévastateur pour les modèles, un autre outil a été proposé par la même équipe, mais ici pour protéger le style des artistes. « Glaze est une autre attaque empoisonnée. Elle va perturber les caractéristiques liées au style », décrit Shawn Shan. Le procédé ici est semblable. Le modèle a une compréhension mathématique de ce qui fait la particularité d’un artiste sur un autre. De nouveau, l’idée est de modifier les pixels de l’image pour que le style de l’artiste disparaisse pour la machine. « En quelque sorte, on enlève le style de l’artiste pour le remplacer par un autre, comme le style de Van Gogh ou de Picasso », note le chercheur. Pour nous, comme précédemment, les modifications sont trop subtiles pour être remarquées.

Mais nos données en ligne ne sont pas sous la seule menace des entraînements sans notre accord, nos photos peuvent aussi être volées puis modifiées à des fins malveillantes. C’est ce qui se passe avec les deepfakes, à des fins de désinformation ou de pornographie.

Protéger les images contre les manipulations

Dans ce cas, le problème n’est plus que nos images servent d’inspiration aux systèmes génératifs d’images, mais plutôt qu’elles puissent être éditées grâce à ces outils. Des chercheurs de l’Institut de technologie du Massachusetts (MIT) ont alors développé une attaque contre ces usages. Dans une étude, ils présentent leur outil PhotoGuard qui immunise les images d’une modification potentielle par un modèle d’intelligence artificielle. « On parle ici d’attaque ‘adversarial’ [antagoniste en français] », note Guillaume Leclerc, co-auteur de l’étude.

Exemples d’une immunisation avec PhotoGuard : sans protection, l’image peut-être modifiée pour faire danser les deux personnes. Dans le second cas, après immunisation de leurs visages, la sortie ne correspond plus à la requête. // Source : H. Salman et al., Raising the Cost of Malicious AI-Powered Image Editing, 2023

Le principe est comparable : une modification subtile des pixels permet de protéger l’image ou la partie la plus sensible de celle-ci (un visage par exemple). L’une des idées des chercheurs est de changer la valeur des pixels, de sorte que la partie sensible de l’image soit vue par le modèle comme une zone grise (plutôt qu’un visage). Ainsi, en sortie, l’image ne correspond pas à la demande de l’utilisateur.

Des idées en attendant les mesures

« Mais on n’est loin d’avoir résolu le problème ! Si notre outil marche contre les éditions avec Stable Diffusion, il ne fonctionne pas forcément sur les autres modèles et ceux qui arriveront dans les prochaines années », prévient Guillaume Leclerc. Car chaque modèle a son propre espace pour représenter virtuellement les images. « On ne veut pas que cela donne un sentiment de sécurité, on souhaite avant tout ouvrir une discussion et créer un sentiment de responsabilité pour l’industrie. » Et pourquoi pas, forcer tous les modèles génératifs à avoir une faille. De cette façon, il serait possible de protéger nos photos en modifiant quelques pixels pour les envoyer dans cette zone, mal prise en charge.

Dans tous les cas, les chercheurs espèrent qu’en proposant des attaques contre les modèles d’intelligence artificielle, des régulations soient adoptées et respectées. « Il sera intéressant de voir comment ces outils forceront les choses à changer », attend Shawn Shan.

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !

Pour ne rien manquer de l’actualité, suivez Numerama sur Google !

Comment va-t-on empêcher les IA de voler des images ?

Une baie empoisonnée

Glaze : une protection du style des artistes

Protéger les images contre les manipulations

Des idées en attendant les mesures

Microsoft prouve qu’on peut stocker des données sur du verre pendant 10 000 ans

NVIDIA Studio : le secret des monteurs de Mastu et Michou pour booster leur productivité

Vous avez un vieux PC ? VLC est à la recherche d’anciens ordinateurs pour son app Windows XP

Quels sont les meilleurs casques audio Bluetooth à réduction de bruit en 2026 ?

Comment générer de la musique gratuitement avec Google Gemini et Lyria 3 ?

SCAF : le chancelier allemand jette un froid sur l’avenir de l’avion européen

« J’y vais à pied ou en voiture ? » : pourquoi tout le monde pose cette question bête aux IA

« C’est un fiasco total », le code indigeste généré par IA épuise les modérateurs open-source

Quelle Playstation choisir en 2026 : PS5 Slim ou pS5 Pro ? On vous aide à trancher

Précommande Pixel 10a : toutes les offres sur le nouveau smartphone Google