Un contenu accessible sur le net ne veut pas dire qu’il est libre d’utilisation ou d’accès. Cela, les titulaires de droits d’auteur le savent bien : voilà des années qu’ils bataillent contre la circulation d’œuvres piratées, sur le web ou sur les réseaux P2P. Mais ces derniers mois, les ayants droit font face à un autre type de souci : les outils d’intelligence artificielle (IA).
Plus particulièrement, ce sont les systèmes génératifs à la ChatGPT qui posent une difficulté : en effet, ces dispositifs sont entraînés sur des corpus de textes qui peuvent contenir des éléments sous copyright — la façon dont ces données ont été constituées n’est d’ailleurs pas toujours claire. De fait, une certaine opacité règne sur ce qui a servi d’entraînement.
Claude connait trop bien les chansons
C’est dans ce cadre qu’aura lieu un procès aux États-Unis, à l’initiative d’Universal Music. Le Financial Times rapporte en effet dans son édition du 18 octobre la plainte de la maison de disques contre Anthropic, une entreprise spécialisée dans l’IA qui a mis au point un agent conversationnel rival de ChatGPT : Claude. Le grief ? Claude a enregistré les paroles de chansons.
« Lorsqu’on demande à Claude les paroles de la chanson I Will Survive de Gloria Gaynor, par exemple, il répond par ‘une copie presque mot pour mot de ces paroles’ », rapporte le quotidien britannique américain, en citant le contenu d’une plainte déposée auprès d’un tribunal de Nashville (Tennessee). Universal, Concord et ABKCO font partie des plaignants.
Ce constat, Numerama a pu le faire de son côté, à travers le logiciel Slack : Claude est intégré à l’espace de travail de la rédaction. On lui a demandé de nous fournir les paroles de Beat It, de Michael Jackson. Après un temps, le chatbot s’est rapidement exécuté. Le résultat paraît complet, hormis l’absence de répétition de certains refrains en fin de texte.
Sur ChatGPT, on ne retrouve pas ce comportement : un message d’erreur met fin à la tentative après l’envoi de notre requête. « Désolé, je ne peux pas fournir les paroles complètes d’une chanson car elles sont soumises aux droits d’auteur. Je peux vous donner un résumé de la chanson ou répondre à d’autres questions que vous pourriez avoir à son sujet », écrit le chatbot.
Il est toutefois possible de tromper le système, en lui racontant des salades. C’est ce qu’on a réussi à faire en mettant l’outil dans certaines dispositions préalables. Cela étant, le résultat n’est pas commode à obtenir : il a fallu générer ligne par ligne toute la chanson. On n’a pas poursuivi l’expérience sur la totalité du titre, mais cela a marché pour le début.
Du côté de Bard, l’outil de Google, la situation est plus surprenante : il retourne lui aussi les paroles de la chanson, mais se permet aussi de les traduire en français — ce qui n’a pas été demandé. Là encore, aucune mention concernant le copyright n’est donné. Google propose déjà les paroles de chansons directement dans son moteur de recherche, et cela depuis 2014.
On sait que les outils d’intelligence artificielle sont entraînés avec de nombreuses données issues du web — comme Wikipédia et Reddit. Par ailleurs, des chatbots ont la faculté de parcourir le net afin d’aller chercher des informations plus récentes. On peut toutefois utiliser des réglages pour interdire aux robots d’indexation de lire un contenu. Bard et ChatGPT prévoient ce cas de figure.
Le procès intenté par Universal et deux autres labels contre Anthropic, dont il est reproché de ne jamais avoir tenté de conclure un deal en amont avec l’industrie musicale, illustre un phénomène qui risque de prendre davantage d’ampleur — et qui, au-delà de la musique, concerne la presse, la littérature, le dessin, la vidéo — en somme n’importe quelle production de l’esprit.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !