Le média américain attaque en justice l’entreprise OpenAI et Microsoft, accusés d’avoir utilisé des milliers d’articles du média pour nourrir leurs modèles de langage, qui entrent désormais directement en concurrence avec les contenus du site d’information.

Le New York Times est remonté. Le média américain vient de porter plainte, dans un document datant du 27 décembre, contre OpenAI, l’entreprise qui a notamment créé le célèbre chatbot ChatGPT, et Microsoft. Selon lui, les deux firmes auraient « utilisé de manière illégale le travail du Times pour créer un produit d’intelligence artificielle qui menace la capacité du New York Times à produire ce service. »

Microsoft aussi est ciblé par la plainte du média, car il a aussi développé son IA appelée Copilot — et la firme a par ailleurs investi des milliards de dollars dans OpenAI, avec qui elle entretient un rapport très privilégié.

Selon le NYT, OpenAI aurait utilisé « des millions d’articles du Times, qui sont sous copyright : des news, des enquêtes, des éditos, des critiques, des guides et bien plus » pour construire son modèle de langage. ChatGPT est basé sur GPT-4, un modèle d’IA qui a ingurgité des milliards de mots disponibles sur le web, pour pouvoir ensuite être capable de répondre à des instructions textuelles données par un humain. L’an passé, le monde entier a découvert ChatGPT lorsqu’OpenAI a rendu son utilisation publique et gratuite.

« Il est vrai que [OpenAI] a utilisé de très nombreuses sources, mais ils ont particulièrement mis l’emphase sur les contenus du New York Times en créant leur modèle de langage, ce qui montre leur préférence et reconnaît la valeur de nos travaux », peut-on lire dans la plainte.

Pour entrainer leur intelligence artificielle, Microsoft et OpenAI ne se cachent pas d’avoir utilisé des sources librement accessibles sur le web. Le problème est que leurs chatbots sont maintenant accessibles à tous, et ne citent pas toujours les sources qu’ils convoquent lorsqu’ils donnent des réponses.

Sam Altman interviewé par le WSJ // Source : Screenshot YouTube/Wall Street Journal
Sam Altman, patron de OpenAI, interviewé par le WSJ // Source : Screenshot YouTube/Wall Street Journal

Ce que reproche le New York Times à OpenAI et Microsoft

Le New York Times partage d’autres griefs, rapportés par The Verge :

  • Le fait que ChatGPT réutilise certaines tournures de style du NYT serait « dommageable » pour le pacte entre le média et ses lecteurs et lectrices ;
  • Cela risque de faire perdre de l’argent au NYT, dont une grande partie des revenus repose sur les abonnements payants, mais aussi en termes de trafic sur son site, qui génère de la publicité en ligne. Si celui-ci fait moins d’audience, car les internautes préfèrent ChatGPT, alors le média perd de l’argent ;
  • OpenAI et Microsoft n’ont pas dépensé un centime pour utiliser les articles du New York Times pour entrainer leurs machines, tandis qu’ils ont généré beaucoup de valeur pour eux-mêmes ;
  • Le NYT a essayé de nouer un accord financier avec Microsoft et OpenAI, qui n’aurait pas abouti.

Depuis quelques mois, le New York Times fait partie des médias qui ont bloqué l’accès de leur site aux IA qui aspiraient leurs contenus. À noter qu’Apple pourrait s’éviter ce souci juridique en s’alliant à la presse en amont.


Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !