Un internaute a créé un réseau de sites entièrement générés par l’intelligence artificielle, dont un média sur la technologie. L’IA est-elle déjà une menace pour les sites d’actualité ?

D’apparence, Tech Generation a tout d’un média web dédié à la technologie. Intelligence artificielle, réseaux sociaux, crypto, métaverse, blockchain, jeux vidéos, appareils technologiques… Le site, mis à jour quotidiennement, comptabilisait 750 articles au 20 avril selon son fondateur, avec 80 % de reprises d’actualités américaines.

Le site Tech Generation a en fait été généré entièrement par une IA générative // Source : Ari Kouts
Le site Tech Generation est la création d’IA génératives. // Source : Ari Kouts

Chacun de ses deux rédacteurs semble apposer son propre style : Vianney Garet glisse de petits traits d’humour ou une citation d’Elon Musk ; Nina Gavetière préfère une écriture plus neutre et méthodique.

Mais lorsqu’on clique sur leurs portraits dans la section « A propos », un détail intrigue. Vianney et Nina y sont décrits comme des « journalistes génératifs ». Tout s’éclaire dans les mentions légales. Le directeur de la publication s’appelle ChatGPT.

Vianney et Nina, les "journalistes génératifs" du site Tech Generation, généré par IA. // Source : Ari Kouts
Vianney et Nina, les « journalistes génératifs » du site Tech Generation, générés par IA. // Source : Ari Kouts

« J’ai voulu voir si en donnant complètement les rênes à une IA, je pouvais arriver à quelque chose qui ressemblait à un site existant ou crédible », raconte à Numerama son créateur Ari Kouts, qui a utilisé ChatGPT et Midjourney. En même temps, ce consultant en innovation pour la société de conseil Viseo a créé un site de recettes lui aussi généré par IA, Cuisine Generation.

Il estime la ressemblance réussie, « mais pas assez pour que ce soit un remplaçant d’un site ou d’un journal. Et ça montre l’aide que ça peut être sur l’écriture, le choix d’article, la vérification des infos. » 

L’IA reste encore piètre rédactrice

Si on prend le temps de le lire, le contenu laisse encore à désirer. Les angles ne sont jamais très originaux, les articles creux et vides de faits précis et les illustrations sont rarement bien coordonnées (une photo du logo Instagram est accolée à un papier sur Twitter par exemple).

De façon générale, même si ChatGPT à la sauce Microsoft Bing cite ses sources, les IA conversationnelles multiplient les erreurs factuelles (ou « hallucinations ») et inventent même parfois des études ou des ouvrages à l’origine de leurs infos. Ari Kouts estime cependant qu’en donnant comme contexte à ChatGPT des sites de médias reconnus, l’IA générative a été assez précise pour résumer des articles en les retravaillant, et en indiquant ses sources. 

« Mais quand un journaliste va recouper des sources, prendre plusieurs témoignages, lui-même enquêter, aujourd’hui l’IA seule va pas pouvoir le faire », nuance-t-il. Il cite l’exemple du site Frandroid, dédié à la technologie, où « les gens ne viennent pas uniquement pour [l’actualité], mais aussi pour des tests, des guides, des choses sur lesquelles l’humain va être performant et le seul à savoir manier les choses. » Pour lui, « tout ce qui est peu qualitatif peut être remplacé par une IA, ce qui va permettre de faire plus de qualité », en dégageant du temps de travail aux journalistes.

Pour les médias, l’IA doit être un outil d’analyse et de mise en valeur du contenu

L’intelligence artificielle n’est pas un outil nouveau dans le travail des journalistes. Pour l’instant, cette technologie est avant tout utilisée pour de la génération automatique des sous-titres, ou pour actualiser automatiquement les pages d’accueil en fonction des tendances de l’actualité du moment, à travers des outils comme Sophi.io. Le groupe financier américain Bloomberg, également connu comme agence de presse, a aussi développé sa propre IA conversationnelle pour estimer l’impact positif ou négatif d’une publication d’entreprise sur les marchés.

Dans le domaine de la rédaction pure, les résultats sont plus balbutiants. Le mois dernier encore, le site Buzzfeed avait sans le dire généré par IA plusieurs articles répétitifs et maladroits conseillant des destinations de voyage, comme les choses à faire au Maroc ou 42 endroits à visiter en 2023

De la responsabilité des agréateurs de médias et des moteurs de recherche

L’un des problèmes majeurs selon le créateur de Tech Generation est que son site a été certifié par Google Actualités, le service d’information automatisé de Google. Le site y apparaît toujours comme une source à l’heure de la publication de cet article. « Est-ce que côté aggrégateur type Google Actualités il y a une vérification humaine à faire ? », s’interroge Ari Kouts.

Google Actualités affiche encore le site Tech Generation // Source : Numerama
Google Actualités affiche encore le site Tech Generation // Source : Numerama

Dans une série de questions-réponses sur ses règles liées à l’IA en février, Google précisait être doté de « systèmes destinés à faire remonter [dans les résultats de recherche] la couverture de l’actualité “originale” » afin que le contenu de mauvaise qualité généré par IA n’y prenne pas le dessus.

A propos de son service compilant des articles en ligne, la filiale d’Alphabet se contenter de rappeler prudemment que « les éditeurs qui apparaissent dans Google Actualités doivent renseigner la signature et les informations à propos de l’auteur ». Mais rien ne dit explicitement qu’il se doit d’être humain.

Nouveauté : Découvrez

La meilleure expérience de Numerama, sans publicité,
+ riche, + zen, + exclusive.

Découvrez Numerama+

Si vous avez aimé cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à Numerama sur Google News.