Le faux site Tech-Generation, créé par un consultant français pour observer le comportement des IA génératives, gagne en visibilité sur le web français. Si les chiffres sont pour l’instant anecdotiques, son existence offre un aperçu du futur d’un web où se mélangeront contenus rédigés par des humains et des robots.

Savez-vous si l’article que vous lisez actuellement a été rédigé par un humain ou un robot ? Je vous rassure : il est écrit par de petites mains parfaitement organiques, attachées au bout des bras d’une rédactrice en chef de permanence un samedi matin. Mais ma question n’est pas anodine.

Si vous cherchiez des infos, ce 9 décembre 2023 au matin, sur le nouveau plan com’ de la chanteuse Nicki Minaj, vous seriez peut-être tombés, sans le savoir, sur l’article écrit par une intelligence artificielle d’un site pas comme les autres, Tech-Generation.fr.

C’est l’expérience que j’ai faite.

Une recherche sur Google.fr en navigation privée le 9 décembre 2023
Une recherche sur Google.fr en navigation privée le 9 décembre 2023

Tech-Generation, premier sur l’info ?

Au cours de ma veille matinale, j’ai ouvert un article de TechCrunch sur « Gag City », datant du 9 décembre. Il s’agit d’une opération de communication de Nicki Minaj propulsée sur X (ex-Twitter) pour la sortie de son album. Elle consiste à inventer une ville fictive, sorte d’utopie rose fluo où Minaj règne en maîtresse. Les fans sont encouragés à publier des vidéos ou images pour nourrir cet imaginaire. La majorité des visuels sont clairement générés grâce à des IA, comme Dall-E ou Midjourney.

Quelques exemples du mème "gag city" repris sur X
Quelques exemples du mème « gag city » repris sur X

Soit. Comme Numerama est un site spécialisé dans les pratiques du numérique, j’ai commencé à m’intéresser au sujet, pensant qu’il serait intéressant de fouiller l’aspect « IA » de cette tendance. J’ai ouvert mon moteur de recherche pour voir quels autres médias avaient écrit sur le sujet. C’est là que mes yeux se sont arrêtés, avec stupeur, sur le premier lien proposé par Google.fr.

« Gag City, ou comment rose-tinter le marketing numérique avec Minajeste », me dit l’aperçu. Le site qui héberge l’article ? Tech-Generation.fr. Je connais bien ce site. J’ai même demandé à une journaliste de Numerama de lui consacrer un article, que nous avons publié en avril 2023, intitulé « ChatGPT va-t-il remplacer Numerama ».

Capture d'écran du début de l'article écrit par IA
Capture d’écran du début de l’article écrit par IA

Tech-Generation reprend les codes des sites d’information tech, remplis de courts articles qui diffusent des actualités du monde du numérique. Sur ce site web, rien n’a été écrit par des humains. Tous les textes ont été rédigés par ChatGPT, en s’inspirant de news des sites tech américains. Ici d’ailleurs, l’article est adapté de celui de TechCrunch.

Il a été créé par Ari Kouts, consultant spécialisé dans le conseil en numérique pour le groupe Viseo. En avril dernier, il nous expliquait : « J’ai voulu voir si, en donnant complètement les rênes à une IA, je pouvais arriver à quelque chose qui ressemblait à un site existant ou crédible.» À l’époque, il estimait la ressemblance réussie, « mais pas assez pour que ce soit un remplaçant d’un site ou d’un journal.»

Quelques mois plus tard, le constat est-il le même ? L’article est en effet bourré d’erreurs de français et de phrases sans queue ni tête. Il n’y a qu’à voir le premier paragraphe : « Ah, la technologie, sublime outil de nos jours où même une cité peut devenir rose, et je ne parle pas du vin. Plongeons dans le rose bonbon de « Gag City », un métropole numérique peuplée de fans et de marques – et cerise sur le gâteau, un cas d’école en hypnose collective 2.0. »

Cette faible qualité linguistique n’a toutefois pas empêché Google de le propulser en une des recherches françaises.

Comment faire la différence entre un texte

Comme me l’a fait remarquer Ari Kouts, Google dispose d’une politique claire sur la question des textes générés par IA : « Nous nous concentrons sur la qualité du contenu plutôt que sur la façon dont il est produit. » En somme, Tech-Generation produirait des textes d’une qualité assez convenable pour ne pas mériter d’être déréférencé.

Dans le cas de la ville fictive de Minaj, l’une des raisons de la proéminence de ce site dans les recherches Google réside dans l’absence de concurrence. À part un bref article de Konbini — qui, au fond, n’apporte pas grand-chose de plus que Tech-Generation —, aucun site français ne s’était jusqu’ici emparé de l’info. Selon Ari Kouts, si des « sites mieux référencés » écrivaient maintenant sur le sujet, ils « passeraient au-dessus ». Reste que Tech-Generation étant un site automatisé, sa réactivité est imbattable. Surtout les week-ends, où les journalistes français sont moins connectés et publient moins de contenus…

À ce jour, le site ne cumule que quelques milliers de visiteurs uniques par mois, pour près de 100 000 « impressions » (le nombre de fois où le site apparait sous le nez d’un internaute), ce qui est anecdotique. Mais à mesure qu’il publie de plus en plus d’articles, le site gagne en poids et donc en importance.

Le projet d’Ari Kouts a cela de passionnant qu’il permet de suivre de manière transparente la vie d’un vrai-faux site généré par ChatGPT à travers le temps. Il a cependant un impact sur le réel. Interrogé sur la responsabilité de laisser un site rédigé par IA en ligne, le conseiller se montre réceptif et prudent : « Je me pose effectivement la question de la suite. A minima, je pense ajouter un bandeau pour bien indiquer que le texte est généré par IA, pour ne pas induire les lecteurs en erreur (ce n’est probablement pas assez explicite) », nous dit-il.

À la suite de notre échange, il a même ajouté un bandeau violet en une du site et de toutes les pages : « Les articles de ce site sont tous écrits par des intelligences artificielles, dans un but pédagogique et de démonstration technologique », avec un lien vers sa page « A propos » où la démarche est mieux expliquée.

Le nouveau bandeau ajouté sur le site Tech-Generation
Le nouveau bandeau ajouté sur le site Tech-Generation

« Mais le contenu reste de ‘qualité’ pour ceux qui veulent juste une veille, c’est ça qui est surprenant », ajoute-t-il, ouvrant la porte d’une discussion bien plus large sur la manière d’informer les lecteurs et lectrices, et ce qui fait aujourd’hui un « article de qualité » en ligne.


Si vous avez aimé cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à Numerama sur Google News.