Gendered News est un projet visant à mesurer les inégalités de genre dans les médias français. Ses premières statistiques confirment une « inertie des pratiques », avec peu de femmes citées ou mentionnées dans les articles.

Mesurer quotidiennement les inégalités de genre dans les principaux médias français, c’est l’objectif de Gendered News. Rendu public le 8 mars 2022, ce site est un projet de l’Université Grenoble Alpes. Chaque lundi, son compte Twitter baptisé @genderednews diffuse les statistiques de la semaine écoulée, avec deux graphiques simples, mais efficaces : on y voit la part des hommes dans les citations et dans les mentions, dans 7 médias — L’Équipe, la Croix, Le Figaro, Le Monde, Le Parisien, Les Échos, Libération.

Les ciitations Les mentions

L’objectif est ainsi de rendre visibles les inégalités dans les mentions (le fait de parler d’hommes dans les articles) et dans les citations (le fait de donner la parole à des hommes), en fonction des journaux, tout en rendant compte de l’évolution à travers le temps. Sans surprise, les hommes sont majoritairement cités, dans des proportions situées entre 60 et 80 %, avec quelques variations selon les médias et dans le temps.

Un déséquilibre constant entre le nombre de femmes et d’hommes mentionnés

« Ce qu’on trouve intéressant, c’est de voir que c’est constant. Il y a très peu de changement », explique à Numerama Ange Richard, doctorante à l’université Grenoble Alpes. Spécialiste des méthodes quantitatives et de la sociologie des médias, la scientifique fait partie de l’équipe de recherche qui a créé Gendered News. L’algorithme consacré aux mentions est en place depuis un an, celui portant sur les citations fonctionne depuis août 2021, de quoi commencer à avoir du recul sur la situation. « On commence à voir que ça ne bouge pas, sur plusieurs mois d’affilée. »

Même si son équipe continue de collecter des données et n’a pas encore publié d’analyses, Ange Richard évoque déjà plusieurs pistes d’explication. « Les sujets qui comptent en général dans l’actualité ont attrait au pouvoir, ce sont donc des domaines où il y a davantage d’hommes », relève la spécialiste.

Mais elle ajoute que cela ne peut pas tout expliquer, notamment cette « inertie des pratiques » persistante, alors qu’on observe tout de même une petite tendance à la féminisation de certains métiers, et que des initiatives comme Les Expertes facilitent la démarche des journalistes soucieux de solliciter davantage de femmes spécialistes. « Il y a des habitudes, des carnets de contacts qu’on ne renouvelle pas forcément, poursuit Ange Richard. Les journalistes ne peuvent pas non plus être partout : dans les rubriques liées aux relations internationales et à la politique, il peut être couteux pour les rédactions d’envoyer des journalistes sur place, elles s’appuient sur des communiqués, ce qui offre moins liberté de choix. »

Comment fonctionne Gendered News ?

Le projet s’inscrit dans le domaine du traitement automatique des langues. « L’idée, c’est d’utiliser ces technologies-là pour proposer des mesures systématiques des inégalités de genre dans la presse », explique la doctorante. Ce travail est divisé en deux parties :

  • Les mentions, c’est-à-dire les prénoms qui apparaissent dans les textes. « On cherche dans une base de données de plusieurs dizaines de milliers de prénoms. Dans cette base, chaque prénom est associé à une probabilité que ce soit le prénom d’un homme », explique Ange Richard ;
  • Les citations, où l’objectif est de déterminer automatiquement le genre de la personne qui parle. « On ne peut pas se baser que sur le prénom, car il peut y avoir d’autres tournures, comme ‘la présidente a dit’, par exemple. On regarde donc plusieurs faisceaux d’indices : le genre de ce prénom, s’il est cité, mais aussi les titres (madame, monsieur), des noms de métier genrés… Autant d’indices qui vous nous aider à déterminer le genre de la personne citée. »
évolution taux masculinité gendered news
Évolution des taux de masculinité dans les mentions. // Source : Capture d’écran Gendered News

Les scientifiques ont conscience que la méthode peut avoir des failles, et ont tenté autant que possible d’éviter les potentielles erreurs. « Ce n’est pas à 100% sûr, concède la doctorante. Nous avons fait un nettoyage de notre base de données, pour enlever les prénoms qui peuvent renvoyer à d’autres choses qu’à des personnes (Noël, par exemple). » Néanmoins, Ange Richard et son équipe estiment que dans les mesures finales, à l’échelle de l’ensemble des articles publiés dans un même média, le résultat est satisfaisant.

« Ce qui nous intéresse, c’est de retomber sur nos pieds statistiquement, d’avoir une mesure globale. Même si parfois on a quelques erreurs : on trouve un prénom là où il n’y en pas, par exemple. Les fautes d’accord sur un nom sont elles un peu moins fréquentes (le président, la présidente). […] On a évalué notre algorithme pour voir à quel point il se trompe, et les mesures qu’on retrouve statistiquement à la fin sont cohérentes avec ce qu’il devrait trouver, soit entre 70 et 80 % d’hommes cités ou mentionnés. »

Pour l’instant, aucun machine learning, ou apprentissage automatique, n’est impliqué : seuls des algorithmes à base de règles, jugés plus robustes par les chercheurs, servent à déterminer la répartition genrée dans les productions de 7 médias. « Notre objectif est d’amener des technologies d’entrainement, notamment sur les citations, ce qui implique des bases de données beaucoup plus grandes », anticipe Ange Richard. Il est aussi prévu d’ajouter d’autres sources, en plus des 7 retenues pour l’instant, notamment des titres de presse spécialisée et locale.

Comment les articles sont-ils choisis par Gendered News ?

Gendered News prend en considération tous les articles publiés par ces médias sur leur compte Twitter (dans la semaine écoulée avant que ne paraisse le bilan du lundi). « Tous les jours, on récupère les URL des articles publiés sur Twitter. On a fait une comparaison avec les flux RSS, c’est à peu près le même nombre. Passer par Twitter est plus simple et plus accessible. » Si un média publie plusieurs fois le lien d’un même article sur Twitter en un jour, il n’est compté qu’une seule fois.

En plus de vouloir prendre en compte plus de médias, et d’améliorer les technologies impliquées avec de l’apprentissage automatique, le projet avec Gendered News est surtout de comprendre l’origine des biais. Une série d’entretiens menés avec des journalistes est en cours. « Nous voulons fournir des mesures systématiques des inégalités de genre, mais aussi pouvoir les expliquer, comprendre d’où elles viennent, pourquoi ça ne change pas, détaille Ange Richard. Le site est une vitrine de ce projet, un tableau de bord pour montrer notre travail, et pour participer au débat public sur ces questions. »