L'université de Stanford a développé un réseau neuronal artificiel capable de déterminer efficacement, à partir d'un ensemble de photos de visages, si les personnes en question sont homosexuelles ou hétérosexuelles. L'étude, limitée à un cadre très restreint, amène surtout à s'interroger sur les dangers qui pourraient accompagner l'émergence potentielle d'un tel système.

« Les réseaux neuronaux artificiels sont plus compétents que l’homme pour identifier l’orientation sexuelle [d’une personne] à partir d’une photo ». C’est le titre, légèrement provocateur, d’une étude de l’université de Stanford réalisée par Michal Kosinski, psychologue spécialisé dans l’analyse de données, et Yilun Wang, informaticien.

Gay ou hétéro ? Leur réseau neuronal artificiel est capable, à partir de la simple photo d’un visage, de répondre à cette question. Du moins, dans un contexte précis et limité, propre à cette étude au fort caractère polémique au vu de ses implications en matière d’orientation sexuelle.

Le travail des deux universitaires a consisté à sélectionner 35 326 photos tirées d’un « site de rencontre américain populaire » dont les profils sont publics. Ces clichés représentaient 14 776 personnes — hommes et femmes confondus — dont les visages étaient suffisamment visibles pour être analysés.

91 % de réussite pour les hommes, 71 % pour les femmes

Les scientifiques se sont ensuite tournés vers le réseau neuronal artificiel pour lui faire trouver des liens entre la sexualité de la personne — indiquée sur le site de rencontre — et les caractéristiques de son visage.

Ainsi, face à deux photos prises au hasard, l’une d’un homme homosexuel et l’autre d’un homme hétérosexuel, le réseau neuronal obtient un taux d’identification réussie de leur sexualité de 81 %. Un pourcentage qui grimpe à 91 % lorsqu’il fait face à 5 photos respectives des deux hommes, la multiplication d’exemples l’aidant logiquement à améliorer ses chances de succès. Le réseau neuronal se montre en revanche moins efficace avec les visages féminins, pour lesquels son taux de précision chute à 71 % avec une unique photo et 83 % avec 5 clichés.

Le réseau neuronal artificiel devrait son succès à certaines caractéristiques faciales récurrentes citées par l’étude, qui affirme que ces résultats appuient la théorie des hormones prénatales (PHT), selon laquelle la sexualité dépendrait de l’exposition des fœtus à certaines hormones avant la naissance. Celles-ci influeraient directement sur la formation de notre visage, qui serait doté de caractéristiques identifiables liées à l’orientation sexuelle.

Un système encore limité mais potentiellement dangereux

L’étude explique : « En se basant sur la PHT, les hommes homosexuels auraient tendance à avoir des traits du visage plus féminins que les hommes hétérosexuels, tandis que ceux des lesbiennes seraient plus masculins que ceux des femmes hétérosexuelles. En conséquence, les hommes homosexuels sont supposés avoir des mâchoires et des mentons plus petits, des sourcils plus fins, des nez plus longs et des fronts plus larges. L’inverse devrait se vérifier chez les lesbiennes. »

Il convient toutefois de nuancer les résultats de cette étude aux limites évidentes, qui ne prend pas en compte les différences de couleur de peau ni les personnes bisexuelles ou transgenres. Il est notamment important de rappeler que le réseau neuronal artificel s’appuie sur des photos tirées d’un site de rencontre, où la sexualité des personnes concernées est facilement vérifiable grâce à leur profil.

Le taux de précision de 91 % concerne ainsi uniquement des hommes dont les auteurs connaissaient au préalable l’homosexualité. À l’inverse, les deux auteurs de l’étude ont pu constater que, sur 1 000 hommes sélectionnés au hasard, avec un ratio entre hétéros et gays bien plus réduit, le réseau neuronal ne parvenait à identifier correctement que 47 homosexuels sur les 100 identifications qui lui étaient demandées.

Un tel système, s’il devenait fonctionnel, ouvrirait la voie à des dérives graves

Le système fonctionne ainsi beaucoup mieux sur des échantillons plus réduits — de 10 personnes environ. Ce qui signifie que le réseau neuronal n’est pas, au sens propre, capable d’identifier les gays des hétéros sur n’importe quelle photo mais plutôt que l’invention d’un tel système est, à terme, envisageable.

Un scénario qui ouvre la voie à des dangers évidents en matière de vie privée, si des gouvernements — comme la Tchétchénie — des entreprises ou autres se mettent à recourir à des « gaydars » pour pratiquer des discriminations basées sur l’orientation sexuelle.