Des informaticiens de l’université du Maryland ont développé une IA capable d'élaborer des stratégies contournant les mécanismes de censure. Elle a été testée en conditions réelles et fonctionne bien, selon ses inventeurs.

Dans un pays comme la Chine, la censure est inscrite dans la loi. Pour autant, ces restrictions ne sont pas qu’un enjeu politique. C’est aussi un enjeu technologique. Le principe de la censure ? Empêcher le libre accès à des informations et à des sites, comme Wikipédia. Des informaticiens de l’université du Maryland ont développé un nouvel outil qui pourrait s’avérer précieux : Geneva. Dans un article publié le 13 novembre 2019 sur le site de l’université, les chercheurs expliquent comment cette intelligence artificielle peut contourner la censure sur le web, avec succès.

Le problème de la censure informatique, c’est qu’elle s’avère terriblement ingénieuse. À chaque parade, de nouveaux systèmes plus sophistiqués apparaissent. Cela débouche sur ce que les inventeurs de ce nouvel outil qualifient de « course effrénée ». Et dans cette course, l’IA Geneva pourrait être un vrai game changer. Elle a réussi là où aucun informaticien n’aurait pu : testée en Chine, en Inde et au Kazakhstan, elle a établi une douzaine de stratégies pour exploiter les failles de la censure. Ces failles auraient été « virtuellement impossibles à trouver manuellement pour des humains ».

La censure bloque l’accès à des sites internet ou la recherche de mots clés. // Source : University of Maryland

IA d’inspiration génétique

Le nom de Geneva provient de la contradiction de « Genetic Evasion ». Cette intelligence artificielle est effectivement inspirée des mécanismes biologiques dans le domaine génétique. Au lieu de porter des instructions pour le transport d’informations génétiques comme l’ADN, Geneva transporte des données numériques. Les blocs de données peuvent être arrangés de différentes façons, pour former toute une variété d’instructions… et, en l’occurrence, des stratégies d’« évasion ».

Si on compare les informations sur le web à des paquets de données, alors la censure établit un blocage sur la route de paquets pré-définis. « Wikipédia » est défini comme un mot interdit, alors toute requête le contenant verra son paquet bloqué. Le mécanisme de Geneva est de reconfigurer la façon dont sont organisées les données dans les paquets, afin qu’ils ne soient plus associés à une recherche interdite.

Ce qui rend Geneva si efficace ? Sa capacité de mutation. Elle supprime des instructions et/ou en ajoute à des instructions déjà réussies, pour tester sans cesse de nouvelles stratégies différentes. Au fur et à mesure, l’IA conserve les instructions qui fonctionnent le mieux et élimine le reste. Son « code génétique » évolue à chaque tentative, formant à chaque fois une nouvelle génération. C’est une incarnation habile du machine learning — l’apprentissage automatisé d’une machine.

Une nouvelle approche

Geneva a d’abord été testée sur de faux mécanismes de censure. Puis, durant une deuxième étape, elle a été confrontée à d’anciens mécanismes qui ont déjà été percés. En seulement quelques jours, l’IA a découvert les stratégies les plus efficaces. La dernière phase était de confronter Geneva à des mécanismes jamais contournés. L’IA a donc été testée sur un ordinateur en Chine. Résultat sans appel : l’utilisateur a pu chercher des mots bloqués. Geneva a aussi pu contourner des URLs et des réseaux sociaux censurés en Inde et au Kazakhstan.

Les informaticiens du Maryland expliquent que leur approche inverse la façon dont on envisageait jusqu’ici le contournement de la censure sur Internet. « Habituellement, on identifie comment une stratégie de censure fonctionne puis on élabore des stratégies pour y échapper », explique le professeur d’informatique Dave Levin, dans l’article de l’université. Inversement, Geneva se lance contre le mécanisme de censure pour en trouver les failles « et ensuite on apprend quelles sont les stratégies de censure utilisées en regardant Geneva les vaincre ».

Les inventeurs de Geneva veulent diffuser le programme librement sur Internet, ainsi que son code source, pour que cela devienne un outil véritablement utile contre la censure des régimes autoritaires. Mais un problème se pose quand on évoque un tel accès libre : la censure ne pourrait-elle pas, justement, être un frein pour accéder à l’outil ? Ils proposent donc d’envisager l’idée d’intégrer l’IA directement sur le serveur des sites internet, non plus sur l’ordinateur client. « Cela signifierait que des sites comme Wikipédia ou la BBC pourraient être disponibles pour n’importe qui dans les pays qui les bloquent, comme la Chine ou l’Iran, sans nécessiter de configurer quoi que ce soit sur son ordinateur », expliquent les informaticiens du Maryland.

Cette astuce pourrait révolutionner le web mondial, mais ne serait pas facile à déployer. Effectivement, on peut très bien imager quelques conflits politiques entre les entreprises optant pour ce système et certains États censeurs. La censure sur Internet ne pourra malheureusement pas trouver « seulement » une réponse informatique performante.

Partager sur les réseaux sociaux