Google commence à développer un algorithme qui sait deviner d’où une photo a été prise, même lorsque l’internaute a désactivé les données Exif de géolocalisation.

Nous avons vu la scène dans un film ou une série TV. Un personnage est pris en otage, et les ravisseurs envoient une photo ou une vidéo avec le journal du jour, comme preuve de vie. Mais les informaticiens géniaux du FBI en profitent pour passer l’image à la moulinette et obtenir, en quelques clics, une idée précise d’où la personne est retenue en otage, grâce au monument que l’on voit en reflet dans un miroir au fond de la pièce. Nous n’en sommes pas encore là, mais la science progresse.

Employé par Google, le chercheur Tobia Weyland a ainsi publié avec deux confrères une étude surnommé PlaNet, dans laquelle il explique travailler sur une application d’intelligence artificielle, qui peut deviner d’où une photo a été prise, simplement en analysant l’image elle-même.

De quoi rendre plus paranos encore ceux qui pensaient que supprimer les données Exif qui contiennent parfois des informations GPS suffisait à sauvegarder sa vie privée.

La rue devinée dans 3,6 % des cas

geoloc

Pour réaliser leur objectif, les chercheurs ont mis au point un réseau neuronal artificiel, classique dans les techniques de Deep Learning. Le système d’intelligence artificielle a ainsi appris dans un premier temps à découvrir tout seul les similarités qu’il pouvait y avoir entre les images prises sensiblement aux mêmes endroits. Ils ont donc injecté dans le moteur 126 millions d’images pour lesquelles ils disposaient des données Exif de géolocalisation, réparties dans « 26 000 cases » à travers le monde, elles-mêmes subdivisées.

Le système a ingurgité toutes les photos et déduit des caractéristiques communes à chaque endroit (tel arbre ne pousse qu’à tel endroit, telle région est très enneigée, telle région est montagneuse, telle architecture est typique de telle ville, tel bâtiment est situé ici, etc.). Puis les chercheurs ont pris un nouvel échantillon de 2,3 millions de photos tirées de Flickr, en supprimant les données Exif liées à la géolocalisation. Et ils ont demandé à la machine de dire où elles étaient été prises.

Le système a pu deviner correctement le continent dans 48 % des cas, le pays dans 28,4 % des cas, la ville dans 10,1 % des cas, et même la rue dans 3,6 % des cas. Sachant que nous n’en sommes qu’aux tout début, les chiffres pourraient fortement progresser dans les années qui viennent. Pour toutes les photos prises en extérieur, il sera de plus en plus difficile de cacher leur origine.

Plus fort qu’un humain

geoguessr

Pour s’amuser et surtout démontrer l’efficacité de leur méthode, les chercheurs ont même mis au défi une dizaine de grands voyageurs, qui devaient utiliser le site GeoGuessr pour deviner d’où viennent des photos. Le site affiche au hasard des images tirées de Google Street Maps, et demande à l’internaute de cliquer sur la carte du monde, à l’endroit qu’il pense correspondre.

Sans surprise, la machine a été meilleure, mais pas de beaucoup. Elle a remporté 28 des 50 manches. En revanche sa précision géographique était bien meilleure lorsqu’elle devinait. En moyenne, l’IA se trompait de 1131,7 km (tout de même), contre 2320,75 km pour l’humain.


Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !