Des chercheurs de l'université de Princeton ont décrit une technique qui se sert des données sonores via l'API AudioContext pour identifier un internaute sur le web.

Les techniques permettant de pister un internaute d’un site à l’autre pour savoir ce qu’il fait, ce qu’il regarde et combien de temps il reste sur telle ou telle page sont de plus en plus retorses. C’est ce qu’illustre une étude conduite par deux universitaires de la faculté américaine de Princeton, Steven Englehardt et Arvind Narayanan, dont Techcrunch s’est fait l’écho.

Dans leurs travaux, les deux chercheurs citent une méthode prenant une « empreinte sonore » de l’ordinateur via une API appelée AudioContext. « L’interface AudioContext représente un graphe de traitement audio fait de modules audio reliés entre eux », précise un descriptif de l’API publié sur le site de la fondation Mozilla. C’est avec cette API qu’une sorte une signature unique est générée.

Exemple de visualisation AudioContext
Exemple de visualisation AudioContext

Sur une page de test mise en place pour l’occasion, il est possible de voir l’empreinte sonore obtenue avec AudioContext sous la forme d’un graphe. Cette information sera conservée par les deux chercheurs, ainsi que d’autres indicateurs (nombre assigné aléatoirement, adresse IP et user-agent), à des fins de recherche. Les données ne seront pas diffusées publiquement.

Les deux universitaires ajoutent que cette méthode d’analyse sonore n’a que faire de ce qui se passe au niveau des enceintes, du casque ou du micro de l’ordinateur. Ce n’est ni par le son émis ni par le son enregistré que le pistage se fait.

Ni le son émis par les enceintes ni l’audio capté par le micro entrent en ligne de compte

« Les signaux audio traités sur des machines ou des navigateurs différents peuvent avoir de légers écarts causés par les différences matérielles ou logicielles entre les machines, tandis que la même combinaison de machine et de navigateur produira le même résultat », écrivent-ils.

L’approche paraît efficace à court et moyen terme, car un usager lambda ne change pas le matériel de son PC, ce qui provoquerait vraisemblablement une évolution de la structure du signal, à un rythme suffisamment élevé pour la rendre caduque.

À l’heure actuelle, la technique étudiée par les deux universitaires n’est pas considérée comme très répandue. Ceux qui suivent l’internaute à la trace privilégient pour l’heure d’autres méthodes. Cela dit, elle n’est pas non plus neutralisée efficacement par les outils de vie privée et les bloqueurs en tout genre, ce qui laisse un boulevard potentiel à ceux qui suivent les internautes à des fins commerciales.

Partager sur les réseaux sociaux

Articles liés