Des chercheurs de l’université de Princeton ont décrit une technique qui se sert des données sonores via l’API AudioContext pour identifier un internaute sur le web.

Les techniques permettant de pister un internaute d’un site à l’autre pour savoir ce qu’il fait, ce qu’il regarde et combien de temps il reste sur telle ou telle page sont de plus en plus retorses. C’est ce qu’illustre une étude conduite par deux universitaires de la faculté américaine de Princeton, Steven Englehardt et Arvind Narayanan, dont Techcrunch s’est fait l’écho.

Dans leurs travaux, les deux chercheurs citent une méthode prenant une « empreinte sonore » de l’ordinateur via une API appelée AudioContext. « L’interface AudioContext représente un graphe de traitement audio fait de modules audio reliés entre eux », précise un descriptif de l’API publié sur le site de la fondation Mozilla. C’est avec cette API qu’une sorte une signature unique est générée.

Exemple de visualisation AudioContext

Exemple de visualisation AudioContext

Sur une page de test mise en place pour l’occasion, il est possible de voir l’empreinte sonore obtenue avec AudioContext sous la forme d’un graphe. Cette information sera conservée par les deux chercheurs, ainsi que d’autres indicateurs (nombre assigné aléatoirement, adresse IP et user-agent), à des fins de recherche. Les données ne seront pas diffusées publiquement.

Les deux universitaires ajoutent que cette méthode d’analyse sonore n’a que faire de ce qui se passe au niveau des enceintes, du casque ou du micro de l’ordinateur. Ce n’est ni par le son émis ni par le son enregistré que le pistage se fait.

Ni le son émis par les enceintes ni l’audio capté par le micro entrent en ligne de compte

« Les signaux audio traités sur des machines ou des navigateurs différents peuvent avoir de légers écarts causés par les différences matérielles ou logicielles entre les machines, tandis que la même combinaison de machine et de navigateur produira le même résultat », écrivent-ils.

L’approche paraît efficace à court et moyen terme, car un usager lambda ne change pas le matériel de son PC, ce qui provoquerait vraisemblablement une évolution de la structure du signal, à un rythme suffisamment élevé pour la rendre caduque.

À l’heure actuelle, la technique étudiée par les deux universitaires n’est pas considérée comme très répandue. Ceux qui suivent l’internaute à la trace privilégient pour l’heure d’autres méthodes. Cela dit, elle n’est pas non plus neutralisée efficacement par les outils de vie privée et les bloqueurs en tout genre, ce qui laisse un boulevard potentiel à ceux qui suivent les internautes à des fins commerciales.

une comparateur meilleur vpn numerama

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+

Si vous avez aimé cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à Numerama sur Google News.