Google utilise désormais un "réseau neuronal artificiel" pour apprendre à reconnaître les spams dans les e-mails envoyés aux utilisateurs de Gmail, mais aussi pour personnaliser le filtre anti-spam en fonction des centres d'intérêts de chaque utilisateur.

En marge de la présentation de son nouvel outil Postmaster Tools qui permet aux expéditeurs d'effectuer un suivi du sort réservé aux e-mails qu'ils envoient vers Gmail, Google a officialisé jeudi une évolution significative de son filtre anti-spam, sans doute déjà mise en place depuis un certain temps. "Le filtre anti-spam utilise désormais un réseau neuronal artificiel", annonce ainsi l'équipe de Gmail.

Le réseau neuronal artificiel est une méthode d'intelligence artificielle (IA) avancée qui fait désormais l'unanimité chez les grandes firmes du web, qui vise à s'approcher au mieux du fonctionnement du cerveau humain. Elle permet à la machine d'apprendre par elle-même à reconnaître, trier et analyser les éléments qui lui sont soumis, qui ressemblent à d'autres qui lui ont été présentés et explicités par le passé — exactement comme il suffit de dire à un enfant "c'est une chaise" pour qu'il reconnaisse ensuite toutes les autres chaises grâce à des éléments communs qu'il assimile de façon inconsciente, tels que les quatre pieds et le dossier de la chaise. La méthode est déjà impressionnante pour la reconnaissance des images ou des personnes, mais s'applique à bien d'autres domaines.

Dans Gmail, le réseau neuronal artificiel vise deux fonctions principales :

  1. Mieux détecter les spams qui tentent de se faire passer pour des e-mails normaux, en apprenant très tôt à distinguer les nouveaux traits caractéristiques des mails frauduleux signalés par les utilisateurs (ce qui est déjà le cas depuis très longtemps grâce aux anti-spam basés sur des modèles d'inférences bayésiennes, mais avec une nouvelle capacité d'adaptation autonome du filtre) ;
     
  2. Personnaliser l'anti-spam en fonction de chaque utilisateur. Ainsi même si la majorité des utilisateurs ne voient aucun intérêt à recevoir des mails pour du Viagra ou un agrandissement du pénis, quelqu'un qui s'intéresserait à ces sujets ne verrait plus ces e-mails automatiquement classés dans les spams. Plus concrètement, une newsletter hebdomadaire envoyée par un marchand peut intéresser une partie des internautes et être considérée comme du spam par d'autres. Grâce à son IA, Gmail apprend à connaître les centres d'intérêts de chaque utilisateur pour personnaliser le filtrage de façon transparente.

Cette dernière méthode de personnalisation était déjà perceptible dans Gmail à travers les "mails importants" que Google est capable de faire ressortir d'une boîte aux lettres surchargées, pour permettre à chaque utilisateur de ne pas manquer les courriels qu'il trouvera important de lire. Le classement est effectué par un apprentissage des habitudes de l'internaute, selon le contenu des e-mails qu'il a l'habitude de lire, les expéditeurs qu'il privilégie, ceux à qui il répond, ceux qu'il ne lit jamais, etc.


Si vous avez aimé cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à Numerama sur Google News.