Google a obtenu un brevet sur un système d'analyse des documents, qui vise à aider les départements juridiques des entreprises à détecter les e-mails et autres documents Word qui peuvent poser problème.

Il y a trois ans, le 24 avril 2010, une commission d'enquête du Sénat des Etats-Unis publiait une liste d'e-mails internes de Goldman Sachs pour démontrer la responsabilité active de la banque dans la crise des subprimes. Selon les sénateurs, les messages découverts montraient que "trop souvent", la banque "pariait contre les instruments qu'ils vendaient et en tiraient profit au détriment de leurs clients".

De même dans l'affaire Enron, un corpus de 600 000 emails avait pu être exploité par la commission de régulation de l'énergie pour montrer comment l'entreprise avait maquillé ses comptes pour cacher ses opérations spéculatives déficitaires sur le marché de l'énergie. Dans un tout autre domaine, nous avions vu aussi comment des e-mails internes de MegaUpload avaient permis au procureur de monter un lourd dossier contre Kim Dotcom et ses associés, en montrant notamment que MegaUpload rémunérait certains pirates en toute connaissance de cause. C'est déjà grâce aux e-mails que Grokster et Kazaa avaient pu être condamnés

Alors que des discussions sensibles pouvaient avoir lieu avant devant la machine à café ou au téléphone, le règne des e-mails et des messageries instantanées a la conséquence fâcheuse de laisser des traces. Mais heureusement, Google a la solution !

La firme de Mountain View a obtenu la semaine dernière un brevet sur un système visant à "identifier les phrases problématiques dans un document électronique, tel qu'un e-mail". La méthode consiste à "détecter le contexte du document électronique, capturer une phrase textuelle entrée par l'utilisateur, comparer la phrase textuelle à une base de données de phrases précédemment identifiées comme ayant des implications juridiques ou violant la politique (de l'entreprise), et alerter l'utilisateur à travers une notification en ligne lorsque la phrase textuelle correspond à une phrase dans la base de données", le tout "basé sur le contexte détecté du document électronique". Par exemple, le contexte ne sera pas le même si le courrier est destiné à un collègue, ou à une personne extérieure. De même, si le document problématique est détecté comme étant une présentation Powerpoint destinée à la communication externe, l'alerte sera plus forte.

Il s'agit, en somme, d'une mise en oeuvre à plus grande échelle de la technologie déjà déployée dans Gmail pour avertir l'utilisateur lorsqu'il prévient son destinataire qu'une pièce-jointe est attachée au courrier, alors qu'il a oublié de le faire. 

Outre les risques juridiques externes, la méthode vise également (voire surtout) à protéger les secrets de l'entreprise, en évitant que des données confidentielles ne puissent fuiter, accidentellement ou non. La quasi totalité des exemples donnés par Google concernent ainsi la détection de fuites sur des produits à venir.

une comparateur meilleur vpn numerama

Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !