Publié par Guillaume Champeau, le Lundi 06 Mai 2013

Google sait identifier les "phrases problématiques" dans un e-mail

Google a obtenu un brevet sur un système d'analyse des documents, qui vise à aider les départements juridiques des entreprises à détecter les e-mails et autres documents Word qui peuvent poser problème.

Il y a trois ans, le 24 avril 2010, une commission d'enquête du Sénat des Etats-Unis publiait une liste d'e-mails internes de Goldman Sachs pour démontrer la responsabilité active de la banque dans la crise des subprimes. Selon les sénateurs, les messages découverts montraient que "trop souvent", la banque "pariait contre les instruments qu'ils vendaient et en tiraient profit au détriment de leurs clients".

De même dans l'affaire Enron, un corpus de 600 000 emails avait pu être exploité par la commission de régulation de l'énergie pour montrer comment l'entreprise avait maquillé ses comptes pour cacher ses opérations spéculatives déficitaires sur le marché de l'énergie. Dans un tout autre domaine, nous avions vu aussi comment des e-mails internes de MegaUpload avaient permis au procureur de monter un lourd dossier contre Kim Dotcom et ses associés, en montrant notamment que MegaUpload rémunérait certains pirates en toute connaissance de cause. C'est déjà grâce aux e-mails que Grokster et Kazaa avaient pu être condamnés

Alors que des discussions sensibles pouvaient avoir lieu avant devant la machine à café ou au téléphone, le règne des e-mails et des messageries instantanées a la conséquence fâcheuse de laisser des traces. Mais heureusement, Google a la solution !

La firme de Mountain View a obtenu la semaine dernière un brevet sur un système visant à "identifier les phrases problématiques dans un document électronique, tel qu'un e-mail". La méthode consiste à "détecter le contexte du document électronique, capturer une phrase textuelle entrée par l'utilisateur, comparer la phrase textuelle à une base de données de phrases précédemment identifiées comme ayant des implications juridiques ou violant la politique (de l'entreprise), et alerter l'utilisateur à travers une notification en ligne lorsque la phrase textuelle correspond à une phrase dans la base de données", le tout "basé sur le contexte détecté du document électronique". Par exemple, le contexte ne sera pas le même si le courrier est destiné à un collègue, ou à une personne extérieure. De même, si le document problématique est détecté comme étant une présentation Powerpoint destinée à la communication externe, l'alerte sera plus forte.

Il s'agit, en somme, d'une mise en oeuvre à plus grande échelle de la technologie déjà déployée dans Gmail pour avertir l'utilisateur lorsqu'il prévient son destinataire qu'une pièce-jointe est attachée au courrier, alors qu'il a oublié de le faire. 

Outre les risques juridiques externes, la méthode vise également (voire surtout) à protéger les secrets de l'entreprise, en évitant que des données confidentielles ne puissent fuiter, accidentellement ou non. La quasi totalité des exemples donnés par Google concernent ainsi la détection de fuites sur des produits à venir.

Publié par Guillaume Champeau, le 6 Mai 2013 à 11h17
 
9
Commentaires à propos de «Google sait identifier les "phrases problématiques" dans un e-mail»
Inscrit le 08/12/2004
54 messages publiés
Quid si google aide d'éventuels terroristes à cacher leurs réelles intentions par ce biais ?
Peuvent-ils être déclarés complice ?

Ou papa à tromper maman ?
Ou fifille à faire le mur pour aller en boite ?
Ou des ministres à ...
Ou une banque à ...

...
Inscrit le 26/12/2012
51 messages publiés
Le truc légèrement hallucinant ici, c'est de réussir à breveter un "LIKE" SQL...
Inscrit le 06/05/2013
2 messages publiés
Y aura qu'à poser un brevet sur un LIKE %%

De toute manière les brevets... C'est notre troisième guerre mondiale.
Inscrit le 06/11/2012
40 messages publiés
Il est possible aussi que Google espionne les courriers hors entreprise pour le compte des roussins made in USA.
Inscrit le 19/05/2009
190 messages publiés
Possible ?
et pourquoi seulement "hors entreprise ?"
Comment alimentent-ils leur base de données ? Et où sont hébergés leurs calculs, si ce n'est pas chez eux ? Avec tous les contenus qui appartiennent à ceux qui leur font confiance.
cerise sur le gâteau le Patriot Act donne le libre regard du Gvt US à tout ce qui est hébergé aux US...
Bref... Encore un cheval de Troie pour mieux s'approprier le contenu des pigeons.
Ils offrent des supers fonctions en échange d'une licence gratuite ad vitam sur les contenus que vous envoyez chez Ggl afin d'en faire ce que bon leur semblera.
Ggl, FB, même combat.
Inscrit le 30/03/2010
1032 messages publiés
Je ne me fais pas d'illusion sur le destinataire de l'alerte ... l'utilisateur sans doute, mais mon petit doigt me dit que le service RH en recevra également une copie, et qu'il la stockera dans le dossier de l'utilisateur, catégorie "moyen de pression" .
Inscrit le 10/01/2008
465 messages publiés
La "phrase problématique" : "droits de l'homme" va beaucoup intéresser un Etat.
[message édité par dsant le 06/05/2013 à 18:43 ]
Inscrit le 06/05/2013
135 messages publiés
Inscrit le 28/08/2004
6861 messages publiés
Un seul? Hum... *se racle profondément la gorge*
Répondre

Tous les champs doivent être remplis.

OU

Tous les champs doivent être remplis.

FORUMS DE NUMERAMA
Poser une question / Créer un sujet
vous pouvez aussi répondre ;-)
Numerama sur les réseaux sociaux
Mai 2013
 
Lu Ma Me Je Ve Sa Di
29 30 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31 1 2
3 4 5 6 7 8 9