Avec Gaffer, le GCHQ fournit pour la première fois un outil open-source sous licence libre, qui permet de créer des bases de données orientées graphes, particulièrement utiles pour le Big Data.

Si vous voulez profiter du savoir-faire du GCHQ et aider le service de renseignement britannique à développer des techniques plus performantes d’espionnage, vous pouvez désormais vous tourner vers Github. Le service d’écoute des communications de sa Majesté a en effet ouvert un compte sur la plateforme d’hébergement de projets open-source, et diffusé le code de Gaffer, son premier projet partagé sous licence Apache 2.0.

Selon la description fournie, Gaffer est un framework qui permet de réaliser une base de données orientée graphes avec un processus de mises à jours des données spécialement optimisé pour « ingérer de grands volumes de données ». Gaffer fournit en sus de nombreux outils statistiques pour visualiser les nœuds et les arcs de la base, et permet de récupérer facilement les données qui concernent uniquement une période de temps déterminée.

gaffer-gchq

Un outil de Big Data utile pour l’espionnage, mais pas seulement

L’outil permet par exemple de s’intéresser pendant un temps donné aux nœuds du graphe qui présentent des caractéristiques communes, et d’en extraire les informations associées. Idéal, par exemple, pour mettre au point une boîte noire censées repérer des suspects de desseins terroristes, en agrégeant un maximum de données dans une immense base — le système utilise par défaut le moteur Accumulo d’Apache, lui-même développé par la NSA et basé sur Google BigTable, Hadoop, Zookeeper et Thrift.

Tout l’intérêt de Gaffer est de faciliter la création de telles bases de Big Data avec un minimum de code, et d’aider à naviguer dans la base et à extraire les données intéressantes avec un minimum de puissance de calcul et de temps de latence dans les réponses obtenues. Il gère aussi des droits d’autorisation pour accéder ou non à des données plus sensibles que d’autres.

Autant de fonctions qui peuvent intéresser des entreprises qui manipulent quantités de données, et qui peuvent donc avoir un intérêt à partager des technologies avec le GCHQ, même si leur emploi n’est pas le même. Le GCHQ précise d’ailleurs que Gaffer peut être utile  pour réaliser de l’apprentissage-machine, De fait, les réactions des développeurs sont très positives.

Nouveauté : Découvrez

La meilleure expérience de Numerama, sans publicité,
+ riche, + zen, + exclusive.

Découvrez Numerama+

Si vous avez aimé cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à Numerama sur Google News.