Le GCHQ, la principale agence anglaise de renseignement, vient d’ouvrir le code de l’un de ses outils. Nommé Gaffer, il est disponible désormais sous licence Apache 2.0 dans un dépôt GitHub. Bien qu’il existe une évidente dimension de restauration d’une image largement écornée, ce choix pourrait témoigner d’une certaine volonté de transparence. Cependant, il faut distinguer l’outil lui-même des données qu’il peut contenir.
Le GCHQ (Government Communications Headquarters), est l’équivalent anglais de la NSA américaine. Les deux agences ont collaboré dans de très nombreuses opérations et représentent d’ailleurs les deux membres les plus éminents de l’alliance Five Eyes, réunissant également le Canada, l’Australie et la Nouvelle-Zélande. Tout comme la NSA, son nom est devenu synonyme d’espionnage et de toute-puissance des pouvoirs du renseignement dans le sillage des révélations d’Edward Snowden.
La mise en relations en grandes quantités
Il est donc probable que ce déficit flagrant d’image soit intervenu dans la décision de publier les sources de Gaffer, une base de données orientée graphe. L’outil, dont le nom argotique signifie « patron », est disponible depuis hier sous licence Apache 2.0 dans un dépôt GitHub, créé pour l’occasion par le renseignement anglais.
Écrit en Java, Gaffer est une infrastructure conçue pour stocker de grandes quantités de données afin de gérer de larges graphes. Les nœuds et arcs disposent de statistiques, comme les compteurs et les histogrammes, et l’ensemble est prévu pour puiser des informations dans les nœuds jugés d’intérêt. C’est en fait le cœur de Gaffer : rassembler des données et les comparer pour mettre en évidence des liens particuliers entre les éléments. Une activité centrale pour le monde du renseignement, comme les multiples analyses des structures de la NSA l’avaient montré.
Un outil du GCHQ basé sur un autre de la NSA
Les nœuds de la base de données peuvent bien sûr représenter n’importe quelle donnée qui intéresse le développeur. Dans le cadre du GCHQ, on peut imaginer qu’il s’agit d’une personne, l’outil présentant alors des relations entre eux, des lieux, etc. Il est également conçu pour faire apparaître des liens insoupçonnés ou pour suggérer l’existence d’autres nœuds qui n’auraient pas été référencés. Évidemment, ce principe global de fonctionnement peut être repris pour n’importe quel type d’information.
Il est intéressant de noter que Gaffer utilise le système de gestion de base de données NoSQL Accumulo, créé initialement par la NSA, mais dont les sources ont été ouvertes et confiées à la fondation Apache en 2011, d’où son nom complet Apache Accumulo. Il utilise le système de fichier Hadoop d’Apache et est lui-même basé sur la technologie BigTable de Google.
Faire d'une pierre deux coups
La question qui se pose est de savoir pourquoi le GCHQ a choisi de rendre accessible le code source de Gaffer. Le calendrier est intéressant puisque l’ouverture du dépôt GitHub survient à un moment où l’image de l’agence n’est clairement pas au beau fixe. On peut raisonnablement estimer que le renseignement anglais cherche à faire d’une pierre deux coups. D’une part, redorer son blason en dévoilant le fonctionnement interne de l’un de ses principaux outils. D’autre part, faire éventuellement participer la communauté dans l’enrichissement de ce dernier.
Le GCHQ indique en effet sur la page du dépôt qu’il travaille déjà sur une version 2 de Gaffer, avec pour objectif de « créer une infrastructure plus générale offrant le meilleur de Gaffer » mais s’améliorant dans plusieurs domaines. Par exemple, en rendant les nœuds et arcs beaucoup plus souples, actuellement définis de manière trop précise. Gaffer ne propose pas non plus de schéma, ce qui confère selon le GCHQ sa flexibilité à l’outil, mais créer des limitations, notamment sur l’efficacité de la sérialisation.
Quoi qu’il en soit, les développeurs intéressés par cet outil pourront le récupérer depuis son dépôt GitHub.
Commentaires (12)
#1
Ou pour permettre aux alliès d’améliorer leurs outlis de cyberflicage :)
#2
Écrit en Java, Gaffer
j’ai pas besoin d’en savoir plus " />
#3
" />
#4
#5
Pendant ce temps là, en France…
#6
#7
c’est beau, surtout la dernière phrase qui montre bien toute l’étendue des dérives possibles de cet état d’urgence…
#8
#9
Ttututu que lis je …
Veolia qui balance ses propres employés
et dans les commentaires pas un seul Haro sur le “vilain employé”
qui attaque son “pauvre” patron devant les prud’hommes
y a pas a dire, l’etat d’urgence a du bon
#10
J’ai arrêté de lire à partir d’ici :
“Écrit en Java, […]”
#11
#12
Faudrait une option pour planifier l’affichage d’un message qu’à partir du Vendredi suivant. " />