Pour découvrir les comptes offshore et les pratiques d’optimisation fiscale des entreprises et personnalités citées dans les Paradise Papers, le Consortium international des journalistes d’investigation a fait appel à la startup suédoise Neo4j. Son système de gestion de bases de données, combiné à l’outil de visualisation de Linkurious, continue de faire ses preuves.

Comment analyser 13,5 millions de documents de manière efficace, et y établir les connexions nécessaires pour relier tel compte offshore à telle personnalité ? C’est le casse-tête auquel a été confronté le Consortium international des journalistes d’investigation (ICIJ) pendant son année de travail sur les Paradise Papers, sa dernière enquête en date, qui revient sur les pratiques d’optimisation et d’évasion fiscale répandues dans le monde.

Mais les journalistes ont pu compter sur l’aide de la startup suédoise Neo4j, qui propose une autre approche des données, loin des traditionnels tableaux Excel, comme l’explique son fondateur et patron, Emil Eifrem, à Business Insider : « La structure à base de colonnes et de lignes est géniale si vous voulez mettre en place un système de gestion de paie, qui montre le nom, le prénom, le salaire et le poste [des salariés]. C’est à ça que ressemblaient les données dans les années 1970. »

Si le traitement atypique proposé par Neo4j permet à la startup de séduire de grandes entreprises telles qu’eBay et Walmart, elle a su prouver l’intérêt de son système — qui met en valeur les liens entre les différents types de données grâce à une visualisation en graphe permise par l’outil Linkurious — aux journalistes en 2015, à l’occasion des précédentes révélations offshore de l’ICIJ, les Panama Papers. Une collaboration qu’Emil Eifrem qualifie de « révélation ».

La méthode employée pour les Panama Papers et le premier ministre islandais

La méthode employée pour les Panama Papers et le premier ministre islandais / Crédit : Linkurious

Une méthode qui avait déjà servi aux Panama Papers

Sa méthode a permis de découvrir, au sein de ces plus de 11,5 millions les comptes cachés par la famille du premier ministre islandais Sigmundur Davíd Gunnlaugsson — poussé à la démission par le scandale –, notamment grâce à une adresse postale commune présente à la fois sur les documents relatifs au premier ministre et à ceux de sa femme.

Une découverte qui n’aurait pas été possible avec un simple tableau Excel, qui se contente de compiler des données sans permettre d’établir des relations entre telle ou telle information, contrairement à leur mise en forme par l’intermédiaire d’un graphe Linkurious.

Pierre Romera, journaliste français et directeur technique de l’ICIJ, témoigne ainsi auprès de Business Insider de l’efficacité de cette méthode pour les Paradise Papers : « Avec Neo4j et [l’outil de visualisation] Linkurious, après plusieurs semaines de recherche, nous avons pu proposer à nos 382 journalistes un moyen d’explorer les données mais aussi de partager des visualisations des affaires sur lesquelles ils travaillaient. Une base de donnée en graphe s’avère étonnamment instinctive pour des personnes peu familières de la tech. »

Emil Eifrem tient toutefois à préciser un détail important de leur collaboration : « Nous ne possédons pas les données, nous aidons simplement à les traiter. » Il souligne en outre l’importance de cette approche dans le monde de la tech : « La compréhension des liens entretenus par vos données ouvre un potentiel commercial énorme. C’est ce que Google, LinkedIn et Facebook ont fait. » Preuve de son efficacité, l’outil de Neo4j est déjà utilisé au quotidien par certaines rédactions comme la BBC ou le New York Times.


Vous voulez tout savoir sur la mobilité de demain, des voitures électriques aux VAE ? Abonnez-vous dès maintenant à notre newsletter Watt Else !