L’Inria dévoile Software Heritage, une plateforme qui ambitionne de réunir et de préserver l’ensemble des logiciels libres distribués sur Internet.

Créer une sorte de Wikipedia du logiciel libre, où tous les projets placés sous licence libre pourraient être réunis et mis à disposition de la communauté. C’est toute l’ambition de l’Institut national de recherche en informatique et en automatique (Inria), qui a mis en ligne jeudi la plateforme Software Heritage. Elle rassemble déjà près de 23 millions de projets open source, et prévoit d’en ajouter encore bien d’autres.

« Le logiciel est une part précieuse de notre héritage culturel », défend l’Institut français, qui est lui-même un grand contributeur aux logiciels libres à travers ses nombreux chercheurs, dont les travaux alimentent les projets informatiques du monde entier. S’il veut désormais créer ce sanctuaire du logiciel libre, c’est parce que « c’est uniquement en partageant que nous pouvons garantir sa préservation à très long terme ».

software-heritage

Software Heritage ne procède à aucune sélection qualitative ou utilitariste. Tout morceau de code publié sous licence libre a droit de cité sur la plateforme, qui compte actuellement 2,6 milliards de fichiers sources, tracés si possible jusqu’à leur origine. Avec l’aide de la communauté, l’Inria veut toutefois créer des « archives organisées », qui permettent de s’y retrouver plus facilement. Elle souhaite également donner naissance à des miroirs, pour éviter une centralisation qui serait périlleuse pour la préservation à long terme de tout ce patrimoine immatériel.

Près de 23 millions de projets archivés

« Nous avons travaillé en catimini sur le projet pendant un an et demi. Nous voulions en démontrer la faisabilité avant de le rendre public aujourd’hui », explique Antoine Petit, président d’Inria (institut national de recherche en numérique), dans Usine Digitale. Selon Roberto Di Cosmo, qui dirige Software Heritage, l’archive constituée constituée représenterait déjà 20 % des logiciels libres disponibles dans le monde. Elle a reçu le soutien technique ou financier de nombreux acteurs dont GitHub, Microsoft, la Fondation Linux, Creative Commons, Bell Labs, ou encore la FSF. Le gouvernement français a aussi participé.

Actuellement, l’archive rassemble :

  • Des dépôts publics hébergés par Github, qui sont automatiquement synchronisés.
  • Des sources de la distribution Debian ;
  • Des publication du projet GNU.

Dans un second temps, il sera possible de rechercher dans les archives et de télécharger le contenu.


Abonnez-vous à Numerama sur Google News pour ne manquer aucune info !