Software Heritage nous détaille la convention entre Inria et l'UNESCO, une étape importante

Software Heritage nous détaille la convention entre Inria et l’UNESCO, une étape importante

Près de 60 000 projets disponibles

Avatar de l'auteur

Sébastien Gavois

Publié dansInternet

07/04/2017
5
Software Heritage nous détaille la convention entre Inria et l'UNESCO, une étape importante

Software Heritage se définit comme une bibliothèque de code source. Elle propose aujourd'hui plus de trois milliards de fichiers, représentant près de 60 millions de projets. En recherche de reconnaissance, le projet a été distingué par l'UNESCO. Son directeur Roberto Di Cosmo revient avec nous sur ce partenariat.

L'été dernier, Inria présentait officiellement un vaste projet qui avait été lancé en 2015 par l'Institut national de recherche en informatique et en automatique (Inria) : Software Heritage. Son ambition est de « collecter, organiser, préserver, et rendre accessible à tous le code source de tous les logiciels disponibles ». Protéger notre patrimoine logiciel représente donc un travail titanesque.

Dès le lancement, plusieurs partenaires sont rapidement arrivés, Microsoft et le DANS de la Royal Academy des Pays-Bas. Aujourd'hui, ce projet passe un nouveau cap puisqu'Inria a signé une convention de partenariat avec l'UNESCO. Contacté par nos soins, Roberto Di Cosmo – directeur de ce projet – nous explique en quoi c'est une étape importante.

Sur trois piliers, il en manquait un 

Il nous explique que Software Heritage repose sur « trois piliers » fondamentaux : science et technologie qui est principalement fournie par Inria, des ressources (argents, temps ingénieur, stockage, etc.) amenées par des partenaires et enfin « la reconnaissance de l'importance de la mission ».

Si les deux premiers étaient déjà présents dès l'annonce officielle, le troisième manquait cruellement à l'appel. Après un « long long combat pour le faire reconnaitre », cette signature de partenariat avec l'UNESCO permet à Software Heritage de prendre de l'importance dans les « dimensions politiques et sociétales ». Roberto Di Cosmo ne cache d'ailleurs pas son enthousiasme et sa surprise : « on ne s'attendait pas à un truc pareil », lâche-t-il. 

Concrètement, ce partenariat avec l'UNESCO débouchera prochainement sur des interventions communes, une première de deux jours étant planifiée pour septembre. Le but sera d'expliquer pourquoi il est important de sauvegarder le code source des logiciels.

Software Heritage

De nouveaux partenaires, certains prestigieux

Dans tous les cas, Software Heritage n'a pas attendu que l'UNESCO se penche sur son cas pour avancer. Depuis l'annonce officielle du projet l'été dernier, il a été rejoint par Intel Corporation, qui a mis 100 000 euros sur la table, ainsi que par la Société Générale aussi avec 100 000 euros.

D'autres contributions plus modestes sont également de la partie avec le chinois Huawei (25 000 euros), l'Université de Bologne et Nokia Bell Labs. De deux, il est désormais question de sept partenaires. D'autres peuvent évidemment s'ajouter à la liste.

Si Inria et la Société Générale sont deux groupes français, ce n'est pas le cas des autres partenaires qui viennent du reste de l'Europe, d'Asie et des États-Unis. Cette ouverture est d'ailleurs une bonne chose pour Roberto Di Cosmo, qui nous explique qu'« il ne faut pas que ce soit perçu comme un projet franco-français », afin qu'il puisse se développer à l'international.

Au niveau du développement, Software Heritage a également des contributions extérieures. Certains viennent simplement donner un coup de main, d'autres s'investissent davantage. C'est notamment le cas de l'ADULLACT (Association des développeurs et utilisateurs de logiciels libres pour les administrations et les collectivités territoriales) qui a développé un plug-in complet pour ce projet.

Si l'aventure vous tente, vous trouverez tous les détails pour contacter l'équipe en charge du développement par ici. Bien évidemment, l'ensemble du code de Software Heritage est open source et disponible par là.

Plus de trois milliards de fichiers et près de 60 millions de projets

Aujourd'hui, Software Heritage revendique une base de données comprenant plus de 3,2 milliards de fichiers uniques représentants 58 254 852 projets. Concernant ce dernier chiffre, on peut remarquer qu'il a fait un bond de plus de 50 % entre 24 octobre et le 3 novembre 2016, alors que le nombre de commits et de codes sources n'a que peu changé.

Le directeur du projet nous explique que ce changement est intervenu lorsque « chaque fork était compté comme un projet de plus ». Le nombre de projets explose logiquement, mais comme chaque code source n'est sauvegardé qu'une seule fois – tout est dédupliqué –, le nombre de fichiers ne suit donc pas la même tendance. 

Software Heritage

Software Heritage « c'est aussi le futur »

Enfin, Roberto Di Cosmo nous indique que Software Heritage ne veut pas seulement être une sauvegarde du passé, mais aussi avoir les yeux tournés vers le futur. Pour lui, le but est de « savoir ce qui se passe dans le monde logiciel », d'où nous venons et où nous allons ; le tout dans un endroit unique.

Si Software Heritage propose notamment le code d'Apollo 11 (disponible sur GitHub depuis juillet 2016), tout le monde n'a pas une fusée Apollo sous la main pour le mettre en pratique lâche-t-il sur le ton de l'humour. Le directeur présente ce projet comme une grande bibliothèque : l'équipe ajoute des livres dans les rayons, au public maintenant de venir les lire.

Le partenariat avec l'UNESCO pourrait ainsi être perçu comme un premier signe d'ouverture vers le grand public. L'avenir nous le dira.

5
Avatar de l'auteur

Écrit par Sébastien Gavois

Tiens, en parlant de ça :

KDE Plasma 6

KDE Plasma 6 a sa première bêta, le tour des nouveautés

Petite révolution tranquille

17:39 Soft 2
Un homme noir regarde la caméra. Sur son visage, des traits blancs suggèrent un traitement algorithmique.

AI Act et reconnaissance faciale : la France interpelée par 45 eurodéputés

Report minoritaire

15:46 DroitSociété 4
Api

La CNIL préconise l’utilisation des API pour le partage de données personnelles entre organismes

I'm API

15:12 SécuSociété 0

Sommaire de l'article

Introduction

Sur trois piliers, il en manquait un 

De nouveaux partenaires, certains prestigieux

Plus de trois milliards de fichiers et près de 60 millions de projets

Software Heritage « c'est aussi le futur »

KDE Plasma 6

KDE Plasma 6 a sa première bêta, le tour des nouveautés

Soft 2
Un homme noir regarde la caméra. Sur son visage, des traits blancs suggèrent un traitement algorithmique.

AI Act et reconnaissance faciale : la France interpelée par 45 eurodéputés

DroitSociété 4
Api

La CNIL préconise l’utilisation des API pour le partage de données personnelles entre organismes

SécuSociété 0
Fouet de l’Arcep avec de la fibre

Orange sanctionnée sur la fibre : l’argumentaire de l’opérateur démonté par l’Arcep

DroitWeb 10
Bombes

Israël – Hamas : comment l’IA intensifie les attaques contre Gaza

IA 10

#LeBrief : bande-annonce GTA VI, guerre électronique, Spotify licencie massivement

Poing Dev

Le poing Dev – Round 7

Next 53
Logo de Gaia-X sour la forme d’un arbre, avec la légende : infrastructure de données en forme de réseau

Gaia-X « vit toujours » et « arrive à des étapes très concrètes »

WebSécu 5

Trois consoles portables en quelques semaines

Hard 37
Une tasse estampillée "Keep calm and carry on teaching"

Cyberrésilience : les compromis (provisoires) du trilogue européen

DroitSécu 3

#LeBrief : fuite de tests ADN 23andMe, le milliard pour Android Messages, il y a 30 ans Hubble voyait clair

#Flock a sa propre vision de l’inclusion

Flock 25
Un Sébastien transformé en lapin par Flock pour imiter le Quoi de neuf Docteur des Looney Tunes

Quoi de neuf à la rédac’ #10 : nous contacter et résumé de la semaine

44
Autoportrait Sébastien

[Autoportrait] Sébastien Gavois : tribulations d’un pigiste devenu rédac’ chef

Next 20
Logo de StreetPress

Pourquoi le site du média StreetPress a été momentanément inaccessible

Droit 21
Amazon re:Invent

re:Invent 2023 : Amazon lance son assistant Q et plusieurs services IA, dont la génération d’images

IA 14
Un œil symbolisant l'Union européenne, et les dissensions et problèmes afférents

Le Conseil de l’UE tire un bilan du RGPD, les États membres réclament des « outils pratiques »

Droit 6

19 associations européennes de consommateurs portent plainte contre Meta

DroitSocials 16

#LeBrief : Ariane 6 l’été prochain, Nextcloud rachète Roundcube, désinformation via la pub

Chiffre et formules mathématiques sur un tableau

CVSS 4.0 : dur, dur, d’être un expert !

Sécu 16
Une tête de fusée siglée Starlink.

Starlink accessible à Gaza sous contrôle de l’administration israélienne

Web 35
Fibre optique

G-PON, XGS-PON et 50G-PON : jusqu’à 50 Gb/s en fibre optique

HardWeb 53
Photo d'un immeuble troué de part en part

Règlement sur la cyber-résilience : les instances européennes en passe de conclure un accord

DroitSécu 10
lexique IA parodie

AGI, GPAI, modèles de fondation… de quoi on parle ?

IA 11

#LeBrief : logiciels libres scientifiques, fermeture de compte Google, « fabriquer » des femmes pour l’inclusion

livre dématérialisé

Des chercheurs ont élaboré une technique d’extraction des données d’entrainement de ChatGPT

IAScience 3
Un chien avec des lunettes apprend sur une tablette

Devenir expert en sécurité informatique en 3 clics

Sécu 11
Logo ownCloud

ownCloud : faille béante dans les déploiements conteneurisés utilisant graphapi

Sécu 16
Le SoC Graviton4 d’Amazon AWS posé sur une table

Amazon re:invent : SoC Graviton4 (Arm), instance R8g et Trainium2 pour l’IA

Hard 12
Logo Comcybergend

Guéguerre des polices dans le cyber (OFAC et ComCyberMi)

Sécu 10

#LeBrief : faille 0-day dans Chrome, smartphones à Hong Kong, 25 ans de la Dreamcast

Des billets volent dans les airs.

Mistral AI s’apprête à lever 450 millions d’euros auprès de NVIDIA et a16z

ÉcoIA 0

GTA VI

Rockstar met en ligne le trailer de GTA VI

Soft 34

Russian drone shot by the State Border Guard Service of Ukraine

La guerre électronique serait la plus grande faiblesse de l’Ukraine, et la principale force de la Russie

HardSécu 10

Debout, une femme en pull bleu montre à une autre, assise, quelque chose à son écran d'ordinateur.

Futur de l’IA : les femmes manquent dangereusement à l’appel

IASociété 20

Logo Spotify avec notes de musique

Spotify licencie 1 500 personnes de plus

ÉcoSociété 15

Wikipedia sombre

Wikipedia aura son thème sombre

Web 16

Commentaires (5)


skankhunt42
Il y a 7 ans

De toute façon dans pas mal de langage la majorité du code aujourd’hui sera inutilisable dans quelques années à cause de la compatibilité d’environnement, plusgins, ect… Et ce que je remarque aussi c’est que plus un projet est ouvert et plus c’est le boxon la dedans.


Ksass`Peuk
Il y a 7 ans

Le but principal n’est pas d’avoir du code utilisable, le but est d’avoir du code qui puisse être lu et exploré. Ensuite, si les moyens suivent, si, on pourra continuer à avoir du code qu’on peut exécuter, car justement l’idée est d’embarquer les dépendances, les versions d’environnement, etc …

 Quant au troll, il n’est pas très imaginatif.


Jean_G Abonné
Il y a 7 ans

Pour un projet franco-français, Roberto a un très joli accent italien ;) J’ai eu la chance de l’écouter à une conférence, il est très convaincant. Et il faut savoir que le “code” importe autant que les données : à quoi bon stocker des images jpeg si on n’a pas le code pour l’afficher ? Vous direz qu’il suffit d’avoir les spécifications de jpeg, ce qui est vrai ; mais dans ce cas les normes ou spécifications peuvent être compris comme du code de niveau supérieur, lequel intéresse aussi nos amis de Software Heritage…


DUNplus Abonné
Il y a 7 ans

Je voie pas trop en quoi c’est utile une bibliothèque de code non utilisable.

Par contre une bibliothèque de code ou ont pas chercher pas algo, la c’est top


Mimmo D.DN
Il y a 7 ans






DUNplus a écrit :

Je voie pas trop en quoi c’est utile une bibliothèque de code non utilisable.

Par contre une bibliothèque de code ou ont pas chercher pas algo, la c’est top


Elle est codé ta phrase <img data-src=" />&nbsp;

Après s’interroger sur l’intérêt de la chose c’est un peu comme s’interroger sur l’intérêt d’une bibliothèque publique.