Software Heritage nous détaille la convention entre Inria et l'UNESCO, une étape importante

Software Heritage nous détaille la convention entre Inria et l’UNESCO, une étape importante

Près de 60 000 projets disponibles

Avatar de l'auteur

Sébastien Gavois

Publié dansInternet

07/04/2017
5
Software Heritage nous détaille la convention entre Inria et l'UNESCO, une étape importante

Software Heritage se définit comme une bibliothèque de code source. Elle propose aujourd'hui plus de trois milliards de fichiers, représentant près de 60 millions de projets. En recherche de reconnaissance, le projet a été distingué par l'UNESCO. Son directeur Roberto Di Cosmo revient avec nous sur ce partenariat.

L'été dernier, Inria présentait officiellement un vaste projet qui avait été lancé en 2015 par l'Institut national de recherche en informatique et en automatique (Inria) : Software Heritage. Son ambition est de « collecter, organiser, préserver, et rendre accessible à tous le code source de tous les logiciels disponibles ». Protéger notre patrimoine logiciel représente donc un travail titanesque.

Dès le lancement, plusieurs partenaires sont rapidement arrivés, Microsoft et le DANS de la Royal Academy des Pays-Bas. Aujourd'hui, ce projet passe un nouveau cap puisqu'Inria a signé une convention de partenariat avec l'UNESCO. Contacté par nos soins, Roberto Di Cosmo – directeur de ce projet – nous explique en quoi c'est une étape importante.

Sur trois piliers, il en manquait un 

Il nous explique que Software Heritage repose sur « trois piliers » fondamentaux : science et technologie qui est principalement fournie par Inria, des ressources (argents, temps ingénieur, stockage, etc.) amenées par des partenaires et enfin « la reconnaissance de l'importance de la mission ».

Si les deux premiers étaient déjà présents dès l'annonce officielle, le troisième manquait cruellement à l'appel. Après un « long long combat pour le faire reconnaitre », cette signature de partenariat avec l'UNESCO permet à Software Heritage de prendre de l'importance dans les « dimensions politiques et sociétales ». Roberto Di Cosmo ne cache d'ailleurs pas son enthousiasme et sa surprise : « on ne s'attendait pas à un truc pareil », lâche-t-il. 

Concrètement, ce partenariat avec l'UNESCO débouchera prochainement sur des interventions communes, une première de deux jours étant planifiée pour septembre. Le but sera d'expliquer pourquoi il est important de sauvegarder le code source des logiciels.

Software Heritage

De nouveaux partenaires, certains prestigieux

Dans tous les cas, Software Heritage n'a pas attendu que l'UNESCO se penche sur son cas pour avancer. Depuis l'annonce officielle du projet l'été dernier, il a été rejoint par Intel Corporation, qui a mis 100 000 euros sur la table, ainsi que par la Société Générale aussi avec 100 000 euros.

D'autres contributions plus modestes sont également de la partie avec le chinois Huawei (25 000 euros), l'Université de Bologne et Nokia Bell Labs. De deux, il est désormais question de sept partenaires. D'autres peuvent évidemment s'ajouter à la liste.

Si Inria et la Société Générale sont deux groupes français, ce n'est pas le cas des autres partenaires qui viennent du reste de l'Europe, d'Asie et des États-Unis. Cette ouverture est d'ailleurs une bonne chose pour Roberto Di Cosmo, qui nous explique qu'« il ne faut pas que ce soit perçu comme un projet franco-français », afin qu'il puisse se développer à l'international.

Au niveau du développement, Software Heritage a également des contributions extérieures. Certains viennent simplement donner un coup de main, d'autres s'investissent davantage. C'est notamment le cas de l'ADULLACT (Association des développeurs et utilisateurs de logiciels libres pour les administrations et les collectivités territoriales) qui a développé un plug-in complet pour ce projet.

Si l'aventure vous tente, vous trouverez tous les détails pour contacter l'équipe en charge du développement par ici. Bien évidemment, l'ensemble du code de Software Heritage est open source et disponible par là.

Plus de trois milliards de fichiers et près de 60 millions de projets

Aujourd'hui, Software Heritage revendique une base de données comprenant plus de 3,2 milliards de fichiers uniques représentants 58 254 852 projets. Concernant ce dernier chiffre, on peut remarquer qu'il a fait un bond de plus de 50 % entre 24 octobre et le 3 novembre 2016, alors que le nombre de commits et de codes sources n'a que peu changé.

Le directeur du projet nous explique que ce changement est intervenu lorsque « chaque fork était compté comme un projet de plus ». Le nombre de projets explose logiquement, mais comme chaque code source n'est sauvegardé qu'une seule fois – tout est dédupliqué –, le nombre de fichiers ne suit donc pas la même tendance. 

Software Heritage

Software Heritage « c'est aussi le futur »

Enfin, Roberto Di Cosmo nous indique que Software Heritage ne veut pas seulement être une sauvegarde du passé, mais aussi avoir les yeux tournés vers le futur. Pour lui, le but est de « savoir ce qui se passe dans le monde logiciel », d'où nous venons et où nous allons ; le tout dans un endroit unique.

Si Software Heritage propose notamment le code d'Apollo 11 (disponible sur GitHub depuis juillet 2016), tout le monde n'a pas une fusée Apollo sous la main pour le mettre en pratique lâche-t-il sur le ton de l'humour. Le directeur présente ce projet comme une grande bibliothèque : l'équipe ajoute des livres dans les rayons, au public maintenant de venir les lire.

Le partenariat avec l'UNESCO pourrait ainsi être perçu comme un premier signe d'ouverture vers le grand public. L'avenir nous le dira.

5
Avatar de l'auteur

Écrit par Sébastien Gavois

Tiens, en parlant de ça :

Carte graphique AMD GeForce

Cartes graphiques : 30 ans d’évolution des GPU

Ha… la bonne époque d’un CF de 4870 X2 !

18:10 Hard 8

Google lance son opération de communications Gemini pour rivaliser avec OpenAI

Preprint not PR-print

17:31 IA 4
Ecran bleu de Windows

Linux : le composant systemd se dote d’un écran bleu de la mort

LoL Micro$oft

16:33 Soft 23

Sommaire de l'article

Introduction

Sur trois piliers, il en manquait un 

De nouveaux partenaires, certains prestigieux

Plus de trois milliards de fichiers et près de 60 millions de projets

Software Heritage « c'est aussi le futur »

Carte graphique AMD GeForce

Cartes graphiques : 30 ans d’évolution des GPU

Hard 8

Google lance son opération de communications Gemini pour rivaliser avec OpenAI

IA 4
Ecran bleu de Windows

Linux : le composant systemd se dote d’un écran bleu de la mort

Soft 23
Une petite fille en train d'apprendre à programmer et hacker logiciels et appareils électroniques

Un roman graphique explique les logiciels libres aux enfants

SoftSociété 17
Nouveautés pour Messenger

Meta lance (enfin) le chiffrement de bout en bout de Messenger, entre autres

Socials 4

#LeBrief : cloud européen, OSIRIS-REx a frôlée la catastrophe, CPU AMD Ryzen 8040

Windows en 2024 : beaucoup d’IA, mais pas forcément un « 12 »

Soft 18
Einstein avec des qubits en arrière plan

Informatique quantique, qubits : avez-vous les bases ?

HardScience 8
Notifications iPhone

Surveillance des notifications : un sénateur américain demande la fin du secret

DroitSécu 15

En ligne, les promos foireuses restent d’actualité

DroitWeb 19

#LeBrief : modalité des amendes RGPD, cyberattaque agricole, hallucinations d’Amazon Q, 25 ans d’ISS

Logo Twitch

Citant des « coûts prohibitifs », Twitch quitte la Corée du Sud

ÉcoWeb 29
Formation aux cryptomonnaies par Binance à Pôle Emploi

Binance fait son marketing pendant des formations sur la blockchain destinées aux chômeurs

Éco 10
Consommation électrique du CERN

L’empreinte écologique CERN en 2022 : 1 215 GWh, 184 173 teqCO₂, 3 234 Ml…

Science 6
station électrique pour voitures

Voitures électriques : dans la jungle, terrible jungle, des bornes de recharge publiques

Société 74

#LeBrief : intelligence artificielle à tous les étages, fichier biométrique EURODAC

KDE Plasma 6

KDE Plasma 6 a sa première bêta, le tour des nouveautés

Soft 13
Un homme noir regarde la caméra. Sur son visage, des traits blancs suggèrent un traitement algorithmique.

AI Act et reconnaissance faciale : la France interpelée par 45 eurodéputés

DroitSociété 4
Api

La CNIL préconise l’utilisation des API pour le partage de données personnelles entre organismes

SécuSociété 3
Fouet de l’Arcep avec de la fibre

Orange sanctionnée sur la fibre : l’argumentaire de l’opérateur démonté par l’Arcep

DroitWeb 22
Bombes

Israël – Hamas : comment l’IA intensifie les attaques contre Gaza

IA 22

#LeBrief : bande-annonce GTA VI, guerre électronique, Spotify licencie massivement

Poing Dev

Le poing Dev – Round 7

Next 102
Logo de Gaia-X sour la forme d’un arbre, avec la légende : infrastructure de données en forme de réseau

Gaia-X « vit toujours » et « arrive à des étapes très concrètes »

WebSécu 6

Trois consoles portables en quelques semaines

Hard 37
Une tasse estampillée "Keep calm and carry on teaching"

Cyberrésilience : les compromis (provisoires) du trilogue européen

DroitSécu 3

#LeBrief : fuite de tests ADN 23andMe, le milliard pour Android Messages, il y a 30 ans Hubble voyait clair

#Flock a sa propre vision de l’inclusion

Flock 25
Un Sébastien transformé en lapin par Flock pour imiter le Quoi de neuf Docteur des Looney Tunes

Quoi de neuf à la rédac’ #10 : nous contacter et résumé de la semaine

44
Fairphone 5 démonté par iFixit

Sans surprise, le Fairphone 5 obtient 10/10 chez iFixit

Hard 5

WhatsApp vocaux à vue/écoute unique

WhatsApp permet d’envoyer des vocaux à écoute unique

Soft 10

Logo de Google sur un ordinateur portable

Google propose un correctif aux disparitions mystérieuses sur Drive

Soft 22

Puce AMD Instinct

IA : AMD annonce la disponibilité des accélérateurs Instinct MI300A et MI300X

Hard 0

Un œil symbolisant l'Union européenne, et les dissensions et problèmes afférents

Cloud : 1,2 milliard d’euros pour un Projet important d’intérêt européen commun

Web 12

Sonde OSIRIS-REx de la NASA lors du retour de la capsule des échantillons sur Terre

Échantillons d’OSIRIS-REx : la NASA a frôlé la catastrophe

Science 11

CPU AMD Ryzen avec NPU pour l’IA

Ryzen 8040 : AMD lance de nouveaux CPU mobiles (Zen 4, RDNA 3, NPU)

Hard 2

Commentaires (5)


skankhunt42
Le 07/04/2017 à 11h41

De toute façon dans pas mal de langage la majorité du code aujourd’hui sera inutilisable dans quelques années à cause de la compatibilité d’environnement, plusgins, ect… Et ce que je remarque aussi c’est que plus un projet est ouvert et plus c’est le boxon la dedans.


Ksass`Peuk
Le 07/04/2017 à 16h20

Le but principal n’est pas d’avoir du code utilisable, le but est d’avoir du code qui puisse être lu et exploré. Ensuite, si les moyens suivent, si, on pourra continuer à avoir du code qu’on peut exécuter, car justement l’idée est d’embarquer les dépendances, les versions d’environnement, etc …

 Quant au troll, il n’est pas très imaginatif.


Jean_G Abonné
Le 07/04/2017 à 18h01

Pour un projet franco-français, Roberto a un très joli accent italien ;) J’ai eu la chance de l’écouter à une conférence, il est très convaincant. Et il faut savoir que le “code” importe autant que les données : à quoi bon stocker des images jpeg si on n’a pas le code pour l’afficher ? Vous direz qu’il suffit d’avoir les spécifications de jpeg, ce qui est vrai ; mais dans ce cas les normes ou spécifications peuvent être compris comme du code de niveau supérieur, lequel intéresse aussi nos amis de Software Heritage…


DUNplus Abonné
Le 07/04/2017 à 19h19

Je voie pas trop en quoi c’est utile une bibliothèque de code non utilisable.

Par contre une bibliothèque de code ou ont pas chercher pas algo, la c’est top


Mimmo D.DN
Le 08/04/2017 à 10h01






DUNplus a écrit :

Je voie pas trop en quoi c’est utile une bibliothèque de code non utilisable.

Par contre une bibliothèque de code ou ont pas chercher pas algo, la c’est top


Elle est codé ta phrase <img data-src=" />&nbsp;

Après s’interroger sur l’intérêt de la chose c’est un peu comme s’interroger sur l’intérêt d’une bibliothèque publique.