Sous pression, Bercy ouvre les codes sources des modèles Mésange, Opale et Saphir
Top modèles
Le 06 septembre 2018 à 09h50
5 min
Droit
Droit
La direction générale du Trésor vient de mettre en ligne trois de ses modèles économétriques, particulièrement précieux pour simuler différentes réformes (notamment fiscales ou sociales). Une initiative qui fait toutefois suite à une procédure « Cada » lancée l’année dernière par l’association Ouvre-boîte.
C’est par voie de communiqué que Bercy a annoncé, mercredi 5 septembre, la mise à l'ouverture des codes sources des modèles Mésange, Opale et Saphir.
Le premier, Mésange, a été co-développé avec l’Insee « dans le but, entre autres, de réaliser des évaluations ex ante de l’impact de différentes mesures de politique économique sur les grandeurs macroéconomiques comme l’emploi, le PIB ou les prix ». Il permet également de « modéliser les conséquences de chocs externes, comme les variations du taux de change ou du prix du pétrole ».
Opale permet de son côté de « prévoir les principales variables macroéconomiques (croissance du PIB, consommation, investissement...) à horizon d’un à deux ans », notamment dans le cadre de la préparation des projets de loi de finances.
Saphir, enfin, sert à simuler des réformes de la législation socio-fiscale, en s’appuyant sur « les revenus des ménages de France métropolitaine et les transferts monétaires induits par les prestations sociales et les prélèvements obligatoires ».
Ces trois codes sources peuvent être directement téléchargés sur le site du Trésor. Ils sont également accessibles via des dépôts Framagit et Github, accompagnés d’une documentation et de détails sur leurs conditions d’utilisation (licence CeCILL V2.1).
- Code source de Mésange : lien Framagit/Github
- Code source d’Opale : lien Framagit/Github
- Code source de Saphir : lien Framagit/Github
L’association Ouvre-boîte avait déjà saisi le tribunal administratif
Cet effort de transparence de la part de Bercy n’est cependant pas totalement volontaire. En novembre 2017, l’association Ouvre-boîte, qui œuvre pour l’ouverture des données publiques, a demandé au Trésor de mettre en ligne les codes sources des modèles Mésange, Opale et Saphir, ainsi que différentes pièces afférentes : documentations, calibrations, scénarios prospectifs simulés et évaluations de réformes.
Suite au refus opposé par le Trésor, l’organisation s’est tournée fin janvier devant la Commission d’accès aux documents administratifs (Cada). L’autorité administrative peut en effet être saisie lorsqu’une administration rechigne à transmettre un document public – tel qu’un rapport, des statistiques, ou même un code source. Son rôle ? Indiquer si, à ses yeux, les documents sollicités peuvent être communiqués ou non au citoyen, au regard des différentes dispositions légales en vigueur.
Mais faute d’avoir obtenu un avis de la Cada sous deux mois (l’institution étant surchargée), Ouvre-boîte a lancé en parallèle une procédure devant le juge administratif. « Comme la Cada est débordée, il nous arrive de ne pas attendre ses avis, quand elle ne répond pas dans les délais », nous explique l’association.
« Ensuite, quand on reçoit l’avis de la Cada, on l’ajoute à notre dossier au tribunal administratif. » C’est d’ailleurs ce qu’il s’est passé après que l’autorité indépendante a transmis ses conclusions à Ouvre-boîte, fin juin. Le verdict : les fameux codes sources sont bel et bien « communicables ». Le Trésor a d’ailleurs fait savoir à la commission qu’il les rendrait public.
La Cada a toutefois insisté sur le fait que Bercy était fondé « à étaler dans le temps la publication » des trois codes sources, « eu égard à ses contraintes techniques ». L’administration se voyait ainsi invitée à « convenir avec le demandeur d’un échéancier compatible avec le bon fonctionnement des services ».
Demandes de la société civile et du Parlement
Le Trésor se savait quoi qu'il en soit attendu au tournant par certains parlementaires. L’année dernière, le Sénat avait voté un amendement obligeant l’administration fiscale à dévoiler, pour chaque projet de loi de finances, le « code source » traduisant les mesures envisagées par l’exécutif. Le gouvernement, qui jugeait la mesure « impossible à mettre en œuvre », avait réussi à la faire retoquer par l’Assemblée nationale. La Haute assemblée a depuis fait savoir qu’elle comptait rouvrir ce dossier.
L’ouverture des modèles Mésange, Opale et Saphir avait en outre été réclamée il y a peu par la députée Paula Forteza (LREM), au travers d’un rapport consacré aux budgets participatifs. Un sujet qui pourrait d’ailleurs resurgir lors de l’examen du projet de loi de finances, l’élue ambitionnant d’associer davantage les citoyens dans l’attribution de certains fonds publics.
Déception du côté de l’association Ouvre-boîte, qui pourrait maintenir son recours
Contactée par nos soins, l’association Ouvre-boîte « salue » l’ouverture de ces codes sources. Elle souligne même que le Trésor s’est montré « plus réactif que d’autres administrations ».
L’organisation déplore néanmoins « l’opacité tenace » de Bercy qui, à ses yeux, a « livré le strict minimum : les codes sources, mais pas les scénarios prospectifs simulés, etc. » Pire. « Pour l’instant, nous explique-t-on, les codes sont inutilisables. Pour Mésange, les données ne sont pas fournies. Pour Opale, c’est codé en langage TROLL (sic), et le code source du langage n’est pas fourni... »
Les membres d’Ouvre-boîte doivent se réunir ce soir pour décider s’ils maintiennent ou non leur recours devant le tribunal administratif.
Sous pression, Bercy ouvre les codes sources des modèles Mésange, Opale et Saphir
-
L’association Ouvre-boîte avait déjà saisi le tribunal administratif
-
Demandes de la société civile et du Parlement
-
Déception du côté de l’association Ouvre-boîte, qui pourrait maintenir son recours
Commentaires (45)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 07/09/2018 à 11h00
Le 07/09/2018 à 12h41
JVachez !!!!!!!!!!!!!
" />" />
Le 07/09/2018 à 12h51
Je ne trolle pas, le pouvoir au peuple n’est pas prévu dans le fonctionnement de l’état français.
Les phases de démocratie sont limitées aux élections et éventuellement aux périodes de manifestations/grèves. On parle d’ailleurs bien de démocratie représentative (et durant toute la première moitié du 19e être démocrate était limité à l’extrême gauche politiquement et à certains libéraux non st simoniens).
Sinon c’est un système où on délègue et c’est l’élu qui représente le citoyen.
L’élu a un droit de regard sur l’administration, pas le citoyen historiquement.
C’est bien un mouvement très récent que de demander la transparence publique. C’est arrivé en partie avec la décentralisation et l’obligation de publier certaines données financières (subventions par ex.) et par le changement des mentalités et la volonté d’apparaitre démocratiques et de faire du participatif de la part des élus (le désintérêt pour la politique qui délégitime les élus et la “peur d’un nouveau 68” chez les élites au moment de la décentralisation n’y étant pas pour rien).
Le 07/09/2018 à 15h40
Le 07/09/2018 à 17h37
Le 07/09/2018 à 18h56
Le 10/09/2018 à 07h57
Le 10/09/2018 à 17h36
Le 11/09/2018 à 14h31
Le 06/09/2018 à 10h11
Pour Opale, c’est codé en langage TROLL (sic), et le code source du langage n’est pas fourni…
Magnifique " />
Le 06/09/2018 à 10h26
Il est quand même triste de devoir en arriver si loin pour que les ministères réagissent.
Je pense qu’il est nécessaire de permettre aux tribunaux d’assortir leurs sanctions administratives par des mesures pénales d’emprisonnement et amendes: ça permettrait enfin de faire réagir les décisionnaires dans les ministères et, s’il y a des récalcitrants, de les vider et les envoyer en prison où ils cesseront leurs manœuvres détestables.
L’État n’hésite pas à poursuivre et emprisonner ses citoyens quand ils font des fautes, il serait équilibré que nous puissions poursuivre et faire emprisonner ses agents quand ceux-ci font des fautes, non?
Le 06/09/2018 à 10h27
Après avoir regardé mésange rapidement, s’il me paraît difficilement exploitable (langage inconnu), le code a l’air en tout cas compréhensible, notamment à l’aide des PDF à côté.
Le 06/09/2018 à 10h31
Probablement les codes sources les plus importants publiés à ce jour, puisque ça permettrait de valider ou d’invalider les projections économiques sur lesquelles le gouvernement se base pour ses choix politiques.
On comprend mieux du coup pourquoi cette publication est incomplète.
Pour le langage TROLL, ça pourrait être ceci : http://www.hendyplan.com/troll-software/
C’est une solution propriétaire, ce qui explique qu’ils ne l’ait pas fourni.
Ce qui pose la question s’il ne faut pas obliger les services de l’état à n’utiliser que des techno open-sources.
Le 06/09/2018 à 13h41
D’après la description, cela semble être un langage conçu pour la manipulation de données statistiques et économiques. Donc certainement un progiciel très spécialisé pour ce type de besoin… Ce qui a l’avantage d’éviter de réinventer la roue.
D’après leur site (oui le site semble aussi vieux que la techno), c’est un langage né dans les années 60 sur Mainframe, depuis porté sur les autres systèmes.
Le 06/09/2018 à 14h06
on reprend (même si je comprends ce que tu reproches au truc. Je ne mets pas en doute ton point de vue, j’explicite simplement le mien, qui peut très bien être complètement à côté de la plaque) :
Mésange : Simule le résultat en terme de PIB, niveau de prix, emploi, etc. de choix de politiques économiques. Dit autrement (selon toute vraisemblance), le programme regarde ce qu’elles ont donné dans le passé avec les valeur des données de l’époque, actualise ces données (niveau actuel des échanges, des prix, etc.) et prédit ce qui résultera des politiques économiques.
>> pour en modifier le rendu, il faut soit modifier le passé (bonne chance) soit modifier la politique économique envisagée (et là ça n’a rien à voir avec le programme ou son code, c’est du bon vieux lobbying)
Opale : même topo ou presque, il regarde les valeurs passées de composantes macroéconomiques et essaie d’en déduire les valeurs futures.
>>C’est juste de l’actualisation faite sur la base de théories économiques. ça automatise ce que les groupes d’économistes servant de conseil faisaient déjà.
>> Là encore sans pirater le code du programme ou modifier le passé, tu ne gagnes rien. Au mieux, tu peux faire de l’ingénierie sociale (scientifique plutôt) pour modifier les théories économiques dominantes, celles mises en application dans le simulateur si tu veux éviter la phase pénétration du système…
Saphir : se sert des données passées de l’INSEE, les croisent pour en faire des données construites tenant compte des interactions puis donne la valeur qu’elles aurait eu si les différents taux de fiscalisation avait eu cours à ce moment-là.
Dans ces trois cas, ce sont des systèmes qui actualisent des données publiques (au sens connues et accessibles à tous) en fonction de postulats économiques dans les cas de Mésange et Opale, ou en fonction de choix de taux (eux aussi dont le mode calcul est public) dans le cas de Saphir.
D’autres programmes ou algo (il doit y en avoir), je ne dirai pas, mais ces trois-là ne représentent que le risque de déduire les postulats économiques de Bercy, lequel peut être déduit par ailleurs, différemment.
En résumé, ils ne donnent pas d’info supplémentaire, permettent au mieux à une puissance étrangère d’affiner sa connaissance de nos croyances en matière d’économie (dont je gage qu’elle doit déjà être plutôt fine).
Par ailleurs, reposant sur des postulats économiques (les relations entre les valeurs et l’impact d’une évolution de l’une sur les autres), on peut mettre en doute la fiabilité de ce qu’elle recrache¹ (à part Saphir qui, décrit comme ça, n’est une équation ou un système d’équation un peu complexe et encore…)
¹ le fait, par exemple, qu’on entend toujours “le gouvernement table sur un PIB de…” pour ses budgets et qu’on n’obtient jamais ce chiffre-là est un indice sérieux…
" />
Le 06/09/2018 à 14h11
Je ne connaissait pas mais j’avais jeté un coup d’oeil au lien cité plus haut. En allant faire un tour sur le lien que tu nous as donné, je me dis que Python serait tout aussi bien adapté pour ce genre d’application. La seule différence fondamentale que je vois c’est “strong typing”, là c’est à l’opposé de ce que propose Python.. Mais ça ne le rend pas moins bien adapté pour la manipulation de tableaux/matrices et les calculs associés. Soit tout ce qu’il faut pour de la simulation !
Alors certes, Python est apparu après TROLL, mais la communauté, la popularité et la portabilité d’une application Python est sans équivoque face aux sources TROLL. Enfin, on ne refait pas les choix des autres après tout. Par contre bonjour pour dénicher des développeurs qui maîtrisent déjà le langage, ça revient quand même à se fermer des portes et à s’enfermer dans un écosystème probablement bancal..
Encore un que j’aurais jamais connu sans cette libération de code source tiens…
Le 06/09/2018 à 14h27
Et pas que… il a sévi ailleurs aussi. Mais bon… c’est comme CandyMan, faut éviter de le nommer trop souvent ! :)
Le 06/09/2018 à 14h38
J’ai envie de dire que ça dépend où ça dépasse.
Possible que le programme de l’INSEE soit plus ou moins antédiluvien et donc avec le passif qui va avec… J’ai connu des projets de portage d’applications mainframe vers des langages plus “maintenables” qui ont pris des siècles et coûté une blinde parce que secteur complexe ou critique.
Donc il est possible qu’ils évitent ce genre de projet de migration.
Le 06/09/2018 à 14h41
Le 06/09/2018 à 16h03
En préambule, je me souviens du cours de macro-économie (c’était à la fin des années 80 " /> ), où le prof nous avait parlé des logiciels de simulation utilisés par l’INSEE ou le ministère des finances, qui étaient ambitieux car les concepteurs essayaient de pouvoir rentrer plein de paramètres pour modéliser l’économie du pays.
Le 06/09/2018 à 17h43
Le 06/09/2018 à 17h47
S’ils ont quelques milliers d’applications, les transcrire dans un autre langage va prendre du temps, il faut faire ça au fur et à mesure des besoins, pas besoin de casser un existant qui marche. Et le langage n’a pas l’air très compliqué au demeurant.
Sur le site du revendeur est indiqué :
TROLL is an integrated software system for econometric modelling and statistical analysis. TROLL is the primary econometric modelling and analysis tool at many of the world’s leading central banks, national and international governmental agencies, private companies (financial institutions and energy sector) in and prominent research laboratories in the academic world.
Je ne sais pas ce que cela vaut. " />
Le 06/09/2018 à 17h51
Et son site est à jour. " />
Le 07/09/2018 à 08h14
Le 07/09/2018 à 08h18
C’est très récent comme préoccupation : le système politique/administratif Français n’a jamais été conçu pour être une démocratie et le fonctionnement de l’état n’a donc pas statutairement à prendre cela en compte encore aujourd’hui.
Maintenant la France se démocratise petit à petit dans l’histoire (légalisation des syndicats/assocs, vote des jeunes, des femmes, décentralisation, open data etc.) mais faire semblant que notre système inspiré de l’armée et au vote censitaire au départ est démocratique dans son essence n’avance à rien. On n’est pas en cours d’éducation civique en 5e, inutile de se mentir les gens " />
Le 07/09/2018 à 08h25
Le 07/09/2018 à 08h55
Le 07/09/2018 à 08h57
En fait les pays d’importance ont déjà des simulations incluant la France, les économies mondiales étant très interconnectées.
Et c’est probablement pareil pour ces logiciels, ils doivent inclure des simulations des principales économies partenaires de la France.
Enfin les décisions sont prises par des élus, il s’agit d’aides à la décision pour haut fonctionnaires, pas du programme pour gouverner la France.
Le 07/09/2018 à 10h58
Le 06/09/2018 à 10h32
apres le simulateur des impots en langage M, on a donc Mésange et Opale en Troll, et Saphir en SAS…
c’est moi ou tous ces gens a Bercy adorent les langages ésotériques ?
c’est peut etre un concours, chaque outil développé avec un langage différent ?
Le 06/09/2018 à 10h46
Je suis surpris que l’on puisse demander le code source de tel logiciel. En effet, s’ils sont faits pour faire des simulations validant ou invalidant des décisions économique du pays, il pourrait être utilisé par un autre pays pour “hacker” les prévisions et plomber économiquement la France.
Le 06/09/2018 à 10h46
c’est dommage d’utilisé TROLL alors que visiblement R serait adapté à ce genre de logiciel. les manques il faut payé le développement, l’intégré au projet etc … C’est plus de boulot forcément et ce sera forcément plus chère. Et ce sera plus libre \o/
ca doit etre quand meme plus difficile de faire develloper en R avec un marché public https://www.r-project.org/
Le 06/09/2018 à 10h50
ah c’est cool, dans les pdfs on a les emails et numéros pros des gens ;-)
Le 06/09/2018 à 11h29
incroyable le langage TROLL, le pire c’est qu’ils ne doivent même pas se rendre compte de la beauté de la chose ^^
Le 06/09/2018 à 11h30
Pourquoi est-ce que je ne suis même pas étonné de voir que l’état français a choisi de développer ses outils dans des language propriétaires ?
Le 06/09/2018 à 11h40
Le 06/09/2018 à 11h55
c’est pas un peu le même genre d’argument que “wouaaah le Libre c’est dangereux, tous les pirates peuvent lire le code et trouver les failles” ? (toute ressemblance avec une personnalité du web francophone serait fortuite) " />
Le 06/09/2018 à 12h20
Le 06/09/2018 à 12h33
le coup de vieux en lisant ton com foiré va " />
Le 06/09/2018 à 12h35
Le 06/09/2018 à 12h43
La sécurité dans le libre part du principe que l’intérêt des utilisateurs que le code soit sûr est plus grand que l’intérêt d’exploiter des failles.
Sauf que là, le rapport de force n’est pas du tout favorable, c’est la France contre tout le reste du monde (même des “alliés” ont tout intérêt à trouver des petites astuces pour grappiller des avantages : la symbiose n’est qu’une forme de parasitisme tombé dans un statu quo).
De plus, ici de ce que j’ai compris, ce sont des modèles de simulation. Par définition, un modèle est une représentation simplifié, il est justement utilisé pour ne pas avoir à gérer toute la complexité de l’objet modélisé. Du coup, c’est faillible et ça sera toujours faillible.
Le 06/09/2018 à 13h01
Comme tu le dis, ce sont des modèles de simulation reposant pour partie sur des données réelles (issues de l’INSEE, par exemple) et pour autre partie sur des jeux de données choisis par la personne faisant la simulation, et permettant de faire tourner cette dernière pour connaitre le résultat d’une modif dans les variables (par exemple un taux ou une assiette d’imposition).
Du coup, pour hacker ce simulateur et influencer la prise de décision qui en résulterait, il faudrait toucher à la partie données réelles… Tu as déjà hacké tout le pays si tu es parvenu à cela.
Savoir le chemin parcouru depuis une entrée pour aboutir à une sortie ne représente aucun danger (du point de vue technique… ça peut en représenter un d’un point de vue politique ou sociétal si on découvre qu’une des opérations contient une part “à la tête du client” ou “si c’est mon pote” " /> )
Autre angle d’approche, si quelqu’un parvient à modifier l’algorithme utilisé dans la prise de décision (le code qui tourne pour de vrai sur les postes des décisionnaires), c’est que le SI décisionnel lui-même a été pénétré et compromis et on aurait alors un problème beaucoup plus grave sur les bras " />
Donc non : savoir comment les rouages tournent pour transformer “255,255,255” en “ce carré est blanc” ne présente aucun risque dans ce contexte.
(et la référence au libre = opensource¹ = danger est un hommage au génialissime JVachez²)
¹ confusion également récurrente
² I remember… so you don’t have to (©Nostalgia Critic)
Le 06/09/2018 à 13h22
Quand je parle de hack, c’était au sens large du terme (pas uniquement informatique). Ici, par exemple ici, une personne (pays) mal intentionné peut grâce à ce modèle prédire plus facilement les futurs décisions et s’adapter/contrecarré. Il peut même prendre les devants en adoptant un certain comportement (qui peut n’être que factice) afin d’influencer les donnée d’entrée du modèle pour que la France prenne des mesures qui lui seront favorables.
Autrement dit, tu ne donnes pas ton plan de bataille à l’ennemi.
Le 06/09/2018 à 13h25
“En langage TROLL” " /> Vraiment ? " />
C’est quand même dingue d’aller chercher des technos comme ça vu le nombre démentiel de langages de programmation existant et déjà documentés… et largement plus répandus et facile d’accès..
Le 06/09/2018 à 13h40