Le modèle de simulation Ines, de l’INSEE et la DREES, passe en open source
DREES code ?
Le 14 juin 2016 à 14h18
3 min
Internet
Internet
L’INSEE et la DREES rendent public aujourd’hui le code source de leur modèle de simulation « Ines », destiné à établir des projections relatives notamment aux prélèvements sociaux et autres prestations de type RSA ou allocations familiales. L'outil n'est pas sans rappeler OpenFisca, ce logiciel développé en open source sous l'égide du SGMAP.
Après la Direction générale des finances publiques (DGFiP) et son logiciel de calcul de l’impôt sur le revenu, c’est au tour de l’Institut national de la statistique (INSEE) et de la Direction des études du ministère des Affaires sociales et de la santé (DREES) d’ouvrir un code source, correspondant au modèle de microsimulation Ines. Ce dernier a été développé conjointement par les deux institutions et se nourrit chaque année des enquêtes dites de Revenus fiscaux et sociaux.
« Grâce à la richesse de celles-ci, on dispose de centaines d’informations sur les 50 000 ménages de l’échantillon, explique la DREES, et de données précises et fiables sur leurs revenus, issues de leur déclaration fiscale. Sur cette base, le modèle simule, sur barèmes, les différentes prestations auxquelles chaque ménage a droit et les impôts et prélèvements qu’il doit acquitter. Il appréhende ainsi la diversité et la complexité des situations réelles des Français à partir d’un échantillon représentatif de la population vivant en France métropolitaine dans un logement ordinaire. »
Avec ce programme, de nombreuses possibilités s’offrent à celui qui maîtrise un minimum l’informatique : simulation de réformes en tout genre – hausse du montant du RSA, individualisation de l’impôt sur le revenu, suppression de certaines allocations familiales... – éventuellement en se basant sur une législation antérieure (de 2010 à 2014).
Une volonté d'attirer de nouveaux contributeurs
L'accès au code (en SAS) passe par une forge hébergée par l’association Adullact : « adullact.net/projects/ines-libre ». Il faut par contre créer un compte (soumis par ailleurs à validation de l’administrateur...) avant de pouvoir télécharger le fichier du modèle Ines. Nous n’avons de ce fait pas – encore – pu en profiter. L'ensemble des programmes est normalement diffusé avec la licence CeCILL V2.1 et les fichiers de paramètres avec la licence ODbL. Un guide d’utilisation est d’autre part proposé (PDF).
Pour l’INSEE et la DREES, l’ouverture du modèle Ines constitue un bon moyen « d’amplifier les échanges techniques dans la sphère de la microsimulation, à cheval entre la recherche et les administrations gérant des outils semblables (DG Trésor, Cnaf et France Stratégie) ». D’autres équipes de chercheurs pourraient s’emparer de cet outil, et proposer éventuellement des améliorations. « De plus larges utilisations du modèle Ines contribueront ainsi à en accroître la qualité et la légitimité » espère-t-on en interne.
Pour mémoire, le projet de loi Numérique prévoit qu’à partir du 1er janvier 2017, l’INSEE ne pourra plus réclamer de redevance de réutilisation sur les données qu’elle produit (base SIRENE, etc.).
Le modèle de simulation Ines, de l’INSEE et la DREES, passe en open source
-
Une volonté d'attirer de nouveaux contributeurs
Commentaires (18)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 14/06/2016 à 14h48
Exactement. Plus on aura ce genre d’outil plus on pourra réfléchir à des modèles alternatifs et réaliser des simulation sur des hypothèses afin d’affiner des points de vues.
Le 14/06/2016 à 17h37
Pour info j’ai interpellé l’INSEE via leur compte Twitter concernant cette histoire de compte à créer… C’est vraiment étrange comme prérequis… → Twitter
Le 14/06/2016 à 18h20
Un programme open source qui nécessite l’accès obligatoire avec un compte validé par un admin ? Ah oui, c’est très pratique vraiment. Etait-ce si compliqué de mettre le code source sur GitHub comme l’ont fait d’autres institutions ou entreprises ?
On sent bien en filigrane que ça leur a déchiré le cul de passer le soft en open source… " />
Le 14/06/2016 à 20h26
Le logo d’Adullact ressemble à celui d’OpenOffice…
Le 14/06/2016 à 20h31
Un échantillon de 50000 seulement ? Ça me parait léger, comme échantillon. A l’heure du big data, on peut mieux faire, voire même sur l’ensemble des données. Et puis pourquoi “logement ordinaire” ? Exit Sarko et son hôtel particulier (en supposant qu’il n’ai qu’un logement), exit les politiques et autres profiteurs qui disposent d’un logement de fonction grand luxe aux frais de la princesse. En même temps, ils ne paye pas d’impôt, ils en profitent. Exit les riches et leurs châteaux, manoirs, domaines, méga-villas… En même temps, ils payent rien non plus.
Le 14/06/2016 à 21h15
L’ouverture de code, qu’elle soit voulue ou subie, n’est pas forcément évidente à mettre en place. Les connaissances concernant les aspects techniques et/ou communautaires ne sont pas forcément les mêmes au sein de différentes équipes, y compris au sein d’une même institution.
Je préfère attendre de voir s’il s’agit d’un choix (éventuellement stratégique/politique/whatever) de limiter l’accès à des utilisateurs enregistrés et validés manuellement, ou s’il s’agit d’une configuration par défaut qui aurait été appliquée à ce projet comme ça aurait été le cas pour un autre, avant de leur reprocher de faire de l’OpenWashing…
Le 14/06/2016 à 22h23
trouvé ici (INSEE) :
Le logement ordinaire est un logement défini par opposition à un logement en résidence offrant des
services spécifiques (résidences pour personnes âgées, pour étudiants, de tourisme, à vocation sociale, pour personnes handicapées…).
Le 14/06/2016 à 23h27
Des simulations sont déjà faites avec OpenFisca, mais je crois qu’il manque pas mal de données pour que ce soit pertinent : GitHub
Le 15/06/2016 à 05h59
Tu t’enflammes un peu vite. Déjà, fred42 t’a donné la définition du “logement ordinaire”. As tu remarqué que ta vision était aux antipodes ?
Le 15/06/2016 à 07h40
Lorsqu’on fait des stats ou de la simulation sur de grosses populations, le poids des cas particuliers sur le résultat final est négligeable.
Une base de données de qualité sur 50 000 sujets c’est déjà un bel outil. Evidemment 1 million serait mieux et 10 millions encore mieux. Le problème est de placer le curseur au bon endroit sur l’échelle qualité des données/quantité de données. On ne tire jamais rien de bon d’un gigantesque dataset sale. On peut sortir des prévisions bien plus fiables en s’appuyant sur un dataset plus petit mais propre. Obtenir un bon dataset à jour, complet et propre est un gros boulot et on ne rajoute pas des dizaines de milliers d’enregistrements de qualité d’un simple claquement de doigts.
Le 15/06/2016 à 16h40
Complément d’information posté ici → TwitterEn résumé : je suis très déçu des choix de gouvernance effectués.
Le 15/06/2016 à 17h27
@InseeFr répond en privé et refuse la publication de sa réponse
Et quel est le prétexte de ce refus d’une direction générale du ministère de l’Économie et des finances ?
Il me semble que toute personne recevant un courrier, message a le droit de le publier tant qu’il n’y a pas un autre droit en jeu (par exemple atteinte à la vie privée).
En tout cas, rien ne t’empêche de nous indiquer les raisons avec tes mots à toi.
Le 15/06/2016 à 17h33
C’est ce que j’ai fait dans le thread de 4 tweets sur Twitter. ;)
Le 15/06/2016 à 17h48
OK, je n’avais pas vu que c’était une raison tellement ce n’en est pas une.
On veut savoir qui accède à notre code.
Dans ce cas, autant utiliser une licence différente que CECILL équivalente à la GPL.
Cela serait moins hypocrite.
Le 15/06/2016 à 21h40
C’est non seulement hypocrite, contre-productif, mais surtout complètement idiot ! Une fois le code publié sous licence libre, je ne vois pas très bien par quel mécanisme ils espèrent contrôler qui le lit. C’est affligeant, c’est à croire qu’ils n’ont pas lu la licence.
Le 16/06/2016 à 13h57
Le 14/06/2016 à 14h34
Ça peut être pratique pour faire des simulations autour du revenu de base.
Le 16/06/2016 à 14h37
Vas y explique moi comment quelqu’un qui a 500 000 € de revenus ne paie pas plus de 100 € d’impôts en sachant que les niches fiscales sont plafonnées.
Pour l’ISF, tu n’as pas tord, c’est un impôt injuste qui ne touche que les petits riches, donc autant le supprimer.
Sinon, pour la définition de l’INSEE, je l’ai trouvée en suivant le lien de l’article, donc en 2 clics.