Connexion
Abonnez-vous

Les députés veulent que le code source et l’algorithme du successeur d’APB soient publics

Le scanner de la guerre

Les députés veulent que le code source et l’algorithme du successeur d’APB soient publics

Le 14 décembre 2017 à 15h34

L’Assemblée nationale a adopté, mercredi 13 décembre, un amendement destiné à ce que le code source, l’algorithme et le cahier des charges de la future plateforme « Parcoursup » soient communiqués de droit aux citoyens qui en feraient la demande.

Les ratés d’Admission Post-Bac, ce programme qui décidait il y a quelques mois encore de l’affectation de centaines de milliers d’étudiants, sont plus que jamais présents dans les esprits. Certains se souviennent notamment que le ministère de l’Éducation nationale avait transmis, en octobre 2016, l’algorithme d’APB sur support papier à l’association Droits des lycéens...

Le député Cédric Villani (LREM) a ainsi profité de l’examen du projet de loi « relatif à l’orientation et à la réussite des étudiants » pour proposer d’étendre la transparence sur « Parcoursup », qui devrait remplacer APB à partir de la rentrée prochaine.

Une transparence qui relève d'une « exigence démocratique », selon le gouvernement

« Il importe que l’occasion soit saisie du remplacement d’APB pour rendre les codes sources publics, sous une forme analysable, de façon à contribuer à garantir [la] transparence des règles d’affectation des élèves, et la correspondance entre les règles affichées et le code informatique », faisait valoir le mathématicien au travers d’un amendement.

Si, depuis le vote de la loi Numérique, les « codes sources » sont officiellement reconnus comme des documents administratifs communicables de droit au citoyen, sur demande, l’élu souhaite que les pouvoirs publics aillent plus loin s’agissant de Parcoursup. À ses yeux, l’effort de transparence « doit inclure la publication du cahier des charges synthétique du traitement et celle de l’algorithme lui-même, en supplément des codes sources du logiciel ».

Chargée de se pencher sur le cas d’APB, la mission Etalab relevait en début d’année que ce dispositif était constitué d’un « système complexe, composé de plusieurs modules et interfaces ». Le tout comporte pas moins de 35 fichiers, organisés autour de deux algorithmes : l’un pour le classement, l’autre pour l’affectation.

apb etalab
Crédits : Rapport de la mission Etalab sur APB

L’amendement de Cédric Villani prévoit ainsi que devienne communicable, au titre du droit d’accès aux documents administratifs (et sous six mois après la promulgation de la loi) :

  • Le code source des traitements automatisés utilisés pour le fonctionnement de la plateforme Parcoursup
  • L’algorithme du traitement
  • Le cahier des charges du traitement, « présenté de manière synthétique »

Fait plutôt rare, cet amendement a été repris et soutenu dans l’hémicycle par le rapporteur, Gabriel Attal. « Il s’agit de fixer un cadre clair garantissant la transparence du code informatique de la nouvelle plateforme Parcoursup » a fait valoir l’intéressé. « On se souvient qu’il avait été assez difficile d’obtenir la transparence sur le code d’APB : il avait fallu un certain temps avant que les gestionnaires de la plateforme diffusent le code, et la manière dont celui-ci avait été rendu public n’avait pas été totalement satisfaisante puisqu’elle n’avait pas permis aux différents acteurs de tirer profit de cette information. »

Sur le banc du gouvernement, la ministre de l’Enseignement supérieur a émis un avis favorable, considérant que ce pas en faveur de plus de transparence relevait d’une « exigence démocratique ». Frédérique Vidal a également souligné que cet effort avait été réclamé par la Commission nationale de l’informatique et des libertés (CNIL).

Le 30 août, la gardienne des données personnelles a effectivement mis en demeure le gouvernement de proposer, sous trois mois, « une procédure effective de traitement des demandes de droit d’accès garantissant la transmission aux personnes des informations permettant de connaître et de contester la logique qui sous-tend le traitement APB ».

Nuance entre droit de communication et diffusion

Soulignons toutefois que la possibilité de demander la communication de documents administratifs ne signifie malheureusement pas toujours que les services sollicités se plient facilement aux requêtes des citoyens... Certains se souviendront probablement du combat mené par Adrien Fabre, jusque devant le tribunal administratif, pour obtenir le code source du logiciel de calcul de l’impôt sur le revenu (voir notre article).

La mission Etalab avait ainsi préconisé dans son rapport sur APB que le ministère publie de lui-même, « sans attendre une nouvelle demande de communication, le code source de la dernière version d’APB et les données non-réidentifiantes associées ». Elle plaidait dans le même temps pour une mise à disposition du fameux code source « sur un système de gestion de version décentralisé (par exemple git) au moyen d’une plateforme ouverte au public ». « La documentation existante doit être partagée », ajoutait l’institution chargée d’accompagner les administrations dans l’ouverture de leurs données publiques.

Si l’amendement adopté hier par les députés ne prévoit pas de diffusion automatique du code source, de l’algorithme et du cahier des charges de Parcoursup, la loi Numérique pourrait toutefois contraindre les pouvoirs publics à mettre directement à disposition certains de ces fichiers.

À compter du 7 octobre 2018, les administrations d’au moins 50 agents ou salariés (ce qui concerne donc a priori les ministères de l’Éducation nationale et de l’Enseignement supérieur) devront diffuser sur Internet les « règles définissant les principaux traitements algorithmiques » servant à prendre des décisions individuelles.

Autre mécanisme ouvert par la loi Numérique : si un citoyen demande puis obtient des documents liés à Parcoursup après avoir fait valoir son droit d’accès aux documents administratifs, les ministères concernés seront tenus de les mettre à la disposition de tous, sur Internet. Au nom du principe d'Open Data dit « par défaut », tout fichier communiqué individuellement par mail doit être systématiquement mis en ligne.

Seul hic, ces dispositions restent pourtant ignorées de certaines administrations (ce qui nous a récemment conduit à saisir le Conseil d’État, et même pour un cas un peu plus différent, la Commission d’accès aux documents administratifs).

Commentaires (20)

Vous devez être abonné pour pouvoir commenter.

Abonnez-vous
votre avatar

Algorithme un mot bien étrange pour une sélection <img data-src=" />


votre avatar

Parcoursup est développé en interne, ou par des prestataires ?

votre avatar

Seul hic, ces dispositions restent pourtant ignorées de certaines administrations

(ce qui nous a récemment conduit à saisir le Conseil d’État, et même pour un cas un peu

plus différent, la Commission d’accès aux documents administratifs).



bref….y-a encore du chemin !




  • entre “ce qu’il faudrait faire”, ET “ce qui est fait…vraiment” = piou !!! <img data-src=" />

votre avatar

j’arrive pas avec ce nom, ça me rappelle trop ABP = Adblock Plus <img data-src=" />

votre avatar

pareil ! <img data-src=" />

ils auraient dû pu trouver un autre nom, non ? <img data-src=" />

votre avatar

Amusant de voir l’évolution du numérique en France depuis l’arrive d’un jeune président. C’est plaisant de voir enfin mon pays se tourner vers ce monde. Pourtant avec le minitel on a été le premier pays connecté, dommage que l’évolution - v1 -&gt; v2 trop longue - de “ cette boite carrée avec un écran ” n’est pas été poursuivis.

&nbsp;

votre avatar

Attention : entre les paroles et les actes il peut y avoir un énorme fossé.

De précédentes affaires (dont celles citées dans l’article) le prouvent.



Sans être pessimiste, j’ai peur que cela soit surtout de la communication, même si certains députés sont certainement sincères dans leur démarche (Villani ?).



Je ne comprends toujours pas qu’en 2017, presque 2018, cela ne soit pas systématique et qu’il faille déposer un amendement…

Tout code source d’une plateforme publique devrait être diffusé publiquement, sauf si cela remet en cause la sécurité nationale et/ou l’anonymat d’individus.

votre avatar

Il faut cesser de faire cela au cas par cas.




La Loi(*) doit poser le principe que l'on peut accéder au code source des logiciels utilisés par l'administration (dont la Justice) et que par exception (décret ?) , le code source n'est pas accessible.       






 Et même dans ce dernier cas, il pourrait être fait une distinction avec les softs de "sécurité absolue" devant rester strictement confidentiel, et les softs sensibles mais pouvant être audités (par des experts tenus à une obligation de confidentialité).     





*= les textes sur la CADA sont déjà pas loin de le permettre: (merci Marc)

https://www.nextinpact.com/news/98062-le-code-source-dun-logiciel-administration-document-communicable.htm

http://www.assemblee-nationale.fr/14/amendements/3318/CION_LOIS/CL534.asp

votre avatar

Je ne vois pas trop l’intérêt d’avoir le code source d’un algorithme si l’on ne dispose pas des données d’entrée, qui elle ne seront jamais rendue publiques (sauf à être anonymisées?)

votre avatar

C’est une bonne remarque, l’algorithme va avoir une décision qui dépend non seulement des demandes de la personne mais aussi des autres personnes en concurrence.



En plus, j’ai compris qu’il y aurait des décisions humaines qui allaient entrer dans le processus, contrairement à APB.



Mais c’est toujours bon de comprendre comment cela se passe.

votre avatar



la mission Etalab relevait en début d’année que ce dispositif était constitué d’un « système complexe, composé de plusieurs modules et interfaces »





Voici le code source.



select from (select from candidats order by dbms_random.value) where rownum &lt; nMaxPlaces;



De rien.

votre avatar

Un peu plus sérieusement, pour APB. Un des problèmes étant que certains essayaient de forcer la main en ne mettant qu’un seul choix, cela ne marche pas et se sont donc retrouvés sur le carreau.

votre avatar

Ayant fait partie de ceux qui se sont retrouvé sur le carreau post bac justement, j’ai dit merci à la formation professionnelle. Surtout que le bac que j’ai fait ne m’a pas intéressé au final (et je m’en suis rendu compte en terminale), merci les conseillers d’orientation…



Et avec le recul, je ne le regrette pas.

votre avatar

Je ne comprends pas tout.

Ayant été dans les premiers à utiliser le système APB (donc plein de bugs et moins développé), j’ai trouvé ce système génial.

Beaucoup moins de dossier a envoyé, un traitement surement plus efficace des demandes de la part des administrations (qui ne se retrouvent pas avec des tonnes de lettres), une réponse rapide et claire.

Je n’ai pas eu mon premier voeux, mais probablement le second, je n’avais plus qu’à me déplacer à mon université pour signer les papiers.



On nous avais clairement dit aussi qu’une sélection était faites en fonction des notes, des lettres de motivation et des CVs.



Bref, comme l’a dit le dév principal d’APB, le problème n’est pas la plateforme, mais les critères d’entrées à l’université et le nombre de places. Bref, si on ne change pas ça, rien ne changera….

votre avatar

Je suis le seul a penser a AdBlock Plus en premier a la lecture du titre ? <img data-src=" />

votre avatar







vincz777 a écrit :



Je ne vois pas trop l’intérêt d’avoir le code source d’un algorithme si l’on ne dispose pas des données d’entrée, qui elle ne seront jamais rendue publiques (sauf à être anonymisées?)





Si les données sont nécessairement un plus, l’étude de l’algo d’APB avait permis de trouver qu’il y avait des discriminations faites en fonction de critères qui, pour certains, n’étaient pas prévus par la réglementation (distinction sur élève en métropole ou non qui déterminée une priorité plus grande dans l’attribution, parce que je ne sais plus si celui qui était en métropole était prioritaire sur celui qui n’y était pas ou inversement).



Dans l’idéal, il faut les deux.


votre avatar

Si tu avais lu les commentaires…

votre avatar

Si je me souviens bien, les étudiants hors-metropoles étaient prioritaires sur les autres.

Après cela peut s’expliquer sur la difficulté pour trouver des études hors de la métropole, mais il faudrait que ce soit clair et acté.

votre avatar







TheMyst a écrit :



Si je me souviens bien, les étudiants hors-metropoles étaient prioritaires sur les autres.

Après cela peut s’expliquer sur la difficulté pour trouver des études hors de la métropole, mais il faudrait que ce soit clair et acté.





Ah mais clairement, il ne s’agissait pas pour le “développeur” d’une volonté de biaiser le système, mais simplement d’un choix dans la discrimination des paramètres (il aurait pu tout aussi bien décider d’inverser la priorité).



Ceci prouve néanmoins et comme tu l’indiques, qu’il est impératif que les critères de discrimination soient accessibles, car sans aucune volonté de fausser le système, le “développeur” va faire des arbitrages qui feront que son algo ne sera pas neutre.


votre avatar

Ce qui me gêne dans le tirage au sort c’est que l’exécution de l’algorithme n’est pas reproductible, pour vérifier que le résultat présenté est bien obtenu avec celui-ci. Quoi de plus facile de dissimuler des passe-droits à la discrétion du ministère dans ce système invérifiable.



“Système complexe” … 35 fichiers ! Voudrait-on nous dissuader d’y jeter un oeil ? Parce que 35 fichiers c’est franchement pas grand chose (à priori).

Les députés veulent que le code source et l’algorithme du successeur d’APB soient publics

  • Une transparence qui relève d'une « exigence démocratique », selon le gouvernement

  • Nuance entre droit de communication et diffusion

Fermer