Next voudrait en connaître plus sur l'« outil d'IA de remédiation ou d’approfondissement » mis à disposition des élèves de seconde par le ministère de l'Éducation Nationale. Un mois après, faute de réponse, nous avons saisi la CADA.
Le 5 décembre, le ministre de l'Éducation nationale et pas encore Premier ministre, Gabriel Attal, annonçait la mise à disposition aux élèves de seconde d'un nouvel outil d'IA nommé « Modules interactifs adaptatifs » ou « MIA ».
« Tous les élèves entrant au lycée seront désormais accompagnés, à la maison, d’un outil d'IA de remédiation ou d’approfondissement en français et en mathématiques », expliquait le ministre d'alors au personnel de l'Éducation nationale dans un email qu'avait pu consulter BFMTV.
À ce moment-là, le site du projet (voir version archivée) expliquait que son « moteur d’intelligence artificielle [articulait] plusieurs algorithmes créés par le Laboratoire INRIA (sic) et Sorbonne Université ». Sa page d'accueil explique maintenant que « le site n’est pas encore accessible aux utilisateurs ».
Gabriel Attal, lui, affirmait dans sa lettre que « ce logiciel souverain, construit avec des chercheurs et des enseignants, propriété du ministère de l'Éducation nationale et de la Jeunesse, sera mis gratuitement à disposition de 200 000 élèves de 2ᵈᵉ dès les prochains mois, avant d'être généralisé à l'ensemble des élèves de 2ᵈᵉ à partir de septembre prochain ».
Nous avons voulu en savoir plus et, dès le 6 décembre, Next envoyait une demande de documents au Bureau du droit des données et de l'information publique du Ministère. Un mois après, sans réponse et comme prévu par la procédure de demande CADA, nous avons saisi l'administration pour obtenir son avis sur ce refus tacite de communication de ces documents.
Le code source, mais pas seulement
Dans notre email au service du ministère, nous avions demandé plusieurs documents. D'une part, ceux de la préparation du projet « Modules interactifs adaptatifs », ceux concernant les contrats entre le Ministère et EvidenceB, la startup « edtech » qui est chargé de mettre en place ce système, et la bibliographie scientifique sur laquelle il s'appuie, puisqu'il a été conçu « avec des chercheurs ».
D'autre part, nous avons demandé, comme nous l'avions fait pour Parcoursup, le code source du projet et particulièrement les algorithmes d'Intelligence artificielle gérant la progression de niveau au cours de l'utilisation de MIA. En effet, alors que le projet met en place un système gérant la progression éducative par un système automatisé, il parait normal de savoir comment ce système fonctionne.
Bien évidemment, nous vous tiendrons informé de suites de notre demande et nous mettrons à disposition l’ensemble des documents que nous récupérerons.
Espérons que cette demande ne subira pas les mêmes péripéties que pour celle du code source de Parcoursup (qui n’est toujours pas publié en intégralité) :
- Les députés veulent que le code source et l’algorithme du successeur d’APB soient publics
- Un amendement gouvernemental limitant la transparence sur Parcoursup voté au Sénat
- Transparence de Parcoursup : comment le gouvernement a enfumé les parlementaires
- Algorithmes de Parcoursup : Next INpact saisit la CADA
- Le gouvernement ouvre le code source de Parcoursup, mais pas ses algorithmes « locaux »
Commentaires (62)
#1
#1.1
Tu veux dire, en extraire tout le potentiel bullshit de cette (ces ?) IA ?
#1.2
#1.3
#1.4
#1.5
#2
https://framablog.org/2023/07/31/que-veut-dire-libre-ou-open-source-pour-un-grand-modele-de-langage
#2.1
Remarque : ici, ce n'est pas un LLM dont il s'agit, mais le problème est similaire.
#3
D'ailleurs vous en êtes où pour Parcourssup/CADA ? 🤔
#3.1
#4
ps: A quand la transformation des smiley Inpactant vers l'Inkitude ?
#4.1
Cela risque de faire couler beaucoup d'encre ça...
#4.2
#4.3
;) (sinon, à quand la possibilité d'inclure des images dans les commentaires ?)
#4.4
Edit : la vache c'est quoi c'te resize de l'enfer ? XD
#4.6
@fdorin En vrai, je ne sais pas trop si on va intégrer les images vu ce que ça peut impliquer de débordements.
Ce qui est certain, c'est qu'on a pas mal de pain spirituel sur la planche avant.
#4.7
#4.8
Je ne sais pas trop à quel point notre responsabilité d'hébergeur est engagée si la ressource est stockée à l'extérieur tiens.
#4.9
#4.12
localhost, va se reconnaître.
#4.11
#4.13
#4.5
Fais gaffe!!
😅
Laissez-les tranquilles ces magnifiques œuvres d'art.
Pas besoin de faire comme Georges Lucas avec Star Wars...
#4.10
#4.14
#5
Je ne comprends pas cette demande. Vous savez très bien qu'en IA, il y a certes un algorithme pour faire tourner l'IA, mais celui-ci ne contient pas ce qui gère (dans l'exemple présent) la progression éducative. C'est la compilation des données d'apprentissage qui contient ce qui gère cette progression, mais cela n'est pas un document administratif a priori. L'algorithme qui gère cette progression est inconnu des humains qui ont mis en place le système puisqu'il est le produit d'un apprentissage par l'IA.
Cela est d'autant plus vrai que dans l'article de BFMTV, il est écrit :
Le ministère aura donc beau jeu de vous répondre à juste titre que le document que vous demandez n'existe pas.
C'est toute la difficulté des solutions mises en place avec de l'IA, l’humain ne sait pas comment la solution fonctionne et est incapable de l'expliquer aux utilisateurs.
#5.1
Pour certains, IA = réseau de neurones. Pour d'autre, IA = apprentissage sur la base de données. Pour la seconde définition, une simple régression linéaire est une IA.
Autant je suis d'accord avec ce que tu dis lorsqu'il s'agit de réseau de neurones, où, au final, on ne sait pas trop ce qui se passe, autant cela a du sens dans le cadre de la seconde définition. Je donnais l'exemple de régression linéaire, mais un algorithme de scoring rentre aussi dans cette catégorie par exemple. De même que les réseaux de Markov. Et ce ne sont que quelques exemples... Il en existe bien d'autres.
Et comme IA est un buzzword, on essaie aujourd'hui de le caser à toutes les sauces. Il y a quelques mots comme ça, tellement dénaturé qu'ils ne signifient plus grand chose...
#5.5
Un peu comme Internet.
Pour beaucoup, ce n'est que le Web.
Dans la réalité, c'est un ensemble bien plus multiple de protocoles de communication.
#5.2
Oui, et non. Une fois que tu as ton modèle entrainé, tu peux lui faire rejouer une immense quantité de données d'entrée, et faire des statistiques sur sa capacité à répondre correct dans toutes les circonstances, ou pas. C'est comme ça que tu détermine son niveau d'erreur et donc sa précision.
Et de la sorte tu peux prouver, juste en fournissant ces nuages de points, que ton modèle est prédictif tant que tu l'utilise dans les limites pour lesquelles tu l'as construit.
Ensuite, tu peux aussi regarder comment il se comporte quand tu sors de ces limites.
Donc s'il est difficile d'expliquer son fonctionnement, ou son "raisonnement" pour produire une solution en fonction de ses entrées, tu peux démontrer empiriquement qu'il fait correctement ce qu'il doit faire.
Et dans le cas des modèles auto-évolutifs, tu peux (tu dois !) répéter périodiquement la vérification pour t'assurer qu'il ne diverge pas, mais au contraire qu'il se renforce (en précision, en étendant ses limites d'entrées, etc.)
#5.3
Comme je partais de la demande de l'algorithme, je pensais que c'était évident que je parlais de cela.
#5.4
#5.6
saute par la fenêtre
#6
En gros c'est l'IA qui va remplacer le prof (ou les pions / parents / accompagnants / ...) ?
#6.1
Je ne sais pas dans quelle mesure un outil de ce type pourrait réduire ces inégalités, mais ça peut peut-être aider.
#6.6
Ils ont tous des profs / pions / accompagnants, non ?
De plus même si je conviens que cela peut êetre une aide (pour répondre à un devoir par exemple), rien ne remplace l'échange humain. Si je lis seul un texte, ou qu'on me l'explique oralement, ma compréhension peut être totalement différente.
#6.7
Le "à la maison" correspond au lieu d'intervention des parents.
Et l'outil propose des exercices adaptés au niveau de l'élève. Cela permet probablement une personnalisation de la progression que ne permet pas un prof qui doit s'occuper de plein d'élèves à la fois et qui aura du mal à donner des exercices différents à chaque élève.
Ce logiciel n'intervient de toute façon pas dans les établissements d'enseignement où les profs ont toujours leur rôle à jouer.
Je laisse les pions de côté parce que leur travail n'est pas d'enseigner. Quant aux accompagnants, je ne sais pas ce que c'est. Si tu parles de ceux qui s'occupent des enfants en situation de handicap (AESH), je pense que ce n'est pas le sujet car ce logiciel s'adresse à tous.
#6.8
Ca tombe bien, ce n'est pas le rôle de l'IA non plus. On parle d'"approfondissement", donc les pions peuvent assurer cette tâche (peut-être dans tous les lycées).
#6.9
Donner des exercices aux élèves, c'est de toute façon un rôle lié à l'enseignement. Les pions n'ont pas ce rôle et ne sont pas capables de l'avoir (ils ne sont pas recrutés ni payés sur ce critère). De plus, il s'agit ici d'adapter les exercices au niveau de l'élève, c'est encore plus compliqué. En l'absence d'IA, le mieux placé pour le faire dans tous ceux que tu as cités, c'est les profs, mais ils n'ont pas le temps de faire du sur mesure pour chaque élève.
#6.10
D'où l'intérêt de l'IA, permettant à plus d'élèves de profiter d'explications et d'un accompagnement.
#6.2
#6.3
Oui
Oui et non.
A part si on parle des orphelins, en général les parents sont là, en tous cas au moins un. S'ils n'accompagnent pas les gosses, c'est qu'ils ont choisi de prioriser autre chose (ainé d'une famille de 3 avec mère seule, j'en sais quelque chose).
Donc ce n'est pas une inégalité à proprement parler, c'est un choix.
#6.4
#6.5
Inégalité au sens strict peut-être.
Mais pas systémique, donc ca va.
#7
C'est beau l'espoir
#8
#8.1
#8.3
#8.9
Mais je t'en prie, si tu as des idées précises de là où ça peut être un scandale, dis nous le, parce que franchement, moi, je ne vois pas.
Au pire, ça ne sert à rien, au mieux, ça permettra aux élèves les plus faibles de progresser à leur rythme plutôt que d'essayer en vain de suivre le rythme de la classe qui est trop rapide pour eux.
#8.2
ou de ça https://next.ink/brief_article/le-code-source-de-la-caf-revele-une-categorisation-discriminatoire-des-allocataires/
?
#8.4
#8.5
- "pas du tout soutenu par des statistiques" : en es-tu sûr ? Ou plutôt, as-tu une source pour dire ca ?
- biais "misogynes" et "racistes" : tu ne vas pas un peu vite ? Des femmes seules et l'adresse des guettos, moi la première chose que ca m'évoque c'est "pauvreté" (a priori soit les plus enclins à frauder -par nécessité je dirais-, soit -plus certainement- la population qui constitue les allocataires les plus fréquents, par définition ; soit les deux), mais pas du tout "discrimination basée sur le sexe ou l'ethnie"
C'est étonnant que l'argument social soit si souvent employé d'un côté pour éluder des choses, et si souvent oublié d'un autre côté pour mettre d'autres choses en avant.
Sinon d'accord avec toi que la transparence dans l'action publique est un intérêt en soi.
#8.6
L'ordre de grandeur (le milliard d'euros) est aussi inférieur au "non recours" i.e. les personnes qui ont droit à l'aide et qui ne la réclament pas.
Un joli graph ici : https://www.aide-sociale.fr/infographie-fraude-sociale-particulier-entreprise/
Ces données sont publiques, elles sont juste peu médiatisées par les "gros" médias,d'où l'importance d'un NEXT. Le biais cognitif associé (les "plus pauvres que moi" sont forcément plus fraudeur que moi, je trime alors qu'ils foutent rien) est bien entretenu par les groupe (Bolloré et Bouygues en tête, mais ils sont pas les seuls) mais est heureusement largement (statistiquement) sans fondement.
Ma conclusion évidente, (mais c'est la mienne et n'engage que moi) est qu'il serait bien plus rentable pour les finances publiques de courir après les fraudes faites par peu de gens pour des gros montants que d'aller chercher des centaines de milliers de foyers pauvres pour de petits montants.
Mais c'est un choix politique, et l'algorithme en question (c'est même pas le sujet initial de l'article, désolé) a donc une visée politique. Je crains donc qu'un outil numérique opaque destiné à l'Education Nationale suive le même chemin. Ma question initale c'était de savoir si la requête de NEXT était du même ordre que celle de la Quadrature du Net.
Je sais pas tirer le trait de où est la limite dans ce que NEXT veut couvrir comme sujet, peut-être que là on passe de l'autre côté d'une ligne qu'ielles ne souhaitent pas franchir. C'est leur choix et je le respecte
#8.7
Or tu parlais de la CAF. Tu sais que la CAF n'a pas grand chose à voir avec les entreprises ? (d'où le "familiales" ?)
Dans le domaine d'action de la CAF (une partie des allocations sociales versées aux particuliers donc), je ne suis pas certain que ce soient les plus riches qui fraudent, pour la bonne et simple raison que leur revenus leur ouvrent droit à moins d'allocations.
J'ai plutôt l'impression que c'est toi (sans animosité aucune) qui entretient un amalgame courant ici, entre particuliers riches et entreprises, fraude à l'impôt et aux allocs, etc.
La CAF, elle et je le répète, dans son domaine d'action elle ne peut agir que sur... la fraude aux allocations, comme son nom l'indique.
Et si j’étais taquin, j'irais regarder su côté du financement des associations et de l'adéquation entre les sommes versées et le service rendu,,pour rigoler un minimum. Ca, très peu de gens en parlent.
#8.8
Le graph compare ce que volent quelques riches à ce que volent tout un paquet de pauvres quel que soit le sujet. il est donc très pertinent. Mon point c'est que l'existence même d'un algo tel que celui-ci de la caf est un choix politique alors qu'on laisse les riches frauder le fisc en leur donnant même des médailles pour ça.
Je le prends pas mal, mais amalgame n'est pas le bon mot. Il faut en effet comparer les moyens de fraude du pauvre (quelques centaines d'euros sur mon APL), de celui de la classe moyenne (pas cocher la case de la redevance tv quand elle existait, prendre un peu de taf au black) de celui du riche dans lequel il faut en effet inscrire l'entreprise car c'est par ce chemin là que le riche a la majorité de ses revenus (revenus du capital) (défisc massive, paradis fiscaux, non déclaration de salariés... bref les trucs connus).
C'est une vision trop étroite de comparer que sur le social car justement le riche d'en tire presque rien à son échelle (c'est un truc de pauvres comme tu le dis toi-même d'une autre façon).
EDIT: vol de l'état (taxes, impots) et vol des partenaires sociaux sont ici en effet assimilés car il s'agit toujours de tromper la redistribution.
Pour faire simple, le riche a accès a des outils de fraudes faciles, accessibles et surtout de haut rendement (oui il faut payer l'avocat fiscaliste qui va bien, ou le conseiller en gestion de patrimoine). il est peu surveillé et peu menacé et les sanctions sont de vulgaires redressements. Le pauvre a accès à des outils peu rentables, est surveillé façon gestapo, et la sanction (suppression des alloc) arrive sans prévenir, de façon alléatoire (merci l'algorithme) avec peu de moyen de remédiation, et pousse les gens vites à la rue, et aucune responsabilité/condamnation du législateur qui se cache derrière l'algo et sa prétendu neutralité.
#8.10
La base déjà, c'est qu'il faut agir de tous les côtés en même temps. Fraude sociale, fraude aux impots, fraudes en tout genre, bref sur toutes les fraudes.
Alors, en fait l'état agit déjà sur tous les fronts, exemple ceux qui ne déclarent pas leur piscine, récemment vu ici. Et sur d'autres sujets aussi : si tu te fais gauler à faire bosser quelqu'un au black, tu prends cher. Idem quand tu te fais choper à ne pas declarer des salariés, les exemples sont nombreux. Et les sanctions vont jusqu'à la prison ferme, souvent la faillite et aussi l'interdiction de monter des boites pendant X années. Tu gagnes plus gros certes, mais quand tu te fais choper tui perds aussi plus gros, c'est le corolaire.
Tu parles d'avocat fiscaliste, de conseiller en patrimoine, etc. Ici, ce n'est pas de la fraude mais de l'optimisation : l'état ne peut pas condamner ce qui est légal. Et crois bien que je déplore que ce soit légal d'optimiser, mais c'est un fait.
Bref, moi ca ne me choque pas qu'on aille toucher tous les fraudeurs en même temps. Je te dis juste que chaque organisme a son périmètre d'action : la CAF ne peut agir que sur la fraude aux allocs, et là ce sont les pauvres qui fraudent le plus selon toute probabilité.
Ce qui n'empêche pas que l'URSSAF doive aussi aller gérer de son côté ce qu'elle peut gérer (la fraude aux cotisation de entreprises) et le fisc aussi ce qu'il peut gérer (fraude aux declarations de revenus, etc.)
Dire que la CAF fait du racisme et de la misogynie en ciblant les femmes seules et les immigrés (qui sont parmi les plus pauvres en France, donc les bénéficiaires d'allocations principaux) c'est à mon avis aussi logique que de dire que l'URSSAF fait du racisme antiblanc et de la "richophobie" en ciblant les patrons (qui sont souvent riches et blancs).
C'était le sens de mon propos.
#8.14
#8.11
Le système de com quand on édite merdouille un peu j'ai l'impression
#8.15
mdr
Pas de la fraude, donc.
Faux et faux.
#8.12
S'attaquer aux fraudeurs quels qu'ils soient est un problème ?
Je ne comprends pas l'argument: les pauvres ne paient pas d'impots sur le revenu et les riches n'ont pas accès aux aides de la CAF.
Ou alors tu veux dire qu'il faut traquer un type de fraudeur pour permettre à un autre de continuer sans problème.
#8.13
#8.16
Sauf que ça c'est ton ressentiment biaisé, et pas la réalité.
#9
C'est la qu'on voit que dès le départ il y a un problème de compréhension: il n'a jamais été dit (y compris dans les communications officielles) qu'il s'agissait d'un système gérant la progression éducative mais d'un système d'aide adaptée en fonction du niveau de l'élève.
De plus ce système est complémentaire avec l'enseignement reçue dans un établissement. Il ne se substitue à rien sauf éventuellement à l'aide que les parents peuvent donner à la maison.
C'est donc un outil mis à disposition mais qu'il n'est en rien obligatoire d'utiliser, au contraire de parcoursup.
Quant à l'algo, je ne serais pas étonné qu'il s’agisse d'un simple algo prenant en compte le nombre de bonnes réponses sur les x derniers apprentissages pour fournir un exercice en adéquation avec les capacités de l'élève.
Bref, je me demande ce que vous cherchez à trouver...