Deep learning sur des photos d’enfants autistes : des articles scientifiques rétractés
Ethique en toc
User/Chimera – Clarote & AI4Media – Better Images of AI
Plusieurs recherches incluant l'entrainement de réseaux de neurones font l'objet d'une attention particulière, parfois plusieurs années après leur publication. En cause l'utilisation d'une base de données de photos posant des problèmes éthiques concernant le consentement des enfants ayant des troubles autistiques concernés. L'éditeur Springer Nature est en train de rétracter des dizaines d'articles scientifiques.
Le 10 décembre 2025 à 10h58
4 min
Sciences et espace
Sciences
Des dizaines d'articles scientifiques sont actuellement scrutés, notamment par l'éditeur scientifique Springer Nature, pour une éventuelle rétractation. Certains, comme cette meta analyse sur les approches utilisant le deep learning pour prédire l'autisme publiée en 2024, ont déjà fait l'objet d'une rétractation récemment.
Des travaux scientifiques qui soulèvent des questions éthiques
Les chercheurs et éditeurs auraient pu commencer par interroger le bien-fondé de mettre en place une reconnaissance de traits autistiques sur le visage d'enfants en utilisant le deep learning. La littérature scientifique montre que ces questions n'ont pas arrêté nombre de chercheurs.
Mais une nouvelle question éthique apparait, mise au grand jour par The Transmitter. Ce média spécialisé en neurosciences vient de découvrir que plusieurs dizaines d'articles scientifiques sur le sujet s'appuient, en fait, sur une base de données de visages d'enfants créée en 2019 par Gerald Piosenka, un ingénieur à la retraite. Celui-ci l'avait mise en ligne sur la plateforme Kaggle rachetée en 2017 par Google, qui permet à la communauté des machine learning et deep learning de partager des données, codes, modèles, etc.
L'utilisation d'une base de données créée sans le consentement des enfants
Cette base de données contient plus de 2 900 photos d'enfants, dont la moitié est étiquetée en tant qu'autistes. Comme l'a repéré The Transmitter, Gerald Piosenka explique dans un commentaire posté en 2022 que Kaggle a supprimé la base de données parce qu'elle ne respectait pas ses conditions d'utilisation. Mais l'ingénieur l'a remis rapidement en ligne via Google Drive.
Dans la description de la base, Gerald Piosenka explique la manière dont il a procédé pour la créer : « J'ai cherché partout une base de données contenant des images faciales d'enfants autistes. À ma connaissance, il n'en existe aucune. J'ai donc dû développer cette base de données à partir de recherches sur Internet. J'ai principalement trouvé ces images sur des sites web consacrés à l'autisme. En général, j'ai dû télécharger une image particulière, qui était souvent une photo de groupe, puis recadrer manuellement l'image pour ne garder que le visage de l'enfant ».
Questionné par un utilisateur de Kaggle sur l'exclusion de certaines photos pour des questions de vie privée et sur l'obtention du consentement, Gerald Piosenka a répondu que « toutes les images ont été recueillies à partir de sites Web accessibles au public et de recherches Google. Aucune restriction en matière de confidentialité n'a été violée » et a justifié sa démarche en affirmant que sa motivation était « altruiste » et qu' « en matière d'éthique, comment peut-on être plus éthique que d'essayer de favoriser le dépistage précoce et le traitement de l'autisme chez les enfants » sans prendre en compte le signalement sur le besoin de consentement.
Près de 40 articles scientifiques sont étudiés par Springer Nature pour une éventuelle rétractation selon un des conseillers en intégrité de la recherche de l'éditeur interrogé par The Transmitter. Le média a, de son côté, recensé au moins 90 articles (publiés aussi par d'autres éditeurs comme Wiley, IEEE, Elsevier, MDPI ou encore Cell Press) qui citent une version de la base de données.
Deep learning sur des photos d’enfants autistes : des articles scientifiques rétractés
-
Des travaux scientifiques qui soulèvent des questions éthiques
-
L'utilisation d'une base de données créée sans le consentement des enfants
Commentaires (37)
Abonnez-vous pour prendre part au débat
Déjà abonné ? Se connecter
Cet article est en accès libre, mais il est le fruit du travail d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.
Accédez en illimité aux articles
Profitez d’un média expert et unique
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
Abonnez-vousLe 10/12/2025 à 11h26
Le 10/12/2025 à 11h29
Le 10/12/2025 à 11h34
Et soit convainquant, tu joues tous tes points de vertu sur ce coup la.
Le 10/12/2025 à 16h38
Ben ça me paraît simple: posséder une base de données de photo de visages de personnes (= donnée identifiante ET potentiellement biométrique) et flaguer les photo avec une caractéristique médicale = un gros red flag du DPO.
Le 10/12/2025 à 16h51
Le 11/12/2025 à 08h18
Le 10/12/2025 à 19h47
Le 11/12/2025 à 08h20
Le 10/12/2025 à 12h52
Le 10/12/2025 à 13h12
Le 10/12/2025 à 13h23
Le 10/12/2025 à 14h07
Le 10/12/2025 à 16h39
Le 10/12/2025 à 19h37
Le 10/12/2025 à 20h20
Le 10/12/2025 à 11h30
Vous vous rendez compte ? C'est des enfants. Et autistes en plus. Ah lala lala...
Le 10/12/2025 à 11h52
même si la légalité des données utilisées sont discutables, mais que leur qualité est correcte, la connaissance qui en est extraite reste vraie et utile. Ca me pose du coup un problème de devoir retirer des articles qui ont pourtant une valeur scientifique.
Car si c'est le cas contraire, il y a pas mal d'études sur le cancer et en particulier sur celui du col de l'utérus qui devrait être aussi jeté au feu parce qu'elles ont utilisé la lignée cellulaire HeLa sans l'accord de la personne ni de sa famille.
Le 10/12/2025 à 12h04
Soit d'autres recherches peuvent confirmer la connaissance mise en avant, soit il faut essayer de reproduire (en réfléchissant aux questions éthiques avant ;) ) dans de meilleures conditions.
(mon commentaire est général sur les questions de rétractation)
Modifié le 10/12/2025 à 16h11
Quel comité d'éthique a condamné la manière dont ont été rassemblé ces photos et quels points on été reprochés ?
Si les recherches s'appuyant sur ces données ne sont pas scientifiquement fondées, ok, on rétracte les articles, mais on ne doute pas de la qualité de la recherche sur un hypothétique problème éthique.
Voir mon autre commentaire qui explique pourquoi je n'y vois pas de problème même d'un point de vue de l'UE.
Le 10/12/2025 à 13h14
En revanche, ils sont tout à fait fondés à interdire à des scientifiques d'utiliser cette base.
Ce serait sûrement vachement pratique de pouvoir juste demander à un pote non-chercheur de s'occuper de toute la partie non-éthique d'une recherche et de n'avoir plus ensuite qu'à se servir pour contourner les comités, mais ce n'est fort heureusement pas comme ça que ça marche.
Et à supposer que la base soit légale - ce qui me semble très incertain ne serait-ce que du point de vue du droit à l'image - ça ne veut pas dire pour autant qu'elle est éthique au plan scientifique. Un tas d'actes légaux sont interdits par les comités d'éthique.
Le 10/12/2025 à 13h34
Le problème éthique c'est qu'on n'a pas demandé s'il y a un problème éthique.
Modifié le 11/12/2025 à 18h44
Modifié le 11/12/2025 à 18h52
Nous vous remercions sincèrement pour l'intérêt que vous portez à l'étude du Monde tel que Dieu l'a créé et pour le temps que vous avez consacré à la collecte des mouvements planétaires apparents. Cependant, après une étude attentive de votre demande par notre comité d'éthique, nous sommes au regret de vous informer que nous ne pouvons pas donner une suite favorable à la poursuite de vos travaux.
Le 11/12/2025 à 19h04
Sans dec, peut-être que tu peux te renseigner 2 minutes sur comment marchent les règles d'éthique dans la communauté scientifique avant de multiplier les commentaires de type "comptoir de bar PMU" ?
Le 11/12/2025 à 19h14
Le 12/12/2025 à 14h49
Le 10/12/2025 à 15h27
Juste comme ça, tu élimines pratiquement l'intégralité de la recherche sur le cancer.
On peut aussi chasser les chercheurs qui ont utilisé scihub aussi. Niveau éthique ce n'est pas terrible non plus, surtout là, ils sont bien conscients qu'ils n'ont pas le droit. Du coup, la conduite de la recherche réalisée par ces personnes est douteuse ?
Les scientifiques qui ont utilisé la base de donnée, ont réalisé une étude qui a été validé par des pairs afin qu'elle soit publiée dans un journal. Le travail est donc qualitatif, et les connaissances qu'elle a créées n'est pas plus à remettre en doute qu'un quelconque article publié dans le même journal.
Cependant, je distingue bien le cas des études antérieur à la remise en cause de la légalité de la base de données (au passage, est-ce qu'il y a un commité qui a tranché sur la question ? je n'ai rien vu dans l'article là-dessus) et celle postérieure. Effectivement, à partir de là, tu n'utilises plus cette base de donnée, les pairs devraient de toute façon refuser la publication.
Modifié le 10/12/2025 à 16h05
L'éthique scientifique n'est pas seulement encadrée par la loi.
Il existe des comités d'éthique dans les universités, centres de recherche, revues et chez les éditeurs. Je ne vais pas écrire un article sur tout ça ici mais en gros, ces comités d'éthique encadrent à leur niveau l'éthique de la recherche. Par exemple, au CNRS, c'est le rôle du COMETS. Chacun s'appuie sur des textes (chartes, contrats, etc).
Les décisions peuvent être prises à plusieurs niveaux. Ici, comme l'éditeur engage aussi sa responsabilité sur la publication d'un article, il est logique que son comité d'éthique puisse avoir quelque chose à redire. Par exemple, sur la meta analyse que je cite en début d'article, Springer Nature a pris la responsabilité de rétracter l'article en l'expliquant brievement dans une notice. Celle-ci dit d'ailleurs que les auteurs ne sont pas d'accord (ce qui n'empêche pas l'éditeur de le faire).
Edit: et j'ai oublié d'indiquer, concernant la récursivité du problème, que dans un ancien article, je parle d'un outil qui permet de retrouver les articles scientifiques rétractés et cités par d'autres. Donc oui, les chercheuses et chercheurs sont bien au courant que c'est complexe mais ils ont l'air de préférer ça à construire des géants aux pieds d'argile.
Le 10/12/2025 à 16h24
La notice en lien dit 2 choses :
1) on n'est pas sûr que les photos soient des photos d'enfants souffrant de TSA en l'absence de traçabilité.
2) En plus, il n'y a pas de preuve d'un contrôle éthique sur l'étude ou d'un consentement des enfants ou de leurs représentants légaux.
Le premier point à lui seul suffit à invalider l'étude.
Le second point est "en plus" (Additionally). Je ne suis pas sûr que lui-seul aurait fait invalider l'étude. En tout cas, la traçabilité du consentement aurait suffit.
Et le second point ne dit pas que l'étude n'est pas éthique mais que l'on n'a pas la preuve qu'il y ait eu un contrôle de l'éthique par un comité.
Donc,me semble un peu rapide et n'est pas exprimé tel quel dans cette notice.
Le 10/12/2025 à 12h15
On est déjà probablement sur des degrés d'autisme élevés pour qu'ils soient impliqués dans des associations ou dans des activités spécifiques.
Pire, on recadre un visage d'enfant autiste depuis une photo de groupe pour comparer avec un neurotypique, qui lui semble pas du tout recadré d'une photo de groupe. Donc un comportement complètement différent devant l'appareil photo (pris de plus loin, pas le sujet principal, etc.), ce qui est d'autant plus vrai pour des enfants qui, a priori, ont plutôt du mal à être entourés d'autres personnes.
Le 10/12/2025 à 12h17
Sur l'aspect éthique, j'ai du mal à voir où est le problème.
L'auteur de cet ensemble de données est américain. On ne sait rien de la nationalité des enfants a priori.
Comme on parle de consentement, j'ai d'abord cru que la législation applicable était le RGPD, mais cela serait vrai si l'on avait des enfants de l'UE dans le dataset, ce que l'on ignore.
Restons cependant sur le RGPD qui est la législation que je connais le mieux.
Celui-ci autorise dans ses articles 9 ( j du 2.) et 89. Il faut juste qu'il y ait un équilibre entre le but du traitement et la protection des données comme c'est souvent le cas en l'absence de consentement.
Comme le RGPD plutôt protecteur autorise ce genre de traitements sans consentement, je ne vois pas de problème éthique.
Si scientifiquement les résultats se tiennent, le traitement est justifié.
Modifié le 10/12/2025 à 19h27
Le 10/12/2025 à 15h30
Le 10/12/2025 à 20h19
Le 10/12/2025 à 16h57
Scientifiquement, les résultats peuvent être bons. Légalement, ça ne pourra pas être publié.
Modifié le 10/12/2025 à 21h54
J'en souffre personnellement d'un. Pourquoi une telle injustice est-elle possible à la naissance?
Car malheureusement, c'est l'un des principaux facteurs de l'apparition d'une pathologie.
Le 11/12/2025 à 08h26
Deuxièmement, la méthode. C'est nul d'utiliser des photos prises "normalement". Les photos sont encodées de façon à faire ressortir le RGB. Donc: uniquement ce qui est visible à l'humain.
On sait par exemple (il y a des reconstitutions) que les plumes d'oiseau ont plus de "couleurs" mais deans des spectres inaccessibles à l'humain mais accessible aux oiseaux.
Ce qui limite l'être humain et sa perception à différencier un oiseau d'un autre!
Quand on entrainer l'IA, il faut maintenant passer la vitesse supérieure: l'entrainer avec des capteur que nous n'avons pas! Cela lui permettrait d'être plus efficace à détecter des choses que nous ne pouvons pas détecter à cause des handicaps de toute notre espèce.
Bref, étude bas du front?
Signaler un commentaire
Voulez-vous vraiment signaler ce commentaire ?