Connexion Abonnez-vous

Deep learning sur des photos d’enfants autistes : des articles scientifiques rétractés

Ethique en toc

Deep learning sur des photos d’enfants autistes : des articles scientifiques rétractés

User/Chimera – Clarote & AI4Media – Better Images of AI

Plusieurs recherches incluant l'entrainement de réseaux de neurones font l'objet d'une attention particulière, parfois plusieurs années après leur publication. En cause l'utilisation d'une base de données de photos posant des problèmes éthiques concernant le consentement des enfants ayant des troubles autistiques concernés. L'éditeur Springer Nature est en train de rétracter des dizaines d'articles scientifiques.

Le 10 décembre 2025 à 10h58

Des dizaines d'articles scientifiques sont actuellement scrutés, notamment par l'éditeur scientifique Springer Nature, pour une éventuelle rétractation. Certains, comme cette meta analyse sur les approches utilisant le deep learning pour prédire l'autisme publiée en 2024, ont déjà fait l'objet d'une rétractation récemment.

Des travaux scientifiques qui soulèvent des questions éthiques

Les chercheurs et éditeurs auraient pu commencer par interroger le bien-fondé de mettre en place une reconnaissance de traits autistiques sur le visage d'enfants en utilisant le deep learning. La littérature scientifique montre que ces questions n'ont pas arrêté nombre de chercheurs.

Mais une nouvelle question éthique apparait, mise au grand jour par The Transmitter. Ce média spécialisé en neurosciences vient de découvrir que plusieurs dizaines d'articles scientifiques sur le sujet s'appuient, en fait, sur une base de données de visages d'enfants créée en 2019 par Gerald Piosenka, un ingénieur à la retraite. Celui-ci l'avait mise en ligne sur la plateforme Kaggle rachetée en 2017 par Google, qui permet à la communauté des machine learning et deep learning de partager des données, codes, modèles, etc.

L'utilisation d'une base de données créée sans le consentement des enfants

Cette base de données contient plus de 2 900 photos d'enfants, dont la moitié est étiquetée en tant qu'autistes. Comme l'a repéré The Transmitter, Gerald Piosenka explique dans un commentaire posté en 2022 que Kaggle a supprimé la base de données parce qu'elle ne respectait pas ses conditions d'utilisation. Mais l'ingénieur l'a remis rapidement en ligne via Google Drive.

Dans la description de la base, Gerald Piosenka explique la manière dont il a procédé pour la créer : « J'ai cherché partout une base de données contenant des images faciales d'enfants autistes. À ma connaissance, il n'en existe aucune. J'ai donc dû développer cette base de données à partir de recherches sur Internet. J'ai principalement trouvé ces images sur des sites web consacrés à l'autisme. En général, j'ai dû télécharger une image particulière, qui était souvent une photo de groupe, puis recadrer manuellement l'image pour ne garder que le visage de l'enfant ».

Questionné par un utilisateur de Kaggle sur l'exclusion de certaines photos pour des questions de vie privée et sur l'obtention du consentement, Gerald Piosenka a répondu que « toutes les images ont été recueillies à partir de sites Web accessibles au public et de recherches Google. Aucune restriction en matière de confidentialité n'a été violée » et a justifié sa démarche en affirmant que sa motivation était « altruiste » et qu' « en matière d'éthique, comment peut-on être plus éthique que d'essayer de favoriser le dépistage précoce et le traitement de l'autisme chez les enfants » sans prendre en compte le signalement sur le besoin de consentement.

Près de 40 articles scientifiques sont étudiés par Springer Nature pour une éventuelle rétractation selon un des conseillers en intégrité de la recherche de l'éditeur interrogé par The Transmitter. Le média a, de son côté, recensé au moins 90 articles (publiés aussi par d'autres éditeurs comme Wiley, IEEE, Elsevier, MDPI ou encore Cell Press) qui citent une version de la base de données.

Commentaires (37)

votre avatar
Pourquoi se faire chier avec le consentement si c'est pour la bonne cause ...
votre avatar
Techniquement, rien que le flag "autiste" c'est déjà un problème ici, non?
votre avatar
Techniquement, rien que le flag "autiste" c'est déjà un problème ici, non?
Vas-y, explique nous en quoi être autiste c'est techniquement un flag à problème ici.
Et soit convainquant, tu joues tous tes points de vertu sur ce coup la. :devil:
votre avatar
"Et soit convainquant, tu joues tous tes points de vertu sur ce coup la. :devil:"
Ben ça me paraît simple: posséder une base de données de photo de visages de personnes (= donnée identifiante ET potentiellement biométrique) et flaguer les photo avec une caractéristique médicale = un gros red flag du DPO.
votre avatar
très jolie pirouette du joueur Français. :yes:
votre avatar
Ma barre de vertu est resté au même niveau? (je n'irais pas dire qu'elle est full)
votre avatar
De quel DPO parles-tu ? Il s'agit de données rassemblées par quelqu'un vivant aux USA, en Arizona. Point de RGPD là-bas. Et on n'a aucune info sur où vivaient ces enfants à ma connaissance.
votre avatar
C'est juste un réflexe.
votre avatar
nous t'écoutons, en quoi c'est un redflag?
votre avatar
Donnée médicale ?
votre avatar
Et ?
votre avatar
sur les articles scientifiques c'est souvent des données médicales :D
votre avatar
Les données collectées sont généralement collectées de façon anonyme. Mais on ne peut pas collecter la photo du visage de quelqu'un de façon anonyme.
votre avatar
@Wosgien roooh ça va, c'est des autistes, c'est pas de vrais humains, c'est connu ! :D
votre avatar
Merci, ça me semblait tellement évident que je ne l'ai pas précisé 😑…
votre avatar
Probabilité que le retrait soit davantage motivé par une réaction émotionnelle plutôt que par l'éthique scientifique ? hmm... je dirais... élevé.

Vous vous rendez compte ? C'est des enfants. Et autistes en plus. Ah lala lala...
votre avatar
Je me fait une remarque :
même si la légalité des données utilisées sont discutables, mais que leur qualité est correcte, la connaissance qui en est extraite reste vraie et utile. Ca me pose du coup un problème de devoir retirer des articles qui ont pourtant une valeur scientifique.

Car si c'est le cas contraire, il y a pas mal d'études sur le cancer et en particulier sur celui du col de l'utérus qui devrait être aussi jeté au feu parce qu'elles ont utilisé la lignée cellulaire HeLa sans l'accord de la personne ni de sa famille.
votre avatar
Le fait de ne pas respecter des points éthiques de base met aussi le doute sur toute la conduite de la recherche en question. C'est souvent pour ça que les articles sont rétractés dans ce genre de cas. Et la connaissance scientifique ne se base pas que sur un seul article pour affirmer quelque chose.
Soit d'autres recherches peuvent confirmer la connaissance mise en avant, soit il faut essayer de reproduire (en réfléchissant aux questions éthiques avant ;) ) dans de meilleures conditions.

(mon commentaire est général sur les questions de rétractation)
votre avatar
Le fait de ne pas respecter des points éthiques de base
En quoi y a-t-il un problème éthique ?
Quel comité d'éthique a condamné la manière dont ont été rassemblé ces photos et quels points on été reprochés ?

Si les recherches s'appuyant sur ces données ne sont pas scientifiquement fondées, ok, on rétracte les articles, mais on ne doute pas de la qualité de la recherche sur un hypothétique problème éthique.

Voir mon autre commentaire qui explique pourquoi je n'y vois pas de problème même d'un point de vue de l'UE.
votre avatar
Le rassemblement des photos a été fait hors du cadre d'une étude scientifique et les comités d'éthique n'ont jamais été mis dans la boucle et n'ont jamais eu l'occasion de faire valoir leurs réserves.

En revanche, ils sont tout à fait fondés à interdire à des scientifiques d'utiliser cette base.

Ce serait sûrement vachement pratique de pouvoir juste demander à un pote non-chercheur de s'occuper de toute la partie non-éthique d'une recherche et de n'avoir plus ensuite qu'à se servir pour contourner les comités, mais ce n'est fort heureusement pas comme ça que ça marche.

Et à supposer que la base soit légale - ce qui me semble très incertain ne serait-ce que du point de vue du droit à l'image - ça ne veut pas dire pour autant qu'elle est éthique au plan scientifique. Un tas d'actes légaux sont interdits par les comités d'éthique.
votre avatar
Le rassemblement des photos a été fait hors du cadre d'une étude scientifique et les comités d'éthique n'ont jamais été mis dans la boucle et n'ont jamais eu l'occasion de faire valoir leurs réserves.
Ah. voila.
Le problème éthique c'est qu'on n'a pas demandé s'il y a un problème éthique.
:mdr:
votre avatar
Oui, la science c'est pas comme les techbros, c'est pas "on fait avant, et éventuellement on s'excuse après". On réfléchit à l'éthique avant d'agir, pas après. Sinon on risque la rétraction au mieux, les ennuis disciplinaires au pire.
votre avatar
Oui, la science c'est pas comme les techbros, c'est pas "on fait avant, et éventuellement on s'excuse après". On réfléchit à l'éthique avant d'agir, pas après. Sinon on risque la rétraction au mieux, les ennuis disciplinaires au pire.
Cher Monsieur Copernic,

Nous vous remercions sincèrement pour l'intérêt que vous portez à l'étude du Monde tel que Dieu l'a créé et pour le temps que vous avez consacré à la collecte des mouvements planétaires apparents. Cependant, après une étude attentive de votre demande par notre comité d'éthique, nous sommes au regret de vous informer que nous ne pouvons pas donner une suite favorable à la poursuite de vos travaux.
votre avatar
C'est pour ça que les comités d'éthique sont aujourd'hui gérés par la communauté scientifique elle-même, et pas par l'Église catholique ou par l'Association des empêcheurs de tourner en rond.

Sans dec, peut-être que tu peux te renseigner 2 minutes sur comment marchent les règles d'éthique dans la communauté scientifique avant de multiplier les commentaires de type "comptoir de bar PMU" ?
votre avatar
Sans dec, peut-être que tu peux te renseigner 2 minutes sur comment marchent les règles d'éthique dans la communauté scientifique avant de multiplier les commentaires de type "comptoir de bar PMU" ?
N'hésite pas a nous dire comment fonctionnent les règles d'éthique dans la communauté scientifique dans le cas présent.
votre avatar
Martin en a déjà décrit les grandes lignes deux commentaires plus bas. Mais bizarrement ça n'a pas eu l'air de t'intéresser autant que de saisir une bonne occasion de troller.
votre avatar
Du coup, si je suis ta logique, les études qui ont été faites sur la lignée HeLa avant l'accord que la famille a finalement donné doivent être retirées ? Mais quid des études qui se base sur les découvertes des études précédentes, faut-il les retirer, car elles se basent sur des connaissances qui ont "disparu", gommé de la vérité ? Et faut-il faire ça de manière récursive ?

Juste comme ça, tu élimines pratiquement l'intégralité de la recherche sur le cancer.

On peut aussi chasser les chercheurs qui ont utilisé scihub aussi. Niveau éthique ce n'est pas terrible non plus, surtout là, ils sont bien conscients qu'ils n'ont pas le droit. Du coup, la conduite de la recherche réalisée par ces personnes est douteuse ?

Les scientifiques qui ont utilisé la base de donnée, ont réalisé une étude qui a été validé par des pairs afin qu'elle soit publiée dans un journal. Le travail est donc qualitatif, et les connaissances qu'elle a créées n'est pas plus à remettre en doute qu'un quelconque article publié dans le même journal.

Cependant, je distingue bien le cas des études antérieur à la remise en cause de la légalité de la base de données (au passage, est-ce qu'il y a un commité qui a tranché sur la question ? je n'ai rien vu dans l'article là-dessus) et celle postérieure. Effectivement, à partir de là, tu n'utilises plus cette base de donnée, les pairs devraient de toute façon refuser la publication.
votre avatar
@fred42 Ce n'est pas ma logique ou mon opinion. C'est le fonctionnement du système mis en place par les chercheuses et chercheurs pour garder une recherche éthique.

L'éthique scientifique n'est pas seulement encadrée par la loi.

Il existe des comités d'éthique dans les universités, centres de recherche, revues et chez les éditeurs. Je ne vais pas écrire un article sur tout ça ici mais en gros, ces comités d'éthique encadrent à leur niveau l'éthique de la recherche. Par exemple, au CNRS, c'est le rôle du COMETS. Chacun s'appuie sur des textes (chartes, contrats, etc).

Les décisions peuvent être prises à plusieurs niveaux. Ici, comme l'éditeur engage aussi sa responsabilité sur la publication d'un article, il est logique que son comité d'éthique puisse avoir quelque chose à redire. Par exemple, sur la meta analyse que je cite en début d'article, Springer Nature a pris la responsabilité de rétracter l'article en l'expliquant brievement dans une notice. Celle-ci dit d'ailleurs que les auteurs ne sont pas d'accord (ce qui n'empêche pas l'éditeur de le faire).

Edit: et j'ai oublié d'indiquer, concernant la récursivité du problème, que dans un ancien article, je parle d'un outil qui permet de retrouver les articles scientifiques rétractés et cités par d'autres. Donc oui, les chercheuses et chercheurs sont bien au courant que c'est complexe mais ils ont l'air de préférer ça à construire des géants aux pieds d'argile.
votre avatar
Merci pour la réponse.

La notice en lien dit 2 choses :

1) on n'est pas sûr que les photos soient des photos d'enfants souffrant de TSA en l'absence de traçabilité.

2) En plus, il n'y a pas de preuve d'un contrôle éthique sur l'étude ou d'un consentement des enfants ou de leurs représentants légaux.

Le premier point à lui seul suffit à invalider l'étude.
Le second point est "en plus" (Additionally). Je ne suis pas sûr que lui-seul aurait fait invalider l'étude. En tout cas, la traçabilité du consentement aurait suffit.

Et le second point ne dit pas que l'étude n'est pas éthique mais que l'on n'a pas la preuve qu'il y ait eu un contrôle de l'éthique par un comité.

Donc,
Le fait de ne pas respecter des points éthiques de base met aussi le doute sur toute la conduite de la recherche en question.
me semble un peu rapide et n'est pas exprimé tel quel dans cette notice.
votre avatar
De toute façon, le jeu de données semble biaisé dès le départ par la méthode de collecte.

On est déjà probablement sur des degrés d'autisme élevés pour qu'ils soient impliqués dans des associations ou dans des activités spécifiques.
Pire, on recadre un visage d'enfant autiste depuis une photo de groupe pour comparer avec un neurotypique, qui lui semble pas du tout recadré d'une photo de groupe. Donc un comportement complètement différent devant l'appareil photo (pris de plus loin, pas le sujet principal, etc.), ce qui est d'autant plus vrai pour des enfants qui, a priori, ont plutôt du mal à être entourés d'autres personnes.
votre avatar
D'un point de vue scientifique, je n'ai aucune idée de la validité des études pouvant découler de cet ensemble de données et la rétractation des articles devrait s'appuyer uniquement sur l'aspect scientifique.

Sur l'aspect éthique, j'ai du mal à voir où est le problème.

L'auteur de cet ensemble de données est américain. On ne sait rien de la nationalité des enfants a priori.

Comme on parle de consentement, j'ai d'abord cru que la législation applicable était le RGPD, mais cela serait vrai si l'on avait des enfants de l'UE dans le dataset, ce que l'on ignore.

Restons cependant sur le RGPD qui est la législation que je connais le mieux.
Celui-ci autorise dans ses articles 9 ( j du 2.) et 89. Il faut juste qu'il y ait un équilibre entre le but du traitement et la protection des données comme c'est souvent le cas en l'absence de consentement.

Comme le RGPD plutôt protecteur autorise ce genre de traitements sans consentement, je ne vois pas de problème éthique.

Si scientifiquement les résultats se tiennent, le traitement est justifié.
votre avatar
Ça parait pourtant simple, non ? On ne constitue pas une base de données de photos d’enfants collectées sur internet sans au minimum demander la permission des parents, ou directement aux enfants si entre temps elles sont devenues adultes. Leur nationalité, le RGPD ou je ne sais quoi, ce n’est pas une question de législation. Faire ça en douce, c’est hyper creepy.
votre avatar
Quid de l'organisme qui a publié la photo sur son site ?
votre avatar
Lui a peut-être eu l'autorisation pour la publier sur son site (et pas plus).
votre avatar
Le RGPD autorise ce type de traitement pour une base de données dont l'accès est filtré et tracé et pour laquelle il y a un responsable. Le cas présent, c'est une base sauvage en accès libre.

Scientifiquement, les résultats peuvent être bons. Légalement, ça ne pourra pas être publié.
votre avatar
C'est vrai pourquoi ne pas naître sans troubles?
J'en souffre personnellement d'un. Pourquoi une telle injustice est-elle possible à la naissance?
Car malheureusement, c'est l'un des principaux facteurs de l'apparition d'une pathologie.
votre avatar
Je ne comprends même pas l'intérêt de l'étude. Sauf si elle sort un résultat net, ce dont je doute, sinon on saurait tous instinctivement détecter un autiste en regardant son visage. Ce qui n'est pas le cas.

Deuxièmement, la méthode. C'est nul d'utiliser des photos prises "normalement". Les photos sont encodées de façon à faire ressortir le RGB. Donc: uniquement ce qui est visible à l'humain.
On sait par exemple (il y a des reconstitutions) que les plumes d'oiseau ont plus de "couleurs" mais deans des spectres inaccessibles à l'humain mais accessible aux oiseaux.
Ce qui limite l'être humain et sa perception à différencier un oiseau d'un autre!

Quand on entrainer l'IA, il faut maintenant passer la vitesse supérieure: l'entrainer avec des capteur que nous n'avons pas! Cela lui permettrait d'être plus efficace à détecter des choses que nous ne pouvons pas détecter à cause des handicaps de toute notre espèce.

Bref, étude bas du front?

Deep learning sur des photos d’enfants autistes : des articles scientifiques rétractés

  • Des travaux scientifiques qui soulèvent des questions éthiques

  • L'utilisation d'une base de données créée sans le consentement des enfants

Fermer