IBM s'explique sur les photos utilisées pour entraîner sa reconnaissance faciale

IBM s’explique sur les photos utilisées pour entraîner sa reconnaissance faciale

IBM s'explique sur les photos utilisées pour entraîner sa reconnaissance faciale

En janvier, IBM annonçait la mise à disposition pour des travaux de recherche d’un lot de données spécialement conçu pour travailler l’équité des systèmes de reconnaissance faciale. Comprendre l’éradication de potentiels biais ethniques ou de couleur de peau.

Comme le révèle NBC cependant, ce lot de données a été puisé dans Flickr, plus précisément dans un lot de 99,2 millions de photos, connu comme « collection YFCC100M ». Elle avait été composée par Yahoo, ancien propriétaire de Flickr, pour conduire là aussi des recherches.

La mention CC dans le titre de la collection fait référence à Creative Commons, qui suppose dans la majorité des cas une utilisation libre des clichés, mais avec quelques limites. Or, se pose désormais la question de savoir si IBM pouvait s’en servir pour entraîner ses algorithmes.

Le problème est résumé par NBC : les personnes photographiées n’ont pas spécifiquement donné leur accord pour que leur visage serve à entraîner un système de reconnaissance faciale. Plusieurs photographes ont ainsi fait part de leur surprise à nos confrères.

NBC a d’ailleurs développé un outil permettant aux utilisateurs de Flickr d’entrer leur nom de compte pour vérifier si leurs clichés ont été utilisés. Ils ne pourront pas y faire grand-chose cependant.

IBM a cependant précisé à The Verge que tous les principes de vie privée avaient été respectés, que seules des photos disponibles publiquement avaient été utilisées, qu'elles n'étaient disponibles que pour des chercheurs dûment validés et que les personnes concernées pouvaient quitter (opt-out) la base de données.

Commentaires (3)


J’ai vu ya quelques temps qu’une IA était capable de faire de nouveaux visages n’appartenant à personne. Pourquoi ne pas fabriquer une base de donnée remplie que de ces visages là pour éviter ce genres de problèmes?








kisame a écrit :



J’ai vu ya quelques temps qu’une IA était capable de faire de nouveaux visages n’appartenant à personne. Pourquoi ne pas fabriquer une base de donnée remplie que de ces visages là pour éviter ce genres de problèmes?





Pour justement améliorer cette IA là.



Après c’est difficile de crier au droit à l’image sur ce type d’algorithmes, car au final, le réseau de neurone c’est juste une pondération de liens, et le set initial d’image est ensuite jeté. Ce n’est pas plus bizarre qu’un être humain qui pourrait parcourir ces images là en scrollant sur un site web, et que ça lui permette de mieux dessiner par la suite.



Si les photos sont sous licence CC BY ou BY-SA il ne devraient y avoir aucun souci juridique ni aucune nécessité d’opposition, sauf si le photographe n’avait pas obtenu le droit à l’image ou au panorama à la base.


Fermer