IBM s’explique sur les photos utilisées pour entraîner sa reconnaissance faciale
Le 13 mars 2019 à 09h35
2 min
Sciences et espace
Sciences
En janvier, IBM annonçait la mise à disposition pour des travaux de recherche d’un lot de données spécialement conçu pour travailler l’équité des systèmes de reconnaissance faciale. Comprendre l’éradication de potentiels biais ethniques ou de couleur de peau.
Comme le révèle NBC cependant, ce lot de données a été puisé dans Flickr, plus précisément dans un lot de 99,2 millions de photos, connu comme « collection YFCC100M ». Elle avait été composée par Yahoo, ancien propriétaire de Flickr, pour conduire là aussi des recherches.
La mention CC dans le titre de la collection fait référence à Creative Commons, qui suppose dans la majorité des cas une utilisation libre des clichés, mais avec quelques limites. Or, se pose désormais la question de savoir si IBM pouvait s’en servir pour entraîner ses algorithmes.
Le problème est résumé par NBC : les personnes photographiées n’ont pas spécifiquement donné leur accord pour que leur visage serve à entraîner un système de reconnaissance faciale. Plusieurs photographes ont ainsi fait part de leur surprise à nos confrères.
NBC a d’ailleurs développé un outil permettant aux utilisateurs de Flickr d’entrer leur nom de compte pour vérifier si leurs clichés ont été utilisés. Ils ne pourront pas y faire grand-chose cependant.
IBM a cependant précisé à The Verge que tous les principes de vie privée avaient été respectés, que seules des photos disponibles publiquement avaient été utilisées, qu'elles n'étaient disponibles que pour des chercheurs dûment validés et que les personnes concernées pouvaient quitter (opt-out) la base de données.
Le 13 mars 2019 à 09h35
Commentaires