Connexion Premium

Robots domestiques : la collecte de données d’entraînement passe par le ménage gratuit

Les androïdes rêvent-ils de moutons (de poils) électriques ?

Robots domestiques : la collecte de données d’entraînement passe par le ménage gratuit

Image : 1X

L’industrie de la tech s’est entichée d’une nouvelle marotte : les robots humanoïdes spécialisés dans le nettoyage ou le pliage du linge. Devant l’infinité de ces tâches et des situations, ces androïdes d’un nouveau genre sont encore bien démunis. Une startup a trouvé une solution originale pour collecter le volume de données nécessaire à l’entraînement des robots.

Pour beaucoup, un robot qui s’occupe des tâches du quotidien a comme un avant-goût du paradis, car qui prend réellement plaisir à passer le balai ou faire la vaisselle ? Si les perspectives sont colossales, les premiers constructeurs à se lancer sur le marché se heurtent à une problématique de taille : les données d’entraînement.

Des robots à tout faire, avec l’aide des humains

Autant les modèles d’IA générative peuvent piocher, parfois sans vergogne, dans la littérature produite par l’humanité depuis la nuit des temps pour générer du contenu, il n’existe pas de corpus équivalent pour les robots domestiques. Le constructeur 1X a illustré le problème avec son robot humanoïde Neo. L’engin n’est ni habile ni rapide, et il a aussi régulièrement besoin du coup de main d’un téléopérateur humain pour réaliser certaines tâches pour apprendre les gestes spécifiques à accomplir chez le client.

La startup allemande MicroAGI a imaginé une solution. Au travers de son application Shift, elle propose aux résidents de New York le nettoyage gratuit de leur appartement. L’opération est réalisée par des professionnels, sans frais donc, mais en échange ils portent des caméras qui vont filmer tous leurs gestes. Ces vidéos serviront de données d’entraînement pour des IA.

« La robotique se développe à partir de données qui montrent comment les gens accomplissent leurs tâches quotidiennement », explique Shift. « C’est la valeur de ces enregistrements qui finance le service. » La perspective d’un nettoyage gratuit de sa maison peut séduire pas mal de personnes, mais immédiatement se pose la question de la confidentialité.

Un mouchard à la maison

Le service le promet : « Toutes les informations personnelles [que] contiennent [les vidéos] sont anonymisées avant que les enregistrements ne soient traités ». Les noms, visages « et autres informations personnelles » sont automatiquement anonymisés, annonce la FAQ, « tous les éléments sensibles sont floutés avant d’être utilisés ».

Un agent d’entretien de Shift avec sa caméra.

Le casque porté par les agents chargés du nettoyage capture une vue à la première personne centrée sur leurs mains et sur la tâche en cours. « Nous floutons toutes les informations permettant d’identifier une personne, qu’il s’agisse du contenu affiché sur un écran, de cartes d’identité, de documents papier ou encore de téléphones mobiles, afin de protéger à la fois votre vie privée et votre domicile. »

Le processus de floutage est réalisé directement par la caméra, avant le téléversement des vidéos sur les serveurs. Les données ne sont pas rendues publiques, ni exploitées à des fins publicitaires selon la FAQ. Les enregistrements peuvent toutefois être partagés avec des annotateurs pour préparer les données.

La politique de confidentialité de l’entreprise comprend un droit à l’effacement des données personnelles en vertu du règlement européen sur la protection des données (RGPD)… mais elle considère que les informations anonymisées utilisées pour l’entraînement des robots n’entrent pas dans le champ des lois sur la protection des données.

Une nouvelle forme de « travail du clic »

Shift n’en est pas à son coup d’essai. Le service propose également de rémunérer des cobayes 20 dollars de l’heure pour enregistrer leurs tâches de tous les jours chez eux ou au travail. Au premier trimestre, MicroAGI affirme avoir versé plus de 5 millions de dollars à 10 000 « opérateurs » dans une dizaine de pays.

Shift n’est pas la seule à mettre en oeuvre cette nouvelle forme de travail du clic, dédiée à l’entraînement de technologies censées pouvoir s’adapter aux contraintes physiques du monde réel. Turing, Invisible Technologies, Labelbox, Niantic ou même Uber explorent également cette voie dans des domaines variés.

Commentaires (16)

votre avatar
Ont est tous sur la branche, mais qui la coupe ?
votre avatar
Les extracteurs
votre avatar
Ah je m'y attendais pas à celle-là ! Je pensais qu'on allait nous dire que les robots de maison seraient sponso par les données récupérées chez nous, mais non, ce sont des humains.
Je propose de participer pour apprendre aux IA comme faire des pauses clopes de 20 minutes toutes les 2 heures.
votre avatar
Des grèves, des manifs, dénoncer les crimes et délits des clients, assassiner conjoint.e ou belle-mère discrètement ... Tellement d'options...
votre avatar
Ou des pauses clopes de 2h toutes les 20 minutes. Qu'on appellerait "recharge de batterie".
votre avatar
Hum hum, ça va être drôle quand il faudra entrainer les robots sextoys...
votre avatar
votre avatar
Juste un rappel que les robots qui font la vaisselle existent déjà. Ça s'appelle un lave vaisselles.
votre avatar
Oui, mais faut le remplir, le lancer, le vider ensuite ...
Tu ne te rends pas compte des efforts et de l'énergie dépensée.

Heureusement qu'il existe des esclaves nommés "gamins" pour faire le taf gratuitement.
votre avatar
Le problème avec le mode "gamins", c'est le volume : "Hey mais j'ai déjà fait la dernière fois, c'est à [frère] de faire — Nan c'est même pas vrai !"…
votre avatar
C'est parce qu'il faut les mettre dans le lave vaisselle. Meilleure isolation phonique, moins de bruit.
votre avatar
C'est clair que si tu lances ton lave-vaisselle, il t'en faut des biscotos ... :D
votre avatar
Outre le confidentialité, le “20 dollars de l’heure” sonne bien, mais les chiffres racontent autre chose.

5 millions de dollars pour 10 000 opérateurs, ça fait environ 500 dollars par personne sur un trimestre. À 20 dollars de l’heure, cela représente seulement 25 heures payées en trois mois.

Donc on est peut-être moins sur “un travail bien payé” que sur “quelques missions payées correctement quand il y en a”. Comme souvent avec le microtravail de l’IA, le tarif horaire mis en avant cache surtout l’irrégularité des missions, la variation du prix des tâches ou le faible volume réel de travail disponible.

Au passage, très bon article.
votre avatar
Super le sous titre, sacré roman!
votre avatar
Les données ne sont pas rendues publiques, ni exploitées à des fins publicitaires selon la FAQ. Les enregistrements peuvent toutefois être partagés avec des annotateurs pour préparer les données.
Et vérifier que le professionnel n'a fait fait de pause de 15s pour s'étirer ?
votre avatar
Ca me donne qu'une envie : m'inscrire pour véroler leur jeu d’entraînement, du genre :

  • Tenir en équilibre les verres sur le dos de ma main pour aller les ranger

  • Envoyer les poussières sous les meubles avec le balais

  • Prendre l'éponge de la cuisine pour aller nettoyer les toilettes

  • Frotter les saletés avec l'ongle de mon doigt d'honneur



(la liste d'idée est sans fin !)

=> Y a bien un ou deux truc qui passeront et qu'un rebot reproduira un jour !!!!