Microsoft : des transcriptions Skype et Cortana épluchées par des sous-traitants chinois

Microsoft : des transcriptions Skype et Cortana épluchées par des sous-traitants chinois

Microsoft : des transcriptions Skype et Cortana épluchées par des sous-traitants chinois

Nouvel épisode dans la triste suite des scandales liés à l’analyse vocale et aux « assistants ». The Guardian a publié les confessions d’un Anglais travaillant en Chine pour une entreprise ayant eu accès à des fichiers audio provenant de Skype et Cortana.

Ce type de travail « humain » a justement été révélé par le dossier des enceintes connectées, où l’on apprenait que les GAFAM se servaient tous de sous-traitants, souvent étrangers, pour perfectionner leur reconnaissance vocale.

Dans le cas présent, les conditions de travail ont de quoi surprendre : les données étaient disponibles depuis une interface web, accessible depuis l’ordinateur à domicile, dans Chrome, avec un simple duo identifiant/mot de passe envoyé en clair par email.

Surtout, l’employé était capable d’écouter des conversations entières. Lui- même anglais, il ne pouvait écouter que les discussions et commandes vocales dont les appareils étaient réglés en « British English ».

Tout aussi impressionnant, le manque de gestion des personnes impliquées. Il n’y avait par exemple aucune assistance technique, ni de réelle procédure de validation avant d’embaucher les personnes. Selon le concerné, seuls lui ont été demandés quelques détails bancaires.

Ces informations sont en fait le prolongement de celles révélées par Vice l’été dernier. Microsoft affirme depuis que ces pratiques ont été complètements revues.

Les sous-traitants sont désormais sélectionnés avec soin, en provenance d’une courte liste de pays, dont la Chine ne fait plus partie. En outre, les extraits audio sont maintenant limités à 10 secondes.

L’éditeur promet qu’il sera plus transparent sur ce qu’il fait avec ces informations, mais les dégâts sont en partie déjà faits. On aurait apprécié, à l’instar d’Apple (elle aussi fautive), que Microsoft demande directement à l’utilisateur s’il voulait participer à l’amélioration de la reconnaissance vocale. Après tout, Windows 10 pose la question pour la reconnaissance manuscrite.

Commentaires (11)


Toujours triste de voir qu’il faut qu’il se fasse prendre la main dans

le sac pour qu’il assure enfin le niveau de confidentialité qu’il aurait dû être dès le début.


C’est à se demander si AI ne veut pas dire Armée d’Indiens <img data-src=" />

Plaisanterie à part il y a plein de boite qui revendiques le traitement automatique des données via des IA et autres nouveautés technologiques de pointes et qui sont souvent traitées par des sous-traitant dans des pays beaucoup moins cher de façon manuelle.








Kadoc1 a écrit :



Toujours triste de voir qu’il faut qu’il se fasse prendre la main dans le sac pour qu’il assure enfin le niveau de confidentialité qu’il aurait dû être dès le début.&nbsp;





+1, ça en dit long sur le niveau de préoccupation réel de ces entreprises sur ces questions, à mille lieues de ce qu’ils peuvent raconter/afficher/marketer.



Pour ma part je ne fais confiance qu’a signal, telegram, jami et un bon vieux serveur xmpp privés pour mes communications instantanées.








Homo_Informaticus a écrit :



C’est à se demander si AI ne veut pas dire Armée d’Indiens <img data-src=" />

Plaisanterie à part il y a plein de boite qui revendiques le traitement automatique des données via des IA et autres nouveautés technologiques de pointes et qui sont souvent traitées par des sous-traitant dans des pays beaucoup moins cher de façon manuelle.







Je penses aussi. Ce sont 2 lettres qui font beaucoup vendre chez certaines personnes.

D’ailleurs on peut voir un exemple dans le Cache investigation : mon patron est un algorithme.

Où on voit des gens être payé une misère pour regarder des images toute la journée. Et de l’autre coté l’utilisateur crois qu’une IA l’a fait.





On aurait apprécié, à l’instar d’Apple (elle aussi fautive), que Microsoft demande directement à l’utilisateur s’il voulait participer à l’amélioration de la reconnaissance vocale. Après tout, Windows 10 pose la question pour la reconnaissance manuscrite.



Il me semble que la question est posée justement, en tout cas pour ce qui est de Cortana (aucune idée pour Skype)








honyme a écrit :



Je penses aussi. Ce sont 2 lettres qui font beaucoup vendre chez certaines personnes.

D’ailleurs on peut voir un exemple dans le Cache investigation : mon patron est un algorithme.

Où on voit des gens être payé une misère pour regarder des images toute la journée. Et de l’autre coté l’utilisateur crois qu’une IA l’a fait.





Bin en fait c’est un terme qui est conforme.

Ici “Artificielle” correspond bien.

&nbsp;



Si je dis pas de bêtise, c’est bien l’IA qui analyse tes photos et les classe. Mais cette IA, pour qu’elle puisse apprendre, il lui faut un jeu de données déjà classées. Et pour qu’elle progresse, il faut qu’un humain lui donne la bonne réponse quand elle est pas capable de déterminer comment classer. C’est à ça que servent les armées de sous-traitants, à l’amélioration. Pas à répondre aux requêtes des utilisateurs en direct.



Mais ça en reste tout aussi inacceptable que des données personnelles soient analysées de manière non-automatisées sans que l’utilisateur ait donné son consentement explicite.








Rozgann a écrit :



Si je dis pas de bêtise, c’est bien l’IA qui analyse tes photos et les classe. Mais cette IA, pour qu’elle puisse apprendre, il lui faut un jeu de données déjà classées. Et pour qu’elle progresse, il faut qu’un humain lui donne la bonne réponse quand elle est pas capable de déterminer comment classer. C’est à ça que servent les armées de sous-traitants, à l’amélioration. Pas à répondre aux requêtes des utilisateurs en direct.



Mais ça en reste tout aussi inacceptable que des données personnelles soient analysées de manière non-automatisées sans que l’utilisateur ait donné son consentement explicite.





Pas seulement.

Il y a aussi la “contre vérification”. En bref vérifier que l’IA ne se trompe pas. Une sorte d’accompagnement.

&nbsp;C’est donc bien plus long que de produire le jeu de données initiales.

&nbsp;



ça ressemble quand même à une cascade de sous traitance … J’ai quand même du mal à croire que Microsoft puisse envoyer des login + mot de passe en clair dans un e-mail … ça parait tellement fou :eek:



Si vraiment c’est Microsoft qui a sortit ça comme ça c’est vraiment inquiétant en effet … <img data-src=" />


<img data-src=" /> Si, et ils ont même fait mieux, ils ont inventé&nbsp;Microsoft Hello&nbsp;pour te connecter sans login ni mot de passe. Avec ce service le petit indien entraîne l’IA,&nbsp; IA qui lui dira si il peut se connecter ou non. Si il fait bien son boulot la machine accepte qu’il poursuive, si il bosse mal, hop plus de connexion possible <img data-src=" />&nbsp;<img data-src=" />&nbsp;


Fermer