Connexion
Abonnez-vous

Microsoft : des transcriptions Skype et Cortana épluchées par des sous-traitants chinois

Microsoft : des transcriptions Skype et Cortana épluchées par des sous-traitants chinois

Le 13 janvier 2020 à 09h08

Nouvel épisode dans la triste suite des scandales liés à l’analyse vocale et aux « assistants ». The Guardian a publié les confessions d’un Anglais travaillant en Chine pour une entreprise ayant eu accès à des fichiers audio provenant de Skype et Cortana.

Ce type de travail « humain » a justement été révélé par le dossier des enceintes connectées, où l’on apprenait que les GAFAM se servaient tous de sous-traitants, souvent étrangers, pour perfectionner leur reconnaissance vocale.

Dans le cas présent, les conditions de travail ont de quoi surprendre : les données étaient disponibles depuis une interface web, accessible depuis l’ordinateur à domicile, dans Chrome, avec un simple duo identifiant/mot de passe envoyé en clair par email.

Surtout, l’employé était capable d’écouter des conversations entières. Lui- même anglais, il ne pouvait écouter que les discussions et commandes vocales dont les appareils étaient réglés en « British English ».

Tout aussi impressionnant, le manque de gestion des personnes impliquées. Il n’y avait par exemple aucune assistance technique, ni de réelle procédure de validation avant d’embaucher les personnes. Selon le concerné, seuls lui ont été demandés quelques détails bancaires.

Ces informations sont en fait le prolongement de celles révélées par Vice l’été dernier. Microsoft affirme depuis que ces pratiques ont été complètements revues.

Les sous-traitants sont désormais sélectionnés avec soin, en provenance d’une courte liste de pays, dont la Chine ne fait plus partie. En outre, les extraits audio sont maintenant limités à 10 secondes.

L’éditeur promet qu’il sera plus transparent sur ce qu’il fait avec ces informations, mais les dégâts sont en partie déjà faits. On aurait apprécié, à l’instar d’Apple (elle aussi fautive), que Microsoft demande directement à l’utilisateur s’il voulait participer à l’amélioration de la reconnaissance vocale. Après tout, Windows 10 pose la question pour la reconnaissance manuscrite.

Le 13 janvier 2020 à 09h08

Commentaires (11)

Vous devez être abonné pour pouvoir commenter.

Abonnez-vous
votre avatar

Toujours triste de voir qu’il faut qu’il se fasse prendre la main dans

le sac pour qu’il assure enfin le niveau de confidentialité qu’il aurait dû être dès le début.

votre avatar

C’est à se demander si AI ne veut pas dire Armée d’Indiens <img data-src=" />

Plaisanterie à part il y a plein de boite qui revendiques le traitement automatique des données via des IA et autres nouveautés technologiques de pointes et qui sont souvent traitées par des sous-traitant dans des pays beaucoup moins cher de façon manuelle.

votre avatar







Kadoc1 a écrit :



Toujours triste de voir qu’il faut qu’il se fasse prendre la main dans le sac pour qu’il assure enfin le niveau de confidentialité qu’il aurait dû être dès le début.&nbsp;





+1, ça en dit long sur le niveau de préoccupation réel de ces entreprises sur ces questions, à mille lieues de ce qu’ils peuvent raconter/afficher/marketer.


votre avatar

Pour ma part je ne fais confiance qu’a signal, telegram, jami et un bon vieux serveur xmpp privés pour mes communications instantanées.

votre avatar







Homo_Informaticus a écrit :



C’est à se demander si AI ne veut pas dire Armée d’Indiens <img data-src=" />

Plaisanterie à part il y a plein de boite qui revendiques le traitement automatique des données via des IA et autres nouveautés technologiques de pointes et qui sont souvent traitées par des sous-traitant dans des pays beaucoup moins cher de façon manuelle.







Je penses aussi. Ce sont 2 lettres qui font beaucoup vendre chez certaines personnes.

D’ailleurs on peut voir un exemple dans le Cache investigation : mon patron est un algorithme.

Où on voit des gens être payé une misère pour regarder des images toute la journée. Et de l’autre coté l’utilisateur crois qu’une IA l’a fait.


votre avatar



On aurait apprécié, à l’instar d’Apple (elle aussi fautive), que Microsoft demande directement à l’utilisateur s’il voulait participer à l’amélioration de la reconnaissance vocale. Après tout, Windows 10 pose la question pour la reconnaissance manuscrite.



Il me semble que la question est posée justement, en tout cas pour ce qui est de Cortana (aucune idée pour Skype)

votre avatar







honyme a écrit :



Je penses aussi. Ce sont 2 lettres qui font beaucoup vendre chez certaines personnes.

D’ailleurs on peut voir un exemple dans le Cache investigation : mon patron est un algorithme.

Où on voit des gens être payé une misère pour regarder des images toute la journée. Et de l’autre coté l’utilisateur crois qu’une IA l’a fait.





Bin en fait c’est un terme qui est conforme.

Ici “Artificielle” correspond bien.

&nbsp;


votre avatar

Si je dis pas de bêtise, c’est bien l’IA qui analyse tes photos et les classe. Mais cette IA, pour qu’elle puisse apprendre, il lui faut un jeu de données déjà classées. Et pour qu’elle progresse, il faut qu’un humain lui donne la bonne réponse quand elle est pas capable de déterminer comment classer. C’est à ça que servent les armées de sous-traitants, à l’amélioration. Pas à répondre aux requêtes des utilisateurs en direct.



Mais ça en reste tout aussi inacceptable que des données personnelles soient analysées de manière non-automatisées sans que l’utilisateur ait donné son consentement explicite.

votre avatar







Rozgann a écrit :



Si je dis pas de bêtise, c’est bien l’IA qui analyse tes photos et les classe. Mais cette IA, pour qu’elle puisse apprendre, il lui faut un jeu de données déjà classées. Et pour qu’elle progresse, il faut qu’un humain lui donne la bonne réponse quand elle est pas capable de déterminer comment classer. C’est à ça que servent les armées de sous-traitants, à l’amélioration. Pas à répondre aux requêtes des utilisateurs en direct.



Mais ça en reste tout aussi inacceptable que des données personnelles soient analysées de manière non-automatisées sans que l’utilisateur ait donné son consentement explicite.





Pas seulement.

Il y a aussi la “contre vérification”. En bref vérifier que l’IA ne se trompe pas. Une sorte d’accompagnement.

&nbsp;C’est donc bien plus long que de produire le jeu de données initiales.

&nbsp;


votre avatar

ça ressemble quand même à une cascade de sous traitance … J’ai quand même du mal à croire que Microsoft puisse envoyer des login + mot de passe en clair dans un e-mail … ça parait tellement fou :eek:



Si vraiment c’est Microsoft qui a sortit ça comme ça c’est vraiment inquiétant en effet … <img data-src=" />

votre avatar

<img data-src=" /> Si, et ils ont même fait mieux, ils ont inventé&nbsp;Microsoft Hello&nbsp;pour te connecter sans login ni mot de passe. Avec ce service le petit indien entraîne l’IA,&nbsp; IA qui lui dira si il peut se connecter ou non. Si il fait bien son boulot la machine accepte qu’il poursuive, si il bosse mal, hop plus de connexion possible <img data-src=" />&nbsp;<img data-src=" />&nbsp;

Microsoft : des transcriptions Skype et Cortana épluchées par des sous-traitants chinois

Fermer