Microsoft : des transcriptions Skype et Cortana épluchées par des sous-traitants chinois

Le 13 janvier 2020 à 09h08

2 min

Logiciel

Nouvel épisode dans la triste suite des scandales liés à l’analyse vocale et aux « assistants ». The Guardian a publié les confessions d’un Anglais travaillant en Chine pour une entreprise ayant eu accès à des fichiers audio provenant de Skype et Cortana.

Ce type de travail « humain » a justement été révélé par le dossier des enceintes connectées, où l’on apprenait que les GAFAM se servaient tous de sous-traitants, souvent étrangers, pour perfectionner leur reconnaissance vocale.

Dans le cas présent, les conditions de travail ont de quoi surprendre : les données étaient disponibles depuis une interface web, accessible depuis l’ordinateur à domicile, dans Chrome, avec un simple duo identifiant/mot de passe envoyé en clair par email.

Surtout, l’employé était capable d’écouter des conversations entières. Lui- même anglais, il ne pouvait écouter que les discussions et commandes vocales dont les appareils étaient réglés en « British English ».

Tout aussi impressionnant, le manque de gestion des personnes impliquées. Il n’y avait par exemple aucune assistance technique, ni de réelle procédure de validation avant d’embaucher les personnes. Selon le concerné, seuls lui ont été demandés quelques détails bancaires.

Ces informations sont en fait le prolongement de celles révélées par Vice l’été dernier. Microsoft affirme depuis que ces pratiques ont été complètements revues.

Les sous-traitants sont désormais sélectionnés avec soin, en provenance d’une courte liste de pays, dont la Chine ne fait plus partie. En outre, les extraits audio sont maintenant limités à 10 secondes.

L’éditeur promet qu’il sera plus transparent sur ce qu’il fait avec ces informations, mais les dégâts sont en partie déjà faits. On aurait apprécié, à l’instar d’Apple (elle aussi fautive), que Microsoft demande directement à l’utilisateur s’il voulait participer à l’amélioration de la reconnaissance vocale. Après tout, Windows 10 pose la question pour la reconnaissance manuscrite.

Sébastien Gavois

Le 13 janvier 2020 à 09h08

Commentaires (11)

Angelblue Abonné

Le 13/01/2020 à 09h20

Toujours triste de voir qu’il faut qu’il se fasse prendre la main dans

le sac pour qu’il assure enfin le niveau de confidentialité qu’il aurait dû être dès le début.

Homo_Informaticus

Le 13/01/2020 à 09h35

C’est à se demander si AI ne veut pas dire Armée d’Indiens " />

Plaisanterie à part il y a plein de boite qui revendiques le traitement automatique des données via des IA et autres nouveautés technologiques de pointes et qui sont souvent traitées par des sous-traitant dans des pays beaucoup moins cher de façon manuelle.

Arkeen Abonné

Le 13/01/2020 à 10h01

Kadoc1 a écrit :

Toujours triste de voir qu’il faut qu’il se fasse prendre la main dans le sac pour qu’il assure enfin le niveau de confidentialité qu’il aurait dû être dès le début. 

+1, ça en dit long sur le niveau de préoccupation réel de ces entreprises sur ces questions, à mille lieues de ce qu’ils peuvent raconter/afficher/marketer.

millman42 Abonné

Le 13/01/2020 à 10h45

Pour ma part je ne fais confiance qu’a signal, telegram, jami et un bon vieux serveur xmpp privés pour mes communications instantanées.

honyme

Le 13/01/2020 à 11h28

Homo_Informaticus a écrit :

C’est à se demander si AI ne veut pas dire Armée d’Indiens " />

Plaisanterie à part il y a plein de boite qui revendiques le traitement automatique des données via des IA et autres nouveautés technologiques de pointes et qui sont souvent traitées par des sous-traitant dans des pays beaucoup moins cher de façon manuelle.

Je penses aussi. Ce sont 2 lettres qui font beaucoup vendre chez certaines personnes.

D’ailleurs on peut voir un exemple dans le Cache investigation : mon patron est un algorithme.

Où on voit des gens être payé une misère pour regarder des images toute la journée. Et de l’autre coté l’utilisateur crois qu’une IA l’a fait.

Freeben666 Abonné

Le 13/01/2020 à 12h06

On aurait apprécié, à l’instar d’Apple (elle aussi fautive), que Microsoft demande directement à l’utilisateur s’il voulait participer à l’amélioration de la reconnaissance vocale. Après tout, Windows 10 pose la question pour la reconnaissance manuscrite.

Il me semble que la question est posée justement, en tout cas pour ce qui est de Cortana (aucune idée pour Skype)

TexMex

Le 13/01/2020 à 12h56

honyme a écrit :

Je penses aussi. Ce sont 2 lettres qui font beaucoup vendre chez certaines personnes.

D’ailleurs on peut voir un exemple dans le Cache investigation : mon patron est un algorithme.

Où on voit des gens être payé une misère pour regarder des images toute la journée. Et de l’autre coté l’utilisateur crois qu’une IA l’a fait.

Bin en fait c’est un terme qui est conforme.

Ici “Artificielle” correspond bien.

 

Rozgann Abonné

Le 13/01/2020 à 13h17

Si je dis pas de bêtise, c’est bien l’IA qui analyse tes photos et les classe. Mais cette IA, pour qu’elle puisse apprendre, il lui faut un jeu de données déjà classées. Et pour qu’elle progresse, il faut qu’un humain lui donne la bonne réponse quand elle est pas capable de déterminer comment classer. C’est à ça que servent les armées de sous-traitants, à l’amélioration. Pas à répondre aux requêtes des utilisateurs en direct.

Mais ça en reste tout aussi inacceptable que des données personnelles soient analysées de manière non-automatisées sans que l’utilisateur ait donné son consentement explicite.

TexMex

Le 13/01/2020 à 13h25

Rozgann a écrit :

Si je dis pas de bêtise, c’est bien l’IA qui analyse tes photos et les classe. Mais cette IA, pour qu’elle puisse apprendre, il lui faut un jeu de données déjà classées. Et pour qu’elle progresse, il faut qu’un humain lui donne la bonne réponse quand elle est pas capable de déterminer comment classer. C’est à ça que servent les armées de sous-traitants, à l’amélioration. Pas à répondre aux requêtes des utilisateurs en direct.

Mais ça en reste tout aussi inacceptable que des données personnelles soient analysées de manière non-automatisées sans que l’utilisateur ait donné son consentement explicite.

Pas seulement.

Il y a aussi la “contre vérification”. En bref vérifier que l’IA ne se trompe pas. Une sorte d’accompagnement.

 C’est donc bien plus long que de produire le jeu de données initiales.

 

Kiroha Abonné

Le 13/01/2020 à 16h46

ça ressemble quand même à une cascade de sous traitance … J’ai quand même du mal à croire que Microsoft puisse envoyer des login + mot de passe en clair dans un e-mail … ça parait tellement fou :eek:

Si vraiment c’est Microsoft qui a sortit ça comme ça c’est vraiment inquiétant en effet … " />

Jossy

Le 13/01/2020 à 20h20

" /> Si, et ils ont même fait mieux, ils ont inventé Microsoft Hello pour te connecter sans login ni mot de passe. Avec ce service le petit indien entraîne l’IA,  IA qui lui dira si il peut se connecter ou non. Si il fait bien son boulot la machine accepte qu’il poursuive, si il bosse mal, hop plus de connexion possible " /> " /> 

Catégories

Nous Suivre

À propos

Microsoft : des transcriptions Skype et Cortana épluchées par des sous-traitants chinois

Commentaires (11)