La NSA peut transcrire à la volée des conversations dans de nombreuses langues
Mais qui s'en étonnera encore ?
Le 08 mai 2015 à 10h00
4 min
Internet
Internet
La NSA et son équivalent anglais, le GCHQ, ont investi durant des années dans la recherche sur la reconnaissance vocale. Les agences de renseignement seraient en capacité d’écouter des conversations dans de nombreuses langues pour les convertir automatiquement en texte anglais. Les documents seraient alors stockés dans une base de données interrogeable par les analystes.
Transcrire à la volée et en anglais des conversations enregistrées
Les documents dérobés à la NSA par Edward Snowden ont montré à de très nombreuses reprises l’étendue des capacités de l’agence américaine de renseignement, mais pas seulement. Ils ont mis en évidence des réseaux de relations entre les pays, notamment une alliance formée par les États-Unis et le Royaume-Uni, et plus globalement avec le Canada, la Nouvelle-Zélande et l’Australie : les fameux Five Eyes.
The Intercept a pu plonger dans d’autres documents, qui abordent cette fois la reconnaissance vocale. On y apprend comment la NSA et le GCHQ ont utilisé le logiciel Dragon Dictate et l’ont modifié durant des années pour arriver au résultat attendu. Avec un tel outil, les agences sont capables de passer à la moulinette l’ensemble des conversations vocales enregistrées pour les traduire automatiquement sous forme de texte.
Les analystes ont donc accès à une base de données particulièrement riche contenant ces transcriptions ainsi que les fichiers audio d’origine. Divers algorithmes travaillent sur les versions textes pour repérer automatiquement certains mots-clés et marquer des conversations comme « intéressantes ».
Au moins un million de transcriptions par jour
La première utilisation du logiciel, nommé RHINEHART, remonterait à 2004 et se serait montré si efficace que les propres analystes de la NSA l’auraient surnommé « Google For Voice ». Il aurait été remplacé plusieurs années après par VoiceRT, plus performant et utilisé pour la première fois à Bagdad. En 2013, nouveau remplacement avec SPITFIRE, à son tour nettement plus rapide. Les documents donnent d’ailleurs un ordre d’idée des capacités mises en mouvement, puisque VoiceRT pouvait analyser, transcrire et repérer les termes intéressants au rythme d’un million de fichiers audio par jour.
Les documents vus par The Intercept ne permettent cependant pas de connaître l’étendue de l’utilisation de ces solutions aujourd’hui ou même durant la dernière décennie. Il est certain qu’elles ont été utilisées à l’étranger puisque le but premier est de traduire automatiquement en anglais, mais rien ne dit que l’une ou l’autre n’ait pas été employée directement sur le sol national.
La collecte des métadonnées remise en cause aux États-Unis
L’avenir des données téléphoniques aux États-Unis pourrait d’ailleurs changer dans les mois qui viennent. L’ACLU (American Civil Liberties Union) avait en effet déposé plainte contre le gouvernement pour avoir dépassé les permissions du Patriot Act sur la collecte à très large échelle des métadonnées téléphoniques. Or, une cour fédérale d’appel vient de donner raison à l’association, en indiquant que si le Congrès souhaitait autoriser une pareille collecte, il pouvait légiférer en ce sens, mais que la loi actuelle ne l’autorisait pas.
L’affaire a donc été renvoyée devant un autre tribunal. La chronologie pourrait mal tomber pour la NSA car l’autorisation doit être renouvelée périodiquement, le mandat actuel expirant le 1er juin. L’ACLU se félicite de cette victoire et estime désormais que la situation dépend entièrement du Congrès.
La NSA peut transcrire à la volée des conversations dans de nombreuses langues
-
Transcrire à la volée et en anglais des conversations enregistrées
-
Au moins un million de transcriptions par jour
-
La collecte des métadonnées remise en cause aux États-Unis
Commentaires (85)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 08/05/2015 à 15h58
Pour plus de confort bientôt un capteur d’odeur intégré au téléphone, et plus tard on apprendra que la NSA traque l’odeur de la poudre.
Le 08/05/2015 à 16h52
Le 08/05/2015 à 17h55
pour calculer de la kaille bien zdeg, faut qu’il charbonne mortel.
Le 08/05/2015 à 19h18
Toutes manières, si vous n’avez rien à cacher, je ne vois pas en quoi ça serait dérangeant que les Américains (la NSA) ait accès à tout ce qui passe par du réseau…
Après tout, ils ne le font que probablement pour chasser du barbu, certainement pas pour des secrets indus ou autre, z’ont beaucoup trop de morale pour s’abaisser à ce genre de méthodes.
Le 08/05/2015 à 20h54
On parle de transcription (conversion de paroles orales en texte écrit) ou de traduction (conversion d’une langue à l’autre) ?
Le 08/05/2015 à 21h08
Vendredi, trop visible " />
Le 08/05/2015 à 21h21
Ouais mais bon, on s’entend que Cortana détecte le Hey Cortana en local, hein… En plus, toute observation passant par ce genre de technique serait très facilement visible au niveau de la connection internet qui en prendrait un coup.
Le 08/05/2015 à 23h08
Le 08/05/2015 à 23h09
Le 08/05/2015 à 23h30
Le 09/05/2015 à 05h56
Le 09/05/2015 à 05h57
Le 09/05/2015 à 06h01
Le 09/05/2015 à 06h03
Le 09/05/2015 à 06h08
Le 09/05/2015 à 07h06
Dès que tu parles de CIA et de NSA, on te traite toujours de parano… Les gens sont navrants de naïveté.
Le 08/05/2015 à 11h31
Je verrais plutôt un traducteur “immigré-anglais”, en fait " />
Le 08/05/2015 à 11h31
avec cortana qui va generaliser l’os qui ecoute en permanence ca fait une bonne combo " />
Le 08/05/2015 à 11h39
Par définition Cortana transcrit un son en code informatique utilisable par une machine. Donc le truc de la NSA ne sert à rien, vu que MS le fait déjà pour te renvoyer le résultat " />
Le 08/05/2015 à 11h40
Google Now me fait plus peur que Cortana pour le moment.
Le 08/05/2015 à 11h43
C’est un hommage à l’actu je pense :
“Les analystes ont donc axé à une base de données” " />
Le 08/05/2015 à 11h46
" /> Whoupitin j’ai même pas fait gaffe " />
Le 08/05/2015 à 11h48
Ca va engendrer une renaissance des patois, dialectes et autres langues tribales, comme la langue navajo pendant la II ème guerre
Le 08/05/2015 à 11h55
Le 08/05/2015 à 11h56
Le 08/05/2015 à 11h58
Rater voulait faire 911. " />
Le 08/05/2015 à 12h01
Quand un des GAFA aura acheter la NSA.
Le 08/05/2015 à 12h03
" />
" /> " />
Le 08/05/2015 à 12h08
ce que je voulais dire c’est que grâce a cortana, votre ordi vous ecoute en permanence pour capter le “hey cortana” (marche aussi pour google, siri and co)
bon ok “gadget” pour le moment peu utile. mais si cela devient intégré de plus en plus a l’os au point d’en devenir nécessaire et donc devenir permanent et répandu.
ce flux audio capté en permanence pourra donc etre capté par la nsa et retranscrit en texte (plus facile a traiter par la suite je pense)
on a donc les tel portables, les tel fixes (même pas décrochés, voir citizenfour avec Snowden), les télé connectées, les consoles new gen, les ordi portables, les tablettes. il manque les desktop qui n’ont pas de perph connecté en permanence comme les casque ou webcam.
cela devrait donc évoluer sur les destop oem pour justement pouvoir utiliser cortana. donc hop micros répandus encore plus " /> (notamment entreprises)
bon je dis pas pas super sérieusement, mais une fois qu’on a lu les diff déclarations et documents Snowden on sait maintenant que c’est possible." />
attention je parle d’ordi ciblés hein. pas d’écoute trop généralisées a la metadonnées
Le 08/05/2015 à 12h12
Même le WeshGrosBienouBien ?
Le 08/05/2015 à 12h14
Le 08/05/2015 à 12h44
Bof , je suis allé passer quelques jours a Amsterdam , et si Google Now m’a fait peur c’est plus par son efficacité , que ca soit pour retrouver le chemin jusqu’à la location , les horaires des bus et tramways , les trucs sympa a voir aux alentours….
Le truc qui m’a soufflé , dans un restaurant au moment de payer je me souvenais plus comment on disait “addition” en anglais , j’ouvre Google Now m’apprêtant a taper ma demande et dans les suggestion de traduction avant meme de taper quoi que ce soit je vois “l’addition s’il vous plait = Bill please” Là je fais wouarf ils savent même qu’on vient de manger " />
Le 08/05/2015 à 10h05
Çà ne m’étonne absolument pas, et en fait je pensais même que çà se savait " />
Le 08/05/2015 à 10h10
Une société français participe aux logiciels de traductions“systran”, cocorico ….. ou pas " />
Le 08/05/2015 à 10h19
Quand je pense que pour les personnes sourdes et malentendantes c’est encore la croix et la bannière pour comprendre le français oral. Je ne parle même pas des autres langues…
A quand un petit appareil (ou appli SmartPhone) efficace et performante pour traduire en live ou simplement “sous-titrer” en live ?
Le 08/05/2015 à 10h20
Bientôt plus besoin avec Skype ! Le boulot sera fait par microsoft !
Le 08/05/2015 à 10h35
Le 08/05/2015 à 10h45
Je penser que les américains n’aimè pas le sous-titré." />
Le 08/05/2015 à 10h51
Le 08/05/2015 à 11h06
Bon et quand est-ce qu’ils nous font profiter de leur formidable outil ? " />
Le 08/05/2015 à 11h14
Tu plaisantes ? Controler la planete est bien plus INtéressant !
Le 08/05/2015 à 11h22
Pourquoi plusieurs langues ? Seul l’arabe suffit non ?
" /> " /> " />
Le 08/05/2015 à 11h23
Le 08/05/2015 à 12h51
Le 08/05/2015 à 13h12
Les analystes ont donc axé à une base de données
Seriously? ^^
Le 08/05/2015 à 13h23
Ça fonctionne pour les conversations hot ou pas ?
Remarque, transcrire “oh oui, oh oui” en “oh yes, oh yes”, ça n’a guère d’intérêt…
" />
" />
Le 08/05/2015 à 13h28
Le 08/05/2015 à 13h38
Je n’y connais rien mais peut-être qu’ils peuvent ralentir l’enregistrement pour mieux l’analyser . Ce qui occasionne un petit délai par rapport à de la traduction à la volée mais qui est peut-être acceptable pour eux " />
Le 08/05/2015 à 13h48
C’est pour quand les sou-titre sur tout les video de toutube?
Le 08/05/2015 à 13h53
Le 08/05/2015 à 13h54
Le 08/05/2015 à 14h01
Le 08/05/2015 à 14h03
Le 08/05/2015 à 14h05
Le 08/05/2015 à 14h14
Le Big Data a de beaux jours devant lui :)
Le 08/05/2015 à 14h26
Le 08/05/2015 à 14h29
Le 08/05/2015 à 14h51
wesh bn kourag pr capter se kon dis mddrr, il a intéré a etre chanmé leure bordel ptdr
Le 08/05/2015 à 14h54
Tu peux bien écrire n’importe comment, ça retranscrit la voix, pas l’écrit. " />
Le 09/05/2015 à 08h29
Mais qui s’en étonnera encore ?
En lisant de sous-titre j’ai ri (jaune)… et puis je me suis rendu compte de ma non indignation.
En effet, beaucoup affirme aisément que cela ne les surprend pas et/ou qu’ils le savaient déjà.
Pour finir sur un “bof”.
Bof ?!?
Bof d’avoir (enfin!) les preuves d’un système de surveillance généralisé et massif des populations par des gouvernements de dites “démocraties” ?!?
Bof de voir que la majorité des surveillances ne concerne en rien le terrorisme ou plus généralement la sécurité (cf la surveillance de la France par l’Allemagne au profit de la NSA) ?!?
Et pourtant ceux qui finissent avec ce “bof” ( dont je fais parti) sont les mêmes qui se sont insurgés contre la HADOPI, l’ACTA, LA LOPPSI, etc.
A croire que ce qui n’est pas palpable est plus facilement accepté.
Il semble malheureusement que le coup des pédos-nazis-terroristes fonctionnent toujours.
Ce sous-titre démontre finalement l’acceptation de ce système à la Big Brother par les populations.
Et le plus drôle est de voir les réactions quand on ose affirmer qu’on n’est pas dans une véritable Démocratie…
Comme si le moins pire était la seule alternative… " />
Le 09/05/2015 à 08h29
Je me demande toujours, connaissant le baratin habituel des commerciaux en logiciels, à quel point ces annonces sont réalistes d’un point de vue réelle.
S’il y a des logiciels qui m’étonnent sur leurs capacités, je vois aussi beaucoup de déconvenues. Les capacités réelles d’un logiciel quand on le met en place sont souvent loin de ce que l’on s’imagine en lisant les brochures.
Exemple dans la reconnaissance vocale: incapacité chronique à comprendre une longue phrase dite à vitesse normale. Incapacité chronique à comprendre une phrase dans laquelle on ne marque pas correctement la ponctuation par des pauses.
Bien sûr, la NSA peut avoir mieux, mais certainement en se basant (comme nous même) sur une réinterprétation des sons à partir de ce que l’on connais comme tournure de phrase courante (globalement et de la part de notre interlocuteur). Tout cela pour dire que moi-même j’ai souvent du mal à comprendre ce que disent les gens au téléphone avec le réseau actuel, j’ai dû mal à croire qu’un ordinateur puisse retranscrire correctement sans faire de “wild guess”.
Le 09/05/2015 à 09h52
Max Payne.
Le 09/05/2015 à 10h23
Donc si je comprends bien, ils ont un outil pour retranscrire « en live » une source audio sous une forme numérique quelconque (ce qui peut vouloir dire plein de choses, à priori ce n’est pas impressionnant du tout), puis ils donnent le résultat à manger à un outil capable de définir la langue source (ça me semble compliqué, à tort?) et traduire le merdier en anglais (probablement sous tout un tas de conditions)…
Le 09/05/2015 à 10h55
Le 09/05/2015 à 11h18
Le 09/05/2015 à 13h05
Le 09/05/2015 à 13h06
Le 09/05/2015 à 14h42
il a de la transcription quasi temp-reel dans les systèmes de sous-titres des chaines TV.
Il suffit d’activer les sous-titres mal-entendants pour s’en rendre compte.
Quand les matchs sportifs sont diffusés dans les bars tres bruyants, vous avez jamais remarqué que le barman affichait la retranscription automatique des commentaires sportifs?
Le 09/05/2015 à 15h39
tu n’as même pas une petite idée ???
Le 09/05/2015 à 15h47
Le 09/05/2015 à 22h12
Le 09/05/2015 à 22h16
Le 09/05/2015 à 23h21
Le 10/05/2015 à 07h42
Non, il ne parle pas des films, mais des lives et des reportages qui n’ont pas de piste sous-titre à priori. Il s’agit donc bien de transcription temps réel. Aprés comme il n’y a qu’un seul flux à gérer par chaine, c’est peut-être assuré par un humain…
Le 10/05/2015 à 08h07
Le 10/05/2015 à 09h46
Le 10/05/2015 à 09h55
Le 10/05/2015 à 11h19
Le 10/05/2015 à 12h49
Je pensais vraiment que Max Payne était antérieur à Matrix !
Le 10/05/2015 à 18h33
C’est triste mais ça ne me choque même plus.
Ca ne me choque plus qu’ils bafouent tant de droits et de valeurs - Y compris celles portées par leur propre pays. Et ça ne me choque plus qu’ils disposent d’une technologie qui pourraient servir à tant de choses…
Ca veut dire que je suis habitué ? " />
Le 10/05/2015 à 19h30
Bon, il va falloir que j’apprenne le Klingon ou elfique, jusqu’à ce que la NSA décode aussi ça. " />
Le 10/05/2015 à 19h51
" />
Le 11/05/2015 à 00h23
Le 11/05/2015 à 11h59
Merci pour la précision, je ne savais pas qu’il y avait cette pratique d’avoir un “perroquet”.
Au final il joue un peu le rôle d’un interprète qui traduit juste en langage clair les propos tenus par un animateur qui peuvent être animés par l’émotion ou le jeu. Ca reste du flux tendu et à mon avis on a pas beaucoup le droit à l’erreur !!
Néanmoins les outils de reconnaissance vocal s’améliorent quand même pas mal. Je vois sur mon Lumia la miss Cortana est pas trop mauvaise. Après c’est du traitement assisté par serveurs distants qui apprennent avec les milliers d’utilisateurs qui s’en servent, là où les solutions dont tu parles ne doivent pas avoir cet avantage.
Le 12/05/2015 à 08h13
L’ article n’ est pas très correct vis à vis de Snowden.
Pire.
Mensonger.
Ou il y a un problème de journalisme.
Ou un problème de moralité.
Parce que Snowden n’ a jamais eu besoin de voler aucun document à quiconque vu que pour voler quelque chose à quelqu’ un il faut y être étranger.
Or Snowden était non seulement un employé de la NSA mais surtout un des admins de son système d’ information.
Cela m’ arrive de dire que je me suis volé moi même quand je ne retrouve pas mes propres affaires.
Mais dans ce cas, Snowden les détenait déjà.
Tout ce qu’ on peut lui reprocher, c’ est une entorse à son contrat de travail en ce qui concerne la confiden,tialité & nullement d’ être un voleur.
Quelques soient nos contrats de travail, nous vivoons dans des pays qui se disent démocratiques.
C’ est à dire censés respecter notre liberté de conscience.
Ce qui par conséquent pour motif de conscience, le droit à cette liberté étant une primauté des droits de l’ homme & de la démocratie il me semble, revient à l’ absoudre de tout péché.
Je n’ ai hamais été le toutou d’ aucun patron.
Et s’ il me vient l’ envie de lui claquer la “gle parce qu’il fait des trucs pas corrects, crois moi !!
Je vais pas me gêner !!
Et toi ?