La NSA peut transcrire à la volée des conversations dans de nombreuses langues

Mais qui s'en étonnera encore ?

Le 08 mai 2015 à 10h00

4 min

Internet

La NSA et son équivalent anglais, le GCHQ, ont investi durant des années dans la recherche sur la reconnaissance vocale. Les agences de renseignement seraient en capacité d’écouter des conversations dans de nombreuses langues pour les convertir automatiquement en texte anglais. Les documents seraient alors stockés dans une base de données interrogeable par les analystes.

Transcrire à la volée et en anglais des conversations enregistrées

Les documents dérobés à la NSA par Edward Snowden ont montré à de très nombreuses reprises l’étendue des capacités de l’agence américaine de renseignement, mais pas seulement. Ils ont mis en évidence des réseaux de relations entre les pays, notamment une alliance formée par les États-Unis et le Royaume-Uni, et plus globalement avec le Canada, la Nouvelle-Zélande et l’Australie : les fameux Five Eyes.

The Intercept a pu plonger dans d’autres documents, qui abordent cette fois la reconnaissance vocale. On y apprend comment la NSA et le GCHQ ont utilisé le logiciel Dragon Dictate et l’ont modifié durant des années pour arriver au résultat attendu. Avec un tel outil, les agences sont capables de passer à la moulinette l’ensemble des conversations vocales enregistrées pour les traduire automatiquement sous forme de texte.

Les analystes ont donc accès à une base de données particulièrement riche contenant ces transcriptions ainsi que les fichiers audio d’origine. Divers algorithmes travaillent sur les versions textes pour repérer automatiquement certains mots-clés et marquer des conversations comme « intéressantes ».

Au moins un million de transcriptions par jour

La première utilisation du logiciel, nommé RHINEHART, remonterait à 2004 et se serait montré si efficace que les propres analystes de la NSA l’auraient surnommé « Google For Voice ». Il aurait été remplacé plusieurs années après par VoiceRT, plus performant et utilisé pour la première fois à Bagdad. En 2013, nouveau remplacement avec SPITFIRE, à son tour nettement plus rapide. Les documents donnent d’ailleurs un ordre d’idée des capacités mises en mouvement, puisque VoiceRT pouvait analyser, transcrire et repérer les termes intéressants au rythme d’un million de fichiers audio par jour.

Les documents vus par The Intercept ne permettent cependant pas de connaître l’étendue de l’utilisation de ces solutions aujourd’hui ou même durant la dernière décennie. Il est certain qu’elles ont été utilisées à l’étranger puisque le but premier est de traduire automatiquement en anglais, mais rien ne dit que l’une ou l’autre n’ait pas été employée directement sur le sol national.

La collecte des métadonnées remise en cause aux États-Unis

L’avenir des données téléphoniques aux États-Unis pourrait d’ailleurs changer dans les mois qui viennent. L’ACLU (American Civil Liberties Union) avait en effet déposé plainte contre le gouvernement pour avoir dépassé les permissions du Patriot Act sur la collecte à très large échelle des métadonnées téléphoniques. Or, une cour fédérale d’appel vient de donner raison à l’association, en indiquant que si le Congrès souhaitait autoriser une pareille collecte, il pouvait légiférer en ce sens, mais que la loi actuelle ne l’autorisait pas.

L’affaire a donc été renvoyée devant un autre tribunal. La chronologie pourrait mal tomber pour la NSA car l’autorisation doit être renouvelée périodiquement, le mandat actuel expirant le 1er juin. L’ACLU se félicite de cette victoire et estime désormais que la situation dépend entièrement du Congrès.

Commentaires (85)

elezoic

Le 08/05/2015 à 15h58

Pour plus de confort bientôt un capteur d’odeur intégré au téléphone, et plus tard on apprendra que la NSA traque l’odeur de la poudre.

SebGF Abonné

Le 08/05/2015 à 16h52

elezoic a écrit :

Pour plus de confort bientôt un capteur d’odeur intégré au téléphone, et plus tard on apprendra que la NSA traque l’odeur de la poudre.

Et ben, avec toutes les caisses que je lâche je serai vite classé terroriste alors car je vais en tuer plus d’un " />

Amis de la poésie, bonsoir.

PS : avec un petit combo maroilles / Tartiflette tiens " />

127.0.0.1

Le 08/05/2015 à 17h55

pour calculer de la kaille bien zdeg, faut qu’il charbonne mortel.

Marco07

Le 08/05/2015 à 19h18

Toutes manières, si vous n’avez rien à cacher, je ne vois pas en quoi ça serait dérangeant que les Américains (la NSA) ait accès à tout ce qui passe par du réseau…

Après tout, ils ne le font que probablement pour chasser du barbu, certainement pas pour des secrets indus ou autre, z’ont beaucoup trop de morale pour s’abaisser à ce genre de méthodes.

Liam

Le 08/05/2015 à 20h54

On parle de transcription (conversion de paroles orales en texte écrit) ou de traduction (conversion d’une langue à l’autre) ?

fred131 a écrit :

Une société français participe aux logiciels de traductions“systran”, cocorico ….. ou pas " />

Si vraiment ils utilisent les technologies de Systran pour traduire automatiquement d’une langue à l’autre… je serais vous je m’en ferais pas trop pour ma vie privée. Ces trucs là ne marchent à peu près pas. " />

Bon j’imagine que ça peut servir pour extraire quelques mots clés, et ainsi filtrer les messages qui ensuite ont besoin d’être traduits par un humain par rapport à ceux dont on s’en fout. Mais faut pas croire qu’on peut vraiment travailler avec des textes traduits par Systran.

Voici une traduction par Systran du premier commentaire du premier post de la page d’accueil de Reddit :

Systran a écrit :

Il y a un APP. Presque tous les (dans pas encore le tout) dépôts à la maison ont WiFi gratuit. L’APP vous indique dans quel bas-côté, sur lequel baie (support) et combien sont en stock. Il fournit également le nombre d’évaluation et d’article.

Voilà, essayez de reconstituer l’original maintenant…

psn00ps

Le 08/05/2015 à 21h08

Vendredi, trop visible " />

Marco07 a écrit :

Toutes manières, si vous n’avez rien à cacher, je ne vois pas en quoi ça serait dérangeant que les Américains (la NSA) ait accès à tout ce qui passe par du réseau…

Après tout, ils ne le font que probablement pour chasser du barbu, certainement pas pour des secrets indus ou autre, z’ont beaucoup trop de morale pour s’abaisser à ce genre de méthodes.

Sinon pour ceux qui n’ont rien à cacher, instruisez vous :

http://jenairienacacher.fr/

Céd

Le 08/05/2015 à 21h21

Ouais mais bon, on s’entend que Cortana détecte le Hey Cortana en local, hein… En plus, toute observation passant par ce genre de technique serait très facilement visible au niveau de la connection internet qui en prendrait un coup.

Ler van keeg

Le 08/05/2015 à 23h08

marshall39 a écrit :

Bof , je suis allé passer quelques jours a Amsterdam , et si Google Now m’a fait peur c’est plus par son efficacité , que ca soit pour retrouver le chemin jusqu’à la location , les horaires des bus et tramways , les trucs sympa a voir aux alentours….

Le truc qui m’a soufflé , dans un restaurant au moment de payer je me souvenais plus comment on disait “addition” en anglais , j’ouvre Google Now m’apprêtant a taper ma demande et dans les suggestion de traduction avant meme de taper quoi que ce soit je vois “l’addition s’il vous plait = Bill please” Là je fais wouarf ils savent même qu’on vient de manger " />

Pareil, mais avec les outils Nokia sur Windows Phone.

Restaurants aux alentours, métro à prendre avec les horaires kivonbien, gps à pied pour pas se perdre…

On devient dépendants en fait…

Ler van keeg

Le 08/05/2015 à 23h09

kade a écrit :

Oui, ils utilisent le système “bullet-time” inventé je crois, par Monsieur Matrix.

Aaah ce fameux Don ??

panda09

Le 08/05/2015 à 23h30

Cara62 a écrit :

Pourquoi plusieurs langues ? Seul l’arabe suffit non ?

" /> " /> " />

Avec l’autre taré de Matignon et pas mal d’autres de la classe politique, ce serait plutôt l’hébreu, non ? " />

popolski

Le 09/05/2015 à 05h56

SpiritNico a écrit :

Quand je pense que pour les personnes sourdes et malentendantes c’est encore la croix et la bannière pour comprendre le français oral. Je ne parle même pas des autres langues…

A quand un petit appareil (ou appli SmartPhone) efficace et performante pour traduire en live ou simplement “sous-titrer” en live ?

dragon naturally speacking 8

balabolka :  lit du texte et traduit en voix

popolski

Le 09/05/2015 à 05h57

Cara62 a écrit :

Pourquoi plusieurs langues ? Seul l’arabe suffit non ?

" /> " /> " />

" />

popolski

Le 09/05/2015 à 06h01

dodo021 a écrit :

Google Now me fait plus peur que Cortana pour le moment.

Google …….." />

popolski

Le 09/05/2015 à 06h03

svoboda a écrit :

Ca va engendrer une renaissance des patois, dialectes et autres langues tribales, comme la langue navajo pendant la II ème guerre

toujours en patois au téléphone avec les amis

popolski

Le 09/05/2015 à 06h08

matroska a écrit :

Ça fonctionne pour les conversations hot ou pas ?

Remarque, transcrire “oh oui, oh oui” en “oh yes, oh yes”, ça n’a guère d’intérêt…

" />

" />

oh my gode " />

Goldoark

Le 09/05/2015 à 07h06

Dès que tu parles de CIA et de NSA, on te traite toujours de parano… Les gens sont navrants de naïveté.

fwak

Le 08/05/2015 à 11h31

Je verrais plutôt un traducteur “immigré-anglais”, en fait " />

moggbomber

Le 08/05/2015 à 11h31

avec cortana qui va generaliser l’os qui ecoute en permanence ca fait une bonne combo " />

linkin623 Abonné

Le 08/05/2015 à 11h39

Par définition Cortana transcrit un son en code informatique utilisable par une machine. Donc le truc de la NSA ne sert à rien, vu que MS le fait déjà pour te renvoyer le résultat " />

dodo021

Le 08/05/2015 à 11h40

Google Now me fait plus peur que Cortana pour le moment.

Clapitti

Le 08/05/2015 à 11h43

C’est un hommage à l’actu je pense :

“Les analystes ont donc axé à une base de données” " />

linkin623 Abonné

Le 08/05/2015 à 11h46

" /> Whoupitin j’ai même pas fait gaffe " />

svoboda

Le 08/05/2015 à 11h48

Ca va engendrer une renaissance des patois, dialectes et autres langues tribales, comme la langue navajo pendant la II ème guerre

CryoGen

Le 08/05/2015 à 11h55

moggbomber a écrit :

avec cortana qui va generaliser l’os qui ecoute en permanence ca fait une bonne combo " />

Il y a de la reconnaissance vocale depuis Vista…

Nikodym

Le 08/05/2015 à 11h56

Cara62 a écrit :

Pourquoi plusieurs langues ? Seul l’arabe suffit non ?

" /> " /> " />

" />

Ami-Kuns

Le 08/05/2015 à 11h58

Rater voulait faire 911. " />

Ami-Kuns

Le 08/05/2015 à 12h01

Quand un des GAFA aura acheter la NSA.

wawadou

Le 08/05/2015 à 12h03

" />

" /> " />

moggbomber

Le 08/05/2015 à 12h08

ce que je voulais dire c’est que grâce a cortana, votre ordi vous ecoute en permanence pour capter le “hey cortana” (marche aussi pour google, siri and co)

 

bon ok “gadget” pour le moment peu utile. mais si cela devient intégré de plus en plus a l’os au point d’en devenir nécessaire et donc devenir permanent et répandu.

ce flux audio capté en permanence pourra donc etre capté par la nsa et retranscrit en texte (plus facile a traiter par la suite je pense)

on a donc les tel portables, les tel fixes (même pas décrochés, voir citizenfour avec Snowden), les télé connectées, les consoles new gen, les ordi portables, les tablettes. il manque les desktop qui n’ont pas de perph connecté en permanence comme les casque ou webcam.

cela devrait donc évoluer sur les destop oem pour justement pouvoir utiliser cortana. donc hop micros répandus encore plus " /> (notamment entreprises)

 

bon je dis pas pas super sérieusement, mais une fois qu’on a lu les diff déclarations et documents  Snowden on sait maintenant que c’est possible." />

attention je parle d’ordi ciblés hein. pas d’écoute trop généralisées a la metadonnées

v1nce

Le 08/05/2015 à 12h12

Même le WeshGrosBienouBien ?

Himurai

Le 08/05/2015 à 12h14

Vekin a écrit :

Bon et quand est-ce qu’ils nous font profiter de leur formidable outil ? " />

Ca s’appelle la traduction instantanée de Skype et c’est bientôt disponible :p

marshall39

Le 08/05/2015 à 12h44

Bof , je suis allé passer quelques jours a Amsterdam , et si Google Now m’a fait peur c’est plus par son efficacité , que ca soit pour retrouver le chemin jusqu’à la location , les horaires des bus et tramways , les trucs sympa a voir aux alentours….

Le truc qui m’a soufflé , dans un restaurant au moment de payer je me souvenais plus comment on disait “addition” en anglais , j’ouvre Google Now m’apprêtant a taper ma demande et dans les suggestion de traduction avant meme de taper quoi que ce soit je vois “l’addition s’il vous plait = Bill please” Là je fais wouarf ils savent même qu’on vient de manger " />

CryoGen

Le 08/05/2015 à 10h05

Çà ne m’étonne absolument pas, et en fait je pensais même que çà se savait " />

fred131

Le 08/05/2015 à 10h10

Une société français participe aux logiciels de traductions“systran”, cocorico ….. ou pas " />

SpiritNico

Le 08/05/2015 à 10h19

Quand je pense que pour les personnes sourdes et malentendantes c’est encore la croix et la bannière pour comprendre le français oral. Je ne parle même pas des autres langues…

A quand un petit appareil (ou appli SmartPhone) efficace et performante pour traduire en live ou simplement “sous-titrer” en live ?

Jossy

Le 08/05/2015 à 10h20

Bientôt plus besoin avec Skype !  Le boulot sera fait par microsoft !

Baldurien Abonné

Le 08/05/2015 à 10h35

fred131 a écrit :

Une société français participe aux logiciels de traductions“systran”, cocorico ….. ou pas " />

Ben … développer ce genre de logiciel, c’est très intéressant…

Après, l’utilisation éthique… c’est une autre histoire…

Ami-Kuns

Le 08/05/2015 à 10h45

Je penser que les américains n’aimè pas le sous-titré." />

linkin623 Abonné

Le 08/05/2015 à 10h51

Baldurien a écrit :

Ben … développer ce genre de logiciel, c’est très intéressant…

Après, l’utilisation éthique… c’est une autre histoire…

La quoi? " />

Ami-Kuns a écrit :

Je penser que les américains n’aimè pas le sous-titré." />

" />

9 mots, 2 verbes, 2 fautes ; pas mal… Astuce

Vekin

Le 08/05/2015 à 11h06

Bon et quand est-ce qu’ils nous font profiter de leur formidable outil ? " />

DahoodG4

Le 08/05/2015 à 11h14

Tu plaisantes ? Controler la planete est bien plus INtéressant !

Cara62

Le 08/05/2015 à 11h22

Pourquoi plusieurs langues ? Seul l’arabe suffit non ?

" /> " /> " />

Baldurien Abonné

Le 08/05/2015 à 11h23

linkin623 a écrit :

La quoi? " />

et tique ? :)

manbu

Le 08/05/2015 à 12h51

  Vincent Hermann a écrit :

Les analystes ont donc “axé”  à une base de données particulièrement riche

contenant ces transcriptions ainsi que les fichiers audio d’origine

 Au secours ! Ça m’a fait un gros trou dans l’oeil droit.

Dori66

Le 08/05/2015 à 13h12

Les analystes ont donc axé à une base de données

 

Seriously? ^^

matroska

Le 08/05/2015 à 13h23

Ça fonctionne pour les conversations hot ou pas ?

Remarque, transcrire “oh oui, oh oui” en “oh yes, oh yes”, ça n’a guère d’intérêt…

" />

" />

OlivierJ Abonné

Le 08/05/2015 à 13h28

Vekin a écrit :

Bon et quand est-ce qu’ils nous font profiter de leur formidable outil ? " />

Sur mon Galaxy S5 mini, la reconnaissance vocale marche assez bien, mais il faut quand même que je parle nettement plus lentement que mon débit naturel pour que ça marche. Je me demande si le logiciel mis au point par la NSA arrive à transcrire une de mes conversations à débit normal (je parle vite donc).

Nerkazoid

Le 08/05/2015 à 13h38

Je n’y connais rien mais peut-être qu’ils peuvent ralentir l’enregistrement pour mieux l’analyser . Ce qui occasionne un petit délai par rapport à de la traduction à la volée mais qui est peut-être acceptable pour eux " />

DUNplus Abonné

Le 08/05/2015 à 13h48

C’est pour quand les sou-titre sur tout les video de toutube?

kade

Le 08/05/2015 à 13h53

linkin623 a écrit :

" />

9 mots, 2 verbes, 2 fautes ; pas mal… Astuce

Je venais de lire le commentaire. Je ne savais plus quoi penser…

Pui j’aî tombai surle tient.

Rien à ajouter.

Merci " />

kade

Le 08/05/2015 à 13h54

DotNerk a écrit :

Je n’y connais rien mais peut-être qu’ils peuvent ralentir l’enregistrement pour mieux l’analyser .

Oui, ils utilisent le système “bullet-time” inventé je crois, par Monsieur Matrix.

kade

Le 08/05/2015 à 14h01

OlivierJ a écrit :

Sur mon Galaxy S5 mini, la reconnaissance vocale marche assez bien, mais il faut quand même que je parle nettement plus lentement que mon débit naturel pour que ça marche. Je me demande si le logiciel mis au point par la NSA arrive à transcrire une de mes conversations à débit normal (je parle vite donc).

Mon petit doigt me dit que les systèmes de la NSA doivent être légèrement plus performants qu’un téléphone. Mais je n’avance imprudemment sans aucune source à présenter.

OlivierJ Abonné

Le 08/05/2015 à 14h03

DotNerk a écrit :

Je n’y connais rien mais peut-être qu’ils peuvent ralentir l’enregistrement pour mieux l’analyser . Ce qui occasionne un petit délai par rapport à de la traduction à la volée mais qui est peut-être acceptable pour eux " />

Ralentir l’enregistrement, ça ne veut pas dire grand chose, ils partent d’un enregistrement et des données, qu’ils analysent comme n’importe quelles autres données, il n’y a pas vraiment de notion de vitesse. En principe en parlant vite et en articulant, un logiciel devrait arriver à reconnaître les syllabes, mais il a moins de signal pour ça je suppose.

OlivierJ Abonné

Le 08/05/2015 à 14h05

kade a écrit :

Mon petit doigt me dit que les systèmes de la NSA doivent être légèrement plus performants qu’un téléphone. Mais je n’avance imprudemment sans aucune source à présenter.

Vu que sur un mobile, l’analyse doit être assez rapide pour être utile, certes pour la NSA le logiciel peut prendre plus son temps. D’un autre côté, la puissance des ordinateurs ayant bien augmenté au cours des années, et vu les moyens de Google (derrière Android), je suppose qu’ils utilisent un logiciel aussi performant que possible sur leur téléphone. Note que le logiciel de reconnaissance ne dépend pas la puissance du mobile vu qu’il faut être connecté pour que la reconnaissance fonctionne.

john san Abonné

Le 08/05/2015 à 14h14

Le Big Data a de beaux jours devant lui :)

kade

Le 08/05/2015 à 14h26

OlivierJ a écrit :

Note que le logiciel de reconnaissance ne dépend pas la puissance du mobile vu qu’il faut être connecté pour que la reconnaissance fonctionne.

Ouais, dans un téléphone…

Mais quand tu es connecté en local par fibre aux BDD, c’est une autre histoire " />

kade

Le 08/05/2015 à 14h29

john san a écrit :

Le Big Data a de beaux jours devant lui :)

Il est utilisé par des infrastructures bien plus petites que Facebook, Google et les autres.

Le NOSQL entre autre, est disponible sur pas mal de BDD en natif maintenant.

Puis le traitement en mode colonne, tout ça… ça devient incontournable pour des traitements “batch” aussi.

cendrev3

Le 08/05/2015 à 14h51

wesh bn kourag pr capter se kon dis mddrr, il a intéré a etre chanmé leure bordel ptdr

darth21

Le 08/05/2015 à 14h54

Tu peux bien écrire n’importe comment, ça retranscrit la voix, pas l’écrit. " />

zempa Abonné

Le 09/05/2015 à 08h29

Mais qui s’en étonnera encore ?

En lisant de sous-titre j’ai ri (jaune)… et puis je me suis rendu compte de ma non indignation.

En effet, beaucoup affirme aisément que cela ne les surprend pas et/ou qu’ils le savaient déjà.

Pour finir sur un “bof”.

Bof ?!?

Bof d’avoir (enfin!) les preuves d’un système de surveillance généralisé et massif des populations par des gouvernements de dites “démocraties” ?!?

Bof de voir que la majorité des surveillances ne concerne en rien le terrorisme ou plus généralement la sécurité (cf la surveillance de la France par l’Allemagne au profit de la NSA) ?!?

Et pourtant ceux qui finissent avec ce “bof” ( dont je fais parti) sont les mêmes qui se sont insurgés contre la HADOPI, l’ACTA, LA LOPPSI, etc.

A croire que ce qui n’est pas palpable est plus facilement accepté.

Il semble malheureusement que le coup des pédos-nazis-terroristes fonctionnent toujours.

Ce sous-titre démontre finalement l’acceptation de ce système à la Big Brother par les populations.

 

Et le plus drôle est de voir les réactions quand on ose affirmer qu’on n’est pas dans une véritable Démocratie…

Comme si le moins pire était la seule alternative… " />

Wosgien Abonné

Le 09/05/2015 à 08h29

Je me demande toujours, connaissant le baratin habituel des commerciaux en logiciels, à quel point ces annonces sont réalistes d’un point de vue réelle.

S’il y a des logiciels qui m’étonnent sur leurs capacités, je vois aussi beaucoup de déconvenues. Les capacités réelles d’un logiciel quand on le met en place sont souvent loin de ce que l’on s’imagine en lisant les brochures.

Exemple dans la reconnaissance vocale: incapacité chronique à comprendre une longue phrase dite à vitesse normale. Incapacité chronique à comprendre une phrase dans laquelle on ne marque pas correctement la ponctuation par des pauses.

Bien sûr, la NSA peut avoir mieux, mais certainement en se basant (comme nous même) sur une réinterprétation des sons à partir de ce que l’on connais comme tournure de phrase courante (globalement et de la part de notre interlocuteur). Tout cela pour dire que moi-même j’ai souvent du mal à comprendre ce que disent les gens au téléphone avec le réseau actuel, j’ai dû mal à croire qu’un ordinateur puisse retranscrire correctement sans faire de “wild guess”.

Mr.Nox

Le 09/05/2015 à 09h52

Max Payne.

lateo

Le 09/05/2015 à 10h23

Donc si je comprends bien, ils ont un outil pour retranscrire « en live » une source audio sous une forme numérique quelconque (ce qui peut vouloir dire plein de choses, à priori ce n’est pas impressionnant du tout), puis ils donnent le résultat à manger à un outil capable de définir la langue source (ça me semble compliqué, à tort?) et traduire le merdier en anglais (probablement sous tout un tas de conditions)…

Liam

Le 09/05/2015 à 10h55

brice.wernet a écrit :

Bien sûr, la NSA peut avoir mieux, mais certainement en se basant (comme nous même) sur une réinterprétation des sons à partir de ce que l’on connais comme tournure de phrase courante (globalement et de la part de notre interlocuteur). Tout cela pour dire que moi-même j’ai souvent du mal à comprendre ce que disent les gens au téléphone avec le réseau actuel, j’ai dû mal à croire qu’un ordinateur puisse retranscrire correctement sans faire de “wild guess”.

Je pense surtout que la NSA n’a pas besoin d’une transcription parfaite : c’est plutôt une première approche pour extraire des mots-clés intéressants et savoir ce qui mérite leur attention ou pas : une fois que c’est fait, ils peuvent faire appel à un humain pour la transcription et la traduction. Mais s’ils devaient tout faire retranscrire et traduire par des humains, sans procéder à un premier filtrage, il leur faudrait embaucher la moitié des Etats-Unis.

lateo a écrit :

Donc si je comprends bien, ils ont un outil pour retranscrire « en live » une source audio sous une forme numérique quelconque (ce qui peut vouloir dire plein de choses, à priori ce n’est pas impressionnant du tout), puis ils donnent le résultat à manger à un outil capable de définir la langue source (ça me semble compliqué, à tort?) et traduire le merdier en anglais (probablement sous tout un tas de conditions)…

La transcription d’audio veut dire un truc bien précis : la conversion en texte.

Définir la langue source à partir d’un texte ensuite, c’est super simple, rien que Google Translate le fait plutôt bien.

Enfin, reste la traduction vers l’anglais… s’ils utilisent les technologies de Systran, le texte est grosso-modo inutilisable pour un usage réel, mais c’est sans doute suffisant pour extraire des mots-clés et savoir si la conversation parle de ton week-end chez mamie ou de ton intention de poser une bombe sale sur le Pentagone en criant Allahu Akhbar.

lateo

Le 09/05/2015 à 11h18

Liam a écrit :

La transcription d’audio veut dire un truc bien précis : la conversion en texte.

Définir la langue source à partir d’un texte ensuite, c’est super simple, rien que Google Translate le fait plutôt bien.

Enfin, reste la traduction vers l’anglais… s’ils utilisent les technologies de Systran, le texte est grosso-modo inutilisable pour un usage réel, mais c’est sans doute suffisant pour extraire des mots-clés et savoir si la conversation parle de ton week-end chez mamie ou de ton intention de poser une bombe sale sur le Pentagone en criant Allahu Akhbar.

Clarification : ce qui me semble compliqué c’est de «nourrir» le traducteur ou le détecteur de langue avec ce qui est pondu par le transcripteur.

Le résultat du transcripteur étant nécessairement assez éloigné de la forme écrite correcte dans la langue d’origine (forme correcte que les outils grand public savent plus ou moins traduire correctement).

Haemy

Le 09/05/2015 à 13h05

zempa a écrit :

Mais qui s’en étonnera encore ?

En lisant de sous-titre j’ai ri (jaune)… et puis je me suis rendu compte de ma non indignation.

En effet, beaucoup affirme aisément que cela ne les surprend pas et/ou qu’ils le savaient déjà.

Pour finir sur un “bof”.

Bof ?!?

Bof d’avoir (enfin!) les preuves d’un système de surveillance généralisé et massif des populations par des gouvernements de dites “démocraties” ?!?

Bof de voir que la majorité des surveillances ne concerne en rien le terrorisme ou plus généralement la sécurité (cf la surveillance de la France par l’Allemagne au profit de la NSA) ?!?

Et pourtant ceux qui finissent avec ce “bof” ( dont je fais parti) sont les mêmes qui se sont insurgés contre la HADOPI, l’ACTA, LA LOPPSI, etc.

A croire que ce qui n’est pas palpable est plus facilement accepté.

Il semble malheureusement que le coup des pédos-nazis-terroristes fonctionnent toujours.

Ce sous-titre démontre finalement l’acceptation de ce système à la Big Brother par les populations.

 

Et le plus drôle est de voir les réactions quand on ose affirmer qu’on n’est pas dans une véritable Démocratie…

Comme si le moins pire était la seule alternative… " />

Que veux tu que l’individu lambda fasse ? 

kade

Le 09/05/2015 à 13h06

Mr.Nox a écrit :

Max Payne.

" />

C’est vrai, j’y ai joué il y à fort fort longtemps, et je me souviens de cette fonction " />

Par contre, niveau chronologie : Matrix ou Max Payne ?

nigol

Le 09/05/2015 à 14h42

il a de la transcription quasi temp-reel dans les systèmes de sous-titres des chaines TV.

Il suffit d’activer les sous-titres mal-entendants pour s’en rendre compte.

Quand les matchs sportifs sont diffusés dans les bars tres bruyants, vous avez jamais remarqué que le barman affichait la retranscription automatique des commentaires sportifs?

zempa Abonné

Le 09/05/2015 à 15h39

tu n’as même pas une petite idée ???

linkin623 Abonné

Le 09/05/2015 à 15h47

svoboda a écrit :

Ca va engendrer une renaissance des patois, dialectes et autres langues tribales, comme la langue navajo pendant la II ème guerre

Windtalkers, excellent film avec Nicolas Cage (eh c’est arrivé oui).

Sinon je te rassure, la NSA et autre ont les personnes pour comprendre les “patois” ou autres “dialectes locaux”, suffit de voir les offres d’emplois…

Et puis de toute façon c’est pas la langue qui les gênent, le plus compliqué est d’avoir le code.

Comme dans Windtalkers, c’est le mot “tortue” qui désigne les tanks. Donc même en comprenant le navajo, faut pouvoir faire le lien…

psn00ps

Le 09/05/2015 à 22h12

nigol a écrit :

il a de la transcription quasi temp-reel dans les systèmes de sous-titres des chaines TV.

Il suffit d’activer les sous-titres mal-entendants pour s’en rendre compte.

Ceux la sont préenregistrés.

 

psn00ps

Le 09/05/2015 à 22h16

kade a écrit :

" />

C’est vrai, j’y ai joué il y à fort fort longtemps, et je me souviens de cette fonction " />

Par contre, niveau chronologie : Matrix ou Max Payne ?

Matrix d’abord, en suite Max Payne (un des truands en parle carrément dans le jeu)

 mais…

aucun des deux n’est l’inventeur de la technique " />

kade

Le 09/05/2015 à 23h21

psn00ps a écrit :

Matrix d’abord, en suite Max Payne (un des truands en parle carrément dans le jeu)

mais…

aucun des deux n’est l’inventeur de la technique " />

" />

J’avais donc raison !

Bon, sous réserves du Wiki (que je m’étais interdit de consulter depuis le début).

Ouf ! " />

divide

Le 10/05/2015 à 07h42

Non, il ne parle pas des films, mais des lives et des reportages qui n’ont pas de piste sous-titre à priori. Il s’agit donc bien de transcription temps réel. Aprés comme il n’y a qu’un seul flux à gérer par chaine, c’est peut-être assuré par un humain…

SebGF Abonné

Le 10/05/2015 à 08h07

divide a écrit :

Non, il ne parle pas des films, mais des lives et des reportages qui n’ont pas de piste sous-titre à priori. Il s’agit donc bien de transcription temps réel. Aprés comme il n’y a qu’un seul flux à gérer par chaine, c’est peut-être assuré par un humain…

Même si le direct à la TV a toujours un léger différé d’une minute ou deux (pour censurer quelque chose d’horrible et qui provoquerait la perte de l’humanité, genre un bout de néné), je doute sincèrement qu’il y ait intervention humaine sur une transcription d’un live. Peut-être relecture oui, mais écriture faut une sacré dextérité pour ne faire aucune faute de frappe et erreur de langue en si peu de temps avec un tel flux tendu.

A titre d’exemple, Youtube fait depuis quelques temps la traduction/transcription automatique des paroles d’une vidéo. C’est plus ou moins efficace.

Mihashi Abonné

Le 10/05/2015 à 09h46

SebGF a écrit :

A titre d’exemple, Youtube fait depuis quelques temps la traduction/transcription automatique des paroles d’une vidéo. C’est plus ou moins totalement pas efficace.

" />

Parce que bon, quand même…

Haemy

Le 10/05/2015 à 09h55

zempa a écrit :

tu n’as même pas une petite idée ???

Non.

JoePike

Le 10/05/2015 à 11h19

psn00ps a écrit :

Ceux la sont préenregistrés.

Non Non c’est en Live

J’utilise ça ici ( Catalogne) pendant les news en catalan parce que j’y pige quedalle .

donc les phrases ne sont pas complètes mais certains mots clés ressortent ce qui fait que tu perçois vaguement de quoi on cause.

Mr.Nox

Le 10/05/2015 à 12h49

Je pensais vraiment que Max Payne était antérieur à Matrix !

JohnDeuf

Le 10/05/2015 à 18h33

C’est triste mais ça ne me choque même plus.

Ca ne me choque plus qu’ils bafouent tant de droits et de valeurs - Y compris celles portées par leur propre pays. Et ça ne me choque plus qu’ils disposent d’une technologie qui pourraient servir à tant de choses…

Ca veut dire que je suis habitué ? " />

zefling Abonné

Le 10/05/2015 à 19h30

Bon, il va falloir que j’apprenne le Klingon ou elfique, jusqu’à ce que la NSA décode aussi ça. " />

zempa Abonné

Le 10/05/2015 à 19h51

" />

Liam

Le 11/05/2015 à 00h23

nigol a écrit :

il a de la transcription quasi temp-reel dans les systèmes de sous-titres des chaines TV.

Il suffit d’activer les sous-titres mal-entendants pour s’en rendre compte.

Quand les matchs sportifs sont diffusés dans les bars tres bruyants, vous avez jamais remarqué que le barman affichait la retranscription automatique des commentaires sportifs?

SebGF a écrit :

Même si le direct à la TV a toujours un léger différé d’une minute ou deux (pour censurer quelque chose d’horrible et qui provoquerait la perte de l’humanité, genre un bout de néné), je doute sincèrement qu’il y ait intervention humaine sur une transcription d’un live. Peut-être relecture oui, mais écriture faut une sacré dextérité pour ne faire aucune faute de frappe et erreur de langue en si peu de temps avec un tel flux tendu.

A titre d’exemple, Youtube fait depuis quelques temps la traduction/transcription automatique des paroles d’une vidéo. C’est plus ou moins efficace.

C’est bien du direct, mais ça ne marche pas du tout comme Youtube : il y a en fait un humain (que l’on surnomme dans le milieu un “perroquet”) qui répète tout ce qui se dit dans un micro mais plus clairement, distinctement, en faisant les bonnes pauses et en énnonçant les virgules et ce genre de truc, pour que le système de reconnaissance vocale ne fasse pas trop d’erreur.

En général, il y a aussi en bout de chaîne un correcteur qui reprend les erreurs les plus grossières du système de reconnaissance vocale (en général, les chaînes qui ont renoncé au correcteur, “charmés” par les promesses d’un commercial qui jurait que son logiciel de reconnaissance avait 99% d’exactitude, sont revenu en arrière sous les protestations de leur public malentendant, les sous-titres devenant quasi-illisibles).

Le système utilisé par la NSA doit être plus proche du système de Youtube (mais peut-être un peu + avancé) en se passant totalement d’humains. Ça marche potablement quand une personne parle seule, clairement, sans divers bruits de fond derrière, sans plusieurs voix qui s’entrecoupent, sans hurler ou chanter etc.

Il faut reconnaître qu’erreurs de transcription automatique + erreurs de traduction automatique doit donner des textes marrants, mais assez éloigné de l’original. Maintenant, si le but est de repérer quand un mec parle de “bombarder le pentagone” au téléphone, ça doit faire l’affaire.

SebGF Abonné

Le 11/05/2015 à 11h59

Merci pour la précision, je ne savais pas qu’il y avait cette pratique d’avoir un “perroquet”.

Au final il joue un peu le rôle d’un interprète qui traduit juste en langage clair les propos tenus par un animateur qui peuvent être animés par l’émotion ou le jeu. Ca reste du flux tendu et à mon avis on a pas beaucoup le droit à l’erreur !!

Néanmoins les outils de reconnaissance vocal s’améliorent quand même pas mal. Je vois sur mon Lumia la miss Cortana est pas trop mauvaise. Après c’est du traitement assisté par serveurs distants qui apprennent avec les milliers d’utilisateurs qui s’en servent, là où les solutions dont tu parles ne doivent pas avoir cet avantage.

fullero

Le 12/05/2015 à 08h13

L’ article n’ est pas très correct vis à vis de Snowden.

Pire.

Mensonger.

Ou il y a un problème de journalisme.

Ou un problème de moralité.

Parce que Snowden n’ a jamais eu besoin de voler aucun document à quiconque vu que pour voler quelque chose à quelqu’ un il faut y être étranger.

Or Snowden était non seulement un employé de la NSA  mais surtout un des admins de son système d’ information.

Cela m’ arrive de dire que je me suis volé moi même quand je ne retrouve pas mes propres affaires.

Mais dans ce cas, Snowden les détenait déjà.

Tout ce qu’ on peut lui reprocher, c’ est une entorse à son contrat de travail en ce qui concerne la confiden,tialité & nullement d’ être un voleur.

Quelques soient nos contrats de travail, nous vivoons dans des pays qui se disent démocratiques.

C’ est à dire censés respecter notre liberté de conscience.

Ce qui par conséquent pour motif de conscience, le droit à cette liberté étant une primauté des droits de l’ homme & de la démocratie il me semble, revient à l’ absoudre de tout péché.

Je n’ ai hamais été le toutou d’ aucun patron.

Et s’ il me vient l’ envie de lui claquer la “gle parce qu’il fait des trucs pas corrects, crois moi !!

Je vais pas me gêner !!

Et toi ?