Connexion
Abonnez-vous

La NSA peut transcrire à la volée des conversations dans de nombreuses langues

Mais qui s'en étonnera encore ?

La NSA peut transcrire à la volée des conversations dans de nombreuses langues

Le 08 mai 2015 à 10h00

La NSA et son équivalent anglais, le GCHQ, ont investi durant des années dans la recherche sur la reconnaissance vocale. Les agences de renseignement seraient en capacité d’écouter des conversations dans de nombreuses langues pour les convertir automatiquement en texte anglais. Les documents seraient alors stockés dans une base de données interrogeable par les analystes.

Transcrire à la volée et en anglais des conversations enregistrées

Les documents dérobés à la NSA par Edward Snowden ont montré à de très nombreuses reprises l’étendue des capacités de l’agence américaine de renseignement, mais pas seulement. Ils ont mis en évidence des réseaux de relations entre les pays, notamment une alliance formée par les États-Unis et le Royaume-Uni, et plus globalement avec le Canada, la Nouvelle-Zélande et l’Australie : les fameux Five Eyes.

The Intercept a pu plonger dans d’autres documents, qui abordent cette fois la reconnaissance vocale. On y apprend comment la NSA et le GCHQ ont utilisé le logiciel Dragon Dictate et l’ont modifié durant des années pour arriver au résultat attendu. Avec un tel outil, les agences sont capables de passer à la moulinette l’ensemble des conversations vocales enregistrées pour les traduire automatiquement sous forme de texte.

Les analystes ont donc accès à une base de données particulièrement riche contenant ces transcriptions ainsi que les fichiers audio d’origine. Divers algorithmes travaillent sur les versions textes pour repérer automatiquement certains mots-clés et marquer des conversations comme « intéressantes ».

Au moins un million de transcriptions par jour

La première utilisation du logiciel, nommé RHINEHART, remonterait à 2004 et se serait montré si efficace que les propres analystes de la NSA l’auraient surnommé « Google For Voice ». Il aurait été remplacé plusieurs années après par VoiceRT, plus performant et utilisé pour la première fois à Bagdad. En 2013, nouveau remplacement avec SPITFIRE, à son tour nettement plus rapide. Les documents donnent d’ailleurs un ordre d’idée des capacités mises en mouvement, puisque VoiceRT pouvait analyser, transcrire et repérer les termes intéressants au rythme d’un million de fichiers audio par jour.

Les documents vus par The Intercept ne permettent cependant pas de connaître l’étendue de l’utilisation de ces solutions aujourd’hui ou même durant la dernière décennie. Il est certain qu’elles ont été utilisées à l’étranger puisque le but premier est de traduire automatiquement en anglais, mais rien ne dit que l’une ou l’autre n’ait pas été employée directement sur le sol national.

La collecte des métadonnées remise en cause aux États-Unis

L’avenir des données téléphoniques aux États-Unis pourrait d’ailleurs changer dans les mois qui viennent. L’ACLU (American Civil Liberties Union) avait en effet déposé plainte contre le gouvernement pour avoir dépassé les permissions du Patriot Act sur la collecte à très large échelle des métadonnées téléphoniques. Or, une cour fédérale d’appel vient de donner raison à l’association, en indiquant que si le Congrès souhaitait autoriser une pareille collecte, il pouvait légiférer en ce sens, mais que la loi actuelle ne l’autorisait pas.

L’affaire a donc été renvoyée devant un autre tribunal. La chronologie pourrait mal tomber pour la NSA car l’autorisation doit être renouvelée périodiquement, le mandat actuel expirant le 1er juin. L’ACLU se félicite de cette victoire et estime désormais que la situation dépend entièrement du Congrès.

Commentaires (85)

Vous devez être abonné pour pouvoir commenter.

Abonnez-vous
votre avatar

Pour plus de confort bientôt un capteur d’odeur intégré au téléphone, et plus tard on apprendra que la NSA traque l’odeur de la poudre.

votre avatar







elezoic a écrit :



Pour plus de confort bientôt un capteur d’odeur intégré au téléphone, et plus tard on apprendra que la NSA traque l’odeur de la poudre.







Et ben, avec toutes les caisses que je lâche je serai vite classé terroriste alors car je vais en tuer plus d’un <img data-src=" />



Amis de la poésie, bonsoir.



PS : avec un petit combo maroilles / Tartiflette tiens <img data-src=" />


votre avatar

pour calculer de la kaille bien zdeg, faut qu’il charbonne mortel.

votre avatar

Toutes manières, si vous n’avez rien à cacher, je ne vois pas en quoi ça serait dérangeant que les Américains (la NSA) ait accès à tout ce qui passe par du réseau…



Après tout, ils ne le font que probablement pour chasser du barbu, certainement pas pour des secrets indus ou autre, z’ont beaucoup trop de morale pour s’abaisser à ce genre de méthodes.

votre avatar

On parle de transcription (conversion de paroles orales en texte écrit) ou de traduction (conversion d’une langue à l’autre) ?









fred131 a écrit :



Une société français participe aux logiciels de traductions“systran”, cocorico ….. ou pas <img data-src=" />







Si vraiment ils utilisent les technologies de Systran pour traduire automatiquement d’une langue à l’autre… je serais vous je m’en ferais pas trop pour ma vie privée. Ces trucs là ne marchent à peu près pas. <img data-src=" />



Bon j’imagine que ça peut servir pour extraire quelques mots clés, et ainsi filtrer les messages qui ensuite ont besoin d’être traduits par un humain par rapport à ceux dont on s’en fout. Mais faut pas croire qu’on peut vraiment travailler avec des textes traduits par Systran.



Voici une traduction par Systran du premier commentaire du premier post de la page d’accueil de Reddit :







Systran a écrit :



Il y a un APP. Presque tous les (dans pas encore le tout) dépôts à la maison ont WiFi gratuit. L’APP vous indique dans quel bas-côté, sur lequel baie (support) et combien sont en stock. Il fournit également le nombre d’évaluation et d’article.







Voilà, essayez de reconstituer l’original maintenant…


votre avatar

Vendredi, trop visible <img data-src=" />







Marco07 a écrit :



Toutes manières, si vous n’avez rien à cacher, je ne vois pas en quoi ça serait dérangeant que les Américains (la NSA) ait accès à tout ce qui passe par du réseau…



Après tout, ils ne le font que probablement pour chasser du barbu, certainement pas pour des secrets indus ou autre, z’ont beaucoup trop de morale pour s’abaisser à ce genre de méthodes.





Sinon pour ceux qui n’ont rien à cacher, instruisez vous :

http://jenairienacacher.fr/


votre avatar

Ouais mais bon, on s’entend que Cortana détecte le Hey Cortana en local, hein… En plus, toute observation passant par ce genre de technique serait très facilement visible au niveau de la connection internet qui en prendrait un coup.

votre avatar







marshall39 a écrit :



Bof , je suis allé passer quelques jours a Amsterdam , et si Google Now m’a fait peur c’est plus par son efficacité , que ca soit pour retrouver le chemin jusqu’à la location , les horaires des bus et tramways , les trucs sympa a voir aux alentours….

Le truc qui m’a soufflé , dans un restaurant au moment de payer je me souvenais plus comment on disait “addition” en anglais , j’ouvre Google Now m’apprêtant a taper ma demande et dans les suggestion de traduction avant meme de taper quoi que ce soit je vois “l’addition s’il vous plait = Bill please” Là je fais wouarf ils savent même qu’on vient de manger&nbsp;<img data-src=" />





Pareil, mais avec les outils Nokia sur Windows Phone.

Restaurants aux alentours, métro à prendre avec les horaires kivonbien, gps à pied pour pas se perdre…

On devient dépendants en fait…


votre avatar







kade a écrit :



Oui, ils utilisent le système “bullet-time” inventé je crois, par Monsieur Matrix.





Aaah ce fameux Don ??


votre avatar







Cara62 a écrit :



Pourquoi plusieurs langues ? Seul l’arabe suffit non ?



<img data-src=" /> <img data-src=" /> <img data-src=" />



Avec l’autre taré de Matignon et pas mal d’autres de la classe politique, ce serait plutôt l’hébreu, non ? <img data-src=" />


votre avatar







SpiritNico a écrit :



Quand je pense que pour les personnes sourdes et malentendantes c’est encore la croix et la bannière pour comprendre le français oral. Je ne parle même pas des autres langues…

A quand un petit appareil (ou appli SmartPhone) efficace et performante pour traduire en live ou simplement “sous-titrer” en live ?





dragon naturally speacking 8



balabolka :&nbsp; lit du texte et traduit en voix


votre avatar







Cara62 a écrit :



Pourquoi plusieurs langues ? Seul l’arabe suffit non ?



<img data-src=" /> <img data-src=" /> <img data-src=" />





<img data-src=" />


votre avatar







dodo021 a écrit :



Google Now me fait plus peur que Cortana pour le moment.





Google ……..<img data-src=" />


votre avatar







svoboda a écrit :



Ca va engendrer une renaissance des patois, dialectes et autres langues tribales, comme la langue navajo pendant la II ème guerre





toujours en patois au téléphone avec les amis


votre avatar







matroska a écrit :



Ça fonctionne pour les conversations hot ou pas ?



Remarque, transcrire “oh oui, oh oui” en “oh yes, oh yes”, ça n’a guère d’intérêt…



<img data-src=" />



<img data-src=" />





oh my gode&nbsp;<img data-src=" />


votre avatar

Dès que tu parles de CIA et de NSA, on te traite toujours de parano… Les gens sont navrants de naïveté.

votre avatar

Je verrais plutôt un traducteur “immigré-anglais”, en fait <img data-src=" />

votre avatar

avec cortana qui va generaliser l’os qui ecoute en permanence ca fait une bonne combo&nbsp;<img data-src=" />

votre avatar

Par définition Cortana transcrit un son en code informatique utilisable par une machine. Donc le truc de la NSA ne sert à rien, vu que MS le fait déjà pour te renvoyer le résultat <img data-src=" />

votre avatar

Google Now me fait plus peur que Cortana pour le moment.

votre avatar

C’est un hommage à l’actu je pense :



“Les analystes ont donc axé à une base de données”&nbsp;<img data-src=" />

votre avatar

<img data-src=" /> Whoupitin j’ai même pas fait gaffe <img data-src=" />

votre avatar

Ca va engendrer une renaissance des patois, dialectes et autres langues tribales, comme la langue navajo pendant la II ème guerre

votre avatar







moggbomber a écrit :



avec cortana qui va generaliser l’os qui ecoute en permanence ca fait une bonne combo <img data-src=" />







Il y a de la reconnaissance vocale depuis Vista…


votre avatar







Cara62 a écrit :



Pourquoi plusieurs langues ? Seul l’arabe suffit non ?



<img data-src=" /> <img data-src=" /> <img data-src=" />





<img data-src=" />


votre avatar

Rater voulait faire 911. <img data-src=" />

votre avatar

Quand un des GAFA aura acheter la NSA.

votre avatar

<img data-src=" />



<img data-src=" /> <img data-src=" />

votre avatar

ce que je voulais dire c’est que grâce a cortana, votre ordi vous ecoute en permanence pour capter le “hey cortana” (marche aussi pour google, siri and co)

&nbsp;

bon ok “gadget” pour le moment peu utile. mais si cela devient intégré de plus en plus a l’os au point d’en devenir nécessaire et donc devenir permanent et répandu.

ce flux audio capté en permanence pourra donc etre capté par la nsa et retranscrit en texte (plus facile a traiter par la suite je pense)



on a donc les tel portables, les tel fixes (même pas décrochés, voir citizenfour avec Snowden), les télé connectées, les consoles new gen, les ordi portables, les tablettes. il manque les desktop qui n’ont pas de perph connecté en permanence comme les casque ou webcam.

cela devrait donc évoluer sur les destop oem pour justement pouvoir utiliser cortana. donc hop micros répandus encore plus&nbsp;<img data-src=" /> (notamment entreprises)

&nbsp;

bon je dis pas pas super sérieusement, mais une fois qu’on a lu les diff déclarations et documents &nbsp;Snowden on sait maintenant que c’est possible.<img data-src=" />



attention je parle d’ordi ciblés hein. pas d’écoute trop généralisées a la metadonnées

votre avatar

Même le WeshGrosBienouBien ?

votre avatar







Vekin a écrit :



Bon et quand est-ce qu’ils nous font profiter de leur formidable outil ? <img data-src=" />





Ca s’appelle la traduction instantanée de Skype et c’est bientôt disponible :p


votre avatar

Bof , je suis allé passer quelques jours a Amsterdam , et si Google Now m’a fait peur c’est plus par son efficacité , que ca soit pour retrouver le chemin jusqu’à la location , les horaires des bus et tramways , les trucs sympa a voir aux alentours….

Le truc qui m’a soufflé , dans un restaurant au moment de payer je me souvenais plus comment on disait “addition” en anglais , j’ouvre Google Now m’apprêtant a taper ma demande et dans les suggestion de traduction avant meme de taper quoi que ce soit je vois “l’addition s’il vous plait = Bill please” Là je fais wouarf ils savent même qu’on vient de manger&nbsp;<img data-src=" />

votre avatar

Çà ne m’étonne absolument pas, et en fait je pensais même que çà se savait <img data-src=" />

votre avatar

Une société français participe aux logiciels de traductions“systran”, cocorico ….. ou pas <img data-src=" />

votre avatar

Quand je pense que pour les personnes sourdes et malentendantes c’est encore la croix et la bannière pour comprendre le français oral. Je ne parle même pas des autres langues…

A quand un petit appareil (ou appli SmartPhone) efficace et performante pour traduire en live ou simplement “sous-titrer” en live ?

votre avatar

Bientôt plus besoin avec Skype !&nbsp; Le boulot sera fait par microsoft !

votre avatar







fred131 a écrit :



Une société français participe aux logiciels de traductions“systran”, cocorico ….. ou pas <img data-src=" />





Ben … développer ce genre de logiciel, c’est très intéressant…

Après, l’utilisation éthique… c’est une autre histoire…


votre avatar

Je penser que les américains n’aimè pas le sous-titré.<img data-src=" />

votre avatar







Baldurien a écrit :



Ben … développer ce genre de logiciel, c’est très intéressant…

Après, l’utilisation éthique… c’est une autre histoire…





La quoi? <img data-src=" />





Ami-Kuns a écrit :



Je penser que les américains n’aimè pas le sous-titré.<img data-src=" />





<img data-src=" />

9 mots, 2 verbes, 2 fautes ; pas mal… Astuce


votre avatar

Bon et quand est-ce qu’ils nous font profiter de leur formidable outil ? <img data-src=" />

votre avatar

Tu plaisantes ? Controler la planete est bien plus INtéressant !

votre avatar

Pourquoi plusieurs langues ? Seul l’arabe suffit non ?



<img data-src=" /> <img data-src=" /> <img data-src=" />

votre avatar







linkin623 a écrit :



La quoi? <img data-src=" />





et tique ? :)


votre avatar







&nbsp; Vincent Hermann a écrit :



Les analystes ont donc “axé”&nbsp; à une base de données particulièrement riche

contenant ces transcriptions ainsi que les fichiers audio d’origine





&nbsp;Au secours ! Ça m’a fait un gros trou dans l’oeil droit.


votre avatar



Les analystes ont donc axé à une base de données

&nbsp;

Seriously? ^^

votre avatar

Ça fonctionne pour les conversations hot ou pas ?



Remarque, transcrire “oh oui, oh oui” en “oh yes, oh yes”, ça n’a guère d’intérêt…



<img data-src=" />



<img data-src=" />

votre avatar







Vekin a écrit :



Bon et quand est-ce qu’ils nous font profiter de leur formidable outil ? <img data-src=" />





Sur mon Galaxy S5 mini, la reconnaissance vocale marche assez bien, mais il faut quand même que je parle nettement plus lentement que mon débit naturel pour que ça marche. Je me demande si le logiciel mis au point par la NSA arrive à transcrire une de mes conversations à débit normal (je parle vite donc).


votre avatar

Je n’y connais rien mais peut-être qu’ils peuvent ralentir l’enregistrement pour mieux l’analyser . Ce qui occasionne un petit délai par rapport à de la traduction à la volée mais qui est peut-être acceptable pour eux <img data-src=" />

votre avatar

C’est pour quand les sou-titre sur tout les video de toutube?

votre avatar







linkin623 a écrit :



<img data-src=" />

9 mots, 2 verbes, 2 fautes ; pas mal… Astuce





Je venais de lire le commentaire. Je ne savais plus quoi penser…

Pui j’aî tombai surle tient.



Rien à ajouter.



Merci <img data-src=" />


votre avatar







DotNerk a écrit :



Je n’y connais rien mais peut-être qu’ils peuvent ralentir l’enregistrement pour mieux l’analyser .





Oui, ils utilisent le système “bullet-time” inventé je crois, par Monsieur Matrix.


votre avatar







OlivierJ a écrit :



Sur mon Galaxy S5 mini, la reconnaissance vocale marche assez bien, mais il faut quand même que je parle nettement plus lentement que mon débit naturel pour que ça marche. Je me demande si le logiciel mis au point par la NSA arrive à transcrire une de mes conversations à débit normal (je parle vite donc).





Mon petit doigt me dit que les systèmes de la NSA doivent être légèrement plus performants qu’un téléphone. Mais je n’avance imprudemment sans aucune source à présenter.


votre avatar







DotNerk a écrit :



Je n’y connais rien mais peut-être qu’ils peuvent ralentir l’enregistrement pour mieux l’analyser . Ce qui occasionne un petit délai par rapport à de la traduction à la volée mais qui est peut-être acceptable pour eux <img data-src=" />





Ralentir l’enregistrement, ça ne veut pas dire grand chose, ils partent d’un enregistrement et des données, qu’ils analysent comme n’importe quelles autres données, il n’y a pas vraiment de notion de vitesse. En principe en parlant vite et en articulant, un logiciel devrait arriver à reconnaître les syllabes, mais il a moins de signal pour ça je suppose.


votre avatar







kade a écrit :



Mon petit doigt me dit que les systèmes de la NSA doivent être légèrement plus performants qu’un téléphone. Mais je n’avance imprudemment sans aucune source à présenter.





Vu que sur un mobile, l’analyse doit être assez rapide pour être utile, certes pour la NSA le logiciel peut prendre plus son temps. D’un autre côté, la puissance des ordinateurs ayant bien augmenté au cours des années, et vu les moyens de Google (derrière Android), je suppose qu’ils utilisent un logiciel aussi performant que possible sur leur téléphone. Note que le logiciel de reconnaissance ne dépend pas la puissance du mobile vu qu’il faut être connecté pour que la reconnaissance fonctionne.


votre avatar

Le Big Data a de beaux jours devant lui :)

votre avatar







OlivierJ a écrit :



Note que le logiciel de reconnaissance ne dépend pas la puissance du mobile vu qu’il faut être connecté pour que la reconnaissance fonctionne.





Ouais, dans un téléphone…

Mais quand tu es connecté en local par fibre aux BDD, c’est une autre histoire <img data-src=" />


votre avatar







john san a écrit :



Le Big Data a de beaux jours devant lui :)





Il est utilisé par des infrastructures bien plus petites que Facebook, Google et les autres.

Le NOSQL entre autre, est disponible sur pas mal de BDD en natif maintenant.

Puis le traitement en mode colonne, tout ça… ça devient incontournable pour des traitements “batch” aussi.


votre avatar

wesh bn kourag pr capter se kon dis mddrr, il a intéré a etre chanmé leure bordel ptdr

votre avatar

Tu peux bien écrire n’importe comment, ça retranscrit la voix, pas l’écrit. <img data-src=" />

votre avatar

Mais qui s’en étonnera encore ?

En lisant de sous-titre j’ai ri (jaune)… et puis je me suis rendu compte de ma non indignation.



En effet, beaucoup affirme aisément que cela ne les surprend pas et/ou qu’ils le savaient déjà.

Pour finir sur un “bof”.



Bof ?!?

Bof d’avoir (enfin!) les preuves d’un système de surveillance généralisé et massif des populations par des gouvernements de dites “démocraties” ?!?

Bof de voir que la majorité des surveillances ne concerne en rien le terrorisme ou plus généralement la sécurité (cf la surveillance de la France par l’Allemagne au profit de la NSA) ?!?



Et pourtant ceux qui finissent avec ce “bof” ( dont je fais parti) sont les mêmes qui se sont insurgés contre la HADOPI, l’ACTA, LA LOPPSI, etc.

A croire que ce qui n’est pas palpable est plus facilement accepté.



Il semble malheureusement que le coup des pédos-nazis-terroristes fonctionnent toujours.



Ce sous-titre démontre finalement l’acceptation de ce système à la Big Brother par les populations.

&nbsp;

Et le plus drôle est de voir les réactions quand on ose affirmer qu’on n’est pas dans une véritable Démocratie…

Comme si le moins pire était la seule alternative… <img data-src=" />

votre avatar

Je me demande toujours, connaissant le baratin habituel des commerciaux en logiciels, à quel point ces annonces sont réalistes d’un point de vue réelle.



S’il y a des logiciels qui m’étonnent sur leurs capacités, je vois aussi beaucoup de déconvenues. Les capacités réelles d’un logiciel quand on le met en place sont souvent loin de ce que l’on s’imagine en lisant les brochures.



Exemple dans la reconnaissance vocale: incapacité chronique à comprendre une longue phrase dite à vitesse normale. Incapacité chronique à comprendre une phrase dans laquelle on ne marque pas correctement la ponctuation par des pauses.



Bien sûr, la NSA peut avoir mieux, mais certainement en se basant (comme nous même) sur une réinterprétation des sons à partir de ce que l’on connais comme tournure de phrase courante (globalement et de la part de notre interlocuteur). Tout cela pour dire que moi-même j’ai souvent du mal à comprendre ce que disent les gens au téléphone avec le réseau actuel, j’ai dû mal à croire qu’un ordinateur puisse retranscrire correctement sans faire de “wild guess”.

votre avatar

Max Payne.

votre avatar

Donc si je comprends bien, ils ont un outil pour retranscrire « en live » une source audio sous une forme numérique quelconque (ce qui peut vouloir dire plein de choses, à priori ce n’est pas impressionnant du tout), puis ils donnent le résultat à manger à un outil capable de définir la langue source (ça me semble compliqué, à tort?) et traduire le merdier en anglais (probablement sous tout un tas de conditions)…

votre avatar







brice.wernet a écrit :



Bien sûr, la NSA peut avoir mieux, mais certainement en se basant (comme nous même) sur une réinterprétation des sons à partir de ce que l’on connais comme tournure de phrase courante (globalement et de la part de notre interlocuteur). Tout cela pour dire que moi-même j’ai souvent du mal à comprendre ce que disent les gens au téléphone avec le réseau actuel, j’ai dû mal à croire qu’un ordinateur puisse retranscrire correctement sans faire de “wild guess”.







Je pense surtout que la NSA n’a pas besoin d’une transcription parfaite : c’est plutôt une première approche pour extraire des mots-clés intéressants et savoir ce qui mérite leur attention ou pas : une fois que c’est fait, ils peuvent faire appel à un humain pour la transcription et la traduction. Mais s’ils devaient tout faire retranscrire et traduire par des humains, sans procéder à un premier filtrage, il leur faudrait embaucher la moitié des Etats-Unis.







lateo a écrit :



Donc si je comprends bien, ils ont un outil pour retranscrire « en live » une source audio sous une forme numérique quelconque (ce qui peut vouloir dire plein de choses, à priori ce n’est pas impressionnant du tout), puis ils donnent le résultat à manger à un outil capable de définir la langue source (ça me semble compliqué, à tort?) et traduire le merdier en anglais (probablement sous tout un tas de conditions)…







La transcription d’audio veut dire un truc bien précis : la conversion en texte.

Définir la langue source à partir d’un texte ensuite, c’est super simple, rien que Google Translate le fait plutôt bien.

Enfin, reste la traduction vers l’anglais… s’ils utilisent les technologies de Systran, le texte est grosso-modo inutilisable pour un usage réel, mais c’est sans doute suffisant pour extraire des mots-clés et savoir si la conversation parle de ton week-end chez mamie ou de ton intention de poser une bombe sale sur le Pentagone en criant Allahu Akhbar.


votre avatar







Liam a écrit :



La transcription d’audio veut dire un truc bien précis : la conversion en texte.

Définir la langue source à partir d’un texte ensuite, c’est super simple, rien que Google Translate le fait plutôt bien.

Enfin, reste la traduction vers l’anglais… s’ils utilisent les technologies de Systran, le texte est grosso-modo inutilisable pour un usage réel, mais c’est sans doute suffisant pour extraire des mots-clés et savoir si la conversation parle de ton week-end chez mamie ou de ton intention de poser une bombe sale sur le Pentagone en criant Allahu Akhbar.







Clarification : ce qui me semble compliqué c’est de «nourrir» le traducteur ou le détecteur de langue avec ce qui est pondu par le transcripteur.

Le résultat du transcripteur étant nécessairement assez éloigné de la forme écrite correcte dans la langue d’origine (forme correcte que les outils grand public savent plus ou moins traduire correctement).


votre avatar







zempa a écrit :



Mais qui s’en étonnera encore ?

En lisant de sous-titre j’ai ri (jaune)… et puis je me suis rendu compte de ma non indignation.



En effet, beaucoup affirme aisément que cela ne les surprend pas et/ou qu’ils le savaient déjà.

Pour finir sur un “bof”.



Bof ?!?

Bof d’avoir (enfin!) les preuves d’un système de surveillance généralisé et massif des populations par des gouvernements de dites “démocraties” ?!?

Bof de voir que la majorité des surveillances ne concerne en rien le terrorisme ou plus généralement la sécurité (cf la surveillance de la France par l’Allemagne au profit de la NSA) ?!?



Et pourtant ceux qui finissent avec ce “bof” ( dont je fais parti) sont les mêmes qui se sont insurgés contre la HADOPI, l’ACTA, LA LOPPSI, etc.

A croire que ce qui n’est pas palpable est plus facilement accepté.



Il semble malheureusement que le coup des pédos-nazis-terroristes fonctionnent toujours.



Ce sous-titre démontre finalement l’acceptation de ce système à la Big Brother par les populations.

&nbsp;

Et le plus drôle est de voir les réactions quand on ose affirmer qu’on n’est pas dans une véritable Démocratie…

Comme si le moins pire était la seule alternative… <img data-src=" />





Que veux tu que l’individu lambda fasse ?&nbsp;


votre avatar







Mr.Nox a écrit :



Max Payne.





<img data-src=" />

C’est vrai, j’y ai joué il y à fort fort longtemps, et je me souviens de cette fonction <img data-src=" />

Par contre, niveau chronologie : Matrix ou Max Payne ?


votre avatar

il a de la transcription quasi temp-reel dans les systèmes de sous-titres des chaines TV.

Il suffit d’activer les sous-titres mal-entendants pour s’en rendre compte.



Quand les matchs sportifs sont diffusés dans les bars tres bruyants, vous avez jamais remarqué que le barman affichait la retranscription automatique des commentaires sportifs?

votre avatar

tu n’as même pas une petite idée ???

votre avatar







svoboda a écrit :



Ca va engendrer une renaissance des patois, dialectes et autres langues tribales, comme la langue navajo pendant la II ème guerre





Windtalkers, excellent film avec Nicolas Cage (eh c’est arrivé oui).



Sinon je te rassure, la NSA et autre ont les personnes pour comprendre les “patois” ou autres “dialectes locaux”, suffit de voir les offres d’emplois…



Et puis de toute façon c’est pas la langue qui les gênent, le plus compliqué est d’avoir le code.



Comme dans Windtalkers, c’est le mot “tortue” qui désigne les tanks. Donc même en comprenant le navajo, faut pouvoir faire le lien…


votre avatar







nigol a écrit :



il a de la transcription quasi temp-reel dans les systèmes de sous-titres des chaines TV.

Il suffit d’activer les sous-titres mal-entendants pour s’en rendre compte.



Ceux la sont préenregistrés.

&nbsp;


votre avatar







kade a écrit :



<img data-src=" />

C’est vrai, j’y ai joué il y à fort fort longtemps, et je me souviens de cette fonction <img data-src=" />

Par contre, niveau chronologie : Matrix ou Max Payne ?





Matrix d’abord, en suite Max Payne (un des truands en parle carrément dans le jeu)

&nbsp;mais…

aucun des deux n’est l’inventeur de la technique <img data-src=" />


votre avatar







psn00ps a écrit :



Matrix d’abord, en suite Max Payne (un des truands en parle carrément dans le jeu)

 mais…

aucun des deux n’est l’inventeur de la technique <img data-src=" />





<img data-src=" />

J’avais donc raison !

Bon, sous réserves du Wiki (que je m’étais interdit de consulter depuis le début).

Ouf ! <img data-src=" />


votre avatar

Non, il ne parle pas des films, mais des lives et des reportages qui n’ont pas de piste sous-titre à priori. Il s’agit donc bien de transcription temps réel. Aprés comme il n’y a qu’un seul flux à gérer par chaine, c’est peut-être assuré par un humain…

votre avatar







divide a écrit :



Non, il ne parle pas des films, mais des lives et des reportages qui n’ont pas de piste sous-titre à priori. Il s’agit donc bien de transcription temps réel. Aprés comme il n’y a qu’un seul flux à gérer par chaine, c’est peut-être assuré par un humain…







Même si le direct à la TV a toujours un léger différé d’une minute ou deux (pour censurer quelque chose d’horrible et qui provoquerait la perte de l’humanité, genre un bout de néné), je doute sincèrement qu’il y ait intervention humaine sur une transcription d’un live. Peut-être relecture oui, mais écriture faut une sacré dextérité pour ne faire aucune faute de frappe et erreur de langue en si peu de temps avec un tel flux tendu.



A titre d’exemple, Youtube fait depuis quelques temps la traduction/transcription automatique des paroles d’une vidéo. C’est plus ou moins efficace.


votre avatar







SebGF a écrit :



A titre d’exemple, Youtube fait depuis quelques temps la traduction/transcription automatique des paroles d’une vidéo. C’est plus ou moins totalement pas efficace.





<img data-src=" />

Parce que bon, quand même…


votre avatar







zempa a écrit :



tu n’as même pas une petite idée ???





Non.


votre avatar







psn00ps a écrit :



Ceux la sont préenregistrés.





Non Non c’est en Live

J’utilise ça ici ( Catalogne) pendant les news en catalan parce que j’y pige quedalle .

donc les phrases ne sont pas complètes mais certains mots clés ressortent ce qui fait que tu perçois vaguement de quoi on cause.



votre avatar

Je pensais vraiment que Max Payne était antérieur à Matrix !

votre avatar

C’est triste mais ça ne me choque même plus.

Ca ne me choque plus qu’ils bafouent tant de droits et de valeurs - Y compris celles portées par leur propre pays. Et ça ne me choque plus qu’ils disposent d’une technologie qui pourraient servir à tant de choses…



Ca veut dire que je suis habitué ? <img data-src=" />

votre avatar

Bon, il va falloir que j’apprenne le Klingon ou elfique, jusqu’à ce que la NSA décode aussi ça. <img data-src=" />

votre avatar

<img data-src=" />

votre avatar







nigol a écrit :



il a de la transcription quasi temp-reel dans les systèmes de sous-titres des chaines TV.

Il suffit d’activer les sous-titres mal-entendants pour s’en rendre compte.



Quand les matchs sportifs sont diffusés dans les bars tres bruyants, vous avez jamais remarqué que le barman affichait la retranscription automatique des commentaires sportifs?









SebGF a écrit :



Même si le direct à la TV a toujours un léger différé d’une minute ou deux (pour censurer quelque chose d’horrible et qui provoquerait la perte de l’humanité, genre un bout de néné), je doute sincèrement qu’il y ait intervention humaine sur une transcription d’un live. Peut-être relecture oui, mais écriture faut une sacré dextérité pour ne faire aucune faute de frappe et erreur de langue en si peu de temps avec un tel flux tendu.



A titre d’exemple, Youtube fait depuis quelques temps la traduction/transcription automatique des paroles d’une vidéo. C’est plus ou moins efficace.









C’est bien du direct, mais ça ne marche pas du tout comme Youtube : il y a en fait un humain (que l’on surnomme dans le milieu un “perroquet”) qui répète tout ce qui se dit dans un micro mais plus clairement, distinctement, en faisant les bonnes pauses et en énnonçant les virgules et ce genre de truc, pour que le système de reconnaissance vocale ne fasse pas trop d’erreur.

En général, il y a aussi en bout de chaîne un correcteur qui reprend les erreurs les plus grossières du système de reconnaissance vocale (en général, les chaînes qui ont renoncé au correcteur, “charmés” par les promesses d’un commercial qui jurait que son logiciel de reconnaissance avait 99% d’exactitude, sont revenu en arrière sous les protestations de leur public malentendant, les sous-titres devenant quasi-illisibles).



Le système utilisé par la NSA doit être plus proche du système de Youtube (mais peut-être un peu + avancé) en se passant totalement d’humains. Ça marche potablement quand une personne parle seule, clairement, sans divers bruits de fond derrière, sans plusieurs voix qui s’entrecoupent, sans hurler ou chanter etc.



Il faut reconnaître qu’erreurs de transcription automatique + erreurs de traduction automatique doit donner des textes marrants, mais assez éloigné de l’original. Maintenant, si le but est de repérer quand un mec parle de “bombarder le pentagone” au téléphone, ça doit faire l’affaire.


votre avatar

Merci pour la précision, je ne savais pas qu’il y avait cette pratique d’avoir un “perroquet”.

Au final il joue un peu le rôle d’un interprète qui traduit juste en langage clair les propos tenus par un animateur qui peuvent être animés par l’émotion ou le jeu. Ca reste du flux tendu et à mon avis on a pas beaucoup le droit à l’erreur !!



Néanmoins les outils de reconnaissance vocal s’améliorent quand même pas mal. Je vois sur mon Lumia la miss Cortana est pas trop mauvaise. Après c’est du traitement assisté par serveurs distants qui apprennent avec les milliers d’utilisateurs qui s’en servent, là où les solutions dont tu parles ne doivent pas avoir cet avantage.

votre avatar

L’ article n’ est pas très correct vis à vis de Snowden.

Pire.

Mensonger.

Ou il y a un problème de journalisme.

Ou un problème de moralité.

Parce que Snowden n’ a jamais eu besoin de voler aucun document à quiconque vu que pour voler quelque chose à quelqu’ un il faut y être étranger.

Or Snowden était non seulement un employé de la NSA&nbsp; mais surtout un des admins de son système d’ information.

Cela m’ arrive de dire que je me suis volé moi même quand je ne retrouve pas mes propres affaires.

Mais dans ce cas, Snowden les détenait déjà.

Tout ce qu’ on peut lui reprocher, c’ est une entorse à son contrat de travail en ce qui concerne la confiden,tialité & nullement d’ être un voleur.

Quelques soient nos contrats de travail, nous vivoons dans des pays qui se disent démocratiques.

C’ est à dire censés respecter notre liberté de conscience.

Ce qui par conséquent pour motif de conscience, le droit à cette liberté étant une primauté des droits de l’ homme & de la démocratie il me semble, revient à l’ absoudre de tout péché.

Je n’ ai hamais été le toutou d’ aucun patron.

Et s’ il me vient l’ envie de lui claquer la “gle parce qu’il fait des trucs pas corrects, crois moi !!

Je vais pas me gêner !!

Et toi ?

&nbsp;

La NSA peut transcrire à la volée des conversations dans de nombreuses langues

  • Transcrire à la volée et en anglais des conversations enregistrées

  • Au moins un million de transcriptions par jour

  • La collecte des métadonnées remise en cause aux États-Unis

Fermer