Skype traduira bientôt oralement et en temps réel les langues étrangères

Skype traduira bientôt oralement et en temps réel les langues étrangères

Guten tag !

Avatar de l'auteur

Vincent Hermann

Publié dansLogiciel

28/05/2014
58
Skype traduira bientôt oralement et en temps réel les langues étrangères

Microsoft a présenté hier soir lors d’une conférence une importante évolution prévue pour Skype plus tard dans l’année. Il s’agit d’un module de traduction en temps réel capable d’écouter la voix d’un correspondant d’un côté, et d’en donner oralement la version dans une autre langue dans la foulée.

skype traduction

Traduire oralement et en temps réel une autre langue 

Lorsque Microsoft a racheté Skype pour 8,5 milliards de dollars, de nombreux observateurs n’ont pas manqué de souligner qu’il s’agissait d’une somme colossale pour une « simple » solution de messagerie. Évidemment, le sens de « colossal » est devenu plus relatif depuis le rachat de WhatsApp par Facebook, pour un total de 19 milliards de dollars. Mais Microsoft avait rapidement indiqué de son côté que Skype serait une brique importante de sa stratégie, et toutes les décisions prises depuis vont dans ce sens, la messagerie ayant totalement remplacé Live Messenger par exemple.

 

Dans une démonstration réalisée hier soir, Microsoft a dévoilé quel genre d’évolution était prévu pour sa solution de messagerie. En développement au sein de Microsoft Research depuis plusieurs années, une solution de traduction en temps réel sera ainsi ajoutée à la version Windows 8 de Skype plus tard dans l’année. Le principe de fonctionnement en est simple : deux personnes utilisant des langues différentes pourront se parler, Skype se chargeant de traduire oralement les propos de chacun.

 

 

Comme on peut le voir dans la vidéo de démonstration, un américain et un allemand font une conférence Skype. Dès que l’utilisateur allemand parle, l’autre reçoit sur son écran une version écrite de ce qui vient d’être prononcé. Juste après, la synthèse vocale prend le relai pour prononcer les mots.

Même perfectible, la démonstration reste impressionnante car naturelle 

La solution semble efficace, mais la technologie peut encore être améliorée, comme on peut le voir dans cette autre vidéo ci-dessous. Il s’agit de la démonstration réalisée hier soir lors de la conférence Re/Code, à la suite d’un entretien sur le sujet avec Satya Nadella, PDG de Microsoft. Cette démonstration a été réalisée par Gurdeep Pall, qui dirige les équipes de Skype et de Lync. On peut y voir là encore un entretien entre des utilisateurs américain et allemand. Mais on peut remarquer que ces derniers prennent bien soin d’articuler très soigneusement. Les majuscules ne sont pas toujours présentes et la ponctuation devrait être renforcée.

 

 

Dans tous les cas, la démonstration réalisée par Microsoft reste impressionnante. La reconnaissance fonctionne bien et c’est la quasi-simultanéité des traductions qui renforce l’impression de « naturel » de cette solution. D’autant que l’utilisateur obtient un flux audio dans la langue de son interlocuteur, la phrase écrite qu’il vient de prononcer et sa version dans l’autre langue. Il s’agit d’ailleurs pour Satya Nadella de l’illustration parfaite de l’évolution qu’il constate pour l’informatique en général, qui se dirige vers une ère « plus personnelle, plus humaine ».

 

Mais évidemment, la question qui intéressante maintenant est : quand ? Selon le PDG de Microsoft, une version bêta de ce traducteur en temps réel sera disponible plus tard dans l’année sur Windows 8, sans aucune date plus précise pour l’instant. Cette phase de test sera suivie d’une diffusion plus générale sur d’autres plateformes. Interrogé sur la possibilité d’appeler un interlocuteur en Égypte et d’entretenir facilement une conversation traduite, Nadella a répondu que ce serait le cas « au cours des deux prochaines années ».

58
Avatar de l'auteur

Écrit par Vincent Hermann

Tiens, en parlant de ça :

livre dématérialisé

Des chercheurs ont élaboré une technique d’extraction des données d’entrainement de ChatGPT

Toxique de répétition

17:15IA et algorithmesSciences et espace 3
Un chien avec des lunettes apprend sur une tablette

Devenir expert en sécurité informatique en 3 clics

Ou comment briller en société (de service)

16:53Sécurité 9
Logo ownCloud

ownCloud : faille béante dans les déploiements conteneurisés utilisant graphapi

Dangereuse, mais spécifique ?

15:57Sécurité 14

Sommaire de l'article

Introduction

Traduire oralement et en temps réel une autre langue 

Même perfectible, la démonstration reste impressionnante car naturelle 

livre dématérialisé

Des chercheurs ont élaboré une technique d’extraction des données d’entrainement de ChatGPT

IA et algorithmesSciences et espace 3
Un chien avec des lunettes apprend sur une tablette

Devenir expert en sécurité informatique en 3 clics

Sécurité 9
Logo ownCloud

ownCloud : faille béante dans les déploiements conteneurisés utilisant graphapi

Sécurité 14
Le SoC Graviton4 d’Amazon AWS posé sur une table

Amazon re:invent : SoC Graviton4 (Arm), instance R8g et Trainium2 pour l’IA

Hardware 3
Logo Comcybergend

Guéguerre des polices dans le cyber (OFAC et ComCyberMi)

Sécurité 10

#LeBrief : faille 0-day dans Chrome, smartphones à Hong Kong, 25 ans de la Dreamcast

0
Mur d’OVHcloud à Roubaix, avec le logo OVHcloud

OVHcloud Summit 2023 : SecNumCloud, IA et Local Zones

HardwareInternet 2
algorithmes de la CAF

Transparence, discriminations : les questions soulevées par l’algorithme de la CAF

IA et algorithmesSociété numérique 57

Plainte contre l’alternative paiement ou publicité comportementale de Meta

DroitIA et algorithmes 31
Nuage (pour le cloud) avec de la foudre

Économie de la donnée et services de cloud : l’Arcep renforce ses troupes

DroitInternet 0
De vieux ciseaux posés sur une surface en bois

Plus de 60 % des demandes de suppression reçues par Google émanent de Russie

Société numérique 4
Une vieille boussole posée sur un plan en bois

La Commission européenne et Google proposent deux bases de données de fact-checks

DroitInternet 3

#LeBrief : des fichiers Google Drive disparaissent, FreeBSD 14, caméras camouflées, OnePlus 12

0

Le poing Dev – round 6

Next 146

Produits dangereux sur le web : nouvelles obligations en vue pour les marketplaces

Droit 9
consommation de l'ia

Usages et frugalité : quelle place pour les IA dans la société de demain ?

IA et algorithmes 12

La NASA établit une liaison laser à 16 millions de km, les essais continuent

Sciences et espace 17
Concept de CPU

Semi-conducteurs : un important accord entre l’Europe et l’Inde

Hardware 7

#LeBrief : PS5 Slim en France, Valeo porte plainte contre NVIDIA, pertes publicitaires X/Twitter

0
Un mélange entre une réunion d’Anonymous et de tête d’ampoules, pour le meilleur et le pire

651e édition des LIDD : Liens Intelligents Du Dimanche

Internet 30
Bannière de Flock avec des bomes sur un fond rouge

#Flock, le grand remplacement par les intelligences artificielles

Flock 34
Un Sébastien transformé en lapin par Flock pour imiter le Quoi de neuf Docteur des Looney Tunes

Quoi de neuf à la rédac’ #9 : LeBrief 2.0, ligne édito, dossiers de fond

Next 65
Pilule rouge et bleue avec des messages codés

Encapsulation de clés et chiffrement d’enveloppes

Sécurité 31
Empreinte digital sur une capteur

Empreintes digitales : les capteurs Windows Hello loin d’être exemplaires

Sécurité 20

#LeBrief : succès du test d’Ariane 6, réparer plutôt que remplacer, Broadcom finalise le rachat de VMware

0

Hébergeurs, éditeurs, espaces de conversation ? La difficile régulation des réseaux sociaux

Réseaux sociauxSociété numérique 23
Puces en silicium

Silicium : un matériau indispensable et omniprésent, mais critique

HardwareSciences et espace 25
Panneau solaire bi-face Sunology Play

Panneaux solaires en autoconsommation : on décortique le kit Play de Sunology

Hardware 29
The eyes and ears of the army, Fort Dix, N.J.

Un think tank propose d’autoriser les opérations de « hack back »

Sécurité 13

#LeBrief : Ariane 6 sur le banc de test, arrestation algorithmique, entraînement d’IA par des mineurs

0
Logo de Google sur un ordinateur portable

Chrome : Google corrige plusieurs failles sévères, dont une déjà exploitée

Logiciel 2

vieux téléphones portables

Des cadres supérieurs invités à n’utiliser que des téléphones jetables à Hong Kong

Sécurité 21

La Dreamcast de Sega fête ses 25 ans

Hardware 26

Pilule rouge et bleue avec des messages codés

Démantèlement d’un groupe ukrainien de rançongiciels

Sécurité 5

Commentaires (58)


jb18v
Il y a 10 ans

<img data-src=" /><img data-src=" /><img data-src=" /> très fort


mopi56 Abonné
Il y a 10 ans

Auten je gueule sur µSoft auten la je dit respect les gars <img data-src=" />


Danytime
Il y a 10 ans

Pour le moment c’est juste impressionnant parce que ce sont des démonstrations par Microsoft, tout est beau, le son de la voix à la sortie d’une tablette est en HD digital.

Attendons de voir de “vrai” démonstration et en espérant que ça ne finira pas comme illumiroom.


XalG
Il y a 10 ans






mopi56 a écrit :

Auten je gueule sur µSoft auten la je dit respect les gars <img data-src=" />



O.T.A.N an ampaurte le van !



Anne Onyme Abonné
Il y a 10 ans

Étant interprète, j’ai de forts doutes concernant la qualité de la traduction donnée et soit-disant simultanée. Peut-etre que pour des phrases banales comme “bonjour comment allez-vous ?” c’est acceptable, mais pour le reste, je reste sceptique. <img data-src=" />


Moebius13100
Il y a 10 ans

J’ai hâte de voir comment il va traduire “Ouech Couzin bien ta vu, walla la famille nebes ou bien ?” en Allemand ou en Anglais <img data-src=" />


misterB
Il y a 10 ans






Anne Onyme a écrit :

Étant interprète, j’ai de forts doutes concernant la qualité de la traduction donnée et soit-disant simultanée. Peut-etre que pour des phrases banales comme “bonjour comment allez-vous ?” c’est acceptable, mais pour le reste, je reste sceptique. <img data-src=" />


ça restera approximatif, mais au moins c’est une bonne base pour se comprendre comme le montre la démo en fait <img data-src=" />



Anne Onyme Abonné
Il y a 10 ans

Je l’avoue, je n’ai pas eu le temps de la regarder <img data-src=" /> car une machine comprendre des sous entendus, du second degré ou encore des blagues (parfois intraduisibles) et correctement les interpéter en simultané, c’est pas évident <img data-src=" />


Seazor Abonné
Il y a 10 ans

[ mode=“oui, je sais, c’est lourd a force”]
Faut bien justifier le retrait du mode peer to peer, l’utilisation de leur cloud et faciliter l’interception pour la NSA.
[ /mode=“oui, je sais, c’est lourd a force”]


misterB
Il y a 10 ans






Moebius13100 a écrit :

J’ai hâte de voir comment il va traduire “Ouech Couzin bien ta vu, walla la famille nebes ou bien ?” en Allemand ou en Anglais <img data-src=" />


Comme si un anglais te lâche du Cockney <img data-src=" /><img data-src=" />

Exemple
Got to my mickey, found me way up the apples, put on me whistle and the bloody dog went. It was me trouble telling me to fetch the teapots.



Konrad
Il y a 10 ans

Impressionnant, GG à Microsoft et vivement le produit fini.
Dans le même temps j’espère aussi que les concurrents (Apple, Google…) sortiront aussi leurs solutions, pour qu’il y ait une émulation dans le secteur et que l’utilisateur final ait le choix.






mopi56 a écrit :

Auten je gueule sur µSoft auten la je dit respect les gars


Un traducteur aura par contre du mal à traduire ce genre de phrase… Google Traduction :

I Auten mouth on µSoft Auten said I respect the guys

On va dire que l’avantage à l’oral c’est qu’il n’y a pas de faute d’orthographe…



Mr.Nox Abonné
Il y a 10 ans






Danytime a écrit :

Pour le moment c’est juste impressionnant parce que ce sont des démonstrations par Microsoft, tout est beau, le son de la voix à la sortie d’une tablette est en HD digital.

Attendons de voir de “vrai” démonstration et en espérant que ça ne finira pas comme illumiroom.



Illumiroom n’a jamais été annoncé pour la commercialisation, ce n’était qu’une démo technique.



Reznor26
Il y a 10 ans






Anne Onyme a écrit :

Étant interprète, j’ai de forts doutes concernant la qualité de la traduction donnée et soit-disant simultanée. Peut-etre que pour des phrases banales comme “bonjour comment allez-vous ?” c’est acceptable, mais pour le reste, je reste sceptique. <img data-src=" />


As an interpreter, I have strong doubts about the quality of translation data and so-called simultaneous. Maybe for trite phrases like “hello how are you?” this is acceptable, but for the rest, I remain skeptical.

I can parler anglais ! <img data-src=" />



Poppu78
Il y a 10 ans






Moebius13100 a écrit :

J’ai hâte de voir comment il va traduire “Ouech Couzin bien ta vu, walla la famille nebes ou bien ?” en Allemand ou en Anglais <img data-src=" />


Déjà si tu pouvais me faire la version française, parce que là je ne comprend pas tout <img data-src=" />

Entre ça et le rachat de Word Lens par Google clairement la prochaine guerre se fera sur le terrain du langage. Pour la traduction certes, mais aussi pour sa compréhension sémantique : la domotique “naturelle” est à deux pas dans l’avenir…



Konrad
Il y a 10 ans






Anne Onyme a écrit :

Étant interprète, j’ai de forts doutes concernant la qualité de la traduction donnée et soit-disant simultanée. Peut-etre que pour des phrases banales comme “bonjour comment allez-vous ?” c’est acceptable, mais pour le reste, je reste sceptique.


Ce genre de technologie est difficile car elle passe par trois étapes, chacune ayant ses difficultés :




  • reconnaissance vocale : il faut que l’ordinateur arrive à transcrire le son qu’il reçoit en mots. Selon les langues, les accents, le niveau de langage… ça peut être très compliqué.


  • traduction des phrases : c’est peut-être l’étape la mieux maîtrisée, les services de traduction en ligne sont pléthore et assez rapides.


  • synthèse vocale : une fois les phrases traduites, l’ordinateur doit les prononcer avec un ton naturel, et ça c’est aussi assez compliqué à faire.

    Ces travaux de Microsoft sont indéniablement un pas en avant. J’imagine qu’il reste énormément de boulot pour implémenter les différentes langues de manière correcte.



Moebius13100
Il y a 10 ans

N’empêche, le rêve serait une petite oreillette qu’on porterait et qui traduirait l’intégralité de ce que dit notre interlocuteur, voir nos interlocuteurs lors d’une réunion (plus complexe) en simultané et en conservant le timbre de voix.
Le jour où on arrive à pondre ça avec une fiabilité à toute épreuve <img data-src=" />


Reznor26
Il y a 10 ans
Anne Onyme Abonné
Il y a 10 ans






Konrad a écrit :

Ce genre de technologie est difficile car elle passe par trois étapes, chacune ayant ses difficultés :




  • reconnaissance vocale : il faut que l’ordinateur arrive à transcrire le son qu’il reçoit en mots. Selon les langues, les accents, le niveau de langage… ça peut être très compliqué.


  • traduction des phrases : c’est peut-être l’étape la mieux maîtrisée, les services de traduction en ligne sont pléthore et assez rapides.


  • synthèse vocale : une fois les phrases traduites, l’ordinateur doit les prononcer avec un ton naturel, et ça c’est aussi assez compliqué à faire.

    Ces travaux de Microsoft sont indéniablement un pas en avant. J’imagine qu’il reste énormément de boulot pour implémenter les différentes langues de manière correcte.


    Je suis 100% d’accord avec toi, c’est une avancée, mais il reste encore beaucoup á faire



Mr.Nox Abonné
Il y a 10 ans






Moebius13100 a écrit :

N’empêche, le rêve serait une petite oreillette qu’on porterait et qui traduirait l’intégralité de ce que dit notre interlocuteur, voir nos interlocuteurs lors d’une réunion (plus complexe) en simultané et en conservant le timbre de voix.
Le jour où on arrive à pondre ça avec une fiabilité à toute épreuve <img data-src=" />



J’imagine le genre de traduction que l’oreillette ferait alors que tu discute avec un wesh. <img data-src=" />



Lyzz Abonné
Il y a 10 ans






Moebius13100 a écrit :

N’empêche, le rêve serait une petite oreillette qu’on porterait et qui traduirait l’intégralité de ce que dit notre interlocuteur, voir nos interlocuteurs lors d’une réunion (plus complexe) en simultané et en conservant le timbre de voix.
Le jour où on arrive à pondre ça avec une fiabilité à toute épreuve <img data-src=" />

Et sous la forme d’un poisson ?
http://fr.wikipedia.org/wiki/Babel_fish

Ou de bactéries ?
http://fr.wikipedia.org/wiki/Traducteur_universel#Farscape



misterB
Il y a 10 ans






Moebius13100 a écrit :

N’empêche, le rêve serait une petite oreillette qu’on porterait et qui traduirait l’intégralité de ce que dit notre interlocuteur, voir nos interlocuteurs lors d’une réunion (plus complexe) en simultané et en conservant le timbre de voix.
Le jour où on arrive à pondre ça avec une fiabilité à toute épreuve <img data-src=" />


Un Babelfish quoi <img data-src=" /><img data-src=" />



secouss
Il y a 10 ans

Sa c’est la classe Oo !!

<img data-src=" /><img data-src=" />

Pour un prototype c’est pas mauvais en anglais il faudrait le rendre plus rapide et qu’il comprenne un peu mieux (vu que la ils articulent bien) mais sa c’est vraiment génial !

C’est basé sur cortana donc puisque la voie féminine c’est elle sur un telephone sa serait un kiff !


misterB
Il y a 10 ans






Mr.Nox a écrit :

J’imagine le genre de traduction que l’oreillette ferait alors que tu discute avec un wesh. <img data-src=" />


Vous faites une fixette sur l’argot <img data-src=" /><img data-src=" /><img data-src=" />



chichillus
Il y a 10 ans






Konrad a écrit :

Ce genre de technologie est difficile car elle passe par trois étapes, chacune ayant ses difficultés :




  • reconnaissance vocale : il faut que l’ordinateur arrive à transcrire le son qu’il reçoit en mots. Selon les langues, les accents, le niveau de langage… ça peut être très compliqué.


  • traduction des phrases : c’est peut-être l’étape la mieux maîtrisée, les services de traduction en ligne sont pléthore et assez rapides.


  • synthèse vocale : une fois les phrases traduites, l’ordinateur doit les prononcer avec un ton naturel, et ça c’est aussi assez compliqué à faire.

    Ces travaux de Microsoft sont indéniablement un pas en avant. J’imagine qu’il reste énormément de boulot pour implémenter les différentes langues de manière correcte.



    Effectivement, on cumule tous les problèmes, c’est donc très difficile d’arriver à un truc vraiment utilisable. Souvent, c’est juste des démos technologiques; personne n’arrive à s’en servir pour de vrai. Il faut voir comment ils gèrent les erreurs, qui sont inévitables (est-ce qu’on peut facilement les signaler, corriger, etc. à son interlocuteur), sinon ça peut tourner rapidement au dialogue de sourds.



eb303 Abonné
Il y a 10 ans






Konrad a écrit :




  • traduction des phrases : c’est peut-être l’étape la mieux maîtrisée, les services de traduction en ligne sont pléthore et assez rapides.


    … et font globalement n’importe quoi. Et qu’on ne vienne pas me dire: “oui, mais ça donne une idée”. J’ai déjà vu Google Translate faire carrément des contre-sens, alors l’idée que ça donne, je m’en méfierais à fond… Pour traduire des mots unqiues, ça peut marcher en prenant beaucoup de pincettes (genre bien éplucher la liste des traductions possibles et éventuellement les retraduire dans l’autre sens pour vérifier). Pour des phrases, moi je dis, pas une chance.



anonyme_92fcfbdd6cc3f0397af3a985adab6b1b
Il y a 10 ans






Mr.Nox a écrit :

J’imagine le genre de traduction que l’oreillette ferait alors que tu discute avec un wesh. <img data-src=" />


Ca va donner une scène comme dans Y a-t’il un pilote dans l’avion.



Charly32 Abonné
Il y a 10 ans






Anne Onyme a écrit :

Étant interprète, j’ai de forts doutes concernant la qualité de la traduction donnée et soit-disant simultanée. Peut-etre que pour des phrases banales comme “bonjour comment allez-vous ?” c’est acceptable, mais pour le reste, je reste sceptique. <img data-src=" />



Rassure-toi, c’est pas demain que tu sera au chômage. ;)
Les phrases traduites dans la vidéo sont des phrases toutes faites, du style que tu peux retrouver dans un manuel linguistique pour touristes.
Mais tout comme google trad, ça permet de se dépanner, et la démonstration technologique est assez impressionnante.



Reznor26
Il y a 10 ans






eb303 a écrit :

… et font globalement n’importe quoi. Et qu’on ne vienne pas me dire: “oui, mais ça donne une idée”. J’ai déjà vu Google Translate faire carrément des contre-sens, alors l’idée que ça donne, je m’en méfierais à fond… Pour traduire des mots unqiues, ça peut marcher en prenant beaucoup de pincettes (genre bien éplucher la liste des traductions possibles et éventuellement les retraduire dans l’autre sens pour vérifier). Pour des phrases, moi je dis, pas une chance.


Mais il ne faut pas oublier que les personnes utilisant le service seront conscientes des limites (ou s’en rendront compte par la force des choses) et adapteront le niveau de langue et la diction en fonction.

Bien sûr il faut que ça marche un minimum pour être utilisable quand même, mais se comprendre en faisant quelques efforts sur la simplicité des structures de phrases, ça reste mieux que ne pas se comprendre du tout.



anonyme_92fcfbdd6cc3f0397af3a985adab6b1b
Il y a 10 ans






Charly32 a écrit :

Rassure-toi, c’est pas demain que tu sera au chômage. ;)
Les phrases traduites dans la vidéo sont des phrases toutes faites, du style que tu peux retrouver dans un manuel linguistique pour touristes.
Mais tout comme google trad, ça permet de se dépanner, et la démonstration technologique est assez impressionnante.


C’est sur que la traduction automatique n’aide que pour des phrases simples. Professionnellement, la traduction français-allemand est toujours boîteuse, au point que j’ai créé mon propre outil de traduction lite qui compense les défauts du traducteur.



chichillus
Il y a 10 ans






Reznor26 a écrit :

Mais il ne faut pas oublier que les personnes utilisant le service seront conscientes des limites (ou s’en rendront compte par la force des choses) et adapteront le niveau de langue et la diction en fonction.

Bien sûr il faut que ça marche un minimum pour être utilisable quand même, mais se comprendre en faisant quelques efforts sur la simplicité des structures de phrases, ça reste mieux que ne pas se comprendre du tout.



Mais pour des phrases simples et toutes faites, est-ce qu’on ne se démerde pas mieux en baragouinant un peu d’anglais ? Parmi les gens qui utilisent Skype et qui ont des contacts internationaux, je pense que la plupart (OK, pas tous) se débrouilleront mieux tout seuls.



Qruby Abonné
Il y a 10 ans






Charly32 a écrit :

Rassure-toi, c’est pas demain que tu sera au chômage. ;)
Les phrases traduites dans la vidéo sont des phrases toutes faites, du style que tu peux retrouver dans un manuel linguistique pour touristes.
Mais tout comme google trad, ça permet de se dépanner, et la démonstration technologique est assez impressionnante.


Quand je vois les capacités de reconnaissance vocale de Cortana (Assistant Vocal de Windows Phone), je me dis que la partie reconnaissance vocale, compréhension grammaticale et synthèse vocale sont déjà très poussées.



Reznor26
Il y a 10 ans






chichillus a écrit :

Mais pour des phrases simples et toutes faites, est-ce qu’on ne se démerde pas mieux en baragouinant un peu d’anglais ? Parmi les gens qui utilisent Skype et qui ont des contacts internationaux, je pense que la plupart (OK, pas tous) se débrouilleront mieux tout seuls.


Ben c’est le début là, c’est même pas encore bêta.
C’est comme tout, ça fera surement un peu pitié au début, et d’année en année ça a des chances de devenir de plus en plus impressionnant et de plus en plus aiguisé. Ce n’est qu’une question de temps.



Charly32 Abonné
Il y a 10 ans






gokudomatic a écrit :

C’est sur que la traduction automatique n’aide que pour des phrases simples. Professionnellement, la traduction français-allemand est toujours boîteuse, au point que j’ai créé mon propre outil de traduction lite qui compense les défauts du traducteur.


Intéressant! Tu donnes accès à ton outil au public? :)



Qruby a écrit :

Quand je vois les capacités de reconnaissance vocale de Cortana (Assistant Vocal de Windows Phone), je me dis que la partie reconnaissance vocale, compréhension grammaticale et synthèse vocale sont déjà très poussées.


De même, l’équivalent Apple m’a fait le même effet! :)



chichillus
Il y a 10 ans






Reznor26 a écrit :

Ben c’est le début là, c’est même pas encore bêta.
C’est comme tout, ça fera surement un peu pitié au début, et d’année en année ça a des chances de devenir de plus en plus impressionnant et de plus en plus aiguisé. Ce n’est qu’une question de temps.



C’est juste que des démos comme ça, j’en ai vu qui datent de 1999 <img data-src=" />

Évidemment (heureusement <img data-src=" />), ça progresse.



anonyme_ae0ca2122dbd8685cb619d1352889aa1
Il y a 10 ans






misterB a écrit :

Un Babelfish quoi <img data-src=" /><img data-src=" />




C’est exactement ce à quoi j’ai pensé en lisant la news.
J’ai pas encore matté la démo en vidéo, mais si la trad’ est effectivement correcte, c’est un putain de pas en avant.

Certes le soft ne peut pas comprendre toutes nos subtilités et compagnie, mais ce n’est pas ce qu’on lui demande.



anonyme_edadaecc91c3bb908a8e0ab43a984c71
Il y a 10 ans






jb18v a écrit :

<img data-src=" /><img data-src=" /><img data-src=" /> très fort



En effet, au final ça sera pas mal pour économiser de l’espace pour l’enregistrement des conversations téléphoniques : tout en fichier word et traduit en anglais !



DikVin Abonné
Il y a 10 ans

Je pense qu’on est pas bien loin d’avoir quelque chose de fonctionnel.

Je ne dis pas ça pour le démo (qui est certes impressionnante) mais plus au niveau de la puissance de calcul, de stockage des machines et de toutes les études sur les réseaux neuronaux qui commencent à pouvoir être applicable du à la technologie.

On verra qui de Microsoft, Apple ou Google aura le premier la bonne solution.


anonyme_92fcfbdd6cc3f0397af3a985adab6b1b
Il y a 10 ans






Charly32 a écrit :

Intéressant! Tu donnes accès à ton outil au public? :)


Personnellement, ça ne me dérangerait pas. Le problème est que j’utilise à fond des dictionnaires en ligne sans avoir demandé la moindre autorisation. Pour un usage perso, ça ne se remarque pas, mais si des centaines de gens utilisent mon programme, je vais me faire griller au 3e degré.



blamort
Il y a 10 ans






misterB a écrit :

Comme si un anglais te lâche du Cockney <img data-src=" /><img data-src=" />

Exemple
Got to my mickey, found me way up the apples, put on me whistle and the bloody dog went. It was me trouble telling me to fetch the teapots.


<img data-src=" /><img data-src=" />

Excellent, je croyais qu’il posait un cairon.

Pas du tout ca, explication en “anglais normal” ici :http://www.aldertons.com/



vampire7
Il y a 10 ans

Ouais, aucun doute que ça marche bien avec les langues accentuelles comme l’anglais et l’allemand.

Moi, j’attends de voir une démonstration avec des langues tonales comme le chinois. <img data-src=" /> D’ailleurs, même à l’écrit, les traductions anglais-chinois sont à vomir…


Mr.Nox Abonné
Il y a 10 ans






misterB a écrit :

Vous faites une fixette sur l’argot <img data-src=" /><img data-src=" /><img data-src=" />



Non mais imagine la scène ! <img data-src=" />



misterB
Il y a 10 ans






Mr.Nox a écrit :

Non mais imagine la scène ! <img data-src=" />


Ce sera pareil pour toutes les langues <img data-src=" /><img data-src=" />

http://www.funnyordie.com/videos/5042c54522/oh-stewardess-i-speak-jive-from-airp…

ou pire

https://www.youtube.com/watch?v=bQJrBSXSs6o



Mr.Nox Abonné
Il y a 10 ans






misterB a écrit :

Ce sera pareil pour toutes les langues <img data-src=" /><img data-src=" />

http://www.funnyordie.com/videos/5042c54522/oh-stewardess-i-speak-jive-from-airp…

ou pire

https://www.youtube.com/watch?v=bQJrBSXSs6o



Le Cockney Star Trek j’ai quasi rien pigé ! <img data-src=" />



bogomips
Il y a 10 ans






vampire7 a écrit :

Ouais, aucun doute que ça marche bien avec les langues accentuelles comme l’anglais et l’allemand.

Moi, j’attends de voir une démonstration avec des langues tonales comme le chinois. <img data-src=" /> D’ailleurs, même à l’écrit, les traductions anglais-chinois sont à vomir…



Ça marche également pas trop mal.
Ça fait très longtemps que c’est dans les cartons, z’ont pas attendu Kro$oft pour ça.
Pas sur que les analyses soient faites sur place, c’est comme Siri c’est un hash analysé dans des fermes de calcul distantes.



Esarend
Il y a 10 ans






Konrad a écrit :

Ce genre de technologie est difficile car elle passe par trois étapes, chacune ayant ses difficultés :






  • synthèse vocale : une fois les phrases traduites, l’ordinateur doit les prononcer avec un ton naturel, et ça c’est aussi assez compliqué à faire.

    Ces travaux de Microsoft sont indéniablement un pas en avant. J’imagine qu’il reste énormément de boulot pour implémenter les différentes langues de manière correcte.



    Sur ce point, pas sur du tout.
    Je t’invite à jeter un coup d’œil au logiciel Vocaloid.
    Un (très) bel exemple des possibilités de cette technologie est la chanteuse virtuelle Hatsune Miku : elle en est à faire des concerts…



malock
Il y a 10 ans

Classe !
J’en parlais justement dans certains de mes anciens commentaires : le traitement des langues naturelles, c’est clairement un axe de recherche porteur.
C’est une espèce d’utopie qui en fait rêver plus d’un.
Grâce à des grosses structures comme Microsoft, on voit émerger des solutions grand public.

Je parle d’une “espèce d’utopie” car si à nous humains, ça nous semble si simple, pour la machine c’est tellement compliqué. A ma connaissance, il y a des choses, qui peuvent être largement améliorées.






Konrad a écrit :

Ce genre de technologie est difficile car elle passe par trois étapes, chacune ayant ses difficultés :




  • reconnaissance vocale

  • traduction des phrases

  • synthèse vocale



    Cela me semble tout à fait juste.
    Après, beaucoup de travaux “ne cherchent qu’à” traduire un texte type contrat d’une langue à une autre. Cela réduit la complexité du problème et pourtant, ça reste largement délicat.



    Anne Onyme a écrit :

    Étant interprète, j’ai de forts doutes concernant la qualité de la traduction donnée et soit-disant simultanée. (…)



    Et donc oui… on est bien loin d’avoir le résultat produit par un humain.
    Ce qu’on gagne surement dans un premier temps, c’est bien évidement l’automatisation… un gain de temps quoi (pour un résultat moins bon certes).

    Si Microsoft ici met un baffe à tout le monde, n’oublions pas que certains de nos labo de recherche public produisent des choses du même acabit tout à fait pertinentes <img data-src=" />

    Envoyez-nous des sous <img data-src=" />



vbrandt76
Il y a 10 ans

Je doute que des expressions soient correctement traduites. Qu’on le veuille ou non, ca reste qd même une traduction faites par “une machine”.
Sinon, les traducteurs ont du soucis à se faire !

Et puis, il faut bien cela pour vous les français qui avez tant de mal avec les langues <img data-src=" /><img data-src=" /><img data-src=" /> OK, je sors


Kako78
Il y a 10 ans

Je vais enfin pouvoir comprendre.

Ou pas. <img data-src=" />


Kako78
Il y a 10 ans






misterB a écrit :

Comme si un anglais te lâche du Cockney <img data-src=" /><img data-src=" />

Exemple
Got to my mickey, found me way up the apples, put on me whistle and the bloody dog went. It was me trouble telling me to fetch the teapots.



Tu aurais dû ajouter la traduction pour montrer l’effet Kiss Cool que ça procure quand tu croises un de ces aliens qui parlent ce langage:

“Got to my house, found my way up the stairs, put on my suit when the phone rang. It was my wife telling me to get the kids.”

<img data-src=" />



misterB
Il y a 10 ans






Kako78 a écrit :

Tu aurais dû ajouter la traduction pour montrer l’effet Kiss Cool que ça procure quand tu croises un de ces aliens qui parlent ce langage:

“Got to my house, found my way up the stairs, put on my suit when the phone rang. It was my wife telling me to get the kids.”

<img data-src=" />


Fallait vous laissez chercher <img data-src=" /><img data-src=" /><img data-src=" />



canti
Il y a 10 ans






Esarend a écrit :

Sur ce point, pas sur du tout.
Je t’invite à jeter un coup d’œil au logiciel Vocaloid.
Un (très) bel exemple des possibilités de cette technologie est la chanteuse virtuelle Hatsune Miku : elle en est à faire des concerts…



je ne pense pas que ca remet en cause ce qu’il dit : vocaloid a demandé beaucoup de travail a Yamaha, et il reste encore du boulot ( les intonations sont modulés par de l’auto-tune, on sent bien que c’est une vois de synthèse etc)

Vocaloid rempli son role, mais ce n’est pas la démonstration que c’est facile de faire de la synthèse vocale



anonyme_5308cee4763677866e1421efa4474f79
Il y a 10 ans

Est-ce que la traduction est faite par un interprète de la NSA ? <img data-src=" />


Konrad
Il y a 10 ans






misterB a écrit :

Fallait vous laissez chercher


Ouch <img data-src=" />



misterB
Il y a 10 ans






Konrad a écrit :

Ouch <img data-src=" />


J’ai eut un vieux doute a un moment <img data-src=" /><img data-src=" /><img data-src=" />



Konrad
Il y a 10 ans






misterB a écrit :

J’ai eut un vieux doute a un moment


Apparemment tu doutes souvent <img data-src=" />



misterB
Il y a 10 ans






Konrad a écrit :

Apparemment tu doutes souvent <img data-src=" />


Faut que j’arrête d’écrire, je m’enfonce, je crois <img data-src=" /><img data-src=" /><img data-src=" />



Konrad
Il y a 10 ans






canti a écrit :

je ne pense pas que ca remet en cause ce qu’il dit : vocaloid a demandé beaucoup de travail a Yamaha, et il reste encore du boulot ( les intonations sont modulés par de l’auto-tune, on sent bien que c’est une vois de synthèse etc)

Vocaloid rempli son role, mais ce n’est pas la démonstration que c’est facile de faire de la synthèse vocale


+1
Les vocaloids sont adaptés pour des chansons, ça produit un son proche des vocoders utilisés par Daft Punk par exemple. Mais on peut difficilement parler de «voix naturelle».



Mapics
Il y a 10 ans

Du travail en plus pour la NSA, les pauvres. <img data-src=" />