Connexion
Abonnez-vous

Skype traduira bientôt oralement et en temps réel les langues étrangères

Guten tag !

Skype traduira bientôt oralement et en temps réel les langues étrangères

Le 28 mai 2014 à 08h40

Microsoft a présenté hier soir lors d’une conférence une importante évolution prévue pour Skype plus tard dans l’année. Il s’agit d’un module de traduction en temps réel capable d’écouter la voix d’un correspondant d’un côté, et d’en donner oralement la version dans une autre langue dans la foulée.

skype traduction

Traduire oralement et en temps réel une autre langue 

Lorsque Microsoft a racheté Skype pour 8,5 milliards de dollars, de nombreux observateurs n’ont pas manqué de souligner qu’il s’agissait d’une somme colossale pour une « simple » solution de messagerie. Évidemment, le sens de « colossal » est devenu plus relatif depuis le rachat de WhatsApp par Facebook, pour un total de 19 milliards de dollars. Mais Microsoft avait rapidement indiqué de son côté que Skype serait une brique importante de sa stratégie, et toutes les décisions prises depuis vont dans ce sens, la messagerie ayant totalement remplacé Live Messenger par exemple.

 

Dans une démonstration réalisée hier soir, Microsoft a dévoilé quel genre d’évolution était prévu pour sa solution de messagerie. En développement au sein de Microsoft Research depuis plusieurs années, une solution de traduction en temps réel sera ainsi ajoutée à la version Windows 8 de Skype plus tard dans l’année. Le principe de fonctionnement en est simple : deux personnes utilisant des langues différentes pourront se parler, Skype se chargeant de traduire oralement les propos de chacun.

 

 

Comme on peut le voir dans la vidéo de démonstration, un américain et un allemand font une conférence Skype. Dès que l’utilisateur allemand parle, l’autre reçoit sur son écran une version écrite de ce qui vient d’être prononcé. Juste après, la synthèse vocale prend le relai pour prononcer les mots.

Même perfectible, la démonstration reste impressionnante car naturelle 

La solution semble efficace, mais la technologie peut encore être améliorée, comme on peut le voir dans cette autre vidéo ci-dessous. Il s’agit de la démonstration réalisée hier soir lors de la conférence Re/Code, à la suite d’un entretien sur le sujet avec Satya Nadella, PDG de Microsoft. Cette démonstration a été réalisée par Gurdeep Pall, qui dirige les équipes de Skype et de Lync. On peut y voir là encore un entretien entre des utilisateurs américain et allemand. Mais on peut remarquer que ces derniers prennent bien soin d’articuler très soigneusement. Les majuscules ne sont pas toujours présentes et la ponctuation devrait être renforcée.

 

 

Dans tous les cas, la démonstration réalisée par Microsoft reste impressionnante. La reconnaissance fonctionne bien et c’est la quasi-simultanéité des traductions qui renforce l’impression de « naturel » de cette solution. D’autant que l’utilisateur obtient un flux audio dans la langue de son interlocuteur, la phrase écrite qu’il vient de prononcer et sa version dans l’autre langue. Il s’agit d’ailleurs pour Satya Nadella de l’illustration parfaite de l’évolution qu’il constate pour l’informatique en général, qui se dirige vers une ère « plus personnelle, plus humaine ».

 

Mais évidemment, la question qui intéressante maintenant est : quand ? Selon le PDG de Microsoft, une version bêta de ce traducteur en temps réel sera disponible plus tard dans l’année sur Windows 8, sans aucune date plus précise pour l’instant. Cette phase de test sera suivie d’une diffusion plus générale sur d’autres plateformes. Interrogé sur la possibilité d’appeler un interlocuteur en Égypte et d’entretenir facilement une conversation traduite, Nadella a répondu que ce serait le cas « au cours des deux prochaines années ».

Commentaires (58)

Vous devez être abonné pour pouvoir commenter.

Abonnez-vous
votre avatar

N’empêche, le rêve serait une petite oreillette qu’on porterait et qui traduirait l’intégralité de ce que dit notre interlocuteur, voir nos interlocuteurs lors d’une réunion (plus complexe) en simultané et en conservant le timbre de voix.

Le jour où on arrive à pondre ça avec une fiabilité à toute épreuve <img data-src=" />

votre avatar
votre avatar







Konrad a écrit :



Ce genre de technologie est difficile car elle passe par trois étapes, chacune ayant ses difficultés :





  • reconnaissance vocale : il faut que l’ordinateur arrive à transcrire le son qu’il reçoit en mots. Selon les langues, les accents, le niveau de langage… ça peut être très compliqué.



  • traduction des phrases : c’est peut-être l’étape la mieux maîtrisée, les services de traduction en ligne sont pléthore et assez rapides.



  • synthèse vocale : une fois les phrases traduites, l’ordinateur doit les prononcer avec un ton naturel, et ça c’est aussi assez compliqué à faire.



    Ces travaux de Microsoft sont indéniablement un pas en avant. J’imagine qu’il reste énormément de boulot pour implémenter les différentes langues de manière correcte.





    Je suis 100% d’accord avec toi, c’est une avancée, mais il reste encore beaucoup á faire


votre avatar







Moebius13100 a écrit :



N’empêche, le rêve serait une petite oreillette qu’on porterait et qui traduirait l’intégralité de ce que dit notre interlocuteur, voir nos interlocuteurs lors d’une réunion (plus complexe) en simultané et en conservant le timbre de voix.

Le jour où on arrive à pondre ça avec une fiabilité à toute épreuve <img data-src=" />







J’imagine le genre de traduction que l’oreillette ferait alors que tu discute avec un wesh. <img data-src=" />


votre avatar







Moebius13100 a écrit :



N’empêche, le rêve serait une petite oreillette qu’on porterait et qui traduirait l’intégralité de ce que dit notre interlocuteur, voir nos interlocuteurs lors d’une réunion (plus complexe) en simultané et en conservant le timbre de voix.

Le jour où on arrive à pondre ça avec une fiabilité à toute épreuve <img data-src=" />



Et sous la forme d’un poisson ?

fr.wikipedia.org WikipediaOu de bactéries ?

fr.wikipedia.org Wikipedia


votre avatar







Moebius13100 a écrit :



N’empêche, le rêve serait une petite oreillette qu’on porterait et qui traduirait l’intégralité de ce que dit notre interlocuteur, voir nos interlocuteurs lors d’une réunion (plus complexe) en simultané et en conservant le timbre de voix.

Le jour où on arrive à pondre ça avec une fiabilité à toute épreuve <img data-src=" />





Un Babelfish quoi <img data-src=" /><img data-src=" />


votre avatar

Sa c’est la classe Oo !!



<img data-src=" /><img data-src=" />



Pour un prototype c’est pas mauvais en anglais il faudrait le rendre plus rapide et qu’il comprenne un peu mieux (vu que la ils articulent bien) mais sa c’est vraiment génial !



C’est basé sur cortana donc puisque la voie féminine c’est elle sur un telephone sa serait un kiff !

votre avatar







Mr.Nox a écrit :



J’imagine le genre de traduction que l’oreillette ferait alors que tu discute avec un wesh. <img data-src=" />





Vous faites une fixette sur l’argot <img data-src=" /><img data-src=" /><img data-src=" />



votre avatar







Konrad a écrit :



Ce genre de technologie est difficile car elle passe par trois étapes, chacune ayant ses difficultés :





  • reconnaissance vocale : il faut que l’ordinateur arrive à transcrire le son qu’il reçoit en mots. Selon les langues, les accents, le niveau de langage… ça peut être très compliqué.



  • traduction des phrases : c’est peut-être l’étape la mieux maîtrisée, les services de traduction en ligne sont pléthore et assez rapides.



  • synthèse vocale : une fois les phrases traduites, l’ordinateur doit les prononcer avec un ton naturel, et ça c’est aussi assez compliqué à faire.



    Ces travaux de Microsoft sont indéniablement un pas en avant. J’imagine qu’il reste énormément de boulot pour implémenter les différentes langues de manière correcte.







    Effectivement, on cumule tous les problèmes, c’est donc très difficile d’arriver à un truc vraiment utilisable. Souvent, c’est juste des démos technologiques; personne n’arrive à s’en servir pour de vrai. Il faut voir comment ils gèrent les erreurs, qui sont inévitables (est-ce qu’on peut facilement les signaler, corriger, etc. à son interlocuteur), sinon ça peut tourner rapidement au dialogue de sourds.


votre avatar







Konrad a écrit :





  • traduction des phrases : c’est peut-être l’étape la mieux maîtrisée, les services de traduction en ligne sont pléthore et assez rapides.





    … et font globalement n’importe quoi. Et qu’on ne vienne pas me dire: “oui, mais ça donne une idée”. J’ai déjà vu Google Translate faire carrément des contre-sens, alors l’idée que ça donne, je m’en méfierais à fond… Pour traduire des mots unqiues, ça peut marcher en prenant beaucoup de pincettes (genre bien éplucher la liste des traductions possibles et éventuellement les retraduire dans l’autre sens pour vérifier). Pour des phrases, moi je dis, pas une chance.


votre avatar







Mr.Nox a écrit :



J’imagine le genre de traduction que l’oreillette ferait alors que tu discute avec un wesh. <img data-src=" />





Ca va donner une scène comme dans Y a-t’il un pilote dans l’avion.


votre avatar







Anne Onyme a écrit :



Étant interprète, j’ai de forts doutes concernant la qualité de la traduction donnée et soit-disant simultanée. Peut-etre que pour des phrases banales comme “bonjour comment allez-vous ?” c’est acceptable, mais pour le reste, je reste sceptique. <img data-src=" />







Rassure-toi, c’est pas demain que tu sera au chômage. ;)

Les phrases traduites dans la vidéo sont des phrases toutes faites, du style que tu peux retrouver dans un manuel linguistique pour touristes.

Mais tout comme google trad, ça permet de se dépanner, et la démonstration technologique est assez impressionnante.


votre avatar







eb303 a écrit :



… et font globalement n’importe quoi. Et qu’on ne vienne pas me dire: “oui, mais ça donne une idée”. J’ai déjà vu Google Translate faire carrément des contre-sens, alors l’idée que ça donne, je m’en méfierais à fond… Pour traduire des mots unqiues, ça peut marcher en prenant beaucoup de pincettes (genre bien éplucher la liste des traductions possibles et éventuellement les retraduire dans l’autre sens pour vérifier). Pour des phrases, moi je dis, pas une chance.





Mais il ne faut pas oublier que les personnes utilisant le service seront conscientes des limites (ou s’en rendront compte par la force des choses) et adapteront le niveau de langue et la diction en fonction.



Bien sûr il faut que ça marche un minimum pour être utilisable quand même, mais se comprendre en faisant quelques efforts sur la simplicité des structures de phrases, ça reste mieux que ne pas se comprendre du tout.


votre avatar







Charly32 a écrit :



Rassure-toi, c’est pas demain que tu sera au chômage. ;)

Les phrases traduites dans la vidéo sont des phrases toutes faites, du style que tu peux retrouver dans un manuel linguistique pour touristes.

Mais tout comme google trad, ça permet de se dépanner, et la démonstration technologique est assez impressionnante.





C’est sur que la traduction automatique n’aide que pour des phrases simples. Professionnellement, la traduction français-allemand est toujours boîteuse, au point que j’ai créé mon propre outil de traduction lite qui compense les défauts du traducteur.


votre avatar







Reznor26 a écrit :



Mais il ne faut pas oublier que les personnes utilisant le service seront conscientes des limites (ou s’en rendront compte par la force des choses) et adapteront le niveau de langue et la diction en fonction.



Bien sûr il faut que ça marche un minimum pour être utilisable quand même, mais se comprendre en faisant quelques efforts sur la simplicité des structures de phrases, ça reste mieux que ne pas se comprendre du tout.







Mais pour des phrases simples et toutes faites, est-ce qu’on ne se démerde pas mieux en baragouinant un peu d’anglais ? Parmi les gens qui utilisent Skype et qui ont des contacts internationaux, je pense que la plupart (OK, pas tous) se débrouilleront mieux tout seuls.


votre avatar







Charly32 a écrit :



Rassure-toi, c’est pas demain que tu sera au chômage. ;)

Les phrases traduites dans la vidéo sont des phrases toutes faites, du style que tu peux retrouver dans un manuel linguistique pour touristes.

Mais tout comme google trad, ça permet de se dépanner, et la démonstration technologique est assez impressionnante.





Quand je vois les capacités de reconnaissance vocale de Cortana (Assistant Vocal de Windows Phone), je me dis que la partie reconnaissance vocale, compréhension grammaticale et synthèse vocale sont déjà très poussées.


votre avatar







chichillus a écrit :



Mais pour des phrases simples et toutes faites, est-ce qu’on ne se démerde pas mieux en baragouinant un peu d’anglais ? Parmi les gens qui utilisent Skype et qui ont des contacts internationaux, je pense que la plupart (OK, pas tous) se débrouilleront mieux tout seuls.





Ben c’est le début là, c’est même pas encore bêta.

C’est comme tout, ça fera surement un peu pitié au début, et d’année en année ça a des chances de devenir de plus en plus impressionnant et de plus en plus aiguisé. Ce n’est qu’une question de temps.


votre avatar







gokudomatic a écrit :



C’est sur que la traduction automatique n’aide que pour des phrases simples. Professionnellement, la traduction français-allemand est toujours boîteuse, au point que j’ai créé mon propre outil de traduction lite qui compense les défauts du traducteur.





Intéressant! Tu donnes accès à ton outil au public? :)







Qruby a écrit :



Quand je vois les capacités de reconnaissance vocale de Cortana (Assistant Vocal de Windows Phone), je me dis que la partie reconnaissance vocale, compréhension grammaticale et synthèse vocale sont déjà très poussées.





De même, l’équivalent Apple m’a fait le même effet! :)


votre avatar







Reznor26 a écrit :



Ben c’est le début là, c’est même pas encore bêta.

C’est comme tout, ça fera surement un peu pitié au début, et d’année en année ça a des chances de devenir de plus en plus impressionnant et de plus en plus aiguisé. Ce n’est qu’une question de temps.







C’est juste que des démos comme ça, j’en ai vu qui datent de 1999 <img data-src=" />



Évidemment (heureusement <img data-src=" />), ça progresse.


votre avatar







misterB a écrit :



Un Babelfish quoi <img data-src=" /><img data-src=" />









C’est exactement ce à quoi j’ai pensé en lisant la news.

J’ai pas encore matté la démo en vidéo, mais si la trad’ est effectivement correcte, c’est un putain de pas en avant.



Certes le soft ne peut pas comprendre toutes nos subtilités et compagnie, mais ce n’est pas ce qu’on lui demande.


votre avatar







jb18v a écrit :



<img data-src=" /><img data-src=" /><img data-src=" /> très fort







En effet, au final ça sera pas mal pour économiser de l’espace pour l’enregistrement des conversations téléphoniques : tout en fichier word et traduit en anglais !


votre avatar

Je pense qu’on est pas bien loin d’avoir quelque chose de fonctionnel.



Je ne dis pas ça pour le démo (qui est certes impressionnante) mais plus au niveau de la puissance de calcul, de stockage des machines et de toutes les études sur les réseaux neuronaux qui commencent à pouvoir être applicable du à la technologie.



On verra qui de Microsoft, Apple ou Google aura le premier la bonne solution.

votre avatar







Charly32 a écrit :



Intéressant! Tu donnes accès à ton outil au public? :)





Personnellement, ça ne me dérangerait pas. Le problème est que j’utilise à fond des dictionnaires en ligne sans avoir demandé la moindre autorisation. Pour un usage perso, ça ne se remarque pas, mais si des centaines de gens utilisent mon programme, je vais me faire griller au 3e degré.


votre avatar







misterB a écrit :



Comme si un anglais te lâche du Cockney <img data-src=" /><img data-src=" />



Exemple

Got to my mickey, found me way up the apples, put on me whistle and the bloody dog went. It was me trouble telling me to fetch the teapots.





<img data-src=" /><img data-src=" />



Excellent, je croyais qu’il posait un cairon.



Pas du tout ca, explication en “anglais normal” ici :http://www.aldertons.com/


votre avatar

Ouais, aucun doute que ça marche bien avec les langues accentuelles comme l’anglais et l’allemand.



Moi, j’attends de voir une démonstration avec des langues tonales comme le chinois. <img data-src=" /> D’ailleurs, même à l’écrit, les traductions anglais-chinois sont à vomir…

votre avatar







misterB a écrit :



Vous faites une fixette sur l’argot <img data-src=" /><img data-src=" /><img data-src=" />







Non mais imagine la scène ! <img data-src=" />


votre avatar







Mr.Nox a écrit :



Non mais imagine la scène ! <img data-src=" />





Ce sera pareil pour toutes les langues <img data-src=" /><img data-src=" />



http://www.funnyordie.com/videos/5042c54522/oh-stewardess-i-speak-jive-from-airp…



ou pire



youtube.com YouTube


votre avatar







misterB a écrit :



Ce sera pareil pour toutes les langues <img data-src=" /><img data-src=" />



http://www.funnyordie.com/videos/5042c54522/oh-stewardess-i-speak-jive-from-airp…



ou pire



youtube.com YouTubeLe Cockney Star Trek j’ai quasi rien pigé ! <img data-src=" />


votre avatar







vampire7 a écrit :



Ouais, aucun doute que ça marche bien avec les langues accentuelles comme l’anglais et l’allemand.



Moi, j’attends de voir une démonstration avec des langues tonales comme le chinois. <img data-src=" /> D’ailleurs, même à l’écrit, les traductions anglais-chinois sont à vomir…







Ça marche également pas trop mal.

Ça fait très longtemps que c’est dans les cartons, z’ont pas attendu Kro$oft pour ça.

Pas sur que les analyses soient faites sur place, c’est comme Siri c’est un hash analysé dans des fermes de calcul distantes.



votre avatar







Konrad a écrit :



Ce genre de technologie est difficile car elle passe par trois étapes, chacune ayant ses difficultés :









  • synthèse vocale : une fois les phrases traduites, l’ordinateur doit les prononcer avec un ton naturel, et ça c’est aussi assez compliqué à faire.



    Ces travaux de Microsoft sont indéniablement un pas en avant. J’imagine qu’il reste énormément de boulot pour implémenter les différentes langues de manière correcte.







    Sur ce point, pas sur du tout.

    Je t’invite à jeter un coup d’œil au logiciel Vocaloid.

    Un (très) bel exemple des possibilités de cette technologie est la chanteuse virtuelle Hatsune Miku : elle en est à faire des concerts…


votre avatar

Classe !

J’en parlais justement dans certains de mes anciens commentaires : le traitement des langues naturelles, c’est clairement un axe de recherche porteur.

C’est une espèce d’utopie qui en fait rêver plus d’un.

Grâce à des grosses structures comme Microsoft, on voit émerger des solutions grand public.



Je parle d’une “espèce d’utopie” car si à nous humains, ça nous semble si simple, pour la machine c’est tellement compliqué. A ma connaissance, il y a des choses, qui peuvent être largement améliorées.









Konrad a écrit :



Ce genre de technologie est difficile car elle passe par trois étapes, chacune ayant ses difficultés :





  • reconnaissance vocale

  • traduction des phrases

  • synthèse vocale







    Cela me semble tout à fait juste.

    Après, beaucoup de travaux “ne cherchent qu’à” traduire un texte type contrat d’une langue à une autre. Cela réduit la complexité du problème et pourtant, ça reste largement délicat.







    Anne Onyme a écrit :



    Étant interprète, j’ai de forts doutes concernant la qualité de la traduction donnée et soit-disant simultanée. (…)







    Et donc oui… on est bien loin d’avoir le résultat produit par un humain.

    Ce qu’on gagne surement dans un premier temps, c’est bien évidement l’automatisation… un gain de temps quoi (pour un résultat moins bon certes).



    Si Microsoft ici met un baffe à tout le monde, n’oublions pas que certains de nos labo de recherche public produisent des choses du même acabit tout à fait pertinentes <img data-src=" />



    Envoyez-nous des sous <img data-src=" />


votre avatar

Je doute que des expressions soient correctement traduites. Qu’on le veuille ou non, ca reste qd même une traduction faites par “une machine”.

Sinon, les traducteurs ont du soucis à se faire !



Et puis, il faut bien cela pour vous les français qui avez tant de mal avec les langues <img data-src=" /><img data-src=" /><img data-src=" /> OK, je sors

votre avatar

<img data-src=" /><img data-src=" /><img data-src=" /> très fort

votre avatar

Auten je gueule sur µSoft auten la je dit respect les gars <img data-src=" />

votre avatar

Pour le moment c’est juste impressionnant parce que ce sont des démonstrations par Microsoft, tout est beau, le son de la voix à la sortie d’une tablette est en HD digital.



Attendons de voir de “vrai” démonstration et en espérant que ça ne finira pas comme illumiroom.

votre avatar







mopi56 a écrit :



Auten je gueule sur µSoft auten la je dit respect les gars <img data-src=" />







O.T.A.N an ampaurte le van !


votre avatar

Étant interprète, j’ai de forts doutes concernant la qualité de la traduction donnée et soit-disant simultanée. Peut-etre que pour des phrases banales comme “bonjour comment allez-vous ?” c’est acceptable, mais pour le reste, je reste sceptique. <img data-src=" />

votre avatar

J’ai hâte de voir comment il va traduire “Ouech Couzin bien ta vu, walla la famille nebes ou bien ?” en Allemand ou en Anglais <img data-src=" />

votre avatar







Anne Onyme a écrit :



Étant interprète, j’ai de forts doutes concernant la qualité de la traduction donnée et soit-disant simultanée. Peut-etre que pour des phrases banales comme “bonjour comment allez-vous ?” c’est acceptable, mais pour le reste, je reste sceptique. <img data-src=" />





ça restera approximatif, mais au moins c’est une bonne base pour se comprendre comme le montre la démo en fait <img data-src=" />


votre avatar

Je l’avoue, je n’ai pas eu le temps de la regarder <img data-src=" /> car une machine comprendre des sous entendus, du second degré ou encore des blagues (parfois intraduisibles) et correctement les interpéter en simultané, c’est pas évident <img data-src=" />

votre avatar

[ mode=“oui, je sais, c’est lourd a force”]

Faut bien justifier le retrait du mode peer to peer, l’utilisation de leur cloud et faciliter l’interception pour la NSA.

[ /mode=“oui, je sais, c’est lourd a force”]

votre avatar







Moebius13100 a écrit :



J’ai hâte de voir comment il va traduire “Ouech Couzin bien ta vu, walla la famille nebes ou bien ?” en Allemand ou en Anglais <img data-src=" />





Comme si un anglais te lâche du Cockney <img data-src=" /><img data-src=" />



Exemple

Got to my mickey, found me way up the apples, put on me whistle and the bloody dog went. It was me trouble telling me to fetch the teapots.


votre avatar

Impressionnant, GG à Microsoft et vivement le produit fini.

Dans le même temps j’espère aussi que les concurrents (Apple, Google…) sortiront aussi leurs solutions, pour qu’il y ait une émulation dans le secteur et que l’utilisateur final ait le choix.









mopi56 a écrit :



Auten je gueule sur µSoft auten la je dit respect les gars





Un traducteur aura par contre du mal à traduire ce genre de phrase… Google Traduction :



I Auten mouth on µSoft Auten said I respect the guys



On va dire que l’avantage à l’oral c’est qu’il n’y a pas de faute d’orthographe…


votre avatar







Danytime a écrit :



Pour le moment c’est juste impressionnant parce que ce sont des démonstrations par Microsoft, tout est beau, le son de la voix à la sortie d’une tablette est en HD digital.



Attendons de voir de “vrai” démonstration et en espérant que ça ne finira pas comme illumiroom.







Illumiroom n’a jamais été annoncé pour la commercialisation, ce n’était qu’une démo technique.


votre avatar







Anne Onyme a écrit :



Étant interprète, j’ai de forts doutes concernant la qualité de la traduction donnée et soit-disant simultanée. Peut-etre que pour des phrases banales comme “bonjour comment allez-vous ?” c’est acceptable, mais pour le reste, je reste sceptique. <img data-src=" />





As an interpreter, I have strong doubts about the quality of translation data and so-called simultaneous. Maybe for trite phrases like “hello how are you?” this is acceptable, but for the rest, I remain skeptical.



I can parler anglais ! <img data-src=" />


votre avatar







Moebius13100 a écrit :



J’ai hâte de voir comment il va traduire “Ouech Couzin bien ta vu, walla la famille nebes ou bien ?” en Allemand ou en Anglais <img data-src=" />





Déjà si tu pouvais me faire la version française, parce que là je ne comprend pas tout <img data-src=" />



Entre ça et le rachat de Word Lens par Google clairement la prochaine guerre se fera sur le terrain du langage. Pour la traduction certes, mais aussi pour sa compréhension sémantique : la domotique “naturelle” est à deux pas dans l’avenir…


votre avatar







Anne Onyme a écrit :



Étant interprète, j’ai de forts doutes concernant la qualité de la traduction donnée et soit-disant simultanée. Peut-etre que pour des phrases banales comme “bonjour comment allez-vous ?” c’est acceptable, mais pour le reste, je reste sceptique.





Ce genre de technologie est difficile car elle passe par trois étapes, chacune ayant ses difficultés :





  • reconnaissance vocale : il faut que l’ordinateur arrive à transcrire le son qu’il reçoit en mots. Selon les langues, les accents, le niveau de langage… ça peut être très compliqué.



  • traduction des phrases : c’est peut-être l’étape la mieux maîtrisée, les services de traduction en ligne sont pléthore et assez rapides.



  • synthèse vocale : une fois les phrases traduites, l’ordinateur doit les prononcer avec un ton naturel, et ça c’est aussi assez compliqué à faire.



    Ces travaux de Microsoft sont indéniablement un pas en avant. J’imagine qu’il reste énormément de boulot pour implémenter les différentes langues de manière correcte.


votre avatar

Je vais enfin pouvoir comprendre.



Ou pas. <img data-src=" />

votre avatar







misterB a écrit :



Comme si un anglais te lâche du Cockney <img data-src=" /><img data-src=" />



Exemple

Got to my mickey, found me way up the apples, put on me whistle and the bloody dog went. It was me trouble telling me to fetch the teapots.







Tu aurais dû ajouter la traduction pour montrer l’effet Kiss Cool que ça procure quand tu croises un de ces aliens qui parlent ce langage:



“Got to my house, found my way up the stairs, put on my suit when the phone rang. It was my wife telling me to get the kids.”



<img data-src=" />


votre avatar







Kako78 a écrit :



Tu aurais dû ajouter la traduction pour montrer l’effet Kiss Cool que ça procure quand tu croises un de ces aliens qui parlent ce langage:



“Got to my house, found my way up the stairs, put on my suit when the phone rang. It was my wife telling me to get the kids.”



<img data-src=" />





Fallait vous laissez chercher <img data-src=" /><img data-src=" /><img data-src=" />


votre avatar







Esarend a écrit :



Sur ce point, pas sur du tout.

Je t’invite à jeter un coup d’œil au logiciel Vocaloid.

Un (très) bel exemple des possibilités de cette technologie est la chanteuse virtuelle Hatsune Miku : elle en est à faire des concerts…







je ne pense pas que ca remet en cause ce qu’il dit : vocaloid a demandé beaucoup de travail a Yamaha, et il reste encore du boulot ( les intonations sont modulés par de l’auto-tune, on sent bien que c’est une vois de synthèse etc)



Vocaloid rempli son role, mais ce n’est pas la démonstration que c’est facile de faire de la synthèse vocale


votre avatar

Est-ce que la traduction est faite par un interprète de la NSA ? <img data-src=" />

votre avatar







misterB a écrit :



Fallait vous laissez chercher





Ouch <img data-src=" />


votre avatar







Konrad a écrit :



Ouch <img data-src=" />





J’ai eut un vieux doute a un moment <img data-src=" /><img data-src=" /><img data-src=" />


votre avatar







misterB a écrit :



J’ai eut un vieux doute a un moment





Apparemment tu doutes souvent <img data-src=" />


votre avatar







Konrad a écrit :



Apparemment tu doutes souvent <img data-src=" />





Faut que j’arrête d’écrire, je m’enfonce, je crois <img data-src=" /><img data-src=" /><img data-src=" />


votre avatar







canti a écrit :



je ne pense pas que ca remet en cause ce qu’il dit : vocaloid a demandé beaucoup de travail a Yamaha, et il reste encore du boulot ( les intonations sont modulés par de l’auto-tune, on sent bien que c’est une vois de synthèse etc)



Vocaloid rempli son role, mais ce n’est pas la démonstration que c’est facile de faire de la synthèse vocale





+1

Les vocaloids sont adaptés pour des chansons, ça produit un son proche des vocoders utilisés par Daft Punk par exemple. Mais on peut difficilement parler de «voix naturelle».


votre avatar

Du travail en plus pour la NSA, les pauvres. <img data-src=" />

Skype traduira bientôt oralement et en temps réel les langues étrangères

  • Traduire oralement et en temps réel une autre langue 

  • Même perfectible, la démonstration reste impressionnante car naturelle 

Fermer