Après la traduction du chinois vers l'anglais en septembre, Google Traduction exploite maintenant un système de réseau neuronal pour les interactions de huit langues avec l'anglais. Le but affiché : traduire des phrases entières plutôt que des mots.
Google affirme que son avenir est dans l'intelligence artificielle, l'entreprise tente donc d'en intégrer partout où elle le peut. Le groupe de Mountain View vient d'annoncer l'usage d'un système de réseau neuronal pour la traduction de huit langues vers et depuis l'anglais dans Google Traduction, à savoir l'allemand, le chinois, le coréen, l'espagnol, le français, le japonais, le portugais et le turc. De quoi couvrir de nombreuses combinaisons, qui représenteraient 35 % des requêtes sur le service, parmi les 10 000 possibilités que propose le service.
Un réseau neuronal à entrainer
Cette annonce suit de deux mois celle d'un premier essai en production de ce système « neuronal », pour la traduction du chinois vers l'anglais, estimée difficile par Google. Ce test grandeur nature accompagnait la publication d'un article de recherche, qui décrivait une nouvelle méthode de traduction à partir de ces fameux réseaux neuronaux. Ceux-ci auraient montré une pertinence équivalente aux outils précédents, même en étant entrainés sur un corpus réduit.
L'idée principale est de ne plus fonctionner par mot ou expression, comme auparavant, mais de considérer chaque phrase comme un bloc à traduire. Pour les chercheurs, l'intérêt est bien entendu de fournir des phrases plus naturelles, avec une grammaire bien plus correcte qu'avec les systèmes classiques. L'outil passant de mot en mot pour déterminer le sens de la phrase, puis pondère le sens de chaque mot pour choisir les plus pertinents et les réorganiser, jusqu'à donner une phrase dans l'autre langue.
Lors d'une table ronde en mars dernier sur l'intelligence artificielle (voir notre compte rendu), Yann LeCun – patron de l'intelligence artificielle chez Facebook – expliquait sa vision des choses, qui est exactement la même : « on prend un texte en anglais, on le passe dans un réseau récurrent, qui extrait un long vecteur qui représente le sens de la phrase, et ensuite un autre réseau récurrent régurgite la phrase dans une autre langue, par exemple le français ».
Encore du travail pour des traductions de textes longs
Tout n'est pas encore parfait, comme le dit sans détour Google. « Google Neural Machine Translation (GNMT) est toujours capable d'erreurs importantes qu'un traducteur humain ne ferait jamais, comme oublier des mots, mal traduire des noms propres ou des mots inhabituels, ou encore traduire une phrase de manière isolée plutôt qu'en l'incluant dans le contexte du paragraphe ou de la page » reconnaissait l'entreprise en septembre.
Le GNMT est directement utilisable via les applications et le site web de Google Traduction. Il est aussi proposé via la Cloud Translation API, dont les prix ont été revus à la baisse hier. De nouvelles capacités « cloud » doivent être proposées dès l'an prochain aux entreprises, promet le groupe.
Google n'est pas le seul à se pencher sur cette solution. Yann LeCun affirmait que les réseaux de neurones proposent des performances un peu plus élevées que les systèmes actuels, mais qu'elle n'est pas encore largement utilisée, car elle demande plus de puissance de calcul et revient donc plus cher. Il ajoutait par contre qu'il était probable que cela arrive d'ici peu.
Commentaires (50)
#1
C’est déjà en place ? Parce que j’ai fait quelques tests en faisant des copier/coller et les traductions proposées étaient très bien !
#2
“huit” langues dans Google Traduction, à savoir
chinois,
et
:)
#3
Il y a quelques jours, il y avait à l’intérieur de l’article un anglais un “encart” particulièrement bien traduit.
Le reste était plus chaotique. Cela m’avait marqué car je ne comprenais pas cet écart entre le reste de l’article et l’extrait cité en encart. Je pense qu’ils devaient le beta tester.
#4
#5
Ahh… ca va pouvoir aider notre président qui ne parle même pas couramment plusieurs langues… Je l’image bien avec Google Trad et le smartphone quand il est au téléphone avec Angela " /> " />
Plus sérieusement, c’est une plutôt bonne nouvelle l’IA sur ce point. Parce que traduire une page entière avec Google Trad, parfois ca ne veut pas dire grand chose :)
#6
#7
Wahou, en testant un texte issu de wikipedia version anglaise, le resultat est assez impressionnant. Difficile de détecter que le texte a été écrit par un algo !
#8
Faites le test sur la page de l’API : il y a l’ancienne version et la nouvelle avec IA pour comparer, c’est assez bluffant
https://cloud.google.com/translate/
#9
#10
" />
" />
#11
Cela fait déjà 2 semaines que la mise à jour est en place, la qualité de la traduction est clairement en hausse
#12
Très intéressant comme évolution ! la prochaine étape c’est la traduction vocal " />
#13
#14
coréen et turc ?
Mais quels sont donc leurs critères de sélection de langue ?
Ce n’est assurément pas la grandeur de la population qui emploie la langue. " />
Pour le coréen … avec tous les constructeurs NTIC coréens, je peux comprendre.
Mais le turc ???
#15
Ennemi (militaire et/ou commercial)et dans certain des bases américaines." />
#16
#17
#18
hummmm
Il n’y aurait donc aucun intérêt à fournir un outil de compréhension entre les êtres humains … mais la motivation ne serait que la communication militaire ?
… bon, alors il faut chercher l’URL cachée de google/trans qui traduira le russe " />
#19
Merci. Effectivement l’article a été modifié pour bien évoquer que c’est depuis et vers l’anglais. " />
#20
Ah je vois que l’humour ne passe plus chez NXi. Entre la modération qui devient n’importe quoi et les articles en baisse de qualité… finalement j’aurai peut-être pas du renouveler autant mon abonnement.
#21
Si ça peut nous éviter des chefs d’oeuvre comme Jambonlaissé, c’est pas plus mal " />
#22
Peut-être effet ricochet du à l’insulte à peine déguisé du 3ème commentaire.
#23
Je sais pas je suis arrivé après la bataille sur ce coup là " />
#24
C’est bien gentil l’humour, mais c’est un peu la réponse facile quand on se fait modérer (et à juste raison). Un peu plus de contrôle en amont serait salvateur. Pour ce qui est de la baisse de qualité des articles, tu peux nous envoyer un email pour nous exposer ton point de vue, parce qu’il peut en ressortir une discussion très constructive sur le sujet. Sinon c’est une attaque gratuite, et ce n’est pas l’endroit de toute manière pour en discuter.
#25
vas y vincent, sword lui son poste ‘inutile’
" />
je suis avec vous, mais pas abonné " />
#26
Wow
Je viens de tester en copiant collant des commentaires de PCI. Rien qui ne vole très haut on s’entend.
La traduction proposée m’a bluffer.
#27
Si disons dans 10 15 ans cela traduit en direct la voix et les textes, cela risque de tuer les emplois de traducteurs et doubleurs, et certains blog journalistique." /> (Espérons que l’on pourra voir directement et facilement certaines chaines étrangères)" /> Bon, pour le Pron, cela ne sera pas vraiment nécessaire." />
#28
Coréen : très difficile à traduire car plusieurs graphies et grammaire speciale.
Turc : langue particulière, avec un alphabet fortement latin.
#29
Mail envoyé à la rédaction (via le formulaire) " />
Pour l’humour, oui c’est facile d’utiliser cet argument. mais çà ne veut pas dire qu’il n’est pas valable pour autant dans tous les cas. Sinon picatrix ne serait plus parmis nous depuis longtemps " />
#30
il traduit “wesh gros” en “hi man” " />
sisi la famille quoi.
#31
#32
#33
Mais hors du contexte du poker, un sens supplémentaire est apparu au mot pour dire “Étonner, épater”
https://fr.wiktionary.org/wiki/bluffer
#34
Envoyé à quelle heure ? je n’ai rien dans ma boîte
#35
#36
Ah bah super, comme ça notre président va savoir dire “Au revoir” dans plusieurs langues.
#37
“Pour beaucoup, l’automne est le début de la fin d’une autre saison d’équitation. Mais pour tout amateur de moto, l’automne est aussi le moment de l’année où l’on voit les fruits des départements R & D”
" />" />" />
mais sinon pour le reste c’est quasiment parfait " />
#38
J’ai essayé. La vache, ça s’est carrément amélioré. Impressionnant !
Il y a juste deux ou trois petits détails à corriger sur un texte de 3 ou 4 paragraphes. C’est vraiment très bon.
#39
Genre 10 minutes avant mon message ici :/
Honnêtement j’ai pas sauvegardé mon message… Je ne me vois pas le retaper.
Je suis passer par le formulaire de contact pourtant, et j’ai bien eu l’encart (vert il me semble) qui m’indiquait qu’il avait été transmis correctement.
#40
J’ai testé en prenant un texte au hasard sur un site Internet américain
Hillary Clinton, in her first public speech since last week’s crushing presidential loss, admitted making the appearance “wasn’t the easiest.”
But speaking at the Children’s Defense Fund’s “Beat The Odds” Gala on Wednesday night, Clinton emotionally reflected about the 2016 loss and how she wished she could tell her mother – who decades ago was abandoned as a child – that her struggles were worth it because of what her daughter had accomplished.
Traduit par :
Hillary Clinton, dans son premier discours public depuis la perte écrasante de la semaine dernière à la présidentielle, a admis faire l’apparition “n’était pas le plus facile.”
Clinton a émotionnellement réfléchi sur la perte de 2016 et comment elle aurait souhaité pouvoir dire à sa mère - qui, il ya des décennies, a été abandonnée comme un enfant - que ses luttes valaient la peine Cela à cause de ce que sa fille avait accompli.
C’est plutôt trop mal, à part :
Hillary Clinton, dans son premier discours public depuis la perte présidentielle écrasante de la semaine dernière, la fabrication admise de l’apparence “n’était pas la plus facile.” Mais parlant au Fonds de Défense D’enfant “Battu les Chances” de Gala dans la nuit de mercredi à jeudi, Clinton avec émotion reflété de la perte 2016 et comment elle a souhaité elle pourrait dire à sa mère - qui il y a les décennies ont été abandonnées comme un enfant - que ses luttes ont valu le coup à cause de ce que sa fille avait accompli.
#41
#42
#43