Google Traduction passe à un réseau neuronal pour 8 langues, dont le français
Mon IA is rich
Le 16 novembre 2016 à 08h50
3 min
Internet
Internet
Après la traduction du chinois vers l'anglais en septembre, Google Traduction exploite maintenant un système de réseau neuronal pour les interactions de huit langues avec l'anglais. Le but affiché : traduire des phrases entières plutôt que des mots.
Google affirme que son avenir est dans l'intelligence artificielle, l'entreprise tente donc d'en intégrer partout où elle le peut. Le groupe de Mountain View vient d'annoncer l'usage d'un système de réseau neuronal pour la traduction de huit langues vers et depuis l'anglais dans Google Traduction, à savoir l'allemand, le chinois, le coréen, l'espagnol, le français, le japonais, le portugais et le turc. De quoi couvrir de nombreuses combinaisons, qui représenteraient 35 % des requêtes sur le service, parmi les 10 000 possibilités que propose le service.
Un réseau neuronal à entrainer
Cette annonce suit de deux mois celle d'un premier essai en production de ce système « neuronal », pour la traduction du chinois vers l'anglais, estimée difficile par Google. Ce test grandeur nature accompagnait la publication d'un article de recherche, qui décrivait une nouvelle méthode de traduction à partir de ces fameux réseaux neuronaux. Ceux-ci auraient montré une pertinence équivalente aux outils précédents, même en étant entrainés sur un corpus réduit.
L'idée principale est de ne plus fonctionner par mot ou expression, comme auparavant, mais de considérer chaque phrase comme un bloc à traduire. Pour les chercheurs, l'intérêt est bien entendu de fournir des phrases plus naturelles, avec une grammaire bien plus correcte qu'avec les systèmes classiques. L'outil passant de mot en mot pour déterminer le sens de la phrase, puis pondère le sens de chaque mot pour choisir les plus pertinents et les réorganiser, jusqu'à donner une phrase dans l'autre langue.
Lors d'une table ronde en mars dernier sur l'intelligence artificielle (voir notre compte rendu), Yann LeCun – patron de l'intelligence artificielle chez Facebook – expliquait sa vision des choses, qui est exactement la même : « on prend un texte en anglais, on le passe dans un réseau récurrent, qui extrait un long vecteur qui représente le sens de la phrase, et ensuite un autre réseau récurrent régurgite la phrase dans une autre langue, par exemple le français ».
Encore du travail pour des traductions de textes longs
Tout n'est pas encore parfait, comme le dit sans détour Google. « Google Neural Machine Translation (GNMT) est toujours capable d'erreurs importantes qu'un traducteur humain ne ferait jamais, comme oublier des mots, mal traduire des noms propres ou des mots inhabituels, ou encore traduire une phrase de manière isolée plutôt qu'en l'incluant dans le contexte du paragraphe ou de la page » reconnaissait l'entreprise en septembre.
Le GNMT est directement utilisable via les applications et le site web de Google Traduction. Il est aussi proposé via la Cloud Translation API, dont les prix ont été revus à la baisse hier. De nouvelles capacités « cloud » doivent être proposées dès l'an prochain aux entreprises, promet le groupe.
Google n'est pas le seul à se pencher sur cette solution. Yann LeCun affirmait que les réseaux de neurones proposent des performances un peu plus élevées que les systèmes actuels, mais qu'elle n'est pas encore largement utilisée, car elle demande plus de puissance de calcul et revient donc plus cher. Il ajoutait par contre qu'il était probable que cela arrive d'ici peu.
Google Traduction passe à un réseau neuronal pour 8 langues, dont le français
-
Un réseau neuronal à entrainer
-
Encore du travail pour des traductions de textes longs
Commentaires (43)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 16/11/2016 à 09h03
C’est déjà en place ? Parce que j’ai fait quelques tests en faisant des copier/coller et les traductions proposées étaient très bien !
Le 16/11/2016 à 09h05
“huit” langues dans Google Traduction, à savoir
chinois,
et
:)
Le 16/11/2016 à 09h13
Il y a quelques jours, il y avait à l’intérieur de l’article un anglais un “encart” particulièrement bien traduit.
Le reste était plus chaotique. Cela m’avait marqué car je ne comprenais pas cet écart entre le reste de l’article et l’extrait cité en encart. Je pense qu’ils devaient le beta tester.
Le 16/11/2016 à 09h21
Le 16/11/2016 à 17h08
Le 16/11/2016 à 18h27
Ah bah super, comme ça notre président va savoir dire “Au revoir” dans plusieurs langues.
Le 16/11/2016 à 18h28
“Pour beaucoup, l’automne est le début de la fin d’une autre saison d’équitation. Mais pour tout amateur de moto, l’automne est aussi le moment de l’année où l’on voit les fruits des départements R & D”
" />" />" />
mais sinon pour le reste c’est quasiment parfait " />
Le 16/11/2016 à 22h26
J’ai essayé. La vache, ça s’est carrément amélioré. Impressionnant !
Il y a juste deux ou trois petits détails à corriger sur un texte de 3 ou 4 paragraphes. C’est vraiment très bon.
Le 17/11/2016 à 08h59
Genre 10 minutes avant mon message ici :/
Honnêtement j’ai pas sauvegardé mon message… Je ne me vois pas le retaper.
Je suis passer par le formulaire de contact pourtant, et j’ai bien eu l’encart (vert il me semble) qui m’indiquait qu’il avait été transmis correctement.
Le 17/11/2016 à 12h43
J’ai testé en prenant un texte au hasard sur un site Internet américain
Hillary Clinton, in her first public speech since last week’s crushing presidential loss, admitted making the appearance “wasn’t the easiest.”
But speaking at the Children’s Defense Fund’s “Beat The Odds” Gala on Wednesday night, Clinton emotionally reflected about the 2016 loss and how she wished she could tell her mother – who decades ago was abandoned as a child – that her struggles were worth it because of what her daughter had accomplished.
Traduit par :
Hillary Clinton, dans son premier discours public depuis la perte écrasante de la semaine dernière à la présidentielle, a admis faire l’apparition “n’était pas le plus facile.”
Clinton a émotionnellement réfléchi sur la perte de 2016 et comment elle aurait souhaité pouvoir dire à sa mère - qui, il ya des décennies, a été abandonnée comme un enfant - que ses luttes valaient la peine Cela à cause de ce que sa fille avait accompli.
C’est plutôt trop mal, à part :
Hillary Clinton, dans son premier discours public depuis la perte présidentielle écrasante de la semaine dernière, la fabrication admise de l’apparence “n’était pas la plus facile.” Mais parlant au Fonds de Défense D’enfant “Battu les Chances” de Gala dans la nuit de mercredi à jeudi, Clinton avec émotion reflété de la perte 2016 et comment elle a souhaité elle pourrait dire à sa mère - qui il y a les décennies ont été abandonnées comme un enfant - que ses luttes ont valu le coup à cause de ce que sa fille avait accompli.
Le 17/11/2016 à 12h50
Le 17/11/2016 à 13h38
Le 17/11/2016 à 13h54
Le 16/11/2016 à 09h23
Ahh… ca va pouvoir aider notre président qui ne parle même pas couramment plusieurs langues… Je l’image bien avec Google Trad et le smartphone quand il est au téléphone avec Angela " /> " />
Plus sérieusement, c’est une plutôt bonne nouvelle l’IA sur ce point. Parce que traduire une page entière avec Google Trad, parfois ca ne veut pas dire grand chose :)
Le 16/11/2016 à 09h29
Le 16/11/2016 à 09h30
Wahou, en testant un texte issu de wikipedia version anglaise, le resultat est assez impressionnant. Difficile de détecter que le texte a été écrit par un algo !
Le 16/11/2016 à 09h33
Faites le test sur la page de l’API : il y a l’ancienne version et la nouvelle avec IA pour comparer, c’est assez bluffant
Google
Le 16/11/2016 à 09h36
Le 16/11/2016 à 09h38
" />
" />
Le 16/11/2016 à 09h50
Cela fait déjà 2 semaines que la mise à jour est en place, la qualité de la traduction est clairement en hausse
Le 16/11/2016 à 09h50
Très intéressant comme évolution ! la prochaine étape c’est la traduction vocal " />
Le 16/11/2016 à 10h00
Le 16/11/2016 à 10h04
coréen et turc ?
Mais quels sont donc leurs critères de sélection de langue ?
Ce n’est assurément pas la grandeur de la population qui emploie la langue. " />
Pour le coréen … avec tous les constructeurs NTIC coréens, je peux comprendre.
Mais le turc ???
Le 16/11/2016 à 10h06
Ennemi (militaire et/ou commercial)et dans certain des bases américaines." />
Le 16/11/2016 à 10h07
Le 16/11/2016 à 10h08
Le 16/11/2016 à 10h08
hummmm
Il n’y aurait donc aucun intérêt à fournir un outil de compréhension entre les êtres humains … mais la motivation ne serait que la communication militaire ?
… bon, alors il faut chercher l’URL cachée de google/trans qui traduira le russe " />
Le 16/11/2016 à 10h17
Merci. Effectivement l’article a été modifié pour bien évoquer que c’est depuis et vers l’anglais. " />
Le 16/11/2016 à 10h43
Ah je vois que l’humour ne passe plus chez NXi. Entre la modération qui devient n’importe quoi et les articles en baisse de qualité… finalement j’aurai peut-être pas du renouveler autant mon abonnement.
Le 16/11/2016 à 10h44
Si ça peut nous éviter des chefs d’oeuvre comme Jambonlaissé, c’est pas plus mal " />
Le 16/11/2016 à 10h52
Peut-être effet ricochet du à l’insulte à peine déguisé du 3ème commentaire.
Le 16/11/2016 à 10h55
Je sais pas je suis arrivé après la bataille sur ce coup là " />
Le 16/11/2016 à 11h02
C’est bien gentil l’humour, mais c’est un peu la réponse facile quand on se fait modérer (et à juste raison). Un peu plus de contrôle en amont serait salvateur. Pour ce qui est de la baisse de qualité des articles, tu peux nous envoyer un email pour nous exposer ton point de vue, parce qu’il peut en ressortir une discussion très constructive sur le sujet. Sinon c’est une attaque gratuite, et ce n’est pas l’endroit de toute manière pour en discuter.
Le 16/11/2016 à 11h08
vas y vincent, sword lui son poste ‘inutile’
" />
je suis avec vous, mais pas abonné " />
Le 16/11/2016 à 12h01
Wow
Je viens de tester en copiant collant des commentaires de PCI. Rien qui ne vole très haut on s’entend.
La traduction proposée m’a bluffer.
Le 16/11/2016 à 12h05
Si disons dans 10 15 ans cela traduit en direct la voix et les textes, cela risque de tuer les emplois de traducteurs et doubleurs, et certains blog journalistique." /> (Espérons que l’on pourra voir directement et facilement certaines chaines étrangères)" /> Bon, pour le Pron, cela ne sera pas vraiment nécessaire." />
Le 16/11/2016 à 12h19
Coréen : très difficile à traduire car plusieurs graphies et grammaire speciale.
Turc : langue particulière, avec un alphabet fortement latin.
Le 16/11/2016 à 12h21
Mail envoyé à la rédaction (via le formulaire) " />
Pour l’humour, oui c’est facile d’utiliser cet argument. mais çà ne veut pas dire qu’il n’est pas valable pour autant dans tous les cas. Sinon picatrix ne serait plus parmis nous depuis longtemps " />
Le 16/11/2016 à 12h21
il traduit “wesh gros” en “hi man” " />
sisi la famille quoi.
Le 16/11/2016 à 12h45
Le 16/11/2016 à 13h44
Le 16/11/2016 à 14h10
Mais hors du contexte du poker, un sens supplémentaire est apparu au mot pour dire “Étonner, épater”
https://fr.wiktionary.org/wiki/bluffer
Le 16/11/2016 à 16h14
Envoyé à quelle heure ? je n’ai rien dans ma boîte