Facebook M2M-100 : un « premier modèle d'IA qui traduit 100 langues sans passer par l'anglais »

Facebook M2M-100 : un « premier modèle d’IA qui traduit 100 langues sans passer par l’anglais »

Facebook M2M-100 : un « premier modèle d'IA qui traduit 100 langues sans passer par l'anglais »

Le réseau social explique que la plupart des systèmes de traduction utilisent l’anglais comme pierre angulaire. Par exemple, passer du chinois au français se fait en deux étapes : chinois vers anglais et anglais vers français, doublant ainsi les risques de faire une erreur.

« Notre modèle s'entraîne directement sur les données du chinois vers le français pour mieux préserver le sens. Il surpasse de 10 points les systèmes centrés sur l'anglais par rapport à l’algorithme BLEU largement utilisé pour évaluer les traductions automatiques », explique Facebook.

M2M-100 est open source, sous licence MIT. Il est disponible dans ce dépôt GitHub, avec des exemples d’utilisation.

Commentaires (7)


C’est vraiment le gros problème des traducteurs, ça se voit trop quand ça passe par l’anglais, vu que les certains sens sont perdus car il n’existe pas en anglais. Ça se voit trop sur la politesse et le vous / vouvoiement.


Qu’ils parviennent déjà à traduire, en anglais, une simple phrase comme : je suis dépaysé par mon voyage…
Phrase Strictement impossible à traduire par une IA (ni même par un humain, d’ailleurs…).


J’ai une licence spéciale: “Traducteur et interprète judiciaire permanent á vie agréé par toutes les ambassades du monde pour toutes langues, depuis 1991”. Ce n’est pas une blague. Mais j’ai pu apprendre qu’á partir de la langue hongroise on pouvait apprendre toutes les langues du monde, et beaucoup mieux que basé sur les “grandes langues de l’Occident”: l’anglais, le français, le russe, l’allemand, l’espagnol, l’italien et le portugais.
On dit, je ne sais pas pourquoi que la langue hongroise est la plus difficile des langues du monde á apprendre… Comment ? La langue française a 32 temps, le hongrois 4, il n’y a pas de nasales, dans 98% des cas au lieu du pluriel on utilise le singulier, pour chaque mot sur 1.2 million on a 15.000 variantes, on peut dire “tu” en forme de pluriel sans utiliser “vous”. OK, il y a 40 cas verbaux au lieu des 7 utilisés dans les langues indo-européennes, mais sauf lors d’un examen aucun besoin de savoir ni leur leur nom ni qu’il y en a 32 généraux et 8 complexes. Enfin cerise sur le gâteau on peut utiliser des termes de physique nucléaire allant jusqu’à 5-6 fois au-dessous et au-dessus du niveau de l’atome qu’un pâtre analphabète ayant vécu il y a 1600 ans pourrait comprendre.
Bien sur chaque langue a eu ses essais de modernisation au cours du dix-neuvième siècle, la langue hongroise aussi. Pour exemple: “(animal) coûté/au grand cou” au lieu de “girafe”, “coureur des vallées” au lieu de “cerf”, “chanteur des mares” au lieu de “grenouille”. Cette modernisation en fin de compte ne s’est établie qu’en médecine et en pharmacologie…


On a essayé de traduire la langue hongroise par TM - traduction mécanique. Impossible: il y a trop de synonymes et celles-ci comportent des différences de sens vraiment affinés.
Mais pour quelqu’un qui veut débuter l’apprentissage d’une langue c’est la meilleure base á utiliser. Je me rappelle encore qu’au Maroc en CP en apprenant le passé simple je lus “je fus, tu fus, il-elle fut” - lu en hongrois : “moi herbe, toi herbe, il-elle herbe”… Chaque langue a de tel jeux de mots et cela un ordinateur aura grande peine á comprendre, si du tout.
Quant á la langue la plus difficile du monde c’est l’oubikh, une langue transcaucasienne avec 83 consonnes.
Étant un des 3 personnes au monde á connaître le kamas - j’aimerais bien faire avec les 2 français qui en sont spécialistes.


On a essayé de traduire la langue hongroise par TM - traduction mécanique. Impossible: il y a trop de synonymes et celles-ci comportent des différences de sens vraiment affinés.
Mais pour quelqu’un qui veut débuter l’apprentissage d’une langue c’est la meilleure base á utiliser. Je me rappelle encore qu’au Maroc en CP en apprenant le passé simple je lus “je fus, tu fus, il-elle fut” - lu en hongrois : “moi herbe, toi herbe, il-elle herbe”… Chaque langue a de tel jeux de mots et cela un ordinateur aura grande peine á comprendre, si du tout.
Quant á la langue la plus difficile du monde c’est l’oubikh, une langue transcaucasienne avec 83 consonnes.
Étant un des 3 personnes au monde á connaître le kamas - j’aimerais bien faire connaissance avec les 2 français qui en sont spécialistes.



(quote:1831997:mouton_enragé)
Qu’ils parviennent déjà à traduire, en anglais, une simple phrase comme : je suis dépaysé par mon voyage… Phrase Strictement impossible à traduire par une IA (ni même par un humain, d’ailleurs…).




“Kiderült hogy beborult” essaie de traduire cela :-) Cela devrait donner en français: “il s’est éclairci qu’il s’est déclairci”. Mais c’est plus fin que cela…


Oú est la couleur bleue dans le drapeau chinois ?! C’est “out of the Blue” - comme diraient les Ricains. Hors de question, quoi. Essayez plutôt l’algorithme Vert, basé sur la langue hongroise, vous aurez plus de succès…


Fermer