Facebook M2M-100 : un « premier modèle d’IA qui traduit 100 langues sans passer par l’anglais »
Le 20 octobre 2020 à 08h25
1 min
Sciences et espace
Sciences
Le réseau social explique que la plupart des systèmes de traduction utilisent l’anglais comme pierre angulaire. Par exemple, passer du chinois au français se fait en deux étapes : chinois vers anglais et anglais vers français, doublant ainsi les risques de faire une erreur.
« Notre modèle s'entraîne directement sur les données du chinois vers le français pour mieux préserver le sens. Il surpasse de 10 points les systèmes centrés sur l'anglais par rapport à l’algorithme BLEU largement utilisé pour évaluer les traductions automatiques », explique Facebook.
M2M-100 est open source, sous licence MIT. Il est disponible dans ce dépôt GitHub, avec des exemples d’utilisation.
Le 20 octobre 2020 à 08h25
Commentaires (7)
Abonnez-vous pour prendre part au débat
Déjà abonné ? Se connecter
Cet article est en accès libre, mais il est le fruit du travail d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.
Accédez en illimité aux articles
Profitez d’un média expert et unique
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
Abonnez-vousLe 20/10/2020 à 09h11
C’est vraiment le gros problème des traducteurs, ça se voit trop quand ça passe par l’anglais, vu que les certains sens sont perdus car il n’existe pas en anglais. Ça se voit trop sur la politesse et le vous / vouvoiement.
Le 20/10/2020 à 21h21
Qu’ils parviennent déjà à traduire, en anglais, une simple phrase comme : je suis dépaysé par mon voyage…
Phrase Strictement impossible à traduire par une IA (ni même par un humain, d’ailleurs…).
Le 20/10/2020 à 21h22
J’ai une licence spéciale: “Traducteur et interprète judiciaire permanent á vie agréé par toutes les ambassades du monde pour toutes langues, depuis 1991”. Ce n’est pas une blague. Mais j’ai pu apprendre qu’á partir de la langue hongroise on pouvait apprendre toutes les langues du monde, et beaucoup mieux que basé sur les “grandes langues de l’Occident”: l’anglais, le français, le russe, l’allemand, l’espagnol, l’italien et le portugais.
On dit, je ne sais pas pourquoi que la langue hongroise est la plus difficile des langues du monde á apprendre… Comment ? La langue française a 32 temps, le hongrois 4, il n’y a pas de nasales, dans 98% des cas au lieu du pluriel on utilise le singulier, pour chaque mot sur 1.2 million on a 15.000 variantes, on peut dire “tu” en forme de pluriel sans utiliser “vous”. OK, il y a 40 cas verbaux au lieu des 7 utilisés dans les langues indo-européennes, mais sauf lors d’un examen aucun besoin de savoir ni leur leur nom ni qu’il y en a 32 généraux et 8 complexes. Enfin cerise sur le gâteau on peut utiliser des termes de physique nucléaire allant jusqu’à 5-6 fois au-dessous et au-dessus du niveau de l’atome qu’un pâtre analphabète ayant vécu il y a 1600 ans pourrait comprendre.
Bien sur chaque langue a eu ses essais de modernisation au cours du dix-neuvième siècle, la langue hongroise aussi. Pour exemple: “(animal) coûté/au grand cou” au lieu de “girafe”, “coureur des vallées” au lieu de “cerf”, “chanteur des mares” au lieu de “grenouille”. Cette modernisation en fin de compte ne s’est établie qu’en médecine et en pharmacologie…
Le 20/10/2020 à 21h36
On a essayé de traduire la langue hongroise par TM - traduction mécanique. Impossible: il y a trop de synonymes et celles-ci comportent des différences de sens vraiment affinés.
Mais pour quelqu’un qui veut débuter l’apprentissage d’une langue c’est la meilleure base á utiliser. Je me rappelle encore qu’au Maroc en CP en apprenant le passé simple je lus “je fus, tu fus, il-elle fut” - lu en hongrois : “moi herbe, toi herbe, il-elle herbe”… Chaque langue a de tel jeux de mots et cela un ordinateur aura grande peine á comprendre, si du tout.
Quant á la langue la plus difficile du monde c’est l’oubikh, une langue transcaucasienne avec 83 consonnes.
Étant un des 3 personnes au monde á connaître le kamas - j’aimerais bien faire avec les 2 français qui en sont spécialistes.
Le 20/10/2020 à 21h37
On a essayé de traduire la langue hongroise par TM - traduction mécanique. Impossible: il y a trop de synonymes et celles-ci comportent des différences de sens vraiment affinés.
Mais pour quelqu’un qui veut débuter l’apprentissage d’une langue c’est la meilleure base á utiliser. Je me rappelle encore qu’au Maroc en CP en apprenant le passé simple je lus “je fus, tu fus, il-elle fut” - lu en hongrois : “moi herbe, toi herbe, il-elle herbe”… Chaque langue a de tel jeux de mots et cela un ordinateur aura grande peine á comprendre, si du tout.
Quant á la langue la plus difficile du monde c’est l’oubikh, une langue transcaucasienne avec 83 consonnes.
Étant un des 3 personnes au monde á connaître le kamas - j’aimerais bien faire connaissance avec les 2 français qui en sont spécialistes.
Le 20/10/2020 à 21h39
“Kiderült hogy beborult” essaie de traduire cela :-) Cela devrait donner en français: “il s’est éclairci qu’il s’est déclairci”. Mais c’est plus fin que cela…
Le 20/10/2020 à 21h42
Oú est la couleur bleue dans le drapeau chinois ?! C’est “out of the Blue” - comme diraient les Ricains. Hors de question, quoi. Essayez plutôt l’algorithme Vert, basé sur la langue hongroise, vous aurez plus de succès…
Signaler un commentaire
Voulez-vous vraiment signaler ce commentaire ?