Google Traduction intègre 13 nouvelles langues, dont le corse et le luxembourgeois
La guerre des (anciennes) régions est lancée !
Le 18 février 2016 à 09h10
3 min
Internet
Internet
Google a décidé d'intégrer un peu de culture locale à l'occasion de la mise à jour de son service de traduction. Ainsi, il intègre 13 nouvelles langues, dont le corse et le luxembourgeois. De quoi donner envie à d'autres régions de se faire représenter ?
Google vient d'annoncer l'arrivée de 13 nouvelles langues au sein de son service de traduction, dont le corse et le luxembourgeois. Ce sont ainsi 103 langues qui sont actuellement disponibles. Les autres concernées par l'annonce du jour sont l’amharique, le frison, le kirghize, l’hawaïen, le kurde (kurmanji), le samoan, le gaélique écossais, le shona, le sindhi, le pachtou et le xhosa.
L'ajout d'une langue : des règles et le besoin de la communauté
Google en profite pour préciser que « pour déterminer le lancement d’une nouvelle langue, nous regardons beaucoup de critères : tout d’abord, il doit s’agir d’une langue écrite. Ensuite, il est nécessaire de trouver en ligne de nombreuses traductions dans cette nouvelle langue. À partir de là, nous utilisons une combinaison de machine learning, de contenus sous licence, et le recours à la communauté de Google Traduction ».
Le machine learning permet d'identifier simplement des modèles statistiques afin de gérer le gros de l'apprentissage de la langue, mais comme le précise le géant américain, la communauté reste un maillon essentiel pour compléter cette base de travail et pouvoir prendre en compte la richesse d'une langue.
Il en profite pour tenter de recruter (voir par ici), alors que la journée internationale de la langue maternelle arrivant se déroule le 21 février prochain. « À ce jour, plus de 3 millions de personnes ont contribué à l’amélioration d’environ 200 millions de mots traduits. Là, nous vous invitons d’ailleurs à profiter de cette opportunité pour rejoindre notre communauté Google Traduction » précise le communiqué.
Après le corse, quelles autres langues régionales ?
Ce dernier est signé Anne-Gabrielle Dauba-Pantanacce (Directrice de la Communication & Relations Presse de Google France), qui indique au passage que « mes racines étant aussi du côté de l’Ile de Beauté, j’ai été naturellement très sensible à l’ajout du corse que j’ai bien sûr soutenu activement. Les technologies du numérique représentent un formidable outil pour préserver et valoriser les cultures locales. Dans un monde globalisé, Internet favorise le sentiment d’appartenance à une communauté et nous sommes heureux d’y contribuer en ajoutant le corse à Google Traduction ».
Reste à voir si d'autres seront concernées, car Alsaciens, Bretons et autres Lorrains (pour ne citer que ces cas-là) pourraient décider de se mobiliser pour voir une telle reconnaissance régionale intégrée au service. Espérons qu'ils auront aussi des employés bien placés chez Google pour les représenter.
Google Traduction intègre 13 nouvelles langues, dont le corse et le luxembourgeois
-
L'ajout d'une langue : des règles et le besoin de la communauté
-
Après le corse, quelles autres langues régionales ?
Commentaires (43)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 18/02/2016 à 09h15
et toujours pas de klingon " />
Le 18/02/2016 à 09h20
le Corse.. yeah :)
Le 18/02/2016 à 09h22
le lorrain du sur du nord de l’est de l’ouest puis avec tous nos mots “local” ça va pas être évident " />
Le 18/02/2016 à 09h25
ouèche gros :(
Le 18/02/2016 à 09h25
Ce serait bien si leur traducteur pouvait proposer plus de choix pour un mot. Très souvent un seul choix est proposé et je suis obligé d’aller sur Larousse, Pons ou Reverso pour connaître les autres sens possibles du mot.
Pour le moment, je préfère encore mon outil de traduction fait maison à la solution de google (mais c’est chiant de le lancer alors que google est toujours en ligne).
Le 18/02/2016 à 09h34
Est-ce que les mots raciste, molotov et banditisme sont traduits en corse ?
Le 18/02/2016 à 09h36
crìmine, razzista è Molotov " />
Le 18/02/2016 à 09h38
Le gaélique écossais est hilarant :)
Le 18/02/2016 à 09h41
Le 18/02/2016 à 09h47
Pas entendu ni pratiqué depuis longtemps. Parait que c’est lourd, chiant et hautain " />
Le 18/02/2016 à 09h47
Non mais t’sais mec, la discrimination, c’est, genre, mal, quoi.
Le 18/02/2016 à 11h56
Le 18/02/2016 à 12h01
Le 18/02/2016 à 12h31
Je savais même pas que le luxembourgeois avait une langue propre à vrai dire.
Mais bon je m’étais jamais posé la question non plus " />
Le 18/02/2016 à 12h41
Non c’est une langue depuis le milieu des années 1980, maintenant le truc c’est que la grammaire est partiellement dépendante de la prononciation ce qui est normalement pas possible pour une Langue mais est acceptable pour un dialecte. En France, les dialectes ont étés supprimés (parfois en utilisant la manière forte) au profit du français. Mais dans beaucoup de pays européens les dialectes sont encore très présent, voir regagne en importance comme par exemple en Flandre un flamand d’Ostende ne parle pas le meme flamand qu’un flamand d’Anvers…
Le 18/02/2016 à 12h44
Le 18/02/2016 à 13h20
Le 18/02/2016 à 13h22
Le 18/02/2016 à 13h30
Peut-être a-t-il confondu avec le génocide arménien ?
Le 18/02/2016 à 14h50
Le 18/02/2016 à 14h53
S’ils commencent à mettre tout les Suisse-allemand et haut-valaisan " />
Sinon je trouve drôle d’un coté il y a irlandais et de l’autre il y a gaélique (écossais)
Le 18/02/2016 à 17h52
Tiens, il n’y à plus de kurde et juifs sur Terre!" /> Là vache. C’est à cause d’enlèvement aliens?" />
Le 18/02/2016 à 17h54
Le 18/02/2016 à 17h59
De tout façon, de tout temps, les massacres ont existé depuis le début de l’existence humaine, et j’ai l’impression qu’on n’en verra pas la fin avant la fin de l’humanité." />
Le 19/02/2016 à 08h17
Ouais, enfin…le latin est présent aussi… Je n’ai rien contre, au contraire, mais comme langue parlée, hein…
Le 19/02/2016 à 09h09
Le 19/02/2016 à 09h12
Avant d’ajouter des langues vivantes de tradition écrite, que google revoit d’abord sa copie quant aux langues mortes.
Faites donc l’expérience de demander à google comment on dit “oui” en latin.
Vous allez être surpris …
Le 18/02/2016 à 09h50
Le 18/02/2016 à 09h51
enfin vu la qualité de certaines traduction anglais(allemand) -> français par exemple ça n’aura que du corse(ou autre choisir la langue) que le nom … ;)
Le 18/02/2016 à 10h01
Le merdogan turc risque de bombarder google avec cet ajout de la langue kurde !
Le 18/02/2016 à 10h04
Pas grave. Le plus gros risque était l’ajout du turc, à cause de Poutine.
Le 18/02/2016 à 10h09
Enfin le Luxembourgeois… qui est tout de même l’une des langues officielles de Lululand! " />
Le 18/02/2016 à 10h29
@ David Legrand:
vous pouvez citer aussi le basque qui a été intégré depuis plusieurs années!!
Milesker!!
Bon, c’est vrai, pour nous, le basque n’est pas une langue régionale, mais nationale
Le 18/02/2016 à 10h31
je sais pas, mais le mot”con(ne)” n’existe qu’en français, bizarre, non?
Le 18/02/2016 à 10h34
“Con” (“avec”) existe en espagnol! " />
Le 18/02/2016 à 10h41
c’est vrai, t’as raison" />, mais pas le même sens " />
Le 18/02/2016 à 10h43
J’ai l’extension Im Translator sur Firefox pour vérifier la qualité de mes écrits en espagnol et en anglais (et notamment le sens ou la place d’un mot). Google n’est pas le meilleur du lot. En fait je me suis rendue que le traducteur de Microsoft entre les 4 proposés par l’extension est souvent celui qui rend le mieux le sens voire la syntaxe.
Le 18/02/2016 à 10h44
Pareil en anglais :
« He is very con. » https://fr.wiktionary.org/wiki/con#en
Le 18/02/2016 à 10h56
Reste à voir si d’autres seront concernées, car Alsaciens, Bretons et autres Lorrains (pour ne citer que ces cas-là) pourraient décider de se mobiliser pour voir une telle reconnaissance régionale intégrée au service. Espérons qu’ils auront aussi des employés bien placés chez Google pour les représenter.
Si je ne m’abuse leur traducteur est basé sur une approche statistique, donc il faut un très large corpus de traductions pour entraîner le logiciel (disons quelques millions de lignes contemporaines pour recenser suffisamment de paires et triplets de mots). Il ne va pas être facile de trouver beaucoup de textes en lorrain, et encore moins des traductions. Surtout si l’orthographe n’a pas été normalisée.
Le corse est tout de même plus vivant que les autres langues régionales.
Le 18/02/2016 à 11h04
Je ne comprends pas le ST?
Le 18/02/2016 à 11h19
Le 18/02/2016 à 11h21
Bai Xamari eta euskara hitkuntz ofiziala da hegoa Euskal Herrian !
Oui Xamari et l’Euskara est une langue officielle en Pays Basque Sud (=Pays Basque “espagnol”)!
Le 18/02/2016 à 11h41
Et le gascon, c’est pour quand, bordel ?
L’Occitanie, ça existe, faudrait leur dire chez Google !