Connexion
Abonnez-vous

Google Traduction intègre 13 nouvelles langues, dont le corse et le luxembourgeois

La guerre des (anciennes) régions est lancée !

Google Traduction intègre 13 nouvelles langues, dont le corse et le luxembourgeois

Le 18 février 2016 à 09h10

Google a décidé d'intégrer un peu de culture locale à l'occasion de la mise à jour de son service de traduction. Ainsi, il intègre 13 nouvelles langues, dont le corse et le luxembourgeois. De quoi donner envie à d'autres régions de se faire représenter ?

Google vient d'annoncer l'arrivée de 13 nouvelles langues au sein de son service de traduction, dont le corse et le luxembourgeois. Ce sont ainsi 103 langues qui sont actuellement disponibles. Les autres concernées par l'annonce du jour sont l’amharique, le frison, le kirghize, l’hawaïen, le kurde (kurmanji), le samoan, le gaélique écossais, le shona, le sindhi, le pachtou et le xhosa.

L'ajout d'une langue : des règles et le besoin de la communauté

Google en profite pour préciser que « pour déterminer le lancement d’une nouvelle langue, nous regardons beaucoup de critères : tout d’abord, il doit s’agir d’une langue écrite. Ensuite, il est nécessaire de trouver en ligne de nombreuses traductions dans cette nouvelle langue. À partir de là, nous utilisons une combinaison de machine learning, de contenus sous licence, et le recours à la communauté de Google Traduction ».

Le machine learning permet d'identifier simplement des modèles statistiques afin de gérer le gros de l'apprentissage de la langue, mais comme le précise le géant américain, la communauté reste un maillon essentiel pour compléter cette base de travail et pouvoir prendre en compte la richesse d'une langue. 

Il en profite pour tenter de recruter (voir par ici), alors que la journée internationale de la langue maternelle arrivant se déroule le 21 février prochain. « À ce jour, plus de 3 millions de personnes ont contribué à l’amélioration d’environ 200 millions de mots traduits. Là, nous vous invitons d’ailleurs à profiter de cette opportunité pour rejoindre notre communauté Google Traduction » précise le communiqué.

Après le corse, quelles autres langues régionales ?

Ce dernier est signé Anne-Gabrielle Dauba-Pantanacce (Directrice de la Communication & Relations Presse de Google France), qui indique au passage que « mes racines étant aussi du côté de l’Ile de Beauté, j’ai été naturellement très sensible à l’ajout du corse que j’ai bien sûr soutenu activement. Les technologies du numérique représentent un formidable outil pour préserver et valoriser les cultures locales. Dans un monde globalisé, Internet favorise le sentiment d’appartenance à une communauté et nous sommes heureux d’y contribuer en ajoutant le corse à Google Traduction ».

Reste à voir si d'autres seront concernées, car Alsaciens, Bretons et autres Lorrains (pour ne citer que ces cas-là) pourraient décider de se mobiliser pour voir une telle reconnaissance régionale intégrée au service. Espérons qu'ils auront aussi des employés bien placés chez Google pour les représenter.

Commentaires (43)

Vous devez être abonné pour pouvoir commenter.

Abonnez-vous
votre avatar

et toujours pas de klingon <img data-src=" />

votre avatar

le Corse.. yeah :)

votre avatar

le lorrain du sur du nord de l’est de l’ouest puis avec tous nos mots “local” ça va pas être évident <img data-src=" />

votre avatar

ouèche gros :(&nbsp;

votre avatar

Ce serait bien si leur traducteur pouvait proposer plus de choix pour un mot. Très souvent un seul choix est proposé et je suis obligé d’aller sur Larousse, Pons ou Reverso pour connaître les autres sens possibles du mot.

Pour le moment, je préfère encore mon outil de traduction fait maison à la solution de google (mais c’est chiant de le lancer alors que google est toujours en ligne).

votre avatar

Est-ce que les mots raciste, molotov et banditisme sont traduits en corse ?

votre avatar

&nbsp;crìmine, razzista è Molotov <img data-src=" />

votre avatar

Le gaélique écossais est hilarant :)

votre avatar







CUlater a écrit :



Le gaélique écossais est hilarant :)





Le français parisien aussi.


votre avatar

Pas entendu ni&nbsp;pratiqué depuis longtemps. Parait que c’est lourd, chiant et hautain <img data-src=" />

votre avatar

Non mais t’sais mec, la discrimination, c’est, genre, mal, quoi.

votre avatar







gokudomatic a écrit :



Pas grave. Le plus gros risque était l’ajout du turc, à cause de Poutine.





Je suppose que pour toi le génocide kurde n’a donc pas existé, tout comme celui des juifs.


votre avatar







Exception a écrit :



Je suppose que pour toi le génocide kurde n’a donc pas existé, tout comme celui des juifs.





Pourquoi dis-tu ça? Accuser quelqu’un de ce genre de chose est grave, tu sais.


votre avatar

Je savais même pas que le luxembourgeois avait une langue propre à vrai dire.

&nbsp;

Mais bon je m’étais jamais posé la question non plus <img data-src=" />

votre avatar

Non c’est une langue depuis le milieu des années 1980, maintenant le truc c’est que la grammaire est partiellement dépendante de la prononciation ce qui est normalement pas possible pour une Langue mais est acceptable pour un dialecte. En France, les dialectes ont étés supprimés &nbsp;(parfois en utilisant la manière forte) au profit du français. Mais dans beaucoup de pays européens les dialectes sont encore très présent, voir regagne en importance comme par exemple en Flandre un flamand d’Ostende ne parle pas le meme flamand qu’un flamand d’Anvers…

votre avatar







Reznor26 a écrit :



Je savais même pas que le luxembourgeois avait une langue propre à vrai dire.

&nbsp;

Mais bon je m’étais jamais posé la question non plus <img data-src=" />





Bof, le luxembourgeois, l’alsacien… Tout ça c’est de l’allemand avec un accent. <img data-src=" />


votre avatar







frikakwa a écrit :



Enfin le Luxembourgeois… qui est tout de même l’une des langues officielles de Lululand! <img data-src=" />





Endlech!! :)


votre avatar







Loucheux a écrit :



Bof, le luxembourgeois, l’alsacien… Tout ça c’est de l’allemand avec un accent. <img data-src=" />







C’est vrai… C’est bien pour ça que les allemands non frontalier me demande de parler en Luxembourgeois car ils comprennent rien.



D’ailleurs toutes les langues sont juste des accents de langues préhistoriques..


votre avatar

Peut-être a-t-il confondu avec le génocide arménien ?

votre avatar







Berri-UQAM a écrit :



Pareil en anglais :



« He is very con. » https://fr.wiktionary.org/wiki/con#en



“He’s a con man” est plus juste.


votre avatar

S’ils commencent à mettre tout les Suisse-allemand et haut-valaisan <img data-src=" />



Sinon je trouve drôle d’un coté il y a irlandais et de l’autre il y a gaélique (écossais)

votre avatar

Tiens, il n’y à plus de kurde et juifs sur Terre!<img data-src=" /> Là vache. C’est à cause d’enlèvement aliens?<img data-src=" />

votre avatar







Ami-Kuns a écrit :



Tiens, il n’y à plus de kurde et juifs sur Terre!<img data-src=" /> Là vache. C’est à cause d’enlèvement aliens?<img data-src=" />







Manquerait plus que les Belges soient dans le coup, mais ils ont un alibi : la technologie n’était pas au point quand Jacques Brel a fait son dernier concert à l’Olympia, en 1968…



<img data-src=" /><img data-src=" /><img data-src=" /><img data-src=" /><img data-src=" />


votre avatar

De tout façon, de tout temps, les massacres ont existé depuis le début de l’existence humaine, et j’ai l’impression qu’on n’en verra pas la fin avant la fin de l’humanité.<img data-src=" />

votre avatar

Ouais, enfin…le latin est présent aussi… Je n’ai rien contre, au contraire, mais comme langue parlée, hein…


votre avatar







sigisbert a écrit :



Ouais, enfin…le latin est présent aussi… Je n’ai rien contre, au contraire, mais comme langue parlée, hein…







Pour les juristes, les botanistes et les zoologistes, c’est pas inutile…


votre avatar

Avant d’ajouter des langues vivantes de tradition écrite, que google revoit d’abord sa copie quant aux langues mortes.

Faites donc l’expérience de demander à google comment on dit “oui” en latin.

Vous allez être surpris …

votre avatar







Berri-UQAM a écrit :



Non mais t’sais mec, la discrimination, c’est, genre, mal, quoi.





Ah, ok, désolé, mon vieux. <img data-src=" />





Qu’est-ce que je raconte? Je ne suis pas un puritain antidiscrimination.<img data-src=" />


votre avatar

enfin vu la qualité de certaines traduction anglais(allemand) -&gt; français par exemple ça n’aura que du corse(ou autre choisir la langue) que le nom … ;)

votre avatar

Le merdogan turc risque de bombarder google avec cet ajout de la langue kurde !

votre avatar

Pas grave. Le plus gros risque était l’ajout du turc, à cause de Poutine.

votre avatar

Enfin le Luxembourgeois… qui est tout de même l’une des langues officielles de Lululand! <img data-src=" />

votre avatar

@ David Legrand:

vous pouvez citer aussi le basque qui a été intégré depuis plusieurs années!!

Milesker!!

Bon, c’est vrai, pour nous, le basque n’est pas une langue régionale, mais nationale

votre avatar

je sais pas, mais le mot”con(ne)” n’existe qu’en français, bizarre, non?

votre avatar

“Con” (“avec”) existe en espagnol! <img data-src=" />

votre avatar

c’est vrai, t’as raison<img data-src=" />, mais pas le même sens <img data-src=" />

votre avatar

J’ai l’extension Im Translator sur Firefox pour vérifier la qualité de mes écrits en espagnol et en anglais (et notamment le sens ou la place d’un mot). Google n’est pas le meilleur du lot. En fait je me suis rendue que le traducteur de Microsoft entre les 4 proposés par l’extension est souvent celui qui rend le mieux le sens voire la syntaxe.

votre avatar

Pareil en anglais :



« He is very con. » https://fr.wiktionary.org/wiki/con#en

votre avatar



Reste à voir si d’autres seront concernées, car Alsaciens, Bretons et autres Lorrains (pour ne citer que ces cas-là) pourraient décider de se mobiliser pour voir une telle reconnaissance régionale intégrée au service. Espérons qu’ils auront aussi des employés bien placés chez Google pour les représenter.



Si je ne m’abuse leur traducteur est basé sur une approche statistique, donc il faut un très large corpus de traductions pour entraîner le logiciel (disons quelques millions de lignes contemporaines pour recenser suffisamment de paires et triplets de mots). Il ne va pas être facile de trouver beaucoup de textes en lorrain, et encore moins des traductions. Surtout si l’orthographe n’a pas été normalisée.



Le corse est tout de même plus vivant que les autres langues régionales.











numerid a écrit :



J’ai l’extension Im Translator sur Firefox pour vérifier la qualité de mes écrits en espagnol et en anglais (et notamment le sens ou la place d’un mot). Google n’est pas le meilleur du lot. En fait je me suis rendue que le traducteur de Microsoft entre les 4 proposés par l’extension est souvent celui qui rend le mieux le sens voire la syntaxe.





Pour le franco-anglais, tant celui de Google que celui de MS donnent des résultats décents. Pour le sino-anglais les deux sont complètement à l’ouest.


votre avatar

Je ne comprends pas le ST?

votre avatar







frikakwa a écrit :



Enfin le Luxembourgeois… qui est tout de même l’une des langues officielles de Lululand! <img data-src=" />







C’est pas une langue, c’est un patois


votre avatar

Bai Xamari eta euskara hitkuntz ofiziala da hegoa Euskal Herrian !



Oui Xamari et l’Euskara est une langue officielle en Pays Basque Sud (=Pays Basque “espagnol”)!

votre avatar

Et le gascon, c’est pour quand, bordel ?



L’Occitanie, ça existe, faudrait leur dire chez Google !

Google Traduction intègre 13 nouvelles langues, dont le corse et le luxembourgeois

  • L'ajout d'une langue : des règles et le besoin de la communauté

  • Après le corse, quelles autres langues régionales ?

Fermer