Connexion
Abonnez-vous

Google ajoute 110 langues à son Translate

Le 28 juin à 08h01

Google vient d’annoncer « la plus grande expansion jamais réalisée » de son service Translate avec 110 nouvelles langues. Le bond a pu être réalisé grâce à son modèle linguistique PaLM 2.

Selon l’entreprise, ces langues, prises dans leur ensemble, sont parlées par 614 millions de personnes. Certaines sont parlées par plus de 100 millions de personnes. D’autres par « de petites communautés autochtones », et d’autres encore ne sont pratiquement plus parlées, mais font l’objet « d’efforts de revitalisation ».

Parmi les langues ajoutées, le cantonais figure en bonne place. Il s’agit, selon Google, de l’une des langues les plus demandées. Mais elle « se confond souvent avec le mandarin à l’écrit », ce qui aurait rendu complexe l’obtention de données et l’entrainement des modèles.

On trouve également l’afar, parlé notamment à Djibouti et en Éthiopie, et qui aurait bénéficié « du plus grand nombre de contributions volontaires » dans le nouveau lot. Citons aussi le pendjabi, langue la plus parlée au Pakistan, ou encore le tok pisin (ou néo-mélanésien), un créole fondé sur l’anglais et la lingua franca de Papouasie-Nouvelle-Guinée.

Le 28 juin à 08h01

Commentaires (20)

Vous devez être abonné pour pouvoir commenter.

Abonnez-vous
votre avatar
Google ajoute 110 langues à son Translate
Ce n'est pas sale.
votre avatar
... c'est ton corps qui change :D
votre avatar
Je vois qu'il y a le basque et le breton, elles font parties des 110 ?
votre avatar
je vois le basque sur Google translate mais toujours pas le breton.
votre avatar
Si, si !
Gouzout a ran komz brezhoneg bremañ !
votre avatar
En effet quand on passe par translate.google.com il y a le breton, mais quand c'est le "widget" de traduction sur Google search le breton n'est pas présent.

Sinon pour le breton c'est nouveau du coup.
votre avatar
Kerne, Leon pe Tregor?
votre avatar
Pour les langues parlées en Chine, vu que l'unification s'est faite par l'écriture, il n'y a logiquement aucune différence de symboles. Par contre, à l'oral, c'est le festival.

C'est donc là que la traduction par Google de textes écrit uniquement me gène car la plus grande richesse est dans les langues parlées dont pas mal ne s’écrivaient pas à l'origine, conduisant à des contorsions, comme cela a été le cas avec le Breton. On le voit bien avec les prénoms et noms dont l'orthographe varie selon le fonctionnaire chargé de coucher ces noms sur le papier.

Dur dur de préserver les langues car il faut faire des choix: les variations sont-elles le fait de modes locales de locuteurs à la manière des mille et une variations locales que l'on trouvait autrefois dans les campagnes avec des variations dans chaque village ou apportent-elles une richesse ou une histoire qui en font un patrimoine à conserver ?

Si chaque langue peut être vue comme une boîte de lego, je trouve que les langues les plus intéressantes sont celles qui apportent des briques que les autres n'ont pas ou rarement. Des briques sémantiques et, pour les langues parées, les phonèmes.
votre avatar
Je trouve le nouveau breton enseigné actuellement bien moins intéressant dans ses sonorités que celui parlé par celleux qui l'ont appris à l'oral, jusqu'au milieu du siècle dernier. Mon grand-père et mon arrière-grand-mère parlait le trégorois (Finistère nord / Côtes d'Armor ouest), c'était très particulier ! (merci l'INA)
Donc c'est très bien que le breton soit enseigné "en masse", mais j'ai hâte que ses locuteurs s'en emparent et jouent avec son vocabulaire et ses sonorités (ça doit déjà être le cas !)
votre avatar
Pour le cantonais, je viens de faire un test ultra-basique : j'ai fait traduire une phrase simple en mandarin et en cantonais.
L'orthographe est la même (ce qui est le résultat attendu, donc rien à dire).
Par contre, quand on demande la prononciation de la phrase, c'est différent. Là encore, c'est le résultat attendu.
Mon seul souci : comme je ne connais pas le cantonais, je ne peux pas juger de la qualité de la transcription phonétique, je suis obligé de faire confiance :D
votre avatar
Pour ajouter une nuance, la Chine continentale écrit en chinois simplifié, Hong Kong, Macau et Taiwan écrivent en traditionnel.

Par contre, Taiwan parle mandarin, Hong Kong et Macau parlent cantonais.
votre avatar
Je trouve nulle part la liste des 110 langues ajoutées !
votre avatar
votre avatar
La liste était dans un lien à la fin du billet de Google, j'ai mis à jour la brève pour la mettre en avant :)
votre avatar
Est-ce qu’ils passent toujours par l’anglais comme « pivot » pour leurs traductions ou c’est indépendant désormais ?
votre avatar
Ça doit faire pas loin de dix ans qu'ils ont arrêtés d'utiliser un pivot. Ils avaient développés un nouveau framework pour leur outil de traduction, basculant de la compréhension des mots à la compréhension des phrases, et n'avait plus besoin de pivot.
votre avatar
Ok merci !
votre avatar
Et toujours pas de traduction pour le mec bourré :craint:
votre avatar
Pour ça faut pas un traducteur mais une serpillière.

:vomi1:
votre avatar
Pour mézigue, Google entrave que tchi quand je jacte avec lui sur mon biniou. Baltringue.

Google ajoute 110 langues à son Translate

Fermer