Google ajoute 110 langues à son Translate
Le 28 juin à 08h01
2 min
Internet
Internet
Google vient d’annoncer « la plus grande expansion jamais réalisée » de son service Translate avec 110 nouvelles langues. Le bond a pu être réalisé grâce à son modèle linguistique PaLM 2.
Selon l’entreprise, ces langues, prises dans leur ensemble, sont parlées par 614 millions de personnes. Certaines sont parlées par plus de 100 millions de personnes. D’autres par « de petites communautés autochtones », et d’autres encore ne sont pratiquement plus parlées, mais font l’objet « d’efforts de revitalisation ».
Parmi les langues ajoutées, le cantonais figure en bonne place. Il s’agit, selon Google, de l’une des langues les plus demandées. Mais elle « se confond souvent avec le mandarin à l’écrit », ce qui aurait rendu complexe l’obtention de données et l’entrainement des modèles.
On trouve également l’afar, parlé notamment à Djibouti et en Éthiopie, et qui aurait bénéficié « du plus grand nombre de contributions volontaires » dans le nouveau lot. Citons aussi le pendjabi, langue la plus parlée au Pakistan, ou encore le tok pisin (ou néo-mélanésien), un créole fondé sur l’anglais et la lingua franca de Papouasie-Nouvelle-Guinée.
Le 28 juin à 08h01
Commentaires (20)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 28/06/2024 à 08h18
Le 01/07/2024 à 14h28
Le 28/06/2024 à 08h19
Le 28/06/2024 à 09h37
Le 28/06/2024 à 11h22
Gouzout a ran komz brezhoneg bremañ !
Le 28/06/2024 à 12h12
Sinon pour le breton c'est nouveau du coup.
Le 28/06/2024 à 19h00
Modifié le 28/06/2024 à 08h40
C'est donc là que la traduction par Google de textes écrit uniquement me gène car la plus grande richesse est dans les langues parlées dont pas mal ne s’écrivaient pas à l'origine, conduisant à des contorsions, comme cela a été le cas avec le Breton. On le voit bien avec les prénoms et noms dont l'orthographe varie selon le fonctionnaire chargé de coucher ces noms sur le papier.
Dur dur de préserver les langues car il faut faire des choix: les variations sont-elles le fait de modes locales de locuteurs à la manière des mille et une variations locales que l'on trouvait autrefois dans les campagnes avec des variations dans chaque village ou apportent-elles une richesse ou une histoire qui en font un patrimoine à conserver ?
Si chaque langue peut être vue comme une boîte de lego, je trouve que les langues les plus intéressantes sont celles qui apportent des briques que les autres n'ont pas ou rarement. Des briques sémantiques et, pour les langues parées, les phonèmes.
Modifié le 28/06/2024 à 09h45
Donc c'est très bien que le breton soit enseigné "en masse", mais j'ai hâte que ses locuteurs s'en emparent et jouent avec son vocabulaire et ses sonorités (ça doit déjà être le cas !)
Le 28/06/2024 à 12h31
L'orthographe est la même (ce qui est le résultat attendu, donc rien à dire).
Par contre, quand on demande la prononciation de la phrase, c'est différent. Là encore, c'est le résultat attendu.
Mon seul souci : comme je ne connais pas le cantonais, je ne peux pas juger de la qualité de la transcription phonétique, je suis obligé de faire confiance
Le 28/06/2024 à 17h04
Par contre, Taiwan parle mandarin, Hong Kong et Macau parlent cantonais.
Le 28/06/2024 à 09h44
Modifié le 28/06/2024 à 10h24
Le 28/06/2024 à 10h43
Le 28/06/2024 à 10h04
Le 28/06/2024 à 11h35
Le 28/06/2024 à 12h18
Le 28/06/2024 à 13h07
Le 28/06/2024 à 14h17
Le 01/07/2024 à 14h39