Connexion
Abonnez-vous

Duolingo va remplacer des sous-traitants par des IA

Le 29 avril à 16h45

Duolingo « cessera progressivement de recourir à des sous-traitants pour réaliser des tâches que l’IA peut prendre en charge », selon un mail envoyé par le cofondateur et PDG de l’entreprise, Luis von Ahn.

Le document, dans lequel Duolingo annonce devenir « AI first », a été publié sur le compte Linkedin de la société.

Parmi les évolutions permettant d’atteindre ce but, Luis von Ahn indique que « des effectifs ne seront accordés que si une équipe ne peut pas automatiser une plus grande partie de son travail », un discours qui ressemble fortement à celui formulé par le patron de Shopify au début du mois.

« L’IA n’est pas seulement un gain de productivité, écrit Luis von Ahn. Elle nous aide à nous rapprocher de notre mission. Pour bien enseigner, nous devons créer une quantité massive de contenu, et le faire manuellement n’est pas rentable. »

Le 29 avril à 16h45

Commentaires (19)

votre avatar
nous devons créer une quantité massive de contenu, et le faire manuellement n’est pas rentable
Et donc une quantité massive de contenu généré par IA avec le lot de problème qui va avec (hallucinations, etc.) et donc probablement une baisse de qualité.
votre avatar
Pas tellement. Si il y a bien une tâche sur laquelle l’IA est excellente en 2025 c’est bien la traduction.

Franchement si c’est fait correctement ça fera le taf pour 99% des cas. Et le 1% restant peut facilement se gérer avec des mécanismes de signalement de la part des utilisateurs.
votre avatar
Quand je vois les trad mot à mot de Duolingo (pour l'anglais) ou la construction française un peu.... étrange, dira-t-on, je me dis qu'au contraire, ça ne peut qu'améliorer la qualité.

Accessoirement, un LLM permet d'éviter de passer par une langue intermédiaire. Il me semble que pour certaines, Duolingo ne propose que de l'anglais en langue associée à celle apprise.
votre avatar
Ça fait un moment que Duolingo (au moins 2 ans) a commencé à utiliser l'IA. Du coup ce que tu constates c'est peut-être justement déjà le résultat de l'IA. D'après ce que j'ai compris, Duolingo a également commencé à utiliser l'IA pour la lecture à haute voix et le résultat est vraiment pas terrible, avec beaucoup de prononciations incorrectes.

Pour ce qui est d'éviter de passer par une langue intermédiaire, le problème c'est que typiquement quand un site comme Duolingo ne propose pas de paire directe, c'est souvent des langues assez mineures dans lesquelles... les LLM ont pas tant de contenu que ça à se mettre sous la dent pour s'entraîner. Le résultat risque donc d'être encore plus décevant.
votre avatar
Pour la synthèse vocale, je l'ai ressenti et comme j'utilise un haut parleur, on remarque que le son est parfois dégueux. Tout comme je ne sais pas comment ils considèrent la reconnaissance vocale, mais elle est parfois aux fraises.

Pour le texte, j'ai des doutes ou alors c'est bien orienté pour les rendre trop simplistes, voire grammaticalement bancales.
votre avatar
Bof et re-bof. L'IA fait le café pour donner le sens global mais tout ce qui est tournures idiomatiques et style, c'est encore pas mal aux fraises.

Pas plus tard qu'hier, j'ai vu un très beau titre "This is why..." traduit par "C'est pourquoi..." (genre "This is why you shouldn't buy this product" traduit en "C'est pourquoi vous ne devriez pas acheter ce produit"). J'veux dire... on comprend, mais c'est vraiment pas ce qu'il faut enseigner à des élèves. C'est de la traduction mot à mot qu'on pardonnera à un lycéen, mais pas à un prof.

Ce n'est qu'un exemple : les traductions par IA sont remplies de problèmes de ce style.
votre avatar
Justement, ton exemple illustre très bien ce qui fonctionne mal avec les IA de traduction classiques mais que LLMs savent gérer grâce à leur compréhension profonde du contexte.

J’ai demandé à o3 :

- Traduis : « This is why you shouldn't buy this product »

- « C’est pourquoi vous ne devriez pas acheter ce produit. »

——

- Traduis ce titre : « This is why you shouldn't buy this product »

- « Voilà pourquoi vous ne devriez pas acheter ce produit ».



Comme il a l’information que c’est un titre (et il l’aurait deviné seul si je ne l’avais pas précisé mais que j’avais balancé un article entier), il comprend tout à fait la tournure de style.

Les anciennes IA de traduction type DeepL sont très limitées dans leur gestion du contexte. Elles traduisent presque mot à mot ou phrase par phrase. Des LLM récents comme Gemini 2.5, o3 ou Claude 3.7 sont capables de raisonner avec des contextes de plusieurs centaines de milliers de caractères.
votre avatar
Après, le point d'attention à toujours avoir en tête - même si Transformer a fait ses premières armes sur la trad -, c'est qu'un LLM ne traduit pas vraiment. Il réécrit le texte. De mémoire, il est recommandé de le paramétrer en mode plus déterministe (température basse) pour la traduction.

Cela dit, comme les utilisateurs n'ont pas accès à ces params sur les chat bots en ligne (qui sont plutôt équilibrés sur le température), il y a toujours un risque que le modèle dévie du sens original s'ils sont utilisés à cette fin.
votre avatar
En traduction pure, même sur des températures lambda, je crois n'avoir jamais pris ChatGPT à halluciner purement et simplement dans une traduction (même pas GPT-3.5). Ça lui arrive de faire un contresens mais c'est généralement un contresens explicable (mauvais choix de traduction sur un mot polysémique, ambiguité dans la source d'un point de vue purement linguistique qui ne peut être levée qu'avec une représentation mentale du monde réel ou du monde interne du texte source, termes techniques traduits selon leur sens commun ou avec une formule générique faute de connaissance poussée dans le domaine...).

À part sur des petits modèles assez faibles style LLaMa3-7B, je n'ai jamais vu un LLM vraiment partir en sucette dans une traduction et se mettre à divaguer.

Leur principale limite pour moi c'est qu'absolument tous les modèles que j'ai essayé restent assez littéraux dans leurs traductions. Justement, ils ne transcréent pas assez. Ils collent à la source et s'expriment comme dans la langue source. Ils ont ce petit côté "étudiant de 2e année de licence de langue" : comprend la source, ne fait pas de fautes à proprement parler, mais ne s'exprime pas comme le ferait un natif et garde les réflexes de sa "langue maternelle" (dans le cas d'un LLM : la langue source que tu lui demandes de traduire).

Tu peux leur demander de réécrire le texte entièrement après coup mais là effectivement tu commences à prendre un risque qu'il s'éloigne trop de la source, et en plus tu te manger tous les tics de langage propres à chaque LLM.
votre avatar
Oui, tu peux améliorer singulièrement la traduction avec les LLM en leur donnant des instructions précises au cas par cas, mais ça nécessite un humain pour guider l'IA. Quand le contexte est toujours le même ça va tu peux faire un prompt unique ("Traduis-moi cette liste de titres de vidéos, il s'agit de vidéos de recommandations et de tests de matériel informatique."), mais quand il s'agit d'une vaste gamme de phrases désarticulées aux contextes très divers, comme c'est a priori le cas pour Duolingo, c'est plus compliqué.

J'ajoute qu'en soi, la traduction proposée par o3, sans être incorrecte, reste assez naïve et pas très idiomatique - même s'il est vrai qu'on voit de plus en plus ce genre de formulations sous la plume de journalistes français biberonnés aux contenus en anglais. Ce ne serait pas un problème dans le contexte de Duolingo (ou il faut au contraire conserver une certaine naïveté et coller au texte pour faciliter la compréhension et l'apprentissage) mais ça en serait un pour faire un bon titre d'article ou de vidéo.

À titre perso, même sur la paire de langues anglais-français, qui est sans doute l'une des plus faciles qui soit pour les LLM (vu la quantité de données d'entraînement d'excellente qualité), je reconnais les traductions ChatGPT à des kilomètres.
votre avatar
Un "natif" d'une langue donnée a qd même bien tendance à rester sceptique devant une trad faite à l'IA. Ok, ça s'améliore, mais ce n'est pas encore ça
votre avatar
Je n'étais plus sur de l'atcivité de DUOLINGO (apprentissage des langues), et c'est déjà sur leur site :
[...]
un apprentissage personnalisé
Conçues pour s'adapter à ton niveau et t'aider à apprendre à ton rythme, nos leçons combinent le meilleur de l'intelligence artificielle et de la linguistique.[...]
votre avatar
Quand on voit le nombre d'articles de presse qui contiennent des fautes d'accord, voir des erreurs d'homonymes depuis qqes mois, on voit bien que la correction par ia est déjà défaillante.
Alors pour créer du contenu "de référence".... :fou:
votre avatar
Et puis c'est pas comme si les correcteurs orthographiques basés sur de bons vieux algos n'étaient pas satisfaisants...
votre avatar
Hé bien il suffira de remplacer Duolingo par une autre appli. Ils sont loin d'avoir le monopole.
votre avatar
Pour ma part j'ai essayé de trouver un service équivalent pour l'apprentissage du Japonais, mais j'ai rien trouvé de concluant :-/

Si vous avez des idées je suis preneur.
votre avatar
Bah clairement quitte à ce que Duolingo utilise ChatGPT pour produire ses cours, pour les élèves autant demander directement à ChatGPT de faire cours. Si la valeur ajoutée de Duolingo c'est d'écrire un prompt à ChatGPT, je pense que y a largement moyen de se passer d'eux et d'écrire le prompt soi-même.
votre avatar
Moi je trouve ça logique et bien.
Pas possible d'apprendre le catalan depuis le français car c'est seulement via le castella. Hors une IA avec de la supervision pourrait permettre de générer au moins le premier niveau.

Faut voir que c'est simple Duolingo et que le système mélange les mêmes mots pour faire un semblant de variété et doit gérer des traductions libres différentes, parfois via les signalements/commentaires.

En tout cas si ça peut aider, notamment sur certaines langues manquant de connexions, c'est top !

Duolingo va remplacer des sous-traitants par des IA

Fermer