DeepL Voice fournit des sous-titres traduits en temps réel
Le 15 novembre à 12h14
3 min
IA et algorithmes
IA
La société allemande, spécialisée dans la traduction, manquait depuis plusieurs années d’un service permettant d’afficher immédiatement des sous-titres traduits à partir de sources audio. Alors que de nombreuses entreprises s’y sont mises, dont Google et Microsoft, DeepL comble enfin cette absence.
Dans son billet de blog, DeepL cite plusieurs études pour étayer son propos. Ainsi, selon le NBER (National Bureau of Economic Research), 33,8 % du temps passé en réunion serait perdu à cause de problèmes de compréhension entre les participants. Pour Axios HQ, il en coûte aux entreprises jusqu’à 54 860 dollars par employé et par an, toujours à cause des incompréhensions et du temps perdu.
DeepL se propose bien sûr de réduire cette f(r)acture avec son nouveau produit. À TechCrunch, la société explique qu’il s’agissait de la demande la plus fréquente des clients depuis 2017. Pourquoi avoir mis tout ce temps ? Parce qu’elle a développé son propre modèle de langage, plutôt que de s’appuyer sur un modèle existant, comme GPT.
DeepL Voice se destine donc avant tout aux entreprises. Le nouveau service est divisé en deux versions : l’une pour les réunions, l’autre pour les conversations. Dans la première, des cadres apparaissent près des participants pour traduire ce qu’ils disent. DeepL met largement en avant les gains de temps quand les réunions réunissent des personnes d’un peu partout dans le monde.
Dans la seconde, c’est le téléphone qui sert d’interface entre deux personnes. Là encore, les cas d’usages envisagés se font toujours dans un cadre professionnel, par exemple quand un employé s’adresse à un client étranger.
Par TechCrunch, on apprend aussi plusieurs éléments importants. D’abord, que DeepL Voice n’est pas disponible sous forme d’API que les applications peuvent intégrer comme elles le souhaitent. DeepL travaille spécifiquement avec d’autres entreprises pour intégrer sa technologie. Dans le cadre des réunions, le seul produit à en bénéficier est pour l’instant Teams de Microsoft. Il n’est pas non plus question pour l’instant d’une intégration par exemple dans les navigateurs sous forme d’extension.
DeepL indique également que rien n’est sauvegardé. Les données vocales sont bien envoyées vers les serveurs, mais rien n’y serait stocké, ni pour des questions d’archivage ni pour l’entrainement des modèles. Il est possible, comme le notent nos confrères, que tout le monde ne soit pas à l’aise à l’idée que tous ses propos soient envoyés à une entreprise pour analyse. DeepL a cependant cherché à rassurer en indiquant que la question du RGPD ou de toute autre réglementation du même acabit était travaillée avec ses clients.
Avec les PC Copilot+, Microsoft propose de la traduction automatique, mais vers une poignée de langues pour l’instant. Cette solution, qui exploite le NPU des machines, a néanmoins l’avantage d’être locale.
Le 15 novembre à 12h14
Commentaires (6)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 15/11/2024 à 12h48
Nous sommes toujours dans la problématique des écosystèmes, qui sont certe pratique pour l'utilisateur final, mais empêche toute concurrence d'atteindre ces utilisateurs.
Le public qui pourrait peut-être séduit serait les petites entreprises qui sont imbriquées dans l'écosystème de Microsoft.
Le 15/11/2024 à 18h32
Le 15/11/2024 à 19h57
Le 15/11/2024 à 14h26
Bon, si c'est pour gruger aux devoirs de langues, y'a pas de danger :p
Le 17/11/2024 à 08h44
Le 18/11/2024 à 12h15