Tacotron 2 : Google présente sa voix de synthèse (ultra) réaliste
Le 08 janvier 2018 à 10h20
1 min
Sciences et espace
Sciences
Dans une publication scientifique sur arXiv, des chercheurs de chez Google présentent Tacotron 2, une solution de voix artificielle qui proposerait un résultat très proche d'une prononciation par un humain.
Pour arriver à ce résultat, les chercheurs utilisent deux réseaux de neurones : le premier divise le texte en séquences et les transforme en spectrogramme. La seconde s'occupe de générer le fichier audio.
Plusieurs exemples de rendus sonores sont disponibles sur cette page, avec des séquences qui n'ont évidemment pas été vues durant l'entrainement de Tacotron 2.
En bas de page, un jeu est proposé afin de trouver s'il s'agit d'un humain ou d'une voix de synthèse (un petit tour dans le code source permet de trouver des indices sur la provenance).
Le 08 janvier 2018 à 10h20
Commentaires (4)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 08/01/2018 à 14h54
Il n’y à pas moyen de tester avec notre propre texte, et dans une autre langue que l’anglais. Histoire de voir comment il se débrouille avec du texte technique.
Le 08/01/2018 à 16h07
Franchement c’est à peine croyable, c’est quand même très dur de faire la distinction dans le “jeu en fin de page”…
Le 08/01/2018 à 20h58
Ils sont trop fort google.
Le 09/01/2018 à 06h13
ah ouais, pas mal