Tacotron 2 : Google présente sa voix de synthèse (ultra) réaliste

Tacotron 2 : Google présente sa voix de synthèse (ultra) réaliste

Tacotron 2 : Google présente sa voix de synthèse (ultra) réaliste

Dans une publication scientifique sur arXiv, des chercheurs de chez Google présentent Tacotron 2, une solution de voix artificielle qui proposerait un résultat très proche d'une prononciation par un humain.

Pour arriver à ce résultat, les chercheurs utilisent deux réseaux de neurones : le premier divise le texte en séquences et les transforme en spectrogramme. La seconde s'occupe de générer le fichier audio.

Plusieurs exemples de rendus sonores sont disponibles sur cette page, avec des séquences qui n'ont évidemment pas été vues durant l'entrainement de Tacotron 2.

En bas de page, un jeu est proposé afin de trouver s'il s'agit d'un humain ou d'une voix de synthèse (un petit tour dans le code source permet de trouver des indices sur la provenance).

Commentaires (4)


Il n’y à pas moyen de tester avec notre propre texte, et dans une autre langue que l’anglais. Histoire de voir comment il se débrouille avec du texte technique.


Franchement c’est à peine croyable, c’est quand même très dur de faire la distinction dans le “jeu en fin de page”…


Ils sont trop fort google.


ah ouais, pas mal


Fermer