Tacotron 2 : Google présente sa voix de synthèse (ultra) réaliste
1 min
Sciences et espace
Sciences
Dans une publication scientifique sur arXiv, des chercheurs de chez Google présentent Tacotron 2, une solution de voix artificielle qui proposerait un résultat très proche d’une prononciation par un humain.
Pour arriver à ce résultat, les chercheurs utilisent deux réseaux de neurones : le premier divise le texte en séquences et les transforme en spectrogramme. La seconde s’occupe de générer le fichier audio.
Plusieurs exemples de rendus sonores sont disponibles sur cette page, avec des séquences qui n’ont évidemment pas été vues durant l’entrainement de Tacotron 2.
En bas de page, un jeu est proposé afin de trouver s’il s’agit d’un humain ou d’une voix de synthèse (un petit tour dans le code source permet de trouver des indices sur la provenance).
Commentaires (4)
Abonnez-vous pour prendre part au débat
Déjà abonné ou lecteur ? Se connecter
Cet article est en accès libre, mais il est le produit d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.
Accédez en illimité aux articles d'un média expert
Profitez d'au moins 1 To de stockage pour vos sauvegardes
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
Abonnez-vousLe 08/01/2018 à 14h54
Il n’y à pas moyen de tester avec notre propre texte, et dans une autre langue que l’anglais. Histoire de voir comment il se débrouille avec du texte technique.
Le 08/01/2018 à 16h07
Franchement c’est à peine croyable, c’est quand même très dur de faire la distinction dans le “jeu en fin de page”…
Le 08/01/2018 à 20h58
Ils sont trop fort google.
Le 09/01/2018 à 06h13
ah ouais, pas mal
Signaler un commentaire
Voulez-vous vraiment signaler ce commentaire ?