Reconnaissance vocale : Mozilla veut aider, avec modèle et données
1 min
Sciences et espace
Sciences
L’éditeur souhaite fournir les outils nécessaires à tous les intéressés par la reconnaissance vocale. Il propose donc un modèle de traitement et surtout une base de données.
Mozilla a pu récupérer environ 400 000 échantillons vocaux, via les participations volontaires de 20 000 personnes (projet Common Voice). L’éditeur met cette base à disposition, pour compenser le manque habituel de données, pénalisant souvent les entreprises.
Mozilla fournit également un modèle de reconnaissance autant qu’un moteur speech-to-text : Project DeepSpeech, lui-même reprenant les bases des recherches Deep Speech menées par Baidu. Les travaux de Mozilla se servent de TensorFlow (Google) et ont été publiées sur GitHub sous licence open source (MPL 2.0).
Mozilla veut encourager les développeurs à proposer des fonctions de reconnaissance vocale sans passer par les quelques gros ténors du secteur (Siri, Assistant, Alexa…). Notez cependant que la base fournie ne propose pour l’instant que des extraits en anglais. L’éditeur compte élargir cette collection à d’autres langages durant le premier semestre 2018.
Commentaires (1)
Abonnez-vous pour prendre part au débat
Déjà abonné ou lecteur ? Se connecter
Cet article est en accès libre, mais il est le produit d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.
Accédez en illimité aux articles d'un média expert
Profitez d'au moins 1 To de stockage pour vos sauvegardes
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
Abonnez-vousLe 30/11/2017 à 15h47
Y’a http://www.voxforge.org qui fait ça aussi.
Signaler un commentaire
Voulez-vous vraiment signaler ce commentaire ?