Mozilla Common Voice propose désormais plus de 20 000 heures et 93 langues
Le 02 mai 2022 à 08h11
1 min
Sciences et espace
Sciences
Lancé il y a plus de quatre ans, ce projet a pour but d’aider les développeurs dans le domaine de la reconnaissance vocale. Les enregistrements peuvent notamment servir pour des intelligences artificielles.
Un nouveau cap est franchi avec plus de 20 000 heures disponibles. 27 langues disposent désormais de 100 heures minimum de données vocales, tandis que 9 langues ont au moins 500 heures.
« Chaque entrée du jeu de données consiste en un seul fichier MP3 accompagné d’un fichier du texte correspondant. Une grande partie des 20 217 heures enregistrées dans le jeu de données comprennent également des métadonnées démographiques, telles que l’âge, le sexe et l’accent, qui peuvent contribuer à améliorer la précision des moteurs de reconnaissance vocale », explique Mozilla.
Le 02 mai 2022 à 08h11
Commentaires (9)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 02/05/2022 à 09h06
Enregistré en mp3??
Étonnant, j’aurais pensé que Mozilla aurait pris un codect qu’il avait cherché à promouvoir comme Vorbis ou Opus.
Après, le brevet du mp3 s’est élevé dans le domaine public.
Le 02/05/2022 à 09h38
caractéristiques du jeu de données
Le 02/05/2022 à 10h55
Et les 28% restant ?
Le 02/05/2022 à 18h56
Non renseigné par le contributeur peut-être?…
Le 03/05/2022 à 07h36
Non binaire
Le 02/05/2022 à 11h05
Ca n’est dit nulle part. Mammifère ?
Le 02/05/2022 à 12h55
Ben non, t’es bête, c’est des reptiliens
Le 02/05/2022 à 12h57
Des ovipares donc …
Le 02/05/2022 à 13h08
ou vivipares ou ovovivipares…