Mozilla Common Voice propose désormais plus de 20 000 heures et 93 langues

Mozilla Common Voice propose désormais plus de 20 000 heures et 93 langues

Mozilla Common Voice propose désormais plus de 20 000 heures et 93 langues

Lancé il y a plus de quatre ans, ce projet a pour but d’aider les développeurs dans le domaine de la reconnaissance vocale. Les enregistrements peuvent notamment servir pour des intelligences artificielles.

Un nouveau cap est franchi avec plus de 20 000 heures disponibles. 27 langues disposent désormais de 100 heures minimum de données vocales, tandis que 9 langues ont au moins 500 heures. 

« Chaque entrée du jeu de données consiste en un seul fichier MP3 accompagné d’un fichier du texte correspondant. Une grande partie des 20 217 heures enregistrées dans le jeu de données comprennent également des métadonnées démographiques, telles que l’âge, le sexe et l’accent, qui peuvent contribuer à améliorer la précision des moteurs de reconnaissance vocale », explique Mozilla.

Commentaires (9)


Enregistré en mp3??
Étonnant, j’aurais pensé que Mozilla aurait pris un codect qu’il avait cherché à promouvoir comme Vorbis ou Opus.
Après, le brevet du mp3 s’est élevé dans le domaine public.


caractéristiques du jeu de données



62% Masculin
10% Féminin

Et les 28% restant ?


Thorgalix_21

Et les 28% restant ?


Non renseigné par le contributeur peut-être?…


Thorgalix_21

Et les 28% restant ?


Non binaire



Thorgalix_21 a dit:


Et les 28% restant ?




Ca n’est dit nulle part. Mammifère ?


Ben non, t’es bête, c’est des reptiliens


tazvld

Ben non, t’es bête, c’est des reptiliens


Des ovipares donc …



Thorgalix_21 a dit:


Des ovipares donc …




ou vivipares ou ovovivipares…


Fermer