Connexion
Abonnez-vous

Mozilla Common Voice propose désormais plus de 20 000 heures et 93 langues

Mozilla Common Voice propose désormais plus de 20 000 heures et 93 langues

Le 02 mai 2022 à 08h11

Lancé il y a plus de quatre ans, ce projet a pour but d’aider les développeurs dans le domaine de la reconnaissance vocale. Les enregistrements peuvent notamment servir pour des intelligences artificielles.

Un nouveau cap est franchi avec plus de 20 000 heures disponibles. 27 langues disposent désormais de 100 heures minimum de données vocales, tandis que 9 langues ont au moins 500 heures. 

« Chaque entrée du jeu de données consiste en un seul fichier MP3 accompagné d’un fichier du texte correspondant. Une grande partie des 20 217 heures enregistrées dans le jeu de données comprennent également des métadonnées démographiques, telles que l’âge, le sexe et l’accent, qui peuvent contribuer à améliorer la précision des moteurs de reconnaissance vocale », explique Mozilla.

Le 02 mai 2022 à 08h11

Commentaires (9)

Vous devez être abonné pour pouvoir commenter.

Abonnez-vous
votre avatar

Enregistré en mp3??
Étonnant, j’aurais pensé que Mozilla aurait pris un codect qu’il avait cherché à promouvoir comme Vorbis ou Opus.
Après, le brevet du mp3 s’est élevé dans le domaine public.

votre avatar

caractéristiques du jeu de données



62% Masculin
10% Féminin
votre avatar

Et les 28% restant ?

votre avatar

Non renseigné par le contributeur peut-être?…

votre avatar

Non binaire

votre avatar

Thorgalix_21 a dit:


Et les 28% restant ?


Ca n’est dit nulle part. Mammifère ?

votre avatar

Ben non, t’es bête, c’est des reptiliens

votre avatar

Des ovipares donc …

votre avatar

Thorgalix_21 a dit:


Des ovipares donc …


ou vivipares ou ovovivipares…

Mozilla Common Voice propose désormais plus de 20 000 heures et 93 langues

Fermer