Publié dans Sciences et espace

0

Data2vec, l’algorithme auto-supervisé de Meta pour la parole, les images et le texte

Data2vec, l’algorithme auto-supervisé de Meta pour la parole, les images et le texte

On dispose aujourd’hui d’algorithmes performants pour reconnaître des objets ou concepts dans des tâches précises comme des voitures dans des photos ou vidéos. On crée pour cela des modèles que l’on entraîne dans des réseaux neuronaux.

Mais si l’on dispose par exemple d’un bon algorithme pour trouver des véhicules dans des images, il en faudra un autre pour détecter que l’on parle d’un tel objet dans une conversation.

Une équipe de Meta AI (nouveau nom de Facebook AI Research) annonce donc Data2vec. Ce nouvel algorithme réussirait plusieurs tours de force, notamment être aussi à l’aise avec les images qu’avec la voix et le texte, mais aussi afficher des performances aussi bonnes – sinon plus – que les algorithmes et modèles dédiés. Le tout, sans avoir besoin de données labellisées.

Meta parle d’apprentissage auto-supervisé (on n’est pas encore sur de l’apprentissage non supervisé), qui n’est d’ailleurs pas de son invention. Il se base sur les récents progrès de modèles comme GPT-3, déjà conçus pour traiter des données sans étiquettes. Michael Auli, l’un des chercheurs, précise que l’idée est venue après s’être rendu compte que toutes les recherches dans le domaine utilisaient des techniques différentes pour atteindre le même but.

La « magie » s’opère via deux réseaux neuronaux : l’un professeur, l’autre étudiant. Le professeur est entraîné de manière classique sur des images, textes et sons. L’étudiant, lui, est entraîné à une tâche unique : prédire la représentation interne du professeur. Dans le cas d’un chien, il aboutirait à la même « image mentale » quand le professeur voit une photo d’un labrador ou reconnaît un aboiement.

Une publication scientifique a été mise en ligne ici, tandis que data2vec est disponible sur GitHub, avec des modèles pré-entraînés pour le texte et l’audio, ceux pour les images arriveront prochainement. 

Pour Meta AI, il s’agit d’une première étape : « Cela ouvre la voie à un apprentissage auto-supervisé plus général et nous rapproche d’un monde où l’IA pourrait utiliser des vidéos, des articles et des enregistrements audio pour en apprendre davantage sur des sujets compliqués, tels que le football ou différentes façons de cuire du pain ». 

« Nous espérons également que data2vec nous rapprochera d’un monde où les ordinateurs ont besoin de très peu de données étiquetées pour accomplir des tâches », ajoute le réseau social.

0

Tiens, en parlant de ça :

Mur d’OVHcloud à Roubaix, avec le logo OVHcloud

OVHcloud Summit 2023 : SecNumCloud, IA et Local Zones

Des mini datacenters… Ouais une baie quoi ?

19:03HardwareInternet 1
algorithmes de la CAF

Transparence, discriminations : les questions soulevées par l’algorithme de la CAF

0/1

17:53IA et algorithmesSociété numérique 16

Plainte contre l’alternative paiement ou publicité comportementale de Meta

Schrems vs Meta, saison 3

17:31DroitIA et algorithmes 13
Mur d’OVHcloud à Roubaix, avec le logo OVHcloud

OVHcloud Summit 2023 : SecNumCloud, IA et Local Zones

HardwareInternet 1
algorithmes de la CAF

Transparence, discriminations : les questions soulevées par l’algorithme de la CAF

IA et algorithmesSociété numérique 16

Plainte contre l’alternative paiement ou publicité comportementale de Meta

DroitIA et algorithmes 13
Nuage (pour le cloud) avec de la foudre

Économie de la donnée et services de cloud : l’Arcep renforce ses troupes

DroitInternet 0
De vieux ciseaux posés sur une surface en bois

Plus de 60 % des demandes de suppression reçues par Google émanent de Russie

Société numérique 4
Une vieille boussole posée sur un plan en bois

La Commission européenne et Google proposent deux bases de données de fact-checks

DroitInternet 2

#LeBrief : des fichiers Google Drive disparaissent, FreeBSD 14, caméras camouflées, OnePlus 12

0

Le poing Dev – round 6

Next 138

Produits dangereux sur le web : nouvelles obligations en vue pour les marketplaces

Droit 6
consommation de l'ia

Usages et frugalité : quelle place pour les IA dans la société de demain ?

IA et algorithmes 12

La NASA établit une liaison laser à 16 millions de km, les essais continuent

Sciences et espace 17
Concept de CPU

Semi-conducteurs : un important accord entre l’Europe et l’Inde

Hardware 6

#LeBrief : PS5 Slim en France, Valeo porte plainte contre NVIDIA, pertes publicitaires X/Twitter

0
Un mélange entre une réunion d’Anonymous et de tête d’ampoules, pour le meilleur et le pire

651e édition des LIDD : Liens Intelligents Du Dimanche

Internet 30
Bannière de Flock avec des bomes sur un fond rouge

#Flock, le grand remplacement par les intelligences artificielles

Flock 34
Un Sébastien transformé en lapin par Flock pour imiter le Quoi de neuf Docteur des Looney Tunes

Quoi de neuf à la rédac’ #9 : LeBrief 2.0, ligne édito, dossiers de fond

Next 63
Pilule rouge et bleue avec des messages codés

Encapsulation de clés et chiffrement d’enveloppes

Sécurité 31
Empreinte digital sur une capteur

Empreintes digitales : les capteurs Windows Hello loin d’être exemplaires

Sécurité 20

#LeBrief : succès du test d’Ariane 6, réparer plutôt que remplacer, Broadcom finalise le rachat de VMware

0

Hébergeurs, éditeurs, espaces de conversation ? La difficile régulation des réseaux sociaux

Réseaux sociauxSociété numérique 23
Puces en silicium

Silicium : un matériau indispensable et omniprésent, mais critique

HardwareSciences et espace 25
Panneau solaire bi-face Sunology Play

Panneaux solaires en autoconsommation : on décortique le kit Play de Sunology

Hardware 26
The eyes and ears of the army, Fort Dix, N.J.

Un think tank propose d’autoriser les opérations de « hack back »

Sécurité 12

#LeBrief : Ariane 6 sur le banc de test, arrestation algorithmique, entraînement d’IA par des mineurs

0
Le brief de ce matin n'est pas encore là

Partez acheter vos croissants
Et faites chauffer votre bouilloire,
Le brief arrive dans un instant,
Tout frais du matin, gardez espoir.

Commentaires (0)