Reddit : signature d’un contrat de 60 millions de dollars par an avec un « grande entreprise d’IA »
Le 20 février à 07h11
1 min
Économie
Économie
Après une importante fronde de ses utilisateurs l'année dernière contre l'annonce du passage au payant pour son API, Reddit aurait signé un contrat avec « une grande entreprise d'IA dont le nom n'a pas été révélé », selon Bloomberg.
Le contrat permettrait à celle-ci d'entraîner ses modèles sur les contenus de la plateforme pour la modique somme de 60 millions de dollars par an.
Cette information aurait été transmise par Reddit à des investisseurs potentiels lors de la préparation de l'introduction en bourse de l'entreprise planifiée pour mars.
Le 20 février à 07h11
Commentaires (16)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 20/02/2024 à 08h16
Perso, je pense qu'il faudrait considérer que les contributions à une plateforme aient une licence cc-by-nc par défaut et qu'en cas de changement de politique donc de licence, seules les nouvelles contributions réaliées après la bascule soient soumises à la nouvelle licence.
Le 20/02/2024 à 09h20
J'avais eu la question au changement d'attitude du site du zéro, mais je ne crois pas me souvenir que beaucoup de créateurs de tutos s'étaient plains.
J'ai supprimé mon compte reddit avec la fermeture de la plate-forme, ne plus pouvoir utiliser le client que je voulais était trop pénible.
Le 20/02/2024 à 14h00
Le 20/02/2024 à 15h42
Tout semble être en règles.
Le 20/02/2024 à 16h48
Et il ne faut pas regarder les CU d'aujourd'hui mais celles des jours où ont été créé chaque contenu. Sur archive.org, on peut voir une seule version plus ancienne (datant du 12 septembre 2021) qui a l'air d'avoir les mêmes termes pour ce passage (comparaison à l'œil), mais qu'en est-il d'avant ?
Le 20/02/2024 à 17h48
Le 20/02/2024 à 09h41
Le 20/02/2024 à 13h54
Constatant que quelqu’un d’intelligent pouvait comprendre quelqu’un d’idiot mais que ce n’était pas réciproque (et que les idiots représentaient une part de marché conséquente) ils en sont venus à la conclusion qu’il fallait créer des IA plutôt connes pour répondre aux requêtes des idiots.
Le 20/02/2024 à 14h04
C’est sur y’a du meme, du shitpost, du circlejerk, du low-effort (pour reprendre les termes locaux) mais c’est assez simple à exclure.
Modifié le 20/02/2024 à 18h08
Si l'idée pour Twitter est, par exemple, d'entraîner un modèle pour évaluer la propagation de fausse information ou de prédire l'aspect viral d'un propos, c'est le meilleur endroit possible.
C'est aussi une bonne source pour apprendre au modèle à lire de nombreux types d'écrits, y compris avec une grammaire pauvre ou erronée, ainsi que les niveaux de langue, niveaux d'expression, etc. Une des fonctionnalités d'un LLM est, par exemple, de pouvoir évaluer le sentiment d'un texte : agressif, triste, ironique, etc. Pour ça, les repères à shitstorm du Web ça me semble être une bonne source.
Modifié le 21/02/2024 à 09h31
Et la plupart du temps sur des sujets très pointu dont aucunes informations ne sont disponibles ailleurs.
Je ne vais jamais dessus pour me "balader" donc je ne vois pas les "shitpost" mais niveau technique je trouve que ça a rassemblé tous les gens qui contribuait sur les forums de l'époque.
Reddit c'est comme aller dans une friperie, il faut fouiller au fond du bac mais tu peux trouver des perles.
Le 20/02/2024 à 09h58
Qui aurait pu se douter que les restrictions d'accès mises en place pour soit disant empêcher le pillage par les IA serviraient en fait à monnayer l'accès aux contenus à ces IA.
Le 20/02/2024 à 10h22
Et dans la foulée, je ne peux m'empêcher de penser aux différents projets Wikimedia, qui proposent toutes leurs bases de données en accès libre (contenu qui sert à entraîner absolument toutes les IA), sans que la moindre entreprise ne leur fasse le moindre don. Contenu pourtant infiniment plus utile et de bien meilleure qualité. Triste monde 😕
Modifié le 20/02/2024 à 13h52
La gestion des restrictions mises en place par Reddit est elle fondamentalement différente de celle mise en place par les majors de l'industrie musique/vidéo ?
Bref, il y a plein de sujets de fond sur la collecte/revente du contenu.
.
Le 20/02/2024 à 14h08
Le 20/02/2024 à 15h27