Connexion Abonnez-vous

Accusée de piratage de films porno pour ses IA, Meta invoque l’ « usage personnel »

nsfw

Accusée de piratage de films porno pour ses IA, Meta invoque l’ « usage personnel »

Depuis juillet, Meta fait l'objet d'une plainte de deux studios de production de vidéos porno, qui l'accusent d'avoir téléchargé illégalement plus de 2 000 contenus pour entrainer ses IA. L'entreprise de Mark Zuckerberg réplique en invoquant plutôt l'« usage personnel » de ses salariés, sous-traitants ou visiteurs.

Le 30 octobre à 15h42

De nombreuses entreprises accusent les entreprises d'IA générative d'utiliser leurs contenus illégalement pour entrainer leurs modèles.

Cet été, deux entreprises états-uniennes de production et de distribution de films porno, Strike 3 Holdings et Counterlife Media, ont attaqué Meta, en l'accusant d'avoir téléchargé, via le protocole BitTorrent, 2 396 films. Elles demandent des dommages et intérêts qui pourraient atteindre 350 millions de dollars.

Cette semaine, comme l'explique Torrent Freak, Meta a demandé au tribunal américain en charge de l'affaire de rejeter la plainte en arguant notamment que les téléchargements de ces vidéos étaient pour de l' « usage personnel ».

47 IP de Meta ayant téléchargé les vidéos de deux studios

Dans leur plainte initiale, les deux studios affirmaient que Meta avait téléchargé leurs contenus « à partir de sources pirates dans le but d'acquérir du contenu pour former son Meta Movie Gen, son modèle linguistique à grande échelle ("LLaMA"), ainsi que divers autres modèles d'IA Meta qui s'appuient sur du contenu vidéo pour l'entraînement ». Et d'évoquer la possibilité que Meta les concurrence en créant un modèle qui puisse générer des films en reproduisant la « qualité hollywoodienne » technique de leurs films.

Strike 3 Holdings et Counterlife Media expliquent avoir découvert 47 IP appartenant à Meta dans les bases de données qu'elles ont mises en place pour repérer les utilisateurs de BitTorrent s'échangeant leurs contenus. Elles affirment avoir fait cette recherche suite à l'affaire opposant Meta à l'autrice Andrea Bartz et aux auteurs Charles Graeber et Kirk Wallace Johnson, dans laquelle l'entreprise a aussi été accusée d'utiliser le protocole de transfert de données pair-à-pair.

Meta se décharge sur l' « usage personnel » de ses salariés, sous-traitants et visiteurs

Les avocats de l'entreprise de Mark Zuckerberg font remarquer, dans leur document envoyé au juge [PDF], que Strike 3 Holdings a déjà « intenté des milliers de poursuites judiciaires » et « a été qualifié par certains de "troll des droits d'auteur" qui intente des poursuites judiciaires abusives ».

Ils qualifient le téléchargement de « sporadique » en faisant remarquer que les premiers fichiers incriminés datent de 2018, « soit plusieurs années avant que Meta n'ait prétendument "commencé à faire des recherches sur les modèles multimodaux et la vidéo générative" en 2022 » et pointent le fait que les deux studios ne montrent pas comment ce téléchargement « aurait pu avoir pour objectif "d'acquérir du contenu pour entraîner" ces modèles ».

Mais Meta va plus loin. L'entreprise semble se dédouaner de toute responsabilité en affirmant que les téléchargements étaient « tout au plus » le fait de « sous-traitants, visiteurs ou employés de Meta […] à des fins personnelles ».

Les studios accusaient justement Meta d'avoir utilisé des IP en dehors de son infrastructure pour dissimuler ses activités sur BitTorrent. Ils avaient présenté des corrélations entre les différentes activités des IP pour justifier cette association et affirmaient que « ces corrélations quantifient également le fait que les adresses IP "hors infrastructure" et celles de Meta agissent de manière cohérente selon des modèles non humains et que l'acquisition de ce contenu est destinée à l'entraînement de l'IA et non à un usage personnel ».

De son côté, Meta réfute la méthode qui permettrait aux studios d'affirmer qu'il y a une corrélation entre les téléchargements depuis son réseau et en dehors. Elle ajoute que les moments où se passaient les téléchargements ne correspondent pas à un plan de téléchargements établi mais plutôt à de l' « usage personnel ».

Enfin, l'entreprise pose la question : « pourquoi Meta chercherait-elle à "dissimuler" certains téléchargements présumés de contenus appartenant aux plaignants et à des tiers, mais utiliserait des adresses IP de Meta facilement traçables pour plusieurs centaines d'autres, dont 157 œuvres des plaignants ? ». Meta demande donc à la justice états-unienne d'abandonner ce cas.

Strike 3 Holdings et Counterlife Media ont deux semaines pour donner leurs arguments contre cet abandon. Dans leur plainte, elles affirmaient que « Meta a le droit et la capacité de superviser et/ou de contrôler ses propres adresses IP d'entreprise, ainsi que les adresses IP hébergées dans des centres de données hors infrastructure, et les actes de ses employés et agents qui enfreignent les œuvres des plaignants via leurs adresses IP résidentielles » en passant par des outils fournis par Meta.

Commentaires (36)

votre avatar
Ne pas faire de remarque sur le titre de 2nd section.
Ne pas faire de remarque sur le titre de 2nd section.
Ne pas faire de remarque sur le titre de 2nd section.
:stress:
votre avatar
C'est hélas exactement ce que je viens de faire avant de voir ton commentaire
votre avatar
C'est une boîte de branleurs.
Trop tard.
votre avatar
Ils n'ont pas assez de sous pour faire du filtrage web dans leur entreprise :mdr2:
votre avatar
"what's a little leak between friends?"
votre avatar
Ce qui m'impressionne, c'est que visiblement "l'entraînement d'IA" soit le véritable critère d'attaque alors qu'ils sont de base sur une violation de droit d'auteur en citant le téléchargement par des sources illicites.

L'autre question qui me vient : aux USA, l'entreprise n'est pas responsable des agissements de ses employés si ceux-ci téléchargent du contenu de manière illégale avec les ressources de celle-ci ?

Pourquoi j'ai l'impression que leur angle d'attaque est complètement foireux en cherchant à utiliser un procès d'intention alors qu'il y a visiblement des preuves matérielles de la violation du droit d'auteur ?
votre avatar
Pourquoi j'ai l'impression que leur angle d'attaque est complètement foireux en cherchant à utiliser un procès d'intention alors qu'il y a visiblement des preuves matérielles de la violation du droit d'auteur ?
Parce que en ce moment mettre "AI" dans le titre de quoi que ce soit est porteur ? même pour ton dépot de plainte ?

Blague à part, puisque les géants de l'AI clament haut et fort qu'il faut les laisser piller tout le contenu artistique de la Terre sans quoi leur business model ne marchent pas ... ben du coup je vois pas ce qu'on peut reprocher aux cambrioleurs du Louvre qui ont juste pillé 3 breloques à la valeur somme toute très limitée.
votre avatar
« Interdire le vol réduirait à néant l'industrie du cambriolage et du recel », selon Sam Latman, chef-cambrioleur chez OpenYourDoors.
votre avatar
Entraîner un modèle de langage avec des films pornos ?!? Pas crédible.
votre avatar
"ainsi que divers autres modèles d'IA Meta qui s'appuient sur du contenu vidéo pour l'entraînement"
votre avatar
Pas certain que le modèle entrainé soit pour le "langage". Hormis le "body langage" peut-être ?
Faut pas se leurrer, la création de porn hyper-réaliste c'est la prochaine poule aux oeufs d'or de cette industrie:
Etre en mesure de fabriquer des films porno automatiquement par centaine de millions et aller monétiser ça sur les sites de tubes sans avoir à payer d'acteurs/trices , de location de villa et de cadreurs, c'est le rêve humide de tous ces producteurs...
En terme de scénario & de dialogues , ça sera même le plus simple à générer....
votre avatar
Je crois que c'est déjà le cas vu le nombre de pub type "make your own porn IA modèle"
Même vu ça sur des shorts youtube avec des modèles de princesses disney et consormes (yasmine, fiona etc.)
votre avatar
Surtout avec la tendance des "Influenceurs" qui se développe aussi dans le porno avec les plateformes de fans, on peut imaginer des modèles 100% virtuels qui produisent des contenus payants à la volée selon le "brief" du client.

Dans le reportage de TMC l'autre jour, ils montraient qu'il y avait désormais des "chatteurs" sur les comptes, recrutés pour donner l'impression aux clients qu'ils discutent avec la star et les inciter à consommer le contenu payant, histoire de faire gonfler les... revenus.

Autant dire que les remplacer par l'IA et pouvoir produire à la demande, c'est un marché... juteux.

On se dirige vers un monde incroyable.
:vomi2:
votre avatar
À rapprocher de cette news next.ink Next ?
votre avatar
Bin en fait cela donner un ton aux réponse.

"Vas y; envoie ta grosse question !" ou "Tu la sens ma grosse réponse !".

C'est comme un truc japonais. Ça peut passer.
votre avatar
l'industrie japonaise semble bien plus attentive aux scénarios avec des films de plus de 2-3h (est-ce du à la censure?)
votre avatar
L'industrie japonaise semble surtout entretenir le flou sur certaines choses.
votre avatar
La plupart des modèles modernes sont multimodaux. Et si la génération de porn n'est généralement pas dans la scope du modèle, il semble qu'il puisse y avoir quand même un intérêt à lui montrer des humains tous nus pour améliorer sa compréhension de l'anatomie humaine. Les modèles qui ont été entraînés avec un soin particulier pour ne pas générer de porno ont une fâcheuse tendance à générer, encore aujourd'hui, des humains à 3 ou 4 jambes, à 2 genoux par jambe ou aux épaules qui se tordent à 360° (looking at you, Stable Diffusion 3.5).
votre avatar
Depuis quelques temps on dirait que les entreprises qui sont dans l'IA à corps perdus, se disent qu'ils peuvent faire du fric avec le porno, aussi.

Règle 34 ?
votre avatar
Celles des Ferengis ?

https://memory-alpha.fandom.com/wiki/Rules_of_Acquisition
votre avatar
C'est même particulièrement vrai avec le porno. C'est un sujet tabou, les sujets éthiques et les mœurs rentrent vite en jeu... mais il faut que ça reste humain pour être crédible et vendeur.
Autant dire que l'IA est parfaite dans ce rôle : aucun tabou, pas d'exigences juridiques, et une capacité de plus en plus bluffante à imiter l'être humain en texte, image, vidéo et son.

Le tout en étant capable de produire 40 vidéos en moins de temps qu'il faut pour un unique tournage, sans avoir à payer un lieu, des techniciens, des acteurs, des monteurs (vidéo hein)...

Quand en plus on voit déjà qu'un ChatGPT ultra-filtré suffit à générer des liens sentimentaux chez des utilisateurs, alors un modèle spécialement entraîné pour générer de l'attraction et de l'affection...

En vrai, il reste plus qu'à relier ça aux capteurs quantified self des montres connectées pour mesurer l'efficacité des contenus et ajuster en temps réel le produit pour être le plus impactant possible pour chaque utilisateur.
Ici on parle de porno, mais faut bien se dire que demain ça peut globalement aussi être la nouvelle série Netflix qui adapte son histoire en live pour maximiser la dopamine de chaque spectateur, une publicité pour un produit qui s'intègre dans ton propre salon pour te montrer comment il serait génial dans ton quotidien...
votre avatar
C'est un scénario de Black Mirror ça non ?
votre avatar
Pas strictement sous cette forme, en tout cas pas dans ceux que j'ai vu (je me garde au chaud les derniers épisodes).

Mais le scénario basé sur sa propre vie est dans la dernière saison, et la prise d'affection pour une IA est évoqué autour du deuil (scanner un mort pour le "maintenir" en vie), ou alors c'est plutôt dans le film Her même si c'est involontaire de l'éditeur.

De toute façon Black Mirror a déjà tout dit, il faut juste assembler dans un autre sens pour avoir une autre dystopie possible. Les raisons que tout se passe mal ne manquent pas !
votre avatar
C'est un scénario de Black Mirror ça non ?
La prise d'affection pour une machine, c'est le premier chapitre du cycle des robots d'Asimov.

Les questions sociales de cette série de livres font écho aujourd'hui.
votre avatar
L'ironie absolue quand on connait à la fois la pudibonderie affichée (et la modération qui bannit ce genre de contenus, voire juste un téton féminin) et le fait que facebook a été créé par un certain zuck pour noter les étudiantes de son université ou il étudiait ...
votre avatar
Ce n'est pas nouveau que les Ricains soient tout aussi hypocrites au sujet du sexe que les religieux, en même temps. Il ne faut pas oublier qu'ils ont la plus grosse industrie porno au monde, tout en ne voulant pas montrer publiquement des trucs ne serait-ce qu'érotiques.
votre avatar
L'entreprise semble se dédouaner de toute responsabilité en affirmant que les téléchargements étaient « tout au plus » le fait de « sous-traitants, visiteurs ou employés de Meta […] à des fins personnelles ».
Non sécurisation de l'accès à internet, votre compte est bon !

Ah non, Meta n'est pas en France et la loi Hadopi ne s'applique pas à eux !
votre avatar
C'est vrai qu'en général côté entraînement au langage (pour les LLaMA), les dialogues des films pornos sont en général de vrais mines d'or ! :mdr2:

Et le premier qui dit qu'ainsi les LLaMA prennent des "cours de langue"...
votre avatar
Pour les personnes qui se demandent l'intérêt d'entraîner des modèles sur des contenus pornographiques :

Ça permet d'apprendre à les identifier et les qualifier, et la nudité apporte une meilleure précision anatomique pour la génération, reconnaissance d'image (et probablement la vidéo aussi).

Problème : ça biaise aussi le modèle sur certains détails à cause de l'abondance d'occurrences. Par exemple, en dehors de LoRA spécialisés, les modèles de génération d'image capables de faire du NSFW sont infoutus de représenter un homme nu qui n'a pas en érection.
votre avatar
« Meta a le droit et la capacité de superviser et/ou de contrôler […] les actes de ses employés et agents qui enfreignent les œuvres des plaignants via leurs adresses IP résidentielles »
Euh, ça je ne suis pas sûr, même aux USA (pour le droit, la capacité, ça ils l'ont).
votre avatar
C'est coquain ou cocasse?
L'argumentaire est bien bancal pour du peer to peer et du fair use...
votre avatar
La défense de Meta tient un peu debout en vrai.
Utiliser 47 IP, a priori étalées dans le temps, pour collecter 2 000 vidéos alors qu'un scrapper torrent peut quasiment récupérer seul sur un simple PC de bureau la même quantité... ça sent pas trop l'industrialisation de la collecte de données. A part si on considère que c'est la plainte d'un seul studio et qu'il y a certainement des centaines de studios.

Cela étant, comme avec Hadopi, Meta reste de toute façon responsable du piratage réalisé sur son réseau.
Fallait installer le pare-feu Open Office !

J'aime beaucoup la formulation et l'ordre très politique des responsables trouvés :
les téléchargements étaient « tout au plus » le fait de « sous-traitants, visiteurs ou employés de Meta […] à des fins personnelles ».
C'est sûr, un gars qui vient rendre visite à Meta, il a grave du temps libre dans les locaux, donc quand il a vu le post-it avec le mot de passe WiFi Meta123, il s'est dit "BANCO, on va se récup un p'tit porno sur BitTorrent".
votre avatar
Utiliser 47 IP, a priori étalées dans le temps, pour collecter 2 000 vidéos alors qu'un scrapper torrent peut quasiment récupérer seul sur un simple PC de bureau la même quantité... ça sent pas trop l'industrialisation de la collecte de données.
Ça peut justement être le but pour éviter de se faire bloquer par les systèmes anti bots. Une bonne partie des trackers BitTorrent sont derrière CloudFlare, et celui-ci propose le blocage des scrappers de contenus, justement.
votre avatar
Dans mon ancien boulot, sur 5 cabines wc il y en avait 1 qui n'était jamais ouverte.
Soit il y a eu un bombardement et personne n'a nettoyé, soit un inter-contrat y passait chez journée, à "s'entraîner sur des vidéos de porn", lui aussi.
votre avatar
J'ai sans doute plus de 2000 videos familles depuis une seule adresse ip, alors...
Le plus étrange est surtout l'utilisation de p2p, alors que tous les sites de streaming n'ont pas de barrière au direct dl (en occident)
votre avatar
Dans cet article : arstechnica.com Ars Technica j'avais cru comprendre que la motivation de Meta était notamment de maintenir un seed ratio supérieur à 1 pour pouvoir télécharger tout ce dont ils avaient besoin pour entraîner leurs IA. Les plaignants ont abandonné cette accusation ?

Accusée de piratage de films porno pour ses IA, Meta invoque l’ « usage personnel »

  • 47 IP de Meta ayant téléchargé les vidéos de deux studios

  • Meta se décharge sur l' « usage personnel » de ses salariés, sous-traitants et visiteurs

Fermer