Connexion Premium

Droit Économie Flock Hardware IA Internet Logiciel Next Sciences Sécurité Société

Meta devra répondre aux accusations d’entraînement d’IA avec du porno piraté

Mets de l'huile

Meta devra répondre aux accusations d’entraînement d’IA avec du porno piraté

Illustration : Flock

Mickael Bazoge

Le 16 juin à 08h08

L’IA de Meta a-t-elle en partie été entraînée sur du contenu pornographique téléchargé illégalement ? C’est l’objet d’une plainte déposée l’an dernier par deux sociétés de production et de distribution de films porno. La procédure suit son cours, et Meta a perdu une bataille, mais pas la guerre.

Meta devra répondre aux accusations d’entraînement d’IA avec du porno piraté

Mets de l'huile

Meta devra répondre aux accusations d’entraînement d’IA avec du porno piraté

Illustration : Flock

L’IA de Meta a-t-elle en partie été entraînée sur du contenu pornographique téléchargé illégalement ? C’est l’objet d’une plainte déposée l’an dernier par deux sociétés de production et de distribution de films porno. La procédure suit son cours, et Meta a perdu une bataille, mais pas la guerre.

Le 16 juin à 08h08

IA et algorithmes

IA

3 min

Strike 3 Holdings et Counterlife Media, deux entreprises états-uniennes spécialisées dans la production et la distribution de films porno, ont porté plainte contre Meta durant l’été 2025. Elles accusent le géant des réseaux sociaux d’avoir téléchargé 2 396 films en passant par le protocole BitTorrent. Ces contenus auraient servi à entraîner Llama, son précédent grand modèle de langage (Meta a changé son fusil d’épaule depuis, avec Muse Spark).

L’ombre de LibGen

L’affaire suit son cours devant la justice, et la juge Eumi K. Lee en charge du dossier a rendu une ordonnance ce 11 juin, rapporte TorrentFreak. Elle refuse de rejeter la plainte, estimant que les éléments présentés par les plaignants sont suffisants pour poursuivre la procédure. La juge ne dit pas que Meta est coupable, simplement que les allégations des producteurs sont suffisamment crédibles pour justifier une phase d’enquête plus poussée.

L’ordonnance [PDF] établit aussi que les plaignants n’ont pas besoin de prouver l’entraînement de l’IA. C’est un élément important, car Meta soutenait que les producteurs devaient démontrer que leurs films avaient effectivement servi à l’entraînement de Llama. Pour cette plainte précise, ce n’est pas nécessaire : si Meta a téléchargé et distribué les films via BitTorrent sans autorisation, alors l’infraction au copyright est déjà constituée. Peu importe ensuite que les vidéos aient ou non servi à entraîner un modèle.

Pour se défendre, Meta s’est aussi inspirée d’un argument classique dans les affaires liées à BitTorrent : l’adresse IP ne prouve pas qui a téléchargé les fichiers. Des employés, des sous-traitants ou même des visiteurs auraient pu avoir récupéré ces contenus pour leur usage personnel.

La procédure peut se poursuivre

Les éléments à charge présentés par Strike 3 – qui a la réputation d’un « troll des droits d’auteur » avec des milliers de poursuites à son actif – ont toutefois permis à la juge de déterminer qu’il s’agissait davantage d’un système coordonné et automatisé qui cherchait des contenus à partir de mots-clés qu’à des téléchargements effectués indépendamment par plusieurs personnes.

Enfin, Meta a déjà reconnu s’être servi de BitTorrent pour récupérer des bases de données clandestines (la bibliothèque LibGen) afin d’entraîner ses modèles Llama. La juge ne dit pas que les deux affaires sont identiques, mais à la lumière du dossier LibGen, les accusations des deux plaignants sont plausibles.

Meta, comme bien d’autres acteurs du secteur, a parfois pioché sans trop de vergogne dans tous les contenus accessibles en ligne pour entraîner ses modèles IA, sans le consentement de leurs auteurs.

L’affaire est donc loin d’être terminée. Meta devrait maintenant essayer de montrer que les téléchargements n’étaient pas liés à ses projets d’IA, tandis que les producteurs vont tenter d’établir un lien direct entre les téléchargements BitTorrent et les systèmes permettant l’entraînement des modèles IA de Meta.

Commentaires (5)

Abonnez-vous pour prendre part au débat

Cadenas en colère - Contenu premium

Cet article est en accès libre, mais il est le produit d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.

Accédez en illimité aux articles d'un média expert

Profitez d'au moins 1 To de stockage pour vos sauvegardes

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Abonnez-vous

Polaris Premium

Le 16 juin à 08h29

Ces contenus auraient servi à entraîner Llama, son précédent grand modèle de langage

Oh oui, oui. Ah, oh. Oh.

Voilà peut-être qui explique l'abandon de Meta de Llama

luk Premium

Le 16 juin à 09h10

J'en étais resté à l'idée que les films porno leur permettait de maintenir leur seed ratio pour télécharger tous les ebooks possibles.

Bourrique

Le 16 juin à 09h45

Des employés, des sous-traitants ou même des visiteurs auraient pu avoir récupéré ces contenus pour leur usage personnel.

Défaut de sécurisation. Que fait Hadopi ?

Qu'on leur coupe le net.

Plus de Meta sur le réseau ?

Le rêve

zeldomar Premium

Le 16 juin à 15h17

Moi je mettrais une bille sur : un entrainement de l'IA dans le but d'offrir des scènes porno à la demande (via prompt) dans leurs casques VR.

(Si bien entraîné, c'est la mort de l'industrie porno, car on aura exactement les acteurs/actrices que l'on veut, qui font exactement ce que l'on veut)

GruntZ Premium

Le 16 juin à 16h23

Rhôô ... le sous-titre

Meta devra répondre aux accusations d’entraînement d’IA avec du porno piraté

L'ombre de LibGen
La procédure peut se poursuivre