Connexion Premium

Meta devra répondre aux accusations d’entraînement d’IA avec du porno piraté

Mets de l'huile

Meta devra répondre aux accusations d’entraînement d’IA avec du porno piraté

Illustration : Flock

L’IA de Meta a-t-elle en partie été entraînée sur du contenu pornographique téléchargé illégalement ? C’est l’objet d’une plainte déposée l’an dernier par deux sociétés de production et de distribution de films porno. La procédure suit son cours, et Meta a perdu une bataille, mais pas la guerre.

Strike 3 Holdings et Counterlife Media, deux entreprises états-uniennes spécialisées dans la production et la distribution de films porno, ont porté plainte contre Meta durant l’été 2025. Elles accusent le géant des réseaux sociaux d’avoir téléchargé 2 396 films en passant par le protocole BitTorrent. Ces contenus auraient servi à entraîner Llama, son précédent grand modèle de langage (Meta a changé son fusil d’épaule depuis, avec Muse Spark).

L’ombre de LibGen

L’affaire suit son cours devant la justice, et la juge Eumi K. Lee en charge du dossier a rendu une ordonnance ce 11 juin, rapporte TorrentFreak. Elle refuse de rejeter la plainte, estimant que les éléments présentés par les plaignants sont suffisants pour poursuivre la procédure. La juge ne dit pas que Meta est coupable, simplement que les allégations des producteurs sont suffisamment crédibles pour justifier une phase d’enquête plus poussée.

L’ordonnance [PDF] établit aussi que les plaignants n’ont pas besoin de prouver l’entraînement de l’IA. C’est un élément important, car Meta soutenait que les producteurs devaient démontrer que leurs films avaient effectivement servi à l’entraînement de Llama. Pour cette plainte précise, ce n’est pas nécessaire : si Meta a téléchargé et distribué les films via BitTorrent sans autorisation, alors l’infraction au copyright est déjà constituée. Peu importe ensuite que les vidéos aient ou non servi à entraîner un modèle.

Pour se défendre, Meta s’est aussi inspirée d’un argument classique dans les affaires liées à BitTorrent : l’adresse IP ne prouve pas qui a téléchargé les fichiers. Des employés, des sous-traitants ou même des visiteurs auraient pu avoir récupéré ces contenus pour leur usage personnel.

La procédure peut se poursuivre

Les éléments à charge présentés par Strike 3 – qui a la réputation d’un « troll des droits d’auteur » avec des milliers de poursuites à son actif – ont toutefois permis à la juge de déterminer qu’il s’agissait davantage d’un système coordonné et automatisé qui cherchait des contenus à partir de mots-clés qu’à des téléchargements effectués indépendamment par plusieurs personnes.

Enfin, Meta a déjà reconnu s’être servi de BitTorrent pour récupérer des bases de données clandestines (la bibliothèque LibGen) afin d’entraîner ses modèles Llama. La juge ne dit pas que les deux affaires sont identiques, mais à la lumière du dossier LibGen, les accusations des deux plaignants sont plausibles.

Meta, comme bien d’autres acteurs du secteur, a parfois pioché sans trop de vergogne dans tous les contenus accessibles en ligne pour entraîner ses modèles IA, sans le consentement de leurs auteurs.

L’affaire est donc loin d’être terminée. Meta devrait maintenant essayer de montrer que les téléchargements n’étaient pas liés à ses projets d’IA, tandis que les producteurs vont tenter d’établir un lien direct entre les téléchargements BitTorrent et les systèmes permettant l’entraînement des modèles IA de Meta.

Commentaires (2)

votre avatar
Ces contenus auraient servi à entraîner Llama, son précédent grand modèle de langage
Oh oui, oui. Ah, oh. Oh.


Voilà peut-être qui explique l'abandon de Meta de Llama :bocul:
votre avatar
J'en étais resté à l'idée que les films porno leur permettait de maintenir leur seed ratio pour télécharger tous les ebooks possibles.