Anthropic et OpenAI accusent des IA chinoises d’utiliser illégalement leur travail

Misanthropic ?

Illustration : Flock

Martin Clavey

Le 24 février à 14h58

Alors que l’entraînement de leurs modèles s’appuie notamment sur l’utilisation massive de données dont elles n’ont pas les droits, les startups de l’IA générative américaines se plaignent que leurs rivaux chinois utilisent, via la technique de « distillation », les données générées par leurs modèles.

Anthropic et OpenAI accusent des IA chinoises d’utiliser illégalement leur travail

Misanthropic ?

Illustration : Flock

Martin Clavey

Le 24 février à 14h58

IA et algorithmes

4 min

Anthropic a accusé trois entreprises chinoises, DeepSeek, Moonshot AI et MiniMax d’utiliser les résultats générés par ses modèles pour entrainer les leurs. Quelques jours avant, OpenAI avait aussi accusé Deepseek, devant les élus étatsuniens, d’utiliser la technique de « distillation » (ou extraction) pour mettre au point son prochain modèle. Ces accusations arrivent alors que la startup chinoise doit sortir d’ici quelques jours un nouveau modèle.

Un tir de barrage avant l’arrivée d’un nouveau modèle DeepSeek

Depuis début janvier, les rumeurs d’une sortie d’un nouveau modèle v4 par DeepSeek grandissent. « La société chinoise spécialisée dans l’IA n’a pas encore annoncé de date de sortie, mais celle-ci devrait être imminente après la fin des célébrations du Nouvel An lunaire la semaine dernière », affirmait lundi 23 février CNBC. Et l’industrie américaine de l’IA tremble de revivre l’épisode que lui avait fait subir l’entreprise chinoise il y a un peu plus d’un an quand Wall Street avait remis en cause leurs capacités à lutter.

Dans ce cadre, OpenAI a envoyé le 12 février un mémo [PDF] aux élus de la Chambre des représentants des États-Unis qui participent à la commission sur la « Concurrence stratégique entre les États-Unis et le Parti communiste chinois ». Ce texte accuse DeepSeek de « tenter continuellement de profiter gratuitement des capacités développées par OpenAI et d’autres laboratoires américains de pointe ». L’entreprise de Sam Altman y présentait des indices observés sur sa plateforme qui témoignent, selon elle, « des tentatives continues de DeepSeek pour distiller les modèles de pointe d’OpenAI et d’autres laboratoires américains, notamment par le biais de nouvelles méthodes de brouillage ».

Ce lundi 23 février, Anthropic en remettait donc une couche avec un billet de blog accusant DeepSeek, Moonshot, et MiniMax de lancer des « campagnes à l’échelle industrielle […] pour extraire illicitement les capacités de Claude afin d’améliorer leurs propres modèles ».

« Ces laboratoires ont utilisé une technique appelée « distillation », qui consiste à entraîner un modèle moins performant à partir des résultats d’un modèle plus puissant », explique Anthropic. Pourtant, la startup américaine reconnait que « la distillation est une méthode d’entraînement largement utilisée et légitime. Par exemple, les laboratoires d’IA de pointe distillent régulièrement leurs propres modèles afin de créer des versions plus petites et moins coûteuses pour leurs clients ».

Une utilisation « illicite » de la distillation ?

Mais elle affirme que son utilisation est illicite si des concurrents l’utilisent « pour acquérir les capacités puissantes d’autres laboratoires en une fraction du temps et à un coût bien inférieur à ceux nécessaires pour les développer de manière indépendante », sans pour autant s’appuyer sur un quelconque texte légal. Dans son billet, l’entreprise américaine accuse les trois entreprises chinoises d’avoir utilisé des milliers de comptes qu’elles se seraient créés sur sa plateforme pour récupérer des millions de conversations avec Claude.

Les accusations des deux entreprises semblent plutôt vouloir pointer du doigt que DeepSeek s’appuierait sur leurs travaux et ainsi éviter que Wall Street s’affole de l’arrivée d’un nouveau modèle chinois dépassant les capacités de ses rivaux états-uniens.

Rappelons qu’Anthropic comme OpenAI ont été accusées l’une et l’autre d’avoir entrainé leurs modèles sur des contenus dont elle n’avaient pas les droits. L’entreprise de Dario Amodei a signé un accord de 1,5 milliard de dollars avec des auteurs en septembre 2025, celui-ci est toujours en cours de relecture chez le juge qui doit le valider.

Enfin, Reuters affirme que DeepSeek entrainerait son modèle sur des puces Blackwell de NVIDIA, normalement soumises à un embargo américain. Depuis peu, seule la génération précédente Hopper est autorisée à l’exportation en Chine.

Commentaires (15)

Abonnez-vous pour prendre part au débat

Cet article est en accès libre, mais il est le produit d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.

Accédez en illimité aux articles d'un média expert

Profitez d'au moins 1 To de stockage pour vos sauvegardes

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Abonnez-vous

Nomans

Le 24 février à 15h09

Faites ce que je dis, pas ce que je fais...

jpaul Premium

Le 25 février à 08h27

Non c’est pas vrai ça, tu peux pas dire ça !

Les compagnies IA américaines ont volé le contenu de leur entraînement alors que les compagnies IA chinoises ont payé les tokens qui leur ont permis de s’entraîner.

fdorin Premium

Le 24 février à 15h11

Alors c'est l'histoire de l'arroseur arrosé...

ragoutoutou Premium

Le 24 février à 15h28

Soudain je me suis rappelé que Gad Elmaleh existait...

iMaman Premium

Le 24 février à 15h33

C’est l’hôpital qui se fout de la charité.

Bourrique

Le 24 février à 17h18

La peste qui se fout du choléra.
Et je garde ces deux là qui se répandent plus rapidement et font/ont fait plus de victime qu'Ebola.
Pour le moment. Mais je me garde la possibilité de les upgrader.

Neliger Premium

Le 24 février à 15h36

Oh les pauvres voleurs volés 😹

zandera Premium

Modifié le 24 février à 15h43

C'est un peu simpliste comme réaction de la part des americains... dopés à la puissance de calcul au jus de caméléon...
Ils en oublient l'efficacité des architectures algorithmiques d'attention pour l'entrainement des modèles et l'inférence, domaines dans lesquels quoi qu'on en dise les chinois sont plutôt productifs en idées (Quid du prochain deepseek v4...?)

Jon Joe Premium

Le 24 février à 16h22

Bébouuuuuus!

[Insérer image de chaton très très triste]

Bylon

Le 24 février à 18h26

C'est la panique parce que les Américains avec leur modèle uniquement "business" sont en train de perdre la guerre de l'IA face aux chinois !

Ce que l'agent orange oublie, c'est qu'à force de se mettre le monde à dos, le "soft power" va passer du côté chinois, et les US vont devenir tout petits.

Expérience personnelle, je n'utilise pas Claude (car il demande toujours un téléphone !) mais Gemini. Récemment Google a baissé drastiquement l'utilisation "gratuite" ce qui fait que j'ai assez rapidement le "revenez plus tard". Eh bien pas Deepseek, ça semble infini, mais c'est vrai que ça consomme moins, et que les chinois peuvent donc être plus généreux. C'est bien sûr moins performant, mais suffisant pour mon usage actuel.

Et puis il y a aussi la fameuse IA "réservée au chinois" (pas fou Xi), qui a pondu le fameux clip ayant fait trembler Hollywood.

Il y a bien sûr Tik Tok (quoi qu'on en pense)...

Tout ça ne va pas rendre l'Amérique "Great"... de perdre la main sur un domaine aussi stratégique que le numérique.

... bon je ne parle pas de la pauvre Europe, nous on est au 40ème sous sol, et pas près de remonter la pente !

Jon Joe Premium

Le 24 février à 18h43

Consolons-nous: on se cassera moins directement et brutalement la gueule quand ça s´effondrera.

Bylon

Modifié le 24 février à 18h55

L'IA générative est un changement qui ne va pas disparaître, mais c'est sûr qu'il y a trop de concurrents, tout le monde ne va pas gagner... surtout dans la logique "il faut faire des sous" qui n'est pas forcément celle des chinois. Sans compter que leur modèle est bien moins cher !

Donc oui, il y aura beaucoup de casse, et quelques rares gagnants, comme souvent dans le numérique. Et on finira par revenir à des valorisations "normales" au lieu de l'effet de bulle actuel, je suis bien d'accord.

RuMaRoCO Premium

Le 25 février à 09h11

Voler des voleurs, est-ce du vol ?

Vous avez 4 heures...

fred42 Premium

Le 25 février à 09h50

Le vol est la soustraction frauduleuse d'une chose.

Jon Joe Premium

Le 25 février à 12h19

Rhalalalalalala... Bon. Soit.

Alors: "contrefaire des contrefacteurs, est-ce de la contrefaçon ? Vous avez 4 heures ?"

C'est mieux comme ça ? ("Non, car...