Connexion Premium

Anthropic et OpenAI accusent des IA chinoises d’utiliser illégalement leur travail

Misanthropic ?

Anthropic et OpenAI accusent des IA chinoises d’utiliser illégalement leur travail

Alors que l’entraînement de leurs modèles s’appuie notamment sur l’utilisation massive de données dont elles n’ont pas les droits, les startups de l’IA générative américaines se plaignent que leurs rivaux chinois utilisent, via la technique de « distillation », les données générées par leurs modèles.

Le 24 février à 14h58

Anthropic a accusé trois entreprises chinoises, DeepSeek, Moonshot AI et MiniMax d’utiliser les résultats générés par ses modèles pour entrainer les leurs. Quelques jours avant, OpenAI avait aussi accusé Deepseek, devant les élus étatsuniens, d’utiliser la technique de « distillation » (ou extraction) pour mettre au point son prochain modèle. Ces accusations arrivent alors que la startup chinoise doit sortir d’ici quelques jours un nouveau modèle.

Un tir de barrage avant l’arrivée d’un nouveau modèle DeepSeek

Depuis début janvier, les rumeurs d’une sortie d’un nouveau modèle v4 par DeepSeek grandissent. « La société chinoise spécialisée dans l’IA n’a pas encore annoncé de date de sortie, mais celle-ci devrait être imminente après la fin des célébrations du Nouvel An lunaire la semaine dernière », affirmait lundi 23 février CNBC. Et l’industrie américaine de l’IA tremble de revivre l’épisode que lui avait fait subir l’entreprise chinoise il y a un peu plus d’un an quand Wall Street avait remis en cause leurs capacités à lutter.

Dans ce cadre, OpenAI a envoyé le 12 février un mémo [PDF] aux élus de la Chambre des représentants des États-Unis qui participent à la commission sur la « Concurrence stratégique entre les États-Unis et le Parti communiste chinois ». Ce texte accuse DeepSeek de « tenter continuellement de profiter gratuitement des capacités développées par OpenAI et d’autres laboratoires américains de pointe ». L’entreprise de Sam Altman y présentait des indices observés sur sa plateforme qui témoignent, selon elle, « des tentatives continues de DeepSeek pour distiller les modèles de pointe d’OpenAI et d’autres laboratoires américains, notamment par le biais de nouvelles méthodes de brouillage ».

Ce lundi 23 février, Anthropic en remettait donc une couche avec un billet de blog accusant DeepSeek, Moonshot, et MiniMax de lancer des « campagnes à l’échelle industrielle […] pour extraire illicitement les capacités de Claude afin d’améliorer leurs propres modèles ».

« Ces laboratoires ont utilisé une technique appelée « distillation », qui consiste à entraîner un modèle moins performant à partir des résultats d’un modèle plus puissant », explique Anthropic. Pourtant, la startup américaine reconnait que « la distillation est une méthode d’entraînement largement utilisée et légitime. Par exemple, les laboratoires d’IA de pointe distillent régulièrement leurs propres modèles afin de créer des versions plus petites et moins coûteuses pour leurs clients ».

Une utilisation « illicite » de la distillation ?

Mais elle affirme que son utilisation est illicite si des concurrents l’utilisent « pour acquérir les capacités puissantes d’autres laboratoires en une fraction du temps et à un coût bien inférieur à ceux nécessaires pour les développer de manière indépendante », sans pour autant s’appuyer sur un quelconque texte légal. Dans son billet, l’entreprise américaine accuse les trois entreprises chinoises d’avoir utilisé des milliers de comptes qu’elles se seraient créés sur sa plateforme pour récupérer des millions de conversations avec Claude.

Les accusations des deux entreprises semblent plutôt vouloir pointer du doigt que DeepSeek s’appuierait sur leurs travaux et ainsi éviter que Wall Street s’affole de l’arrivée d’un nouveau modèle chinois dépassant les capacités de ses rivaux états-uniens.

Rappelons qu’Anthropic comme OpenAI ont été accusées l’une et l’autre d’avoir entrainé leurs modèles sur des contenus dont elle n’avaient pas les droits. L’entreprise de Dario Amodei a signé un accord de 1,5 milliard de dollars avec des auteurs en septembre 2025, celui-ci est toujours en cours de relecture chez le juge qui doit le valider.

Enfin, Reuters affirme que DeepSeek entrainerait son modèle sur des puces Blackwell de NVIDIA, normalement soumises à un embargo américain. Depuis peu, seule la génération précédente Hopper est autorisée à l’exportation en Chine.

Commentaires (15)

votre avatar
Faites ce que je dis, pas ce que je fais...
votre avatar
Non c’est pas vrai ça, tu peux pas dire ça !

Les compagnies IA américaines ont volé le contenu de leur entraînement alors que les compagnies IA chinoises ont payé les tokens qui leur ont permis de s’entraîner.
votre avatar
Alors c'est l'histoire de l'arroseur arrosé...
votre avatar
Soudain je me suis rappelé que Gad Elmaleh existait...
votre avatar
C’est l’hôpital qui se fout de la charité.
votre avatar
:cap:
La peste qui se fout du choléra.
Et je garde ces deux là qui se répandent plus rapidement et font/ont fait plus de victime qu'Ebola.
Pour le moment. Mais je me garde la possibilité de les upgrader.
votre avatar
Oh les pauvres voleurs volés 😹
votre avatar
C'est un peu simpliste comme réaction de la part des americains... dopés à la puissance de calcul au jus de caméléon...
Ils en oublient l'efficacité des architectures algorithmiques d'attention pour l'entrainement des modèles et l'inférence, domaines dans lesquels quoi qu'on en dise les chinois sont plutôt productifs en idées (Quid du prochain deepseek v4...?)
votre avatar
Bébouuuuuus!

[Insérer image de chaton très très triste]
votre avatar
C'est la panique parce que les Américains avec leur modèle uniquement "business" sont en train de perdre la guerre de l'IA face aux chinois !

Ce que l'agent orange oublie, c'est qu'à force de se mettre le monde à dos, le "soft power" va passer du côté chinois, et les US vont devenir tout petits.

Expérience personnelle, je n'utilise pas Claude (car il demande toujours un téléphone !) mais Gemini. Récemment Google a baissé drastiquement l'utilisation "gratuite" ce qui fait que j'ai assez rapidement le "revenez plus tard". Eh bien pas Deepseek, ça semble infini, mais c'est vrai que ça consomme moins, et que les chinois peuvent donc être plus généreux. C'est bien sûr moins performant, mais suffisant pour mon usage actuel.

Et puis il y a aussi la fameuse IA "réservée au chinois" (pas fou Xi), qui a pondu le fameux clip ayant fait trembler Hollywood.

Il y a bien sûr Tik Tok (quoi qu'on en pense)...

Tout ça ne va pas rendre l'Amérique "Great"... de perdre la main sur un domaine aussi stratégique que le numérique.

... bon je ne parle pas de la pauvre Europe, nous on est au 40ème sous sol, et pas près de remonter la pente !
votre avatar
Consolons-nous: on se cassera moins directement et brutalement la gueule quand ça s´effondrera. :fumer:
votre avatar
L'IA générative est un changement qui ne va pas disparaître, mais c'est sûr qu'il y a trop de concurrents, tout le monde ne va pas gagner... surtout dans la logique "il faut faire des sous" qui n'est pas forcément celle des chinois. Sans compter que leur modèle est bien moins cher !

Donc oui, il y aura beaucoup de casse, et quelques rares gagnants, comme souvent dans le numérique. Et on finira par revenir à des valorisations "normales" au lieu de l'effet de bulle actuel, je suis bien d'accord.
votre avatar
Voler des voleurs, est-ce du vol ?

Vous avez 4 heures...
votre avatar
Le vol est la soustraction frauduleuse d'une chose.
votre avatar
Rhalalalalalala... Bon. Soit.

Alors: "contrefaire des contrefacteurs, est-ce de la contrefaçon ? Vous avez 4 heures ?"

C'est mieux comme ça ? ("Non, car... :-D")

Anthropic et OpenAI accusent des IA chinoises d’utiliser illégalement leur travail

  • Un tir de barrage avant l'arrivée d'un nouveau modèle DeepSeek

  • Une utilisation « illicite » de la distillation ?