Anthropic change ses règles du jeu, des applications tierces aux limites des sessions
Faire moins ou payer plus
Anthropic
Le 07 avril à 09h02
Durant le week-end, Anthropic a annoncé et déployé quasiment dans la foulée un changement important de son modèle économique : les services tiers ne sont plus intégrés aux abonnements Claude, il faut passer par l’API. Cela a des conséquences importantes pour les clients, notamment ceux qui se sont lancés sur OpenClaw.
Anthropic change ses règles du jeu, des applications tierces aux limites des sessions
Faire moins ou payer plus
Anthropic
Durant le week-end, Anthropic a annoncé et déployé quasiment dans la foulée un changement important de son modèle économique : les services tiers ne sont plus intégrés aux abonnements Claude, il faut passer par l’API. Cela a des conséquences importantes pour les clients, notamment ceux qui se sont lancés sur OpenClaw.
Le 07 avril à 09h02
IA et algorithmes
IA
5 min
Anthropic propose une formule gratuite permettant d’accéder à son IA générative Claude, avec d’importantes restrictions d’usage. Pour débloquer les fonctionnalités supplémentaires et augmenter le temps d’utilisation, il faut passer à la caisse avec un abonnement Pro ou Max pour les particuliers, Team ou Enterprise pour les pros.
Une autre possibilité est d’utiliser l’API, avec une facturation à l’usage. Cela varie de 1 et 5 dollars par million de jetons en entrée et en production (les réponses) pour le modèle léger Haiku, à respectivement 5 et 25 dollars pour le modèle le plus performant, Opus.
Anthropic impose son API pour les applications tierces : OpenClaw en ligne de mire
Jusqu’à présent, les abonnements permettaient d’utiliser Claude dans les applications tierces, dans la limite des restrictions mises en place, évidemment. Désormais, ce n’est plus le cas.
Le changement a été annoncé samedi par Boris Cherny, responsable de Claude Code chez Anthropic, avec une mise en place prévue pour le lendemain : « Les abonnements Claude ne couvriront plus l’utilisation d’outils tiers comme OpenClaw […] La capacité est une ressource que nous gérons avec soin et nous donnons la priorité à nos clients utilisant nos produits et notre API ».
Pour faire passer la pilule et « offrir » la première dose, le responsable ajoute que les « abonnés reçoivent un crédit équivalent au coût de leur abonnement mensuel ». Les clients ont reçu pendant le week-end un email pour réclamer leur « cadeau ».
Dans le message envoyé aux abonnés, une « remarque importante » confirme la déclaration précédente, avec une mise en place le jour même : « À compter du 4 avril, les outils tiers comme OpenClaw connectés à votre compte Claude seront facturés comme une consommation supplémentaire et non plus via votre abonnement ».
OpenClaw est directement cité dans la communication d’Anthropic. Il s’agit, pour rappel, d’un agent IA qui a défrayé la chronique au début de l’année. Son créateur, Peter Steinberger, a rejoint OpenAI mi-février, « pour piloter la prochaine génération d’agents personnels ».
Il s’est exprimé sur X suite à ce changement de politique qu’il trouve « triste pour l’écosystème ». Il annonce au passage que la dernière version d’OpenClaw inclut des « correctifs pour une meilleure utilisation du cache, afin de réduire les coûts pour les utilisateurs de l’API ».
« Demande croissante sur Claude » : Anthropic modifie ses conditions d’usage
Ce n’est pas le seul changement de ces dernières semaines : « Pour répondre à la demande croissante sur Claude, nous ajustons nos limites des sessions de 5 h pour les abonnements gratuits, Pro et Max pendant les heures de pointe. Vos limites hebdomadaires restent inchangées. En semaine entre 5 h et 11 h PT, ainsi qu’entre 13 h et 19 h GMT, vous épuisez vos limites de session de 5 heures plus rapidement qu’auparavant », explique un responsable de Claude Code sur X.
« Nous avons réalisé de nombreux gains d’efficacité pour compenser cela, mais environ 7 % des utilisateurs atteindront des limites de session qu’ils n’auraient pas atteintes auparavant, en particulier pour les niveaux pro. Si vous exécutez des tâches en arrière-plan gourmandes en tokens, les décaler aux heures creuses étendra davantage vos limites de session », explique-t-il. La grogne des clients s’est rapidement faite entendre dans les réponses à cette publication.
Comme le rapporte Le Figaro, une publication Reddit a mis le feu aux poudre le mois dernier. Un internaute affirme avoir trouvé des bugs dans la mémoire cache de l’IA qui « multiplient par 10 à 20 vos consommations ».
Anthropic a annoncé enquêter et, le 2 avril, Lydia Hallie (développeuse Claude Code) a pris la parole sur X : « Les limites en heure de pointe sont plus strictes […] c’est en grande partie ce que vous ressentez. Nous avons corrigé quelques bugs en cours de route, mais aucun ne vous facturait excessivement ».
Elle donne quelques conseils. Elle propose d’utiliser Sonnet 4.6, qui est « le choix par défaut le plus performant sur Pro. Opus consomme [les tokens] environ deux fois plus vite ». Elle recommande aussi de « commencer une nouvelle session plutôt que de reprendre de grandes sessions qui ont été inactives ~1 h », et enfin de limiter votre fenêtre de contexte. Là encore, les clients font part de leur mécontentement en guise de réponse.
C’est aussi un moyen pour Anthropic de pousser ses clients sur une offre plus chère s’ils veulent continuer d’utiliser Claude plus ou moins comme avant. Pour rappel, la formule Pro est à 15 euros par mois, mais le palier du dessus est à 90 euros minimum par mois pour Max. Il y a également l’API avec un paiement à l’usage.
Fuite de Claude Code et de Mythos
Ces derniers jours, Anthropic était au cœur des gros titres de la presse, pour deux raisons. La première concerne la fuite d’une partie du code de Claude Code justement. Si le modèle en lui-même n’est pas publié (le cerveau de Claude Code), le squelette, ses muscles et articulations sont désormais accessibles à tout le monde.
Peu de temps avant, plus de 3 000 documents avaient « fuité » avec un nouveau modèle baptisé Mythos. Il se place au-dessus d’Opus, le modèle actuellement le plus performant d’Anthropic… et donc plus couteux à faire tourner.
Commentaires (21)
Abonnez-vous pour prendre part au débat
Déjà abonné ou lecteur ? Se connecter
Cet article est en accès libre, mais il est le produit d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.
Accédez en illimité aux articles d'un média expert
Profitez d'au moins 1 To de stockage pour vos sauvegardes
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
Abonnez-vousLe 7 avril à 09h17
Quand à Antigravity c'est devenu inutilisable, ça coupe très régulièrement pour cause de trafic trop élevé.
Le 7 avril à 09h48
Modifié le 7 avril à 11h09
Edit : est-ce que vous avez aussi une erreur à chaque envoi de commentaire mais ça marche quand même quand vous rafraichissez la page ?
Le 7 avril à 11h12
Modifié le 7 avril à 12h43
Edit : l'erreur s'est bien évidemment reproduite et j'ai lu plus attentivement le message. Il ne parle pas d'une autre news mais de WordPress et de son débogage. En lisant vite la première fois, j'ai fait l'amalgame avec la news sur EmDash et WordPress.
Modifié le 7 avril à 13h30
Le 7 avril à 09h22
Le 7 avril à 09h40
Par contre Google a sorti un nouveau modèle open-source pouvant être exécuté localement sans connexion internet, nommé Gemma 4, qui est très convaincant pour tous types d'usages, pour un modèle local.
Le 7 avril à 10h25
Vu le prix faible des tokens Mistral ce serait dommage de l'exclure totalement. Il faut juste jongler entre les modèles en fonction des tâches (ce que peut faire OpenClaw ).
Le 7 avril à 12h10
Je comprends pas que les boîtes qui font des modèles de ces tailles, càd à peu près la bonne pour tenir sur des cartes grand public, ne visent pas des tailles adaptées à des gammes de GPU données.
Visez 6Go, puis 14, puis 20-22, puis 28-30. Arrêtez de faire des modèles de 9Go, puis 18, puis 25 puis 36. Ou alors arrêtez de prétendre que vos modèles sont faits pour être exécutés en local.
Le 7 avril à 13h29
Le 7 avril à 09h44
Modifié le 7 avril à 11h08
Le 7 avril à 10h55
C'est désactivable ensuite.
Le 7 avril à 11h26
L'intérêt financier, pour pousser sur les usages Max, je peux l'entendre.
Mais pourquoi imposer alors ces limites même sur Max ? Que cela se fasse sur l'offre Free, un peu moins fortement sur l'offre Pro, et plus du tout dès l'offre Max...
Modifié le 7 avril à 16h14
En travaillant sur un seul projet à la fois et en faisant gaffe au contexte (je dépasse très rarement 150K), c'est difficile d'atteindre la limite avec Opus 4.6 en High / Max raisoning.
Le 7 avril à 18h11
Pas de réponse, et quota déjà atteint !
Si moi, à mon très faible niveau d'utilisation, je me trouve déjà bloqué en 1 requête, ça risque de râler (et de piquer) très fort dans d'autres chaumières
M'est avis qu'avec un changement aussi strict ils risquent, eux aussi, de se tirer une balle dans le pied et les utilisateurs occasionnels vont simplement changer de crèmerie.
Est-ce que ça entraînera dans leur sillage une partie de ceux qui, actuellement, paient ?
La popularité et la conversion, c'est très fluctuant de nos jours, la fidélisation c'est devenu rare (je trouve).
Le 7 avril à 21h00
Le 8 avril à 02h36
En tout cas il me semble que Gemini pro c’est comme ça.
Le 8 avril à 07h20
Pour limiter la casse (ou les frais), il est conseillé de relancer une nouvelle conversation (ou à défaut, de faire générer une synthèse de la conversation en cours et d'utiliser le résultat comme prompt de départ pour le contexte de la nouvelle).
Le 9 avril à 08h34
Signaler un commentaire
Voulez-vous vraiment signaler ce commentaire ?