Connexion Premium

Victime de son succès, Anthropic a testé de supprimer Claude Code de son abonnement Pro

Claude Pro, mais pas trop pro non plus

Victime de son succès, Anthropic a testé de supprimer Claude Code de son abonnement Pro

Anthropic

Anthropic a un sérieux problème sur les bras : trop d’utilisateurs, pas assez de capacités de calcul. La startup a mis en place des mesures de restriction de l’usage et a testé une limitation des plus sévères : supprimer carrément l’accès de Claude Code aux abonnés Pro.

L’engouement envers Claude Code ne faiblit pas, à tel point que le chiffre d’affaires annualisé devrait dépasser les 30 milliards de dollars. Des revenus record qui propulsent encore plus haut l’intérêt des investisseurs, avec une introduction en Bourse qui devrait intervenir cette année.

Claude Code passe pour certains de Pro à Max

Mais l’attrait des utilisateurs pour les solutions IA d’Anthropic, et tout particulièrement Claude Code, s’accompagne aussi d’une crise de croissance. Les capacités de calcul ont du mal à suivre, et ce ne sont pas les accords signés ici et là qui vont améliorer les choses à court terme : encore faut-il construire les centres de données et les équiper, dans un contexte où l’approvisionnement en composants est un véritable coupe-gorge.

L’entreprise tente donc de maîtriser la demande, et la dernière expérimentation en date ne fait pas que des heureux. Des utilisateurs ont ainsi eu la mauvaise surprise de voir que la grille des bénéfices des abonnements Claude avait supprimé l’accès de Claude Code à la formule Pro (17 dollars par mois). Pour pouvoir utiliser l’outil de génération de code, il faut donc souscrire à la formule Max, à partir de 100 dollars.

Les abonnés Pro privés de Claude Code. Capture d’écran : George Pu

Un test et une marche arrière toute d’Anthropic

Les entreprises et les organisations ne sont pas tellement concernées puisqu’elles ont des tarifications spécifiques. Pour les amateurs ou les prosumers en revanche, la pilule est plus difficile à faire passer. Pas de panique (pour l’instant) : il ne s’agit que d’un test concernant 2 % des nouveaux abonnés (rien ne change pour les anciens), a confirmé Amol Avasare, responsable de la croissance chez Anthropic. La liste des fonctions de Claude Pro est d’ailleurs revenue à la normale, l’accès à Claude Code étant de retour. Il ajoute que si quelque chose devait changer, « nous préviendrons les gens bien à l’avance ».

Le dirigeant explique qu’au lancement de la formule Max l’an dernier, elle n’incluait pas Claude Code, que Cowork n’existait pas et que les agents IA qui tournaient durant des heures n’étaient pas encore de la partie. « Max était conçu pour un usage prolongé du chat, voilà tout ». Depuis, Code y est intégré et avec l’avènement d’Opus 4, l’usage a fortement progressé, tandis que les agents comme OpenClaw ont commencé à faire partie des flux de travail au quotidien.

« La manière dont les gens utilisent leur abonnement Claude a fondamentalement changé », observe-t-il, « nos formules actuelles n’ont pas été conçues pour ça ». Avec un engagement en hausse constante, Anthropic a dû faire des ajustements : plafond d’utilisation hebdomadaire, des limites durant les heures de pointe, passage à l’API pour les services tiers… C’est pourquoi l’entreprise cherche de nouvelles manières de partager les capacités de calcul, et en teste certaines.

Va-t-on dès lors vers une hausse des prix des abonnements, couplée à davantage de restrictions dans les offres ? Ce n’est pas à exclure. Le nouveau modèle de langage Opus 4.7 est d’ailleurs plus gourmand en tokens.

Commentaires (21)

votre avatar
"Mince, ils utilisent ce pour quoi ils ont payé"
votre avatar
Ils demandent ça.
On leur donne ça !
Bon, mais ils le prennent !
On est embêtés !
Coluche
votre avatar
Victime de leur succès ? Ou alors ils perdent trop d’argent sur ces abonnements probablement très subventionnés.
Dans un futur court terme, Claude, GitHub copilot et compagnie, ils passeront tous à une facturation au token pour essayer d’être éventuellement un peu rentable.

J’adorerais une introduction en bourse de ses boites, elles seraient obligées d’avoir des résultats publics un peu plus clairs sur leur finances.
votre avatar
J’adorerais une introduction en bourse de ses boites, elles seraient obligées d’avoir des résultats publics un peu plus clairs sur leur finances.
Enron était bien cotée en bourse...
votre avatar
Bientôt un retour à la réalité où il faudra payer le "vrai" pris de ces usines "à gaz" (au littéral comme au figuré) ?
votre avatar
Il est probable que ça arrive, et quand ce sera le cas, la concurrence au niveau des LLM deviendra très rude pour rester en vie. Anthropic facture déjà un montant plus réaliste que ses concurrents, du coup, il est probable qu'ils soient ceux qui souffrent le moins quand l'illusion de l'I.A. bon marché s'évaporera.

Maintenant, si les projections de coût de mes activités sur trois ans venait à dépasser un certain seuil, j'investirai directement dans du matériel d'inférence.
votre avatar
il est probable qu'ils soient ceux qui souffrent le moins quand l'illusion de l'I.A. bon marché s'évaporera.
Ils ont au moins mis les tarifs qui leur permettront de durer plus longtemps que les concurrents et de pousser les prix quand ils seront seuls. Reste à voir si les clients adhéreront.
votre avatar
Je suis entre 100 et 200$ /mois
Je serai prêt à mettre plus mais pas non le coût de l'API qui est totalement hors budget pour ma boite.
votre avatar
"j'investirai directement dans du matériel d'inférence.", bon courage quand tu vois le prix de la RAM, SSD, GPU et ce n'est pas prêt de finir d'augmenter / d'être indispo…
votre avatar
Par rapport au coût des api, crois-moi, ça devient vite compétitif, si tu es à 100€ par mois en faisant gaffe à ta consommation, tu es déjà à 3600€ sur trois ans. a ce prix là, une config mono radeon ai pro 9700 commence à devenir intéressante. Tu fais tourner un qwen 3.6 bien paramétrisé dessus avec une large fenêtre de contexte et une température rabaissée et tu vas pouvoir obtenir des résultats très corrects. Si tu consommes plus ou a besoin de fenêtres de context plus larges, tu rajoutes une carte, ça scale relativement bien en pcie5.

L'autre option est une cm comme la Framework Ryzen AI 395+ avec 128G de LPDDR5x unifiée, c'est moins évolutif mais ça démarre fort pour un prix très acceptable.
votre avatar
Comme pour la drogue, après avoir distribué les échantillons pour pas trop cher, il est temps de traire les vaches
votre avatar
Le sous-titre me fait furieusement pensé à ce (très) vieux sketch de Marc Jolivet : Pro mais cool. :D
votre avatar
À dire vrai j’ai pris cet abonnement pour tester sur mes projets perso et je ne compte pas le reconduire le mois prochain. Les limites sont constamment atteintes et quand je dis constamment c’est que pas une seule fois je n’ai pas tapé dans les limites au bout de 10-20min (sur une fenêtre de réinitialisation de 5h). Parfois même en un seul prompt.

C’est extrêmement frustrant de payer aussi cher pour aussi peu.

C’est d’autant plus frustrant qu’au boulot j’ai un accès illimité à l’API donc je sais de quoi l’outil est capable.

Clairement Anthropic a beaucoup d’avance sur la qualité, Opus bien maîtrisé est une merveille, mais ça coûte bien trop cher.
votre avatar
Jamais utilisé Anthropic, donc je ne saurais juger la qualité (même si tous les avis que je vois passer laissent entendre qu'ils ont effectivement une belle avance technique).

Cela dit, au vu du coût de dev et d'exécution des logiciels d'IA et les coûts / limitations de leur offre, je me dis aussi qu'ils sont plutôt réalistes. Là où Microsoft ou Google font comme à l'époque du Cloud et sous vendent le produit pour mieux s'accaparer le marché (tout en l'introduisant au forceps à peu près partout avec le vendor lock qui ira bien).
votre avatar
Oui et non. Il commence à y avoir des gros LLM open source (Kimi, Qwen, Deepseek … pas les versions que tu peux lancer chez toi, celles qui nécessitent au moins 250Go de VRAM …) auquel tu peux avoir accès chez plusieurs fournisseurs tiers (qui te vendent donc l’accès au prix que ça leur coûte réellement de faire tourner le truc) et ces modèles ne sont peut être pas au niveau de la toute dernière version d’Opus mais n’en sont vraiment pas loin.

Et ces modèles hébergés indépendamment sont nettement moins chers qu’Opus ou même Sonnet.

Anthropic a une petite avance technologique mais soit c’est cette avance qui leur coûte très cher, soit ils ont des problèmes de consommation énergétique non maîtrisée.

Faut pas oublier que Gemma 4 ou Qwen, les versions locales cette fois ci, celles qui tournent sur un mac un peu musclé ou un GPU du marché à 1000-3000€, ont des perfs comparables à Claude de l’an dernier.
votre avatar
Je sais bien que les modèles hébergés coûtent moins cher, j'utilise les API Infomaniak justement ;)

Mais à mon sens, ce n'est pas comparable puisque les hébergeurs se contentent d'héberger et leur matos sert avant tout pour l'inférence. Le plus cher dans l'histoire reste l'entraînement et le fine-tuning et toute la recherche autour qui représentent le gros de l'investissement.
votre avatar
Le plus cher dans l'histoire reste l'entraînement et le fine-tuning et toute la recherche autour qui représentent le gros de l'investissement.
Vu les recherches d'investissement depuis 1 à 2 ans, et les raisons avancées, ce ne serait pas plutôt la construction des datacenters le plus cher ? (ce qui tendrait d'ailleurs à montrer que c'est l'inférence qui coûte, parce qu'elle est répétée des milliards de fois par l'ensemble des utilisateurs)
votre avatar
Il me semble que ceux qui construisent des data centres sont aussi ceux qui produisent des modèles ou proposent de louer de la puissance pour de l'entraînement (entraînement complet ou fine-tuning d'un modèle existant pour le spécialiser).

Infomaniak (qui n'a que deux data centres) ne propose pas d'entraînement, par exemple.

Un autre indicateur qui me conforte dans l'idée que l'inférence revient moins cher : les offres d'hébergement chat bot / modèle sont largement moins chères que celles de machine learning. La diff vient aussi du fait que pour l'entraînement, les bécanes vont tourner pendant une très longue période là où en inférence, ça varie selon la sollicitation.

Évidemment, plus l'inférence est sollicitée, plus y'a besoin de ressources pour conserver des temps de traitement acceptables.
votre avatar
En coût unitaire, il n'y a pas photo que c'est l'entrainement qui coûte le plus, mais en coût total, je suis sûr du contraire, sinon, aucun des grand éditeurs d'IA n'aurait besoin de gigantesques datacenters remplis de GPU pour entrainer ses modèles, qql milliers de GPU suffiraient pour contenir un modèle et l'entrainer, la majorité de l'investissement serait alors du stockage pour contenir les données d'entrainement.
les offres d'hébergement chat bot / modèle sont largement moins chères que celles de machine learning.
J'ai regardé par exemple la grille tarifaire chez OVH, ce sont les mêmes prix pour entraîner/faire tourner un modèle (logique, c'est le même matériel qui est loué), mais c'est (un peu) moins cher pour un accès direct à des modèles mis à disposition par OVH (logique aussi, c'est en mode cloud, ça peut être optimisé par rapport à la loc de matériel).
votre avatar
En coût unitaire, il n'y a pas photo que c'est l'entrainement qui coûte le plus, mais en coût total, je suis sûr du contraire,
Ben, c'est ce que j'ai dit.
votre avatar
Je ne l'avais pas compris d'une manière aussi tranchée (c'est parce que je me suis pas fait implanter de CG à ma dernière opération que je suis lent à comprendre :-P).