DeepSeek : pourquoi une telle déflagration sur le marché de l’IA ?
Tout ce qui brille n'est pas or

Coup de tonnerre sur le marché de l'intelligence artificielle : la startup chinoise DeepSeek aurait développé, avec un investissement de départ dérisoire, un modèle dont les performances égalent, voire dépassent, celles des ténors américains du secteur. Cerise sur le gâteau : son modèle, DeepSeek-R1, est publié en open source. L'annonce a provoqué un véritable séisme à Wall Street, où toutes les valeurs liées à l'IA ont dévissé lundi. Elle soulève aussi tout un lot d'interrogations, de rumeurs et d'accusations, alors même que les États-Unis viennent d'annoncer un plan à 500 milliards de dollars en faveur de l'IA...
Le 28 janvier à 12h40
11 min
IA et algorithmes
IA
Les boursicoteurs connaissent l'adage : « les arbres ne montent pas jusqu'au ciel ». À Wall Street, la journée de lundi a pris la forme d'une séance d'élagage pour les valeurs américaines les plus emblématiques de la course à l'intelligence artificielle. NVIDIA, leader incontesté du secteur, a reculé de 16,9 % sur la journée, soit l'équivalent de 600 milliards de dollars de valorisation perdus en seulement quelques heures. Même topo chez Broadcom, avec 17,4 % effacés en une seule séance.
Une IA aussi douée que gpt-4o entraînée pour une somme dérisoire
Au départ de cette dégringolade historique, se trouve une startup chinoise, DeepSeek, fondée en 2023 et globalement inconnue jusqu'au week-end dernier.
La société sort du bois le 20 janvier dernier, avec une annonce formulée sur les réseaux sociaux : elle affirme avoir mis au point plusieurs modèles d'IA, nourris à l'apprentissage par renforcement et doués, pour certains, de capacités de raisonnement, avec des performances qui seraient supérieures à celles des derniers modèles en date d'OpenAI. Pour appuyer ses dires, elle partage un article de présentation technique (PDF), et publie DeepSeek-V3, son grand modèle de langage (LLM) sur GitHub, dont nous analyserons plus en détail le fonctionnement et les promesses dans un article dédié.
Des modèles open source, il y en a déjà beaucoup, chez les grands noms états-uniens de l'IA comme chez des acteurs plus modestes. Mais DeepSeek attire rapidement l'attention, d'abord, parce que la startup évoque des tarifs défiant toute concurrence : DeepSeek-R1, son modèle capable de raisonnement, est accessible à partir de 0,14 dollar par million de tokens en entrée, et 2,19 dollars par million de tokens en sortie.
Il reste 82% de l'article à découvrir.
Déjà abonné ? Se connecter

Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.
Accédez en illimité aux articles
Profitez d'un média expert et unique
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
Abonnez-vousDeepSeek : pourquoi une telle déflagration sur le marché de l’IA ?
-
Une IA aussi douée que gpt-4o entraînée pour une somme dérisoire
-
Un pied de nez chinois aux rêves de grandeurs états-uniens ?
-
Un « moment Spoutnik » pour l'industrie ?
-
Des doutes sur l'entraînement
-
Le paradoxe de Jevons pour justifier les investissements
-
La vague déborde le marché de l'IA
Commentaires (28)
Le 28/01/2025 à 13h15
Le 28/01/2025 à 13h43
C'est une mauvaise nouvelle pour la planète du coup. Si l'IA devient utilisable bien plus efficacement, alors en effet on peut craindre que la quantité totale de ressources utilisées (environnement détruit, énergie, ...) augmente.
(et une mauvaise nouvelle pour tout un chacun aussi pour plein d'autres raisons)
Le 28/01/2025 à 15h59
Le 28/01/2025 à 19h02
Le 29/01/2025 à 10h26
Le 28/01/2025 à 13h49
Les développeurs sont de la nouvelle école: l'optimisation est une perte de temps, il vaut mieux lever des fonds pour augmenter les ressources disponibles.
Je ne sais pas si DeepSeek est complètement honnète concernant les ressources utilisées pour son développement, par contre si cela pouvait entrainer une remise en question des modèles afin d'optimiser au maximum et de minimiser les ressources techniques et énergétiques nécessaire cela serait une bonne chose.
Le 28/01/2025 à 16h08
https://semianalysis.com/2023/05/04/google-we-have-no-moat-and-neither/
En gros, "être open source ou mourrir, entrainer et itérer rapidement comme les petits modèles sinon on va dans le mur."
Et tout ça c'est sans les autres conséquences néfastes de ce bazar.
Le 28/01/2025 à 16h38
Conséquence directe: certaines tâches réalisées manuellement ont soudainement dû être optimisées et automatisées afin de répondre à un besoin plus pressant. Et mine de rien, ça a été bénéfique.
Le 29/01/2025 à 12h11
Qu'une vague d'opti arrive derrière, c'est normal.
Que deepseek (et la Chine) fasse un petit croche-pied aux américains c'est normal aussi.
De ce que j'ai noté de deepseek: en gros, moyennant l'achat d'une archi locale, on peut le faire tourner et il est bon. Pas excellent, pas le meilleur, mais bon et local.
Il répond donc à un besoin actuel: ne pas fournir ses données, ne pas se lier pieds et poings à un GAFAM pour l'intégralité de son activité.
Les produits US ont tendance à nous enfermer chez eux, et il y a encore pas mal de réticences (vu la douille que met Ms cette année, le plan de sortie sur 10 ans commence à poindre son nez)
Modifié le 29/01/2025 à 16h51
D'autres modèles peuvent être installés en local, avec l'outil ollama par exemple pour les geek, tu peux faire tourner llama ou mistral : https://ollama.com/search
Le 29/01/2025 à 22h10
Dernièrement, on discutait le sujet, et on nous propose des box à 50k€ mangeant 12kVA en pointe, mais le dimensionnement en nombre de traitement simultanés est flou.
De ce que j'ai vu/lu, deepseek permet de le faire à config moindre avec un résultat proche. Cela permet deux choses: soit de multiplier les requêtes, soit de baisser l'investissement.
Un des arguments de l'IA en tant que service, c'est que l'investissement pour faire tourner des instances est trop important.
Deepseek semble être une réponse à cet argument.
Après, j'attends plus de témoignages, et un peu moins "émotionnels"
Modifié le 29/01/2025 à 22h45
Le 30/01/2025 à 08h44
Par ailleurs, j'ai vu des vidéos hier qui expliquent l'autre percée de deepseek: ils ont visiblement publié comment faire son deepseek "spécialisé", véritable expert "léger" et pas un big llama spécialisé qui traîne tout un tas de trucs en trop.
Bref, deepseek se place sur l'IA non générale prête à faire un expert pour les pro.
Sérieusement, ils remuent tous les arguments. Là où les big boss habituels te disent "payez et faites-en ce que vous voulez, on vous accompagne mollement mais vous serez pieds et poings liés chez nous, et aucune garantie de comment les résultats évolueront puisque c'est notr eIA", deepseek met des étoiles dans les yeux des décideurs: payez une fois, spécialisez là, c'est votre IA et elle sera figé dans l'état que vous souhaitez.
Enorme avancée en fait dans le produit.
Pour rappel, de l'aveu même de OpenAI, chatgpt3 a largement régressé dans ses réponses "code" sur son exploitation.
Modifié le 30/01/2025 à 09h07
Le 30/01/2025 à 10h17
Vous n'avez jamais recruté une bête de concours incapable de travailler ? :)
Le 28/01/2025 à 17h31
Le 30/01/2025 à 16h02
Le 28/01/2025 à 19h39
Le 30/01/2025 à 16h00
Le 29/01/2025 à 07h37
L'autre valeur que je suis dans le domaine de l'IA n'a pas spécialement bougé, elle a ses oscillations habituelles.
Modifié le 29/01/2025 à 09h24
Modifié le 29/01/2025 à 11h59
Modifié le 29/01/2025 à 10h14
A quand une cotation officielle en bourse de chaque être vivant présent sur Terre ? Il n'y aurait plus ni salaire ni allocations, uniquement des dividendes, calculés en fonction de ton potentiel de data : plus t'es jeune, plus ce potentiel est élevé.
Conséquence : les vieux de +50 ans comme moi n'auront plus qu'à crever, pour être recyclés en Soleil Vert...
Le 29/01/2025 à 12h16
Au final pour le moment, on nous dit que l'IA c'est le futur, on nous vend du LLM hors de prix, mais quotidiennement, ce n'est toujours pas le LLM que j'utilise intensivement, mais les corrections photos de mon smartphone.
Surtout que l'IA, c'est une promesse d'à peu près pour un coût énorme. Je ne dénigre pas l'IA ou ses avantages, mais l'utiliser pour des cas triviaux est un gâchis énorme de ressources.
L'IA symbolise aussi un phénomène difficile à digérer pour les vieux informaticiens comme moi: on passe dans une conception qui assume un non-déterminisme.
Bref, "l'ordi s'est trompé" devient une réalité tangible - menant à créer l'ambiguité dans l'expression "numérique responsable"
Modifié le 30/01/2025 à 11h35
Je fais le rapprochement avec l'IA parce que de mon point de vue tous les LLM sont fondamentalement flous, ils sont basés sur des probabilités, des potentiels, des statistiques... en d'autres termes, rien de solide, ni de sûr.
L'IA, contrairement à la physique quantique (qui a fait ses preuves) est tout sauf une certitude, quelque chose sur laquelle on peut compter, parce que ses réponses peuvent si vite dérailler... Les IA, même les plus avancées, peuvent très bien mentir et halluciner si elles ne sont pas encadrées par des êtres humains.
Une base de données d’entraînement, même gigantesque, n'est qu'un aperçu partial et partiel de la réalité. Et donc les IA sont entraînées sur une approximation, un ersatz, un tout petit sous-ensemble d'un plus grand ensemble à la complexité infinie qui s'appelle l'Univers, ou la Nature... Ce qu’Einstein, qui n'était pas croyant, appelle "Dieu".
La vraie question est : le grand public est-il vraiment préparé à cette marge de (grosses) erreurs potentielles ? N'y a-t-il pas toute une éducation à faire ?
Le 29/01/2025 à 15h32
Le 29/01/2025 à 22h47
Le 30/01/2025 à 15h25
Oui, la Chine (et nous) avons besoin de remettre les point sur les i: avoir le meilleur produit ne veut pas dire que c'est le bon.
On nous serine avec l'IA et ses débouchés, et on en voit assez peu pour le commun des mortels, mais on nous l'assène et on nous la fait payer à chacun (Ms O365).
Bref, de la part de MS et Google, je n'ai vu que de l'esbrouffe: ils vendent une IA, mais sont incapable de nous proposer une application (bravo à Ms pour sa fantastique présentation avec 3 "spécialistes": un qui plante, un qui râle sur les perfs et se vautre, et un qui montre comment générer un powerpoint pour convaincre sa femme d'aller à Tahiti).
Côte openai, on a constaté ce qu'ils ont avoué: les résultats évoluent tout seuls dans le temps sans explication.
Je regarde et lis les articles sur deepseek: c'est ça qu'on veut en pro: un système qu'on peut figer, qu'on peut dimensionner, et qu'on peut payer.
Les chinois ont remis l'IA à sa place: un produit complémentaire, intéressant et accessible. Grande leçon pour les US: le 1er critère de choix d'un produit, c'est le prix. Quoi qu'on fasse.
Quand à justifier une montée de prix en disant qu'on a dû investir des sommes de malades: j'utilise Croissant, IA entraînée par une université parisienne, je ne pense pas qu'ils y ont mis 100M€, et pourtant ça marche pas mal du tout.
C'est pas parce qu'ils ont promis un plan de 500M$ qu'il y aura 500M$ de dépensés: ça c'est de la pub pour faire croire que le produit est bon.