Plantage des Core i9 : Intel a identifié la cause profonde des bugs, un correctif arrive

Plantage des Core i9 : Intel a identifié la cause profonde des bugs, un correctif arrive

Plantage des Core i9 : Intel a identifié la cause profonde des bugs, un correctif arrive

La cause profonde des plantages des Core i9 série K de 13e et 14e générations est « une tension de fonctionnement élevée » qui « provient d'un algorithme du microcode ». Intel a déjà un correctif en phase de validation. Il devrait arriver mi-août.

Depuis l’année dernière, Intel fait face à des plantages à répétition sur les processeurs haut de gamme Core-i9 13900K et 14900K. Après des mois de silence et de politique de l’autruche, le fondeur annonçait enfin l'ouverture d’une enquête officielle en avril. Intel a ensuite rapidement publié des recommandations officielles, mais sans parvenir à identifier, et donc à corriger la cause profonde du problème.

eTVB : une première étape

En juin, la société corrigeait un bug sur l’eTVB (enhanced Thermal Velocity Boost) découvert lors de son enquête. S’il contribuait « potentiellement à l’instabilité » des Core i9 série K de 13e et 14e générations, ce n’était toujours pas « la cause profonde ». L'enquête continuait donc et le temps devait sembler long aux clients affectés.

Cause profonde identifiée : une tension trop élevée

Cette fois-ci, ce devrait être la bonne. Intel a analysé les processeurs qui lui ont été renvoyés à cause des problèmes d'instabilité : « nous avons déterminé qu'une tension de fonctionnement élevée provoque des problèmes d'instabilité […] la tension de fonctionnement élevée provient d'un algorithme du microcode, entraînant des demandes de tension incorrectes du processeur », explique Thomas Hannaford (community manager) sur les forums d’Intel.

En conséquence, Intel a développé une mise à jour du microcode qui corrige « la cause profonde ». Le correctif est en cours de validation et l’entreprise espère pour l’instant le déployer mi-août auprès de ses partenaires. Il sera mis en ligne après une « validation complète ».

La solution la « plus simple »

Intel affirme dans tous les cas « s'engager à remédier à cette situation auprès de ses clients ». Les personnes concernées ou qui ont un souci sont dans tous les cas invitées à contacter le service client. Sauf rebondissement de dernière minute, Intel s’en sort du mieux qu’elle pouvait l’espérer.

Une mise à jour du microcode est certainement la solution la plus facile à déployer puisqu’elle peut directement passer par le système d’exploitation (Windows Update par exemple). Le microcode est le même sur tous les processeurs d’une même série, facilitant sa validation et son déploiement. S’il avait fallu corriger les BIOS/UEFI des cartes mères, cela aurait nécessité bien plus de mises à jour différentes (suivant les modèles et les fabricants). Sans parler d’un problème hardware qui aurait nécessité un échange des processeurs incriminés.

Néanmoins, l’explication d’Intel – « un algorithme du microcode » qui entraine des tensions trop élevées – reste assez légère et on aimerait en savoir plus sur les causes profondes de la cause profonde. Toucher au microcode n’est pas anecdotique et permet de modifier en profondeur le fonctionnement d’un CPU. C’était, par exemple, la méthode utilisée pour corriger les failles Spectre/Meltdown chez Intel, avec des conséquences (faibles, mais réelles) sur les performances.

Un problème de fabrication sur les premières séries de Raptor Lake

Comme le rapporte AnandTech, Intel est également revenu sur un autre problème avec ses puces Raptor Lake, les mêmes 13e et 14e générations que les Core i9 série K dont nous venons de parler. Cette fois-ci, la cause était un problème de fabrication :

« Nous pouvons confirmer que le problème de fabrication via oxydation a affecté certains des premiers processeurs de bureau Core de 13e génération. Cependant, la cause profonde a été identifiée et résolue avec des améliorations sur les processus de fabrication en 2023 ».

C’est donc un souci différent des bugs dû à l’algorithme du microcode, même si les conséquences et le calendrier pouvaient laisser penser à une origine commune. Selon Intel, « seul un petit nombre de rapports d'instabilité peuvent être liés au problème de fabrication ».

Même problème sur le mobile ? Non, affirme Intel

Enfin, certains se faisaient l’écho de problèmes similaires sur les processeurs mobiles d’Intel. Le fabricant a réfuté auprès de plusieurs de nos confrères américains (Tom‘s Hardware et Digitaltrends par exemple) :

« Sur la base de notre analyse approfondie des soucis d'instabilité des processeurs de bureau Intel Core 13e et 14e générations, Intel a déterminé que les produits mobiles ne sont pas exposés au même problème. Les symptômes signalés sur les systèmes mobiles de 13e et 14e générations – y compris des blocages et crashs du système – sont courants, découlant d’une large gamme de potentiels problèmes logiciels et matériels ».

Commentaires (10)


encore un coup de CrowdStrike ça
Ca mériterait un Strike ce commentaire :mega:

Sébastien Gavois

Ca mériterait un Strike ce commentaire :mega:
j'évalue ton post : NULL

Sébastien Gavois

Ca mériterait un Strike ce commentaire :mega:
Vincent a abandonné sa sword ? :stress:
Merci pour l'article après je ne suis pas super convaincu par l'explication d'Intel car les crash arrive aussi sur des servers avec des carte mere w680 qui suivent les profils intel et limite de puissance intel. Soit la tension trop élevée qui est demandée par le CPU ne touche pas que les i9 soit l'oxydation touche plus de CPU qu'ils ne le pensent car il y a plein de CPU serveurs qui plantent.
Source level1tech https://www.youtube.com/watch?v=QzHcrbT5D_Y
et GamersNexus https://www.youtube.com/watch?v=gTeubeCIwRw
Modifié le 23/07/2024 à 18h37

Historique des modifications :

Posté le 23/07/2024 à 17h51


Merci pour l'article après je ne suis pas super convaincu par l'explication de microsoft car les crash arrive aussi sur des servers avec des carte mere w680 qui suivent les profils intel et limite de puissance intel. Soit la tension trop élevée qui est demandée par le CPU ne touche pas que les i9 soit l'oxydation touche plus de CPU qu'ils ne le pensent car il y a plein de CPU serveurs qui plantent.
Source level1tech https://www.youtube.com/watch?v=QzHcrbT5D_Y
et GamersNexus https://www.youtube.com/watch?v=gTeubeCIwRw

Posté le 23/07/2024 à 18h36


Merci pour l'article après je ne suis pas super convaincu par l'explication d'Intelcar les crash arrive aussi sur des servers avec des carte mere w680 qui suivent les profils intel et limite de puissance intel. Soit la tension trop élevée qui est demandée par le CPU ne touche pas que les i9 soit l'oxydation touche plus de CPU qu'ils ne le pensent car il y a plein de CPU serveurs qui plantent.
Source level1tech https://www.youtube.com/watch?v=QzHcrbT5D_Y
et GamersNexus https://www.youtube.com/watch?v=gTeubeCIwRw

# pas super convaincu par l'explication de microsoft Intel

Je crois qu'on a tellement vu "plantage de Windows suite à une mise à jour" c'est dernier jours que tous les problèmes ont pour source Microsoft, même quand ça ne concerne que le processeur.

Les plus mauvaises langues diront que c'est la responsabilité de Windows de modifier le voltage pour faire en sorte que le CPU ne plante pas :D
Modifié le 23/07/2024 à 18h46

Historique des modifications :

Posté le 23/07/2024 à 18h24


pas super convaincu par l'explication de microsoft Intel


Je crois qu'on a tellement vu "plantage de Windows suite à une mise à jour" c'est dernier jours que tous les problèmes ont pour source Microsoft, même quand ça ne concerne que le processeur.

Les plus mauvaises langues diront que c'est la responsabilité de Windows de modifier le voltage pour faire en sorte que le CPU ne plante pas :D

Posté le 23/07/2024 à 18h24


pas super convaincu par l'explication de microsoft Intel


Je crois qu'on a tellement vu "plantage de Windows suite à une mise à jour" c'est dernier jours que tous les problèmes ont pour source Microsoft, même quand ça ne concerne que le processeur.

Les plus mauvaises langues diront que c'est la responsabilité de Windows de modifier le voltage pour faire en sorte que le CPU ne plante pas :D

Posté le 23/07/2024 à 18h24


pas super convaincu par l'explication de microsoft Intel


Je crois qu'on a tellement vu "plantage de Windows suite à une mise à jour" c'est dernier jours que tous les problèmes ont pour source Microsoft, même quand ça ne concerne que le processeur.

Les plus mauvaises langues diront que c'est la responsabilité de Windows de modifier le voltage pour faire en sorte que le CPU ne plante pas :D

fdorin

# pas super convaincu par l'explication de microsoft Intel

Je crois qu'on a tellement vu "plantage de Windows suite à une mise à jour" c'est dernier jours que tous les problèmes ont pour source Microsoft, même quand ça ne concerne que le processeur.

Les plus mauvaises langues diront que c'est la responsabilité de Windows de modifier le voltage pour faire en sorte que le CPU ne plante pas :D
c'est clair mdr c'est corrigé :merci:
MSI avait fourni en début 2024 des nouvelles versions de BIOS qui modifiaient les settings d'alimentation automatique des CPU de 14eme génération. La Tension apportée au mode auto était trop élevée par défault.
La power Limit MAX aussi avait un impact.
Grace à cette mise à jour des BIOS (CM Z790), des tutoriaux expliquaient comment passer en mode Undervolt du CPU (LCC MODE 5 au lieu de 9, baisse de la tension du CPU (et pas mode AUTO...) etc..
C'était une situation bizarre car un I7-14700k faisait du throttling une fois installée avec des paramètres auto.
Etait-ce l'avant guarde de ce problème ?


https://forum-en.msi.com/index.php?threads/really-need-undervolt-guide-for-14700k-msi-z790-mobo.396039/
La vérité AMHA, c'est qu'Intel est tellement obsédée par la course à la puissance (et à la popularité) avec les proc Apple / Qualcomm / (insérer ici votre proc. RISC préféré) qu'elle prends de gros risques avec les voltages, juste pour se vanter de quelques points de plus aux benchmarks. RAF des plantages / instabilités pour les utilisateurs finaux, là la firme a surtout un besoin urgent en terme d'image / de com' pour ne pas passer pour "la boite has-been à la papa" (ce qu'elle est un peu, il faut bien l'avouer...).

D'autant plus que pendant ce temps, AMD a fait carton sur carton, perso je suis admiratif de voir comment l'architecture Zen a fait des bonds de géants en efficacité, en conso et bien sûr en température, bien aidée en cela par la finesse de gravure, qui bien sûr n'explique pas à elle toute seule les progrès réalisés. Mais AMD elle aussi est menacée par les avancées des procs ARM / RISC.

Pour les CPU laptop, la compétition se double voire triple avec une course à l'autonomie et à la température. Là encore Intel va pousser le bouchon aussi loin qu'il peut pour sortir vainqueur des tests, pas toujours AMHA dans l'intérêt de l'utilisateur final, fusse-t-il professionnel ou pas.
Il va quand même falloir des mises à jour de BIOS, certains constructeurs avaient fait une modification pour tenter de limiter le problème, il faudra donc la retirer.
Fermer