Plantage des Core i9 : Intel corrige un bug sur l’eTVB, mais l’enquête continue

Une root cause peut en cacher une autre

16

Intel est toujours empêtré dans les plantages des Core i9 de 13e et 14e génération (série K). Lors de l’enquête, un souci a été identifié sur une fonction permettant de booster les performances : l’(e)TVB. S’il « contribue potentiellement à l’instabilité, il n’en est pas la cause profonde », qui reste toujours à identifier.

Depuis des mois, des clients Intel font état de plantages sur les processeurs haut de gamme que sont les Core i9-13900K/KF/KS et i9-14900K/KF/KS (respectivement de 13e et 14e génération). En avril, le fondeur ouvrait officiellement une enquête.

En mai, la société publiait ses recommandations officielles, avec des paramètres à mettre en place dans les BIOS/UEFI pour atténuer les soucis. Elle affirmait au passage qu’elle ne cherchait pas à « imputer la faute » à ses partenaires que sont les fabricants de cartes mères. Une des possibilités étant que ces derniers aient la main un peu lourde sur les optimisations.

Des mises à jour étaient également proposées par certains constructeurs afin de mettre en place un retour aux paramètres « Intel baseline ». Asus expliquait que cela permettait « aux utilisateurs de revenir aux paramètres d'usine Intel par défaut pour les fonctionnalités de base, des limites de puissance inférieures et une amélioration de la stabilité dans certains jeux ». Moins de perfs, mais plus de stabilité.

L’(enhanced) Thermal Velocity Boost pointé du doigt

Dans tous les cas, l’enquête se poursuivait et la cause première des plantages n’était toujours pas connue. De nouvelles informations sont arrivées par l’intermédiaire d’Igor Wallossek, qui s’occupait auparavant de Tom's Hardware Germany. Il a publié un document interne d’Intel, dont le fondeur en confirme au moins partiellement l’existence.

L’enhanced Thermal Velocity Boost (eTVB) est pointé du doigt. Il s’agit d’une version améliorée de la fonctionnalité Thermal Velocity Boost (TVB) introduite en 2018. Elle « qui permet de booster les performances du processeur lorsque la marge thermique et le budget de puissance turbo sont disponibles ».

Allez toujours plus vite… parfois trop

Comme l’explique Intel, cette fonctionnalité « accroît automatiquement et de manière opportune la fréquence d’horloge au-delà des fréquences de la technologie Intel Turbo Boost mono et multicœurs en fonction de la température à laquelle fonctionne le processeur ». Elle s’active lorsque la température, la consommation et d’autres paramètres sont en dessous de valeurs prédéfinies.

On imagine bien le souci en cas de mauvaise information, si le processeur est déjà au niveau de ses limites par exemple. Le document publié par notre confrère explique justement qu’un « mauvais calcul de la limite de fréquence peut permettre au processeur de fonctionner à une fréquence et une température élevées ». Le risque en pareille situation est bien connu : un plantage de la machine.

Voilà la « root cause » de la discorde

« La cause première est une valeur incorrecte dans un algorithme du microcode associé à la fonctionnalité eTVB », toujours selon notre confrère qui se base sur le document interne en sa possession. Il s’agit de la « root cause » du problème de l’eTVB, mais pas obligatoirement de la « root cause » des plantages des Core i9 série K. Vous suivez ?

Certains ont visiblement fait le raccourci, poussant Igor’s Lab à ajouter un paragraphe à son article initial : « C’est une autre pièce du puzzle [du plantage des Core i9, ndlr], mais pas la soi-disant "cause profonde". J’ajoute ceci en note car, encore une fois, j’ai été cité de manière incomplète et parfois incorrecte ». Ambiance.

Intel aussi est sortie du bois, avec un communiqué transmis à plusieurs de nos confrères américains, dont The Verge : « Contrairement aux récents rapports des médias, Intel n'a pas confirmé la cause première et continue, avec ses partenaires, d'enquêter sur les rapports des utilisateurs concernant des problèmes d'instabilité sur les processeurs desktop Intel Core 13e et 14e générations (K/KF/KS) ».

Le problème de l’eTVB découvert en cherchant les causes de plantage

Intel confirme au passage que ce bug concernant l’eTVB a été découvert dans le cadre de l’enquête sur les plantages des Core i9. Dans le document, Intel demande à ses clients de mettre à jour le BIOS de leur machine avec « le microcode 0x125 ou une version ultérieure ».

« Bien que ce problème contribue potentiellement à l’instabilité, il n’en est pas la cause profonde », ajoute Intel auprès de nos confrères. L’enquête continue donc pour identifier la « root cause » des plantages des Core i9 série K de 13e et 14e génération.

Le temps commence dans tous les cas à être long pour Intel… Non seulement la société a mis des mois à réagir, mais en plus, elle n’a toujours pas identifié la cause première des plantages des Core i9 série K de 13e et 14e génération, malgré déjà plusieurs mois d’enquête.

Commentaires (16)


650 balles le grille pain.
Correction : 650 balles le grille pain buggué.

Patch

Correction : 650 balles le grille pain buggué.
Qui crame la tartine!

yl

Qui crame la tartine!
Et la fait tomber du côté beurré. Avant même que le beurre ne soit mis dessus.
les processeurs et leurs microcodes sont devenus si complexes aujourd'hui qu'il est difficile de débugguer le tout. Ceci promet d'être long et complexe en tout cas.
Bien moins complexe qu'un OS, pourtant... Intel a un support de merde en dehors de gammes serveur, surtout.
Petite pensée aux marchands de chez LDLC qui clament à tous ceux qui veulent les croire que les Intel Core sont les meilleurs processeurs au monde (les marges doivent être plus grandes).

Vous rendez vous compte, tout le monde achète des Ryzen, et chose incroyable, il y a majoritairement des configs (montées avec les pieds) à base Ryzen dans les ateliers SAV ?! ... D'après eux, les Ryzen sont moisis et les volumes de vente et les statistiques ne sont que des complots de platistes.
Tu sors d'où ces informations?

ForceRouge

Tu sors d'où ces informations?
On dirait le récit d'un échange avec un vendeur en magasin qui affirme haut et fort à des clients plus calés que lui des âneries plus grosses que lui-même, sans jamais se démonter. :D
Modifié le 17/06/2024 à 20h09

Historique des modifications :

Posté le 17/06/2024 à 20h09


On dirait le récit d'un échange avec un vendeur en magasin qui affirme haut et fort à des clients plus calés des âneries plus grosses que lui, sans jamais se démonter. :D

Berbe

On dirait le récit d'un échange avec un vendeur en magasin qui affirme haut et fort à des clients plus calés que lui des âneries plus grosses que lui-même, sans jamais se démonter. :D
Farpaitement !
Il fut un temps où la concurrence poussait vers la qualité.

On pourrait aussi penser que se baigner dans des piscines de pognon permettrait de correctement financer un contrôle de qualité.
Il n'en est rien.

J'ai encore en mémoire l'annonce de coupes budgétaires massives dans le contrôle de qualité chez Intel, alors que les bénéfices étaient déjà surréalistes.
Il est juste logique que les soucis apparaissent, et il est même curieux qu'il n'y en ai pas massivement plus.

Le retour des architectures longtemps abandonnées, les velléités à vouloir produire des puces afin de répondre au protectionnisme, l'envie potentielle d'autres fondeurs dans d'autres domaines à vouloir entrer sur ce marché… peut-être qu'une combinaison de tout cela pourrait stimuler à nouveau ceux qui se reposent sur leurs lauriers.
Modifié le 17/06/2024 à 20h18

Historique des modifications :

Posté le 17/06/2024 à 20h15


Il fut un temps où la concurrence poussait vers la qualité.

On pourrait aussi penser que se baigner dans des piscines de pognon permettrait de correctement financer un contrôle de qualité.
Il n'en est rien.

J'ai encore en mémoire l'annonce de coupes budgétaires massives dans le contrôle de qualité chez Intel, alors que les bénéfices étaient déjà surréalistes.
Il est juste logique que les soucis apparaissent, et il est même curieux qu'il n'y en ai pas massivement plus.

Le problème de plantage du CPU toucherait aussi les 13700K/14700K.

D'après les rumeurs, Intel n'impute pas la faute sur les fabricants de carte mère simplement parce qu'il ne les aurait pas informé des limitations correctes à appliquer. En gros il y aurait trois profils dans les CPUs/BIOS, « Baseline » cité dans l'article ainsi que « Performance » et « Extreme », le dernier n'ayant virtuellement aucune limite d'énergie et autres. Des captures d'écran de BIOS circulent affichant une limite maximale de 4096 Watts pour un 14900K :ooo: On est moins surpris du trou noir qu'est ce dernier du coup :transpi:

Évidemment de base, c'est le « Extreme » qui est appliqué. Le score de performances pour le marketing, la concurrence, tout ça...

Il aurait fallu que le profil par défaut soit « Performance » au maximum (253 W sur les 13900/14900) ou donc « Baseline » qui je crois est à 188 W.

L'ennui est que si on n'a pas corrigé ce problème de réglages assez vite sachant que le BIOS peut mentir (sur les ASUS notamment)(à updater, vite), les rumeurs parlent que plus d'un CPU serait dégradé et restera instable. Bref il faudra le remplacer, et Intel au début refusait de couvrir. J'ignore s'ils refusent encore.

Ce qui est sûr c'est que la stratégie d'Intel du « tirer le maximum d'un CPU tant qu'il n'a pas atteint les 100° » n'est pas la meilleure tactique. Je n'échangerai pas mon Ryzen 3700X pour un i7-13700X.
Modifié le 17/06/2024 à 20h53

Historique des modifications :

Posté le 17/06/2024 à 20h47


Le problème de plantage du CPU toucherait aussi les 13700K/14700K.

D'après les rumeurs, Intel n'impute pas la faute sur les fabricants de carte mère simplement parce qu'il ne les aurait pas informé des limitations correctes à appliquer. En gros il y aurait trois profils dans les CPUs/BIOS, « Baseline » cité dans l'article ainsi que « Performance » et « Extreme », le dernier n'ayant virtuellement aucune limite d'énergie et autres. Des captures d'écran de BIOS circulent affichant une limite maximale de 4096 Watts pour un 14900K :ooo: On est moins surpris du trou noir qu'est ce dernier du coup :transpi:

Évidemment de base, c'est le « Extreme » qui est appliqué. Le score de performances pour le marketing, la concurrence, tout ça...

Il aurait fallu que le profil par défaut soit « Performance » au maximum (253 W sur les 13900/14900) ou donc « Baseline » qui je crois est à 188 W.

L'ennui est que si on n'a pas corrigé ce problème de réglages assez vite sachant que le BIOS peut mentir (sur les ASUS notamment), les rumeurs parlent que plus d'un CPU serait dégradé et restera instable. Bref il est mort, et Intel au début refusait de couvrir. J'ignore s'ils refusent encore.

Posté le 17/06/2024 à 20h49


Le problème de plantage du CPU toucherait aussi les 13700K/14700K.

D'après les rumeurs, Intel n'impute pas la faute sur les fabricants de carte mère simplement parce qu'il ne les aurait pas informé des limitations correctes à appliquer. En gros il y aurait trois profils dans les CPUs/BIOS, « Baseline » cité dans l'article ainsi que « Performance » et « Extreme », le dernier n'ayant virtuellement aucune limite d'énergie et autres. Des captures d'écran de BIOS circulent affichant une limite maximale de 4096 Watts pour un 14900K :ooo: On est moins surpris du trou noir qu'est ce dernier du coup :transpi:

Évidemment de base, c'est le « Extreme » qui est appliqué. Le score de performances pour le marketing, la concurrence, tout ça...

Il aurait fallu que le profil par défaut soit « Performance » au maximum (253 W sur les 13900/14900) ou donc « Baseline » qui je crois est à 188 W.

L'ennui est que si on n'a pas corrigé ce problème de réglages assez vite sachant que le BIOS peut mentir (sur les ASUS notamment), les rumeurs parlent que plus d'un CPU serait dégradé et restera instable. Bref il est mort, et Intel au début refusait de couvrir. J'ignore s'ils refusent encore.

Posté le 17/06/2024 à 20h50


Le problème de plantage du CPU toucherait aussi les 13700K/14700K.

D'après les rumeurs, Intel n'impute pas la faute sur les fabricants de carte mère simplement parce qu'il ne les aurait pas informé des limitations correctes à appliquer. En gros il y aurait trois profils dans les CPUs/BIOS, « Baseline » cité dans l'article ainsi que « Performance » et « Extreme », le dernier n'ayant virtuellement aucune limite d'énergie et autres. Des captures d'écran de BIOS circulent affichant une limite maximale de 4096 Watts pour un 14900K :ooo: On est moins surpris du trou noir qu'est ce dernier du coup :transpi:

Évidemment de base, c'est le « Extreme » qui est appliqué. Le score de performances pour le marketing, la concurrence, tout ça...

Il aurait fallu que le profil par défaut soit « Performance » au maximum (253 W sur les 13900/14900) ou donc « Baseline » qui je crois est à 188 W.

L'ennui est que si on n'a pas corrigé ce problème de réglages assez vite sachant que le BIOS peut mentir (sur les ASUS notamment)(à updater, vite), les rumeurs parlent que plus d'un CPU serait dégradé et restera instable. Bref il faudra le remplacer, et Intel au début refusait de couvrir. J'ignore s'ils refusent encore.

4096W c'est juste pour dire à la carte mère et au CPU de ne pas limiter la puissance c'est le paramètre que tout overclocker met en 1er lorsque l'on veut commencer à overclocker son cpu.
Le profil extrême est un profil d'overclocking avec des paramètres par défaut pour que tout un chacun puisse overclocker son cpu comme un overclocker expérimenté. Historiquement ce profil extreme était décidé par le fabricant de carte mère et le soucis est que la tension appliquée doit être réglée en fonction de l'overclocking désiré, et pendant longtemps la tension appliquée était celle du fail safe grosso modo donc bien trop élevée pour la plupart des CPU
Je ne sais pas si maintenant le profil est toujours appliqué par la cm mais si tel est le cas alors il semblerait que les fabricants de cm ait décidé d'appliquer une tension adaptée pour une majorité de CPU mais ceux qui n'ont pas de chance à la silicon lotery se retrouve avec des cpu qui ont besoin de plus de tension pour ces mêmes paramètres d'où crash.
Si le profil extrème est par contre donné par le CPU alors effectivement ce n'est pas forcément les fabricants de cm qui sont en cause mais bien un soucis de tension sur ce profil intel qui ne renvoie pas une tension assez élevée à appliquer par la carte mère ou alors la carte mère n'arrive pas a réguler proprement cette tension car la LLC de la cm n'est pas bonne.
Je ne comprends pas trop le fuss car c'est de l'overclocking donc au dela des limites intel et les gens s'étonnent que leur cpu plante ba oui quand tu règles mal tes settings cpu il crash tout apprenti overclocker l'apprends à ses dépends.

ashlol

4096W c'est juste pour dire à la carte mère et au CPU de ne pas limiter la puissance c'est le paramètre que tout overclocker met en 1er lorsque l'on veut commencer à overclocker son cpu.
Le profil extrême est un profil d'overclocking avec des paramètres par défaut pour que tout un chacun puisse overclocker son cpu comme un overclocker expérimenté. Historiquement ce profil extreme était décidé par le fabricant de carte mère et le soucis est que la tension appliquée doit être réglée en fonction de l'overclocking désiré, et pendant longtemps la tension appliquée était celle du fail safe grosso modo donc bien trop élevée pour la plupart des CPU
Je ne sais pas si maintenant le profil est toujours appliqué par la cm mais si tel est le cas alors il semblerait que les fabricants de cm ait décidé d'appliquer une tension adaptée pour une majorité de CPU mais ceux qui n'ont pas de chance à la silicon lotery se retrouve avec des cpu qui ont besoin de plus de tension pour ces mêmes paramètres d'où crash.
Si le profil extrème est par contre donné par le CPU alors effectivement ce n'est pas forcément les fabricants de cm qui sont en cause mais bien un soucis de tension sur ce profil intel qui ne renvoie pas une tension assez élevée à appliquer par la carte mère ou alors la carte mère n'arrive pas a réguler proprement cette tension car la LLC de la cm n'est pas bonne.
Je ne comprends pas trop le fuss car c'est de l'overclocking donc au dela des limites intel et les gens s'étonnent que leur cpu plante ba oui quand tu règles mal tes settings cpu il crash tout apprenti overclocker l'apprends à ses dépends.
Ça serait de l'overclocking si les gens bricolaient le bios, là, ce n'est pas le cas: Tu montes une machine, laisse les réglages par défaut et le machin plante sur certains jeux.

fofo9012

Ça serait de l'overclocking si les gens bricolaient le bios, là, ce n'est pas le cas: Tu montes une machine, laisse les réglages par défaut et le machin plante sur certains jeux.
je comprends bien mais les fabricants de carte mere ici sont fautif à tous mettre le profil extreme par defaut c'est comme quand t'actives xmp c'est de l'overclocking.

ashlol

je comprends bien mais les fabricants de carte mere ici sont fautif à tous mettre le profil extreme par defaut c'est comme quand t'actives xmp c'est de l'overclocking.
Techniquement oui, commercialement non : c'est le réglage par défaut.
Fermer