Apple Intelligence : la mémoire vive comme facteur limitant ?
L'ombre d'un soupçon de précipitation
La courte liste d'appareils compatibles avec Apple Intelligence a surpris. S'agissait-il vraiment d'un manque de puissance ou d'un stratagème de l'entreprise pour créer une grande vague de renouvellement ? Apple l'affirme, ce n'était qu'une question de puissance. La mémoire vive, cependant, semble avoir été le vrai facteur limitant.
Le 24 juin 2024 à 11h19
9 min
IA et algorithmes
IA
La conférence d’ouverture de la WWDC d’Apple a fait la part belle à l’IA. Sous l’appellation « Apple Intelligence », l’entreprise veut proposer une longue liste de fonctions pour simplifier le quotidien, dont un nouveau Siri nettement plus dynamique que l’actuel.
Mais avant que tout soit disponible, il reste deux grandes barrières. D’une part, les premières fonctions n’arriveront qu’à l’automne, en anglais et aux États-Unis uniquement. Les autres marchés ne commenceront à en voir la couleur que l’année prochaine. On ne sait quels pays auront la priorité, ni quand. En revanche, on sait que l'Europe n'est pas prioritaire, la faute au DMA selon Apple, qui continue de rouspéter contre le nouveau cadre réglementaire.
L’autre gros problème est la compatibilité matérielle. Si les Mac et iPad s’en sortent relativement bien en réclamant au minimum un M1, la liste des iPhone se résume à un seul appareil : le 15 Pro (et sa déclinaison Max). Un seul appareil : Apple cherche-t-elle à rendre brutalement tous ses appareils ringards et à créer une frénésie de renouvellements ?
Ce n'est « pas un stratagème », assure Apple
C’est la question posée à l’entreprise par John Gruber (Daring Fireball) dans un entretien avec John Giannandrea, responsable de l'IA et de l'apprentissage automatique chez Apple, Greg Joswiak, responsable du marketing, et Craig Federighi, responsable de l'ingénierie logicielle. En résumé, la réponse des responsables est sans surprise : « bien sûr que non ».
Giannandrea commence par expliquer que « l’inférence des grands modèles de langage est incroyablement couteuse en termes de calcul ». « La combinaison de la bande passante de l'appareil, de la taille de l'Apple Neural Engine et de la puissance de l'appareil permet d'exécuter ces modèles suffisamment rapidement pour qu'ils soient utiles. En théorie, vous pourriez exécuter ces modèles sur un très vieil appareil, mais ils seraient tellement lents qu'ils ne seraient pas utiles », ajoute-t-il.
« Ce n'est donc pas un stratagème pour vendre de nouveaux iPhone ? », a demandé John Gruber pour confirmation ». « Non, pas du tout », a répondu Greg Joswiak. Et d’ajouter que si la volonté avait été effectivement de vendre un maximum de produits récents, la compatibilité des iPad et Mac ne serait pas remontée jusqu’à la puce M1.
Une simple question de NPU ?
Pour y voir un peu plus clair, nous avons résumé les caractéristiques des puces compatibles avec Apple Intelligence.
Dans la partie qui nous intéresse – Neural Engine – on remarque vite que la puissance fournie diffère largement d'une puce à l'autre, en dépit des 16 cœurs à chaque fois. Si l’on regarde un peu plus attentivement, on observe un détail étrange : la puce A17 Pro, qui équipe les iPhone 15 Pro, fournit une puissance de 35 TOPS (chiffre donné pendant la conférence, à partir de 1h03), là où le M1 n’en fournit que 11. Mais alors, la puce A16 et ses 17 TOPS, ou même la puce A15 et ses 15,8 TOPS ne sont-elles pas suffisantes ? Apple aurait-elle menti ?
Il y a deux éléments importants à savoir. Premièrement, Apple ne donne jamais la précision utilisée. Lors de la présentation de la puce M4, la firme a donné le chiffre de 38 TOPS. Un bond de géant face aux 18 TOPS du M3. Mais Apple a peut-être simplement recouru à une astuce désormais classique : les 18 TOPS du M3 seraient en précision INT16, là où les 38 TOPS du M4 seraient en INT8. L’équivalent en INT16 serait alors de 19 TOPS (la moitié), représentant une amélioration à la marge du NPU entre deux générations très proches.
Conséquence, il est délicat devant ces chiffres de se positionner sur la puissance réellement requise pour faire fonctionner Apple Intelligence localement. Il est probable que les chiffres donnés pour les puces A17 Pro et M4 soient en INT8 (sur ce principe, l’A17 Pro serait à 17,5 TOPS en INT16), contre INT16 pour les autres. Auquel cas, les 11 TOPS de la puce M1 suffisent manifestement, puisque Apple Intelligence y fonctionne.
Le discret facteur mémoire, et pourtant
Deuxièmement, il faut considérer la mémoire vive. Dans l’entretien avec John Gruber, Craig Federighi laisse entendre que la RAM est un autre aspect important de l’équation. Il pourrait même s’agir du facteur déterminant : tous les appareils compatibles avec Apple intelligence ont 8 Go de mémoire au moins.
Ces 8 Go sont devenus le nouveau minimum des premiers Mac M1. Apple n’a d’ailleurs toujours pas rehaussé cette quantité minimale en 2024. On espère que l’arrivée des PC Copilot+ et leur minimum de 16 Go bousculera un peu les choses. Les iPad Air et Pro équipés du M1 avaient également 8 Go de mémoire. L’iPad Air M2 les a toujours, tandis que l’iPad Pro M4 grimpe à 16 Go sur les modèles avec 1 ou 2 To de stockage.
Et l’iPhone 15 Pro alors ? Il a 8 Go de mémoire. Aucun autre iPhone ne possède cette quantité, les iPhone 13 Pro et 14 Pro en possèdent ainsi 6 Go.
C'est d'ailleurs l'avis de l'analyste Ming-Chi Kuo, connu pour ses sources et ses prédictions exactes sur les produits Apple. Dans un billet publié le 11 juin, il déduit que la mémoire vive est le facteur limitant réellement la disponibilité d'Apple Intelligence. Selon lui, l'entreprise veut garder environ 2 Go de mémoire pour que son modèle puisse y résider en permanence. Ce qui signifie que les iPhone 15 Pro fonctionneront avec 2 Go de mémoire en moins pour les autres tâches quand Apple Intelligence sera activé. L'analyste se demande si l'évolution d'Apple Intelligence ne sera pas utilisée dans la séparation des gammes classique et Pro des futurs iPhone.
Dans ce contexte, il s’agit d’un signe supplémentaire d’un retard d’Apple dans le domaine de l’intelligence artificielle. Une décision précipitée et un manque de préparation qui auraient poussé l’entreprise à mettre de côté la quasi-totalité des modèles d’iPhone encore supportés. Dommage, si l’on considère que les puces A15 et A16 ont un NPU probablement suffisant pour l’exécution locale des fonctions d’Apple Intelligence.
Un écho chez Google il y a quelques mois
Cette piste de la mémoire minimale est à rapprocher de développements récents chez Google à ce sujet. Fin mars, Google a annoncé que son Gemini Nano, pensé pour les smartphones, serait déployé sur les Pixel 8 Pro, mais pas les Pixel 8. Le premier a 12 Go de mémoire, le second 8 Go.
Dans le podcast maison Made by Google, le vice-président Seang Chau s’était exprimé sur ce point, expliquant notamment que la fonction Smart Reply dopée à Gemini Nano était résidente en mémoire. La firme avait finalement changé d’avis pour le Pixel 8, déployant la fonction, mais sous forme d’option pour les développeurs.
Il est probable que les futurs iPhone 16 tiennent compte de ce besoin conséquent en mémoire, à moins qu'Apple décide de réserver son bouquet Intelligence aux modèles Pro. Même constat pour les Mac, dont le renouvellement à base de M4 (et ses déclinaisons) doit commencer vers la fin de l’année, si on en croit les rumeurs.
Mais où est le cloud ?
Dans cette équation matérielle, où se situe le cloud ? La question mérite d’autant plus d’être posée que l’envoi des requêtes vers les serveurs permettrait de résoudre la problématique du manque de puissance (ou plutôt celui de la quantité de mémoire).
Ce point manque encore de détails. Durant la WWDC, Apple a présenté son infrastructure comme pensée avant tout pour préserver la vie privée des utilisateurs et accueillir les requêtes réclamant plus de puissance que ce que ne peut en offrir un iPhone ou même un Mac. Lesquelles ? On ne sait pas exactement, l’entreprise n’ayant pas donné de détails.
Il est certain en revanche qu’une extension à des gammes d’appareils plus anciennes augmenterait singulièrement la charge sur les serveurs. Si Apple est bel et bien en retard, alors elle tiendra à préserver dans un premier temps cette charge. Ce que peut expliquer le choix de ne lancer Apple Intelligence qu’en anglais et pour les seuls États-Unis dans un premier temps.
Il y a également la question de la cohérence dans l’expérience utilisateur. En réservant une majorité des opérations au traitement local, Apple s’assure que les fonctions sont – dans les grandes lignes – toujours disponibles. Sur d’anciens appareils qui communiqueraient constamment avec des serveurs, l’indisponibilité du réseau entrainerait la coupure de toutes les fonctions.
Apple Intelligence : la mémoire vive comme facteur limitant ?
-
Ce n'est « pas un stratagème », assure Apple
-
Une simple question de NPU ?
-
Le discret facteur mémoire, et pourtant
-
Un écho chez Google il y a quelques mois
-
Mais où est le cloud ?
Commentaires (9)
Le 24/06/2024 à 12h02
Le 24/06/2024 à 12h07
Je ne sais pas vers quoi on se dirige (plutôt j'ai peur de le savoir) mais on y va....
Le 24/06/2024 à 12h12
Si on voulait rendre le matériel obsolète, on ne s'y prendrait pas mieux. Mais bon, ce n'est pas grave, c'est la nature qui paie.
Le 24/06/2024 à 20h32
Le 24/06/2024 à 12h13
De toute façon, vu le « combat » d’Apple avec l’Europe, pas sûr qu’on aura Apple Intelligence avant à minima l’année prochaine.
Le 24/06/2024 à 12h21
Le 24/06/2024 à 13h18
Modifié le 25/06/2024 à 13h23
Sauf qu’il y avait une horrible petite tricherie (enfin classique et typique d’Apple) pour réussir ce « tour de magie » …
Les centaines / milliers d’ingé chez Google ne sont pas plus cons que ceux d’Apple.
Chez Apple, dès qu’une appli passait en arrière plan, elle était automatiquement ʺfreezée” (sauf lecteur musique ou quelques autres bien spécifiques, SMS, Emails…).
Sur Android, Google a toujours autorisé le vrai multitâche… ce qu’Apple a enfin fini par accepter bien bien des années plus tard (ben avec une toute p’tite batterie et pas trop de RAM, ça ne l’aurait pas vraiment fait), mais les fanboys brandissaient fièrement la supériorité de leur iPhone alors que… c’était un appareil amputé et tronqué de son plein potentiel... mais bon vu le cœur de cible des clients... et ca permet aussi de maximiser à donf le profit (3GB + 1440mAh)
Tout juste si Apple n'aurait pas vendu une chaine en or pour le porter autour du cou... (ils vendent bien des petits supports en cuir Hermès pour AirTag à... 300€ / pièce )
Hermès AirTag
Signe extérieur de richesse... ou signe intérieur de médiocrité ?
Le marketing… Fascinant.
.
Modifié le 25/06/2024 à 13h05
2 conclusions s’imposent ici :
1 - être assis sur une montagne de cash ne permet pas d’être les 1ers (à part cramer du cash à détruire ses propres actions… super, N°1 mondial, Bravo Tim) et au passage même pas capable de sortir une voiture après plus de 8 ans d’effort… Looser…
2 – L’argent n’a aucune odeur chez Apple… Quand Tim et Mark se détestent cordialement (Mark et Elon aussi qui devaient se battre dans une cage à la MadMax mais silence radio); Tim et Mark se détestant notamment sur le sujet de la conception du respect à la vie privée mais ça n’empêche nullement Apple de discuter avec Meta quand il y a énormément de $$$ en jeu.