Instances AMP2 (Altra Max 128 cœurs) : Scaleway nous parle de son retour sur ARM 64 bits

Instances AMP2 (Altra Max 128 cœurs) : Scaleway nous parle de son retour sur ARM 64 bits

Présenteeez Arm

Avatar de l'auteur

Vincent Hermann

Publié dansSciences et espace

31/03/2023
11
Instances AMP2 (Altra Max 128 cœurs) : Scaleway nous parle de son retour sur ARM 64 bits

Scaleway a lancé récemment de nouvelles instances utilisant des puces Arm. Baptisées AMP2, l’entreprise française en semble particulièrement fière. Elles ont pourtant un statut « expérimental ». Nous nous sommes entretenus avec Sébastien Luttringer, directeur recherche et développement chez Scaleway pour en savoir plus.

L’architecture Arm a largement gagné en visibilité depuis quelques années. Ce qui n’était essentiellement disponible que dans les téléphones mobiles, les tablettes et autres petits appareils légers se retrouve maintenant dans des ordinateurs et serveurs, même s’il y a toujours eu des offres pour ces derniers.

Côté grand public, le grand changement a été provoqué par Apple. L’arrivée de ses puces M1 et de son architecture Apple Silicon – basée sur les puces Ax des iPhone et iPad – a montré qu’il était possible de faire des machines au rapport performances/watt très au-delà de ce que l’on avait l’habitude de voir. Les variations Pro, Max et Ultra, ainsi que la génération M2 en ont remis une couche.

Chez Scaleway, la première offre Arm est apparue en 2013. Elle a rencontré un certain succès, mais a été arrêtée à l’automne 2021. Avec Sébastien Luttringer, nous revenons sur le parcours de ces offres, les problèmes rencontrés, ainsi que la manière dont les évènements se sont enchainés pour mener au retour actuel.

Instances C1 : des débuts prometteurs, mais complexes

L’idée de serveurs utilisant une architecture Arm est loin d’être neuve chez Scaleway. Elle est née en 2011 d’une discussion entre Arnaud de Bermingham, fondateur et président de Scaleway, et Grégoire de Turckheim, alors directeur recherche et développement, comme nous le raconte Sébastien Luttringer : « Ils aimaient l’idée que l’on puisse bâtir des serveurs avec des puces basse consommation, avec une bonne densité et de bonnes performances ».

L’entreprise se penche alors sur la question et commence à concevoir du matériel basé sur les puces Armada (arm32) de chez Marvell. Deux ans plus tard, Scaleway annonce officiellement que des serveurs ARM seront bientôt mis en vente. Ces instances, nommées C1, sont de type bare metal. « On a vite eu de bons retours et beaucoup de clients », résume Sébastien Luttringer. Google notamment, qui s'en servait à cette époque pour une partie du développement d'Android.

Avec le temps cependant, les problèmes apparaissent. Le responsable nous en cite deux en particulier. D’une part, les capacités d’évolutions de la plateforme, qui tenaient pour l’essentiel à l’écosystème logiciel. « À cette époque, il y avait des bugs dans le noyau Linux. Le kernel était patché par Marvell, donc le suivi était compliqué et on ne pouvait pas l’utiliser dans toutes les distributions Linux. Il n’y avait pas non plus d’UEFI ».

L’autre gros problème à cette époque était la concurrence du x86. Cette architecture « résolvait beaucoup plus de problèmes, il fallait donc trouver un intérêt concret à aller vers ARM », nous explique Luttringer. « Les évolutions Intel Avoton [devenu Atom, ndlr] et Denverton avaient permis d’augmenter le nombre de cœurs et de diminuer la consommation, et donc d’avoir à peu près le même rapport performances/watt ».

Résultat : « On s’est rendu compte qu’il n’était pas rentable pour nous de développer notre propre matériel dédié, avec des cartes personnalisées ».

En 2017, l’entreprise tente une évolution importante : un passage à l’architecture arm64. « Pour ça, on a utilisé des puces ThunderX de chez Cavium. C’était une tentative, et ça ne s’est pas très bien passé. On a découvert des bugs dans les processeurs. Nous en avons parlé à Cavium et le problème venait de la conception des puces, qui entrainait des erreurs logiques », nous raconte Sébastien Luttringer. Il ajoute que ces erreurs ont pu être réglées par plusieurs mises à jour de firmwares, mais que la situation restait complexe, en particulier à cause de l'absence de solutions logicielles.

Ces instances ont beau avoir été créées en 2017, elles ont été arrêtées plus tôt que les C1 : en 2020. L’aventure arm64 a donc tourné court chez Scaleway, mais pas pour longtemps.

Une nouvelle division R&D et le retour d’arm64

En février 2022, Sébastien Luttringer est embauché chez Scaleway comme responsable de recherche et développement. Cette division avait été en quelque sorte délaissée depuis quelques années et l’entreprise avait à cœur de la relancer, notamment pour tester des idées qui n’auraient pas d’impératif de commercialisation, dans une optique itérative de laboratoire.

Les choses vont alors s’enchainer rapidement. En juillet, sous l’impulsion d'Arnaud de Bermingham (président), Yann Lechelle (directeur général) et Sébastien Luttringer (directeur R&D), il est décidé que des essais seront faits sur de nouveaux serveurs arm64. Scaleway, qui avait noué un partenariat avec la société Ampere en 2020, conçoit ainsi des serveurs basés sur les puces Altra. Les résultats préliminaires sont encourageants et Scaleway poursuit.

En quelques mois, l’entreprise parvient à un résultat fonctionnel, avec des instances AMP1, non commercialisées. Cette fois, aucun problème majeur n’est rencontré. Surtout, l’écosystème logiciel a beaucoup évolué en trois ans. Il est donc envisagé une commercialisation. Cette décision est prise en janvier dernier, avec une annonce quelques semaines plus tard. Ce sont les annonces AMP2 que Scaleway propose avec un statut expérimental.

Chat échaudé craindrait-il l’eau froide ? « Oui », nous répond simplement Sébastien Luttringer. « Nous sommes justement allés très vite, et même si nous sommes assez confiants dans le résultat, le temps a manqué pour des tests poussés. Nous préférons donc être prudents ».

Pourtant, comme il le dit lui-même, ce statut « expérimental » ne convient pas tout à fait à décrire le produit. Il nous explique en effet que ces instances sont « iso prod », comprendre qu’elles répondent à de nombreux standards internes. Ces serveurs sont avec les autres et gérés de la même manière.

En revanche, le niveau de service (SLA) est de 0 %, l’information est clairement indiquée sur la page de présentation. Ce qui signifie qu’elles peuvent être modifiées, arrêtées ou même supprimées à tout moment, et qu’il n’y a aucune garantie sur les temps de récupération.

Caractéristiques techniques et tarifs

Les instances AMP2 sont virtualisées et proposées selon une formule dépendant du nombre de vCPU (processeurs virtuels). L’instance AMP2-C1, la première, propose ainsi un vCPU, 1,75 Gio de RAM, 100 Mb/s de bande passante réseau, 335 Mb/s de bande passante stockage, le tout pour un prix horaire de 0,005007 euro HT, ou pour 3,66 euros HT par mois.

Scaleway AMP2

Si l’on regarde le tableau ci-dessus, on se rend compte que l’évolution dans la formule n’est pas linéaire. Sébastien Luttringer nous le confirme : elle est affine. La formule permettant de calculer la quantité de mémoire est simple : nombre de cœur x 2 - 256 Mio. 24 cœurs donnent ainsi droit à 47,75 Gio de mémoire. 

C’est l’un des points sur lesquels l’entreprise attend des retours, tout comme la tarification. À titre d’exemple, le responsable évoque la question de la RAM octroyée, qui n’est « pas un compte rond », comprendre un multiple de 2. « On a eu quelques retours à ce sujet, des gens en étaient étonnés, et c’est un point que nous surveillons, car il ne faudrait pas qu’ils fassent demi-tour à cause d’une offre qui manquerait de lisibilité ».

Les puces Altra Max sont 64 bits et de type ARMv8.2, avec une fréquence pouvant varier de 3 GHz. Ces processeurs contiennent 128 cœurs et affichent un TDP (enveloppe thermique) de 250 W. Ils sont épaulés par de la DDR4. Les instances ne sont pour l’instant disponibles que dans la seule région PAR2 (Paris).

Les avantages mis en avant sont la compilation pour les applications Arm, le développement et l’entrainement des modèles IA (TensorFlow, PyTorch et ONNX sont supportés), le transcodage vidéo et le traitement de gros volumes de données (big data).

Mais dans ce cas, si Scaleway estime ne pas avoir assez de recul et affiche ce statut expérimental, pourquoi les faire payer ? « Plusieurs raisons », explique Sébastien Luttringer. « D’abord pour éviter la fraude avec des instances en libre accès. Ensuite, pour pousser les personnes intéressées à prendre les instances dont elles ont réellement besoin, parce que nous voulons des retours là-dessus. Enfin, et ça peut paraître bête… pour qu’ils les rendent quand ils n’en ont plus besoin ».

Il n’y a pour l’instant aucune date de fournie pour une commercialisation complète de ces instances. Il s’agit d’un test et Scaleway compte s’en servir pour mesurer notamment l’enthousiasme vis-à-vis d’arm64.

Nous testerons bientôt ces instances AMP2 pour en mesurer les performances.

11
Avatar de l'auteur

Écrit par Vincent Hermann

Tiens, en parlant de ça :

#Flock a sa propre vision de l’inclusion

Retour à l’envoyeur

13:39 Flock 15
Un Sébastien transformé en lapin par Flock pour imiter le Quoi de neuf Docteur des Looney Tunes

Quoi de neuf à la rédac’ #10 : nous contacter et résumé de la semaine

On est déjà à la V2 de Next ?

11:55 21
Autoportrait Sébastien

[Autoportrait] Sébastien Gavois : tribulations d’un pigiste devenu rédac’ chef

Me voilà à poil sur Internet

17:18 Next 16

Sommaire de l'article

Introduction

Instances C1 : des débuts prometteurs, mais complexes

Une nouvelle division R&D et le retour d’arm64

Caractéristiques techniques et tarifs

#Flock a sa propre vision de l’inclusion

Flock 15
Un Sébastien transformé en lapin par Flock pour imiter le Quoi de neuf Docteur des Looney Tunes

Quoi de neuf à la rédac’ #10 : nous contacter et résumé de la semaine

21
Autoportrait Sébastien

[Autoportrait] Sébastien Gavois : tribulations d’un pigiste devenu rédac’ chef

Next 16
Logo de StreetPress

Pourquoi le site du média StreetPress a été momentanément inaccessible

Droit 13
Amazon re:Invent

re:Invent 2023 : Amazon lance son assistant Q et plusieurs services IA, dont la génération d’images

IA 10
Un œil symbolisant l'Union européenne, et les dissensions et problèmes afférents

Le Conseil de l’UE tire un bilan du RGPD, les États membres réclament des « outils pratiques »

Droit 4

19 associations européennes de consommateurs portent plainte contre Meta

DroitSocials 14

#LeBrief : Ariane 6 l’été prochain, Nextcloud rachète Roundcube, désinformation via la pub

Chiffre et formules mathématiques sur un tableau

CVSS 4.0 : dur, dur, d’être un expert !

Sécu 11
Une tête de fusée siglée Starlink.

Starlink accessible à Gaza sous contrôle de l’administration israélienne

Web 34
Fibre optique

G-PON, XGS-PON et 50G-PON : jusqu’à 50 Gb/s en fibre optique

HardWeb 51
Photo d'un immeuble troué de part en part

Règlement sur la cyber-résilience : les instances européennes en passe de conclure un accord

DroitSécu 10
lexique IA parodie

AGI, GPAI, modèles de fondation… de quoi on parle ?

IA 10

#LeBrief : logiciels libres scientifiques, fermeture de compte Google, « fabriquer » des femmes pour l’inclusion

livre dématérialisé

Des chercheurs ont élaboré une technique d’extraction des données d’entrainement de ChatGPT

IAScience 3
Un chien avec des lunettes apprend sur une tablette

Devenir expert en sécurité informatique en 3 clics

Sécu 11
Logo ownCloud

ownCloud : faille béante dans les déploiements conteneurisés utilisant graphapi

Sécu 16
Le SoC Graviton4 d’Amazon AWS posé sur une table

Amazon re:invent : SoC Graviton4 (Arm), instance R8g et Trainium2 pour l’IA

Hard 12
Logo Comcybergend

Guéguerre des polices dans le cyber (OFAC et ComCyberMi)

Sécu 10

#LeBrief : faille 0-day dans Chrome, smartphones à Hong Kong, 25 ans de la Dreamcast

Mur d’OVHcloud à Roubaix, avec le logo OVHcloud

OVHcloud Summit 2023 : SecNumCloud, IA et Local Zones

HardWeb 2
algorithmes de la CAF

Transparence, discriminations : les questions soulevées par l’algorithme de la CAF

IASociété 62

Plainte contre l’alternative paiement ou publicité comportementale de Meta

DroitIA 38
Nuage (pour le cloud) avec de la foudre

Économie de la donnée et services de cloud : l’Arcep renforce ses troupes

DroitWeb 0
De vieux ciseaux posés sur une surface en bois

Plus de 60 % des demandes de suppression reçues par Google émanent de Russie

Société 7
Une vieille boussole posée sur un plan en bois

La Commission européenne et Google proposent deux bases de données de fact-checks

DroitWeb 3

#LeBrief : des fichiers Google Drive disparaissent, FreeBSD 14, caméras camouflées, OnePlus 12

Le poing Dev – round 6

Next 151

Produits dangereux sur le web : nouvelles obligations en vue pour les marketplaces

Droit 9
consommation de l'ia

Usages et frugalité : quelle place pour les IA dans la société de demain ?

IA 12

La NASA établit une liaison laser à 16 millions de km, les essais continuent

Science 17
Concept de CPU

Semi-conducteurs : un important accord entre l’Europe et l’Inde

Hard 7

#LeBrief : PS5 Slim en France, Valeo porte plainte contre NVIDIA, pertes publicitaires X/Twitter

next n'a pas de brief le week-end

Le Brief ne travaille pas le week-end.
C'est dur, mais c'est comme ça.
Allez donc dans une forêt lointaine,
Éloignez-vous de ce clavier pour une fois !

Commentaires (11)


refuznik Abonné
Il y a 8 mois

Pour vos prochains tests pourriez inclure de l’anim./rendu Blender, histoire de se faire une idée ? Merci.


cognitys Abonné
Il y a 8 mois

“des débuts prometteurs, mais complexes” il faut aussi citer les nombreux bugs chez eux via l’api ou la console… A l’époque j’ai eu le projet idéal pour utiliser leur “cloud arm”, j’ai tellement eu de soucis pendant mes tests que j’ai laché l’affaire… inutilisable, des sessions qui se lancent mais reste bloquées, etc…



je pourrais aussi citer les problèmes de stock… à quoi bon prévoir une archi scalable si aucune instance n’est dispo pour scaler…



bref, je suis chez eux pour les dédiés sur lesquels je n’ai pas grand chose à redire, pour le reste je repasserai voir ce que ca donne dans 5 ans…


Flyman81 Abonné
Il y a 8 mois

Je profite de cet article pour vous dire au revoir, mon abonnement expire demain après 68 mois d’ancienneté sur l’abonnement, et plus de 10 ans à vous suivre (PC INpact!!).



Les nouveaux tarifs ont eu raison de mon soutien, 64€ l’année (plus de 5€ par mois) après la remise d’ancienneté c’est trop pour moi.
J’avais bien suivi l’article sur la mise à jour des offres, et comme certains je pense que le salut passerait plutôt par l’élargissement de l’audience plutôt qu’augmenter fortement les tarifs avec une poignées d’aficionados qui va s’éroder dans le temps.
Mais j’espère ne pas faire partie de la majorité silencieuse et que votre pari va fonctionner.



Je vous remercie et vous félicite encore pour la qualité de vos articles. Vous êtes d’intérêt public et bien trop peu reconnus et visibles pour ça.
Au plaisir de vous retrouver au détour d’une future promo (pour info mon seuil a toujours été moins de 40€ par an = ~3€ par mois).



Fly


cognitys Abonné
Il y a 8 mois

ca tombe bien il y a une promo a 48


Flyman81 Abonné
Il y a 8 mois

cognitys

ca tombe bien il y a une promo a 48

Effectivement je viens de voir, ça tombe à point nommé pour moi.
38,4€ avec la réduction ancienneté, c’est un poil plus que ma limite habituelle mais avec l’inflation c’est pas déconnant.
C’est donc reparti pour 1 an ! (il y aurait eu une décote supplémentaire pour 2 ans au lieu d’un seul j’aurais pu opter pour 2)



Bref, I’m back ^^


hwti Abonné
Il y a 8 mois

C’est quand même bien plus cher que les C1 à l’origine (2€ puis 3€ par mois pour du bare-metal, avec 4 cœurs certes moins puissants, et 2Go de RAM).



Là entre un AMP2-C2 et un DEV-1S (EPYC 7281, 2 vCPUs, 2Go de RAM, possibilité de stockage local), je ne suis pas sûr que arm64 soit plus intéressant que x86.




Les avantages mis en avant sont la compilation pour les applications Arm




A part pour les tests des applications, il y a la cross-compilation : pas besoin d’une machine arm pour compiler pour arm.


OlivierJ Abonné
Il y a 8 mois

Flyman81 a dit:


Je profite de cet article pour vous dire au revoir, mon abonnement expire demain après 68 mois d’ancienneté sur l’abonnement, et plus de 10 ans à vous suivre (PC INpact!!).



Les nouveaux tarifs ont eu raison de mon soutien, 64€ l’année (plus de 5€ par mois) après la remise d’ancienneté c’est trop pour moi.




Franchement, si on s’intéresse à l’informatique, qu’on possède un ordinateur (et sans doute un mobile), faire un croix pour 5 E/mois (c’est dérisoire quand même, c’est même pas un menu fast-food), j’ai du mal à comprendre. Même quand j’étais étudiant (pas riche) j’aurais pu me payer ça.


Vincent_H Abonné
Il y a 8 mois

Il n’y avait sans doute pas autant d’abonnements que maintenant, c’est un point que nous comprenons très bien :chinois:


flan_ Abonné
Il y a 8 mois

Je vous remercie et vous félicite encore pour la qualité de vos articles. Vous êtes d’intérêt public et bien trop peu reconnus et visibles pour ça




Si seulement on pouvait avoir plus d’équivalents (des journalistes sérieux qui essaient de bien faire leur boulot) de NextInpact dans la presse généraliste !


Exagone313 Abonné
Il y a 8 mois

Cette offre est-elle déjà disponible ? Je ne la vois pas citée dans la liste des betas.


Vincent_H Abonné
Il y a 8 mois

Elles sont sur cette page oui, j’ai ajouté le lien dans l’article.