OAM : un format commun d’accélérateurs annoncé à l’Open Compute Summit
Intel déjà sur le coup
Le 15 mars 2019 à 09h25
3 min
Hardware
Hardware
Alors que les accélérateurs se multiplient dans les datacenters et que les protocoles d'interconnexion sont en pleine évolution, l'Open Compute Project a travaillé sur un nouveau format de cartes permettant l'intégration de plus de puces dans une même baie de 19" : OAM.
Avec la diversification des charges de travail, mais aussi des solutions matérielles exploitées pour les traiter (CPU, GPU, NPU, FPGA, ASIC, etc.), un problème commence à se poser dans les datacenters : quel format utiliser ? On pourrait penser aux cartes PCI Express, mais celles-ci occupent une place parfois importante.
Unifier les efforts pour un autre format d'accélérateurs
On a par exemple vu NVIDIA proposer des cartes SXM2 (140 mm x 78 mm) pour ses Tesla V100, au PCB minimal. Cette connectique dispose d'un autre avantage : elle peut exploiter nativement NVLink, avec une bande passante de 300 Go/s, contre 32 Go/s lorsqu'elle est utilisée en PCIe 3.0. Son TDP passe par contre de 250 à 300 watts. Ces modules sont utilisés dans de nombreux serveurs, dont les DGX de NVIDIA.
Mais sans standard clairement défini, le risque est donc de voir chaque constructeur utiliser ses propres formats et interconnexions, réduisant l'interopérabilité de l'ensemble et complexifiant la conception des serveurs. C'est pourquoi l'Open Compute Project s'est penché sur la question, aboutissant à l'OCP Accelerator Modules (OAM).
Ce projet est pris en charge par des représentants de Baidu, Facebook et Microsoft, membres de l'OCP. Ces modules prendront la forme de cartes de 165 x 102 mm, un peu plus gros que les SXM2. Ils doivent pouvoir accueillir une ou plusieurs puces, l'objectif étant de placer jusqu'à huit OAM dans un châssis de 19".
L'alimentation est de 12 V ou 48 V. De quoi obtenir des TDP de 350 ou 700 watts, un refroidissement à air (jusqu'à 450 watts) ou liquide (jusqu'à 700 watts) pouvant être utilisé.
Deux connecteurs mezzanine sont utilisés, sans qu'aucun détail ne soit donné les concernant pour le moment. L'OCP précise simplement que jusqu'à huit liens x16 peuvent être exploités : sept au maximum pour les interconnexions, un ou deux pour le lien à l'hôte. De quoi permettre d'établir différentes topologies selon les besoins.
Un premier produit OAM chez Intel, CXL sans doute en ligne de mire
Intel a déjà évoqué la seconde génération de ses puces Nervana (Spring Crest), qui entrera en production cette année, comme exploitant le format OAM. On attend plus de détails dans la journée.
On imagine que le PCI Express sera dans un premier temps utilisé, mais que le constructeur cherchera rapidement à migrer sur Compute Express Link (CXL), dévoilé en début de semaine. Mais ce protocole n'est pas attendu dans des produits avant 2021, et devra se faire une place au côté d'autres initiatives comme CCIX (notre analyse).
Facebook étant à la fois partenaire d'Intel sur ce projet et membre fondateur de l'OCP, on imagine que les initiatives finiront par se rejoindre à un moment donné.
=>
OCP Infrastructure for Workload Optimization, Intel, OCP Summit, Mar 14, 2019 https://t.co/vJhc7Uccghhttps://t.co/xwTj2zdFM8
Intel Nervana Neural Network Processor
OAM: Training
M.2: Inference
OAM https://t.co/uJG1lrzm8S
M.2 https://t.co/c6UwnJGWr3
CXL https://t.co/8HQ1gHPCkN pic.twitter.com/f0NB5YAm4C— OGAWA, Tadashi (@ogawa_tter) 14 mars 2019
OAM : un format commun d’accélérateurs annoncé à l’Open Compute Summit
-
Unifier les efforts pour un autre format d'accélérateurs
-
Un premier produit OAM chez Intel, CXL sans doute en ligne de mire
Commentaires (5)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 15/03/2019 à 18h32
C’est quoi un accélerateur ? Un Pentium 4 ou bien ?
Le 15/03/2019 à 23h46
Effectivement, un peu de pédagogie serait appréciée, je ne suis pas sûr d’avoir bien compris l’objet de l’article. Ce serait pas mal de donner la définition d’un accélérateur :)
Le 16/03/2019 à 05h48
Tout ce qui apporte une accélération matérielle ou un complément au CPU, comme évoqué dans l’article : GPU, NPU, FPGA, ASIC, etc.
Le 16/03/2019 à 07h41
Pas trouvé cet article. Un lien ???
Le 16/03/2019 à 22h13
Merci David pour l’explication