SmartSSD (U.2) de Samsung : 3,84 To de stockage et un FPGA Xilinx

SmartSSD (U.2) de Samsung : 3,84 To de stockage et un FPGA Xilinx

Un CPU, un GPU et on réinvente l’ordinateur

Avatar de l'auteur

Sébastien Gavois

Publié dansHardware

19/11/2020
12
SmartSSD (U.2) de Samsung : 3,84 To de stockage et un FPGA Xilinx

Petit à petit, les accélérateurs se rapprochent des sources de données. C'est le cas avec les SmartSSD, où Xilinx se place directement dans un périphérique de stockage Samsung.

Samsung avait déjà présenté son SmartSSD – dans la famille des Computational Storage Drive (CSD) – fin 2018. Il était alors question d’une carte PCIe. Le fabricant revient avec une nouvelle version, sous la forme d’un SSD de 2,5" en U.2. 

Il propose pour le moment 3,84 To de stockage via de la V-NAND de Samsung, sans plus de précision. Mais l'on sait d'ores et déjà que d’autres capacités suivront. Les débits sont de 3,5 Go/s en lecture et 3,2 Go/s en écriture (respectivement 800 et 135 kIOPS), avec une endurance de 1 DWPD (Drive Write Per Day) pendant cinq ans.

Une puce KintexUltrascale+ KU15P au plus près des données

Mais surtout ce Smart SSD intègre un FPGA (Field Programmable Gate Arrays) de chez Xilinx pour effectuer des calculs. Il s’agit en l’occurrence d’un KintexUltrascale+ KU15P, avec 4 Go de DDR4. Pour rappel, AMD a officialisé le rachat de cette société, pour 35 milliards de dollars en action, la finalisation n’est pas attendue avant fin 2021. 

Le SmartSSD peut ainsi effectuer directement des calculs sur les données dont il dispose, sans avoir besoin de passer par le CPU de la machine. Le fabricant affirme que cela permet « d’importants gains de performances […] tout en libérant le processeur qui peut gérer plus efficacement d'autres tâches ».

Xilinx Samsung SmartSSD

Des améliorations de performances « jusqu’à 10 fois ou plus »

Le FPGA prend en charge la plateforme unifiée Vitis afin de faciliter « la création de nouveaux accélérateurs et leur intégration dans les applications ». Xilinx cite en exemple des fonctionnalités telles que dm-crypt et Virtual Data Optimizer.

De manière générale, la société affirme que le « SmartSSD accélère considérablement les applications gourmandes en données, jusqu’à 10 fois ou plus ». Selon des tests internes, il est par exemple question d’un gain de 2,8x sur les requêtes SQL et d’une réduction de 87 % de l’utilisation du CPU pour du transcodage vidéo.

Plus on ajoute de SmartSSD, plus on dispose de FPGA et plus les gains peuvent être importants. De plus amples détails sont disponibles sur cette page et celle-ci.

Xilinx Samsung SmartSSDXilinx Samsung SmartSSD

Précommande ouverte, pour le tarif on repassera

Des démonstrations ont été proposées durant le Flash Memory Summit 2020 qui vient de se terminer. Les précommandes sont ouvertes, avec une disponibilité prévue pour le mois de janvier. Le tarif n’est pas précisé.

12
Avatar de l'auteur

Écrit par Sébastien Gavois

Tiens, en parlant de ça :

livre dématérialisé

Des chercheurs ont élaboré une technique d’extraction des données d’entrainement de ChatGPT

Toxique de répétition

17:15IA et algorithmesSciences et espace 3
Un chien avec des lunettes apprend sur une tablette

Devenir expert en sécurité informatique en 3 clics

Ou comment briller en société (de service)

16:53Sécurité 10
Logo ownCloud

ownCloud : faille béante dans les déploiements conteneurisés utilisant graphapi

Dangereuse, mais spécifique ?

15:57Sécurité 15

Sommaire de l'article

Introduction

Une puce KintexUltrascale+ KU15P au plus près des données

Des améliorations de performances « jusqu’à 10 fois ou plus »

Précommande ouverte, pour le tarif on repassera

livre dématérialisé

Des chercheurs ont élaboré une technique d’extraction des données d’entrainement de ChatGPT

IA et algorithmesSciences et espace 3
Un chien avec des lunettes apprend sur une tablette

Devenir expert en sécurité informatique en 3 clics

Sécurité 10
Logo ownCloud

ownCloud : faille béante dans les déploiements conteneurisés utilisant graphapi

Sécurité 15
Le SoC Graviton4 d’Amazon AWS posé sur une table

Amazon re:invent : SoC Graviton4 (Arm), instance R8g et Trainium2 pour l’IA

Hardware 4
Logo Comcybergend

Guéguerre des polices dans le cyber (OFAC et ComCyberMi)

Sécurité 10

#LeBrief : faille 0-day dans Chrome, smartphones à Hong Kong, 25 ans de la Dreamcast

0
Mur d’OVHcloud à Roubaix, avec le logo OVHcloud

OVHcloud Summit 2023 : SecNumCloud, IA et Local Zones

HardwareInternet 2
algorithmes de la CAF

Transparence, discriminations : les questions soulevées par l’algorithme de la CAF

IA et algorithmesSociété numérique 58

Plainte contre l’alternative paiement ou publicité comportementale de Meta

DroitIA et algorithmes 31
Nuage (pour le cloud) avec de la foudre

Économie de la donnée et services de cloud : l’Arcep renforce ses troupes

DroitInternet 0
De vieux ciseaux posés sur une surface en bois

Plus de 60 % des demandes de suppression reçues par Google émanent de Russie

Société numérique 4
Une vieille boussole posée sur un plan en bois

La Commission européenne et Google proposent deux bases de données de fact-checks

DroitInternet 3

#LeBrief : des fichiers Google Drive disparaissent, FreeBSD 14, caméras camouflées, OnePlus 12

0

Le poing Dev – round 6

Next 146

Produits dangereux sur le web : nouvelles obligations en vue pour les marketplaces

Droit 9
consommation de l'ia

Usages et frugalité : quelle place pour les IA dans la société de demain ?

IA et algorithmes 12

La NASA établit une liaison laser à 16 millions de km, les essais continuent

Sciences et espace 17
Concept de CPU

Semi-conducteurs : un important accord entre l’Europe et l’Inde

Hardware 7

#LeBrief : PS5 Slim en France, Valeo porte plainte contre NVIDIA, pertes publicitaires X/Twitter

0
Un mélange entre une réunion d’Anonymous et de tête d’ampoules, pour le meilleur et le pire

651e édition des LIDD : Liens Intelligents Du Dimanche

Internet 30
Bannière de Flock avec des bomes sur un fond rouge

#Flock, le grand remplacement par les intelligences artificielles

Flock 34
Un Sébastien transformé en lapin par Flock pour imiter le Quoi de neuf Docteur des Looney Tunes

Quoi de neuf à la rédac’ #9 : LeBrief 2.0, ligne édito, dossiers de fond

Next 65
Pilule rouge et bleue avec des messages codés

Encapsulation de clés et chiffrement d’enveloppes

Sécurité 31
Empreinte digital sur une capteur

Empreintes digitales : les capteurs Windows Hello loin d’être exemplaires

Sécurité 20

#LeBrief : succès du test d’Ariane 6, réparer plutôt que remplacer, Broadcom finalise le rachat de VMware

0
Le brief de ce matin n'est pas encore là

Partez acheter vos croissants
Et faites chauffer votre bouilloire,
Le brief arrive dans un instant,
Tout frais du matin, gardez espoir.

Commentaires (12)


yohansolo Abonné
Il y a 3 ans

Plus on avance dans l’informatique moderne, plus je réalise qu’on revient aux prémices de celle-ci. Rappelez vous des co-processeurs arithmétiques des débuts.
On commence à ajouter des excroissances à nos CPU pour les libérer de calculs…



(3615malife) Rien à voir, mais en parlant de ça, j’ai des images de l’Amstrad pc1512 de mon père qui me reviennent :p
que de beaux souvenirs sur Gem Paint et l’outil de dessin en langage Basic ^_^


Magyar Abonné
Il y a 3 ans

Hum, le problème des FPGA, c’est que ça peut faire une chose très efficacement, mais qu’une seule chose.
Donc si tu développes un accélérateur pour une tache, du coup il faut que tes 3.84To de données soit affectés à cette seule utilité (enfin c’est la compréhension que j’en ai). Donc évidemment ça peut avoir son utilité quand tu es un pro d’un domaine particulier, mais a voir niveau tarif, par rapport à avoir des RAID de NVMe + un plus gros CPU.
Et j’espère leur plateforme Vitis elle simplifie par rapport au VHDL, car ce truc c’est vraiment a pain in the ass…


Magyar Abonné
Il y a 3 ans

yohansolo a dit:


Plus on avance dans l’informatique moderne, plus je réalise qu’on revient aux prémices de celle-ci. Rappelez vous des co-processeurs arithmétiques des débuts. On commence à ajouter des excroissances à nos CPU pour les libérer de calculs…



(3615malife) Rien à voir, mais en parlant de ça, j’ai des images de l’Amstrad pc1512 de mon père qui me reviennent :p que de beaux souvenirs sur Gem Paint et l’outil de dessin en langage Basic ^_^




C’est toujours le cas, ça s’appelle un MAC, c’est juste que c’est gravé avec le reste du CPU sur le même silicium


ErGo_404
Il y a 3 ans

Je ne sais plus où j’avais vu ça, mais il me semblait qu’il existait déjà des machines avec des FPGA intégrés qui pouvaient être reprogrammés à la volée pour accélérer matériellement la tâche en cours.



En tous cas le gain annoncé est impressionnant, reste à voir si c’est assez ouvert pour que tous les systèmes en profitent.


Qruby Abonné
Il y a 3 ans

Magyar a dit:


Hum, le problème des FPGA, c’est que ça peut faire une chose très efficacement, mais qu’une seule chose. Donc si tu développes un accélérateur pour une tache, du coup il faut que tes 3.84To de données soit affectés à cette seule utilité (enfin c’est la compréhension que j’en ai). Donc évidemment ça peut avoir son utilité quand tu es un pro d’un domaine particulier, mais a voir niveau tarif, par rapport à avoir des RAID de NVMe + un plus gros CPU. Et j’espère leur plateforme Vitis elle simplifie par rapport au VHDL, car ce truc c’est vraiment a pain in the ass…




C’est tout l’intérêt de la partie “FP” du FPGA: ça se reprogramme très vite, de l’ordre de la milliseconde. Du coup on peut très bien imaginer avoir un jeu d’applications pour les opérations les plus gourmandes et une automatisation pour basculer d’un mode à un autre.


tazvld Abonné
Il y a 3 ans

Je me trompe peut-être, mais un FPGA, c’est justement reprogrammable (pas forcément rapidement).



Il me semble en effet qu’un FPGA est un cicruit avec plein de porte logique, et on peu le programmer en bloquant ou ouvrant les lignes entre les portes.



De plus, à l’époque que j’avais entendu parler de ça, on m’avait expliqué qu’en plus de coûter un bras, ce n’était pas très efficace, son principale intérêt, c’était pour faire du prototypage de puce.


patos Abonné
Il y a 3 ans

tazvld a dit:


De plus, à l’époque que j’avais entendu parler de ça, on m’avait expliqué qu’en plus de coûter un bras, ce n’était pas très efficace, son principale intérêt, c’était pour faire du prototypage de puce.




Le FPGA est l’intermédiaire entre un ASIC et un CPU: ça a une partie de la performance de l’ASIC avec une partie de la programmabilité du CPU.


elldekaa Abonné
Il y a 3 ans

tazvld a dit:


Je me trompe peut-être, mais un FPGA, c’est justement reprogrammable (pas forcément rapidement).




La programmation du FPGA est rapide. Ce qui est lent c’est la synthèse du programme qui tourne dessus (l’équivalent de la compilation pour un FPGA). Selon la taille du programme et du FPGA, c’est rapidement 1 heure de compilation. Mais une fois que le programme est compilé, c’est très rapide de programmer le FPGA (de l’ordre de la milliseconde). Il y a même des FPGAs qui se peuvent se reprogrammer partiellement pendant l’exécution.




tazvld a dit:


De plus, à l’époque que j’avais entendu parler de ça, on m’avait expliqué qu’en plus de coûter un bras, ce n’était pas très efficace, son principale intérêt, c’était pour faire du prototypage de puce.




Le principal avantage du FPGA c’est son parallélisme quasi sans limite: selon le problème les FPGAs peuvent être plus efficace que les CPUs/GPUs. Le principal problème c’est la fréquence maximum liée à la technologie utilisé mais aussi à l’application qu’il exécute (chemin critique du circuit programmé).


cyrano2 Abonné
Il y a 3 ans

elldekaa a dit:


Mais une fois que le programme est compilé, c’est très rapide de programmer le FPGA (de l’ordre de la milliseconde).




Ce n’est pas toujours le cas. Si tu utilises une mémoire flash série et que le fpga est gros, cela peut être plus long.


Magyar Abonné
Il y a 3 ans

Qruby a dit:


C’est tout l’intérêt de la partie “FP” du FPGA: ça se reprogramme très vite, de l’ordre de la milliseconde. Du coup on peut très bien imaginer avoir un jeu d’applications pour les opérations les plus gourmandes et une automatisation pour basculer d’un mode à un autre.



tazvld a dit:


Je me trompe peut-être, mais un FPGA, c’est justement reprogrammable (pas forcément rapidement).



Il me semble en effet qu’un FPGA est un cicruit avec plein de porte logique, et on peu le programmer en bloquant ou ouvrant les lignes entre les portes.



De plus, à l’époque que j’avais entendu parler de ça, on m’avait expliqué qu’en plus de coûter un bras, ce n’était pas très efficace, son principale intérêt, c’était pour faire du prototypage de puce.




Oui effectivement, je me suis mal exprimé. Je voulais dire “qu’une seule chose à la fois au même moment”


gremi Abonné
Il y a 3 ans

yohansolo a dit:


Plus on avance dans l’informatique moderne, plus je réalise qu’on revient aux prémices de celle-ci. Rappelez vous des co-processeurs arithmétiques des débuts. On commence à ajouter des excroissances à nos CPU pour les libérer de calculs…



(3615malife) Rien à voir, mais en parlant de ça, j’ai des images de l’Amstrad pc1512 de mon père qui me reviennent :p que de beaux souvenirs sur Gem Paint et l’outil de dessin en langage Basic ^_^




Prochaine étape, réintégrer tous ces circuits dédiés au sein d’une même puce …
Et recommencer :D


xlp Abonné
Il y a 3 ans

Ça s’appelle une Mac. Pardon, je veux dire que certaines machines Apple ont un FPGA intégré (Mac pro de mémoire).
Sinon y’a pas mal de FPGA en PCIe, mais c’est pas gagné que ça soit utilisé pour les programmer.