Stockage ADN : comment Biomemory veut accélérer et s’intégrer dans les datacenters

Stockage ADN : comment Biomemory veut accélérer et s’intégrer dans les datacenters

C’est le vase qui va faire déborder la goutte d’eau

2

Stockage ADN : comment Biomemory veut accélérer et s’intégrer dans les datacenters

Biomemory compte proposer, d’ici 2030, des baies de stockage 42U d’une capacité d’un Eo (1 000 Po ou 1 000 000 To). La société mise sur l’ADN, peu onéreux, avec une densité et une longévité record. On n’en est pas encore là : il va falloir passer de 1 ko d'écriture par jour à 1 Po d'ici à quelques années.

Utiliser de l’ADN pour stocker des informations, l’idée n’est pas nouvelle. Le physicien américain Richard Feynman (prix Nobel en 1965) l'avait déjà suggérée dès 1959, rappelle le CNRS. Il a par contre fallu attendre 2012 pour que la première démonstration significative soit réalisée, à Harvard.

En France, l’Office parlementaire d'évaluation des choix scientifiques et technologiques (OPECST) a publié une « note » détaillée sur cette forme de stockage. On y retrouve les attentes, les embuches et le principe de fonctionnement.

Biomemory à la « croisée de la biotech et de l’informatique »

Des entreprises se sont depuis lancées dans l’aventure, dont Biomemory. Elle était présente à Vivatech et nous avons pu discuter avec deux représentants de la société : Olivier Lauvray (membre du conseil consultatif et directeur technique à temps partiel) et Hela Ammar (chef d'équipe).

La société a été fondée par deux chercheurs et un informaticien : Erfane Arwani, Stéphane Lemaire et Pierre Crozet. Elle se présente comme étant à la « croisée de la biotech et de l’informatique ». C’est une spin-off du CNRS et la Sorbonne université, qui se trouve dans le 14ᵉ arrondissement de Paris. Elle s’est lancée en 2021 et emploie 18 personnes actuellement.

Stéphane Lemaire et Pierre Crozet se sont déjà illustrés il y a quelques années avec DNA Drive, deux capsules contenants des textes symboliques sur de l’ADN : la Déclaration des droits de l’homme et du citoyen de 1789 et la Déclaration des droits de la femme et de la citoyenne de 1791.

Stocker toujours plus de données, une quête sans fin

Le stockage ADN répond à un besoin : stocker toujours plus d’informations dans un volume restreint. En termes de densité, les possibilités de l’ADN sont sans commune mesure avec les autres solutions actuelles. Il y a quelques années, le CNRS expliquait qu’un « seul gramme peut théoriquement contenir jusqu’à 455 exabits d’informations, soit 455 milliards de milliards de bits. Toutes les données du monde tiendraient alors dans une boîte à chaussures ».

« Aujourd'hui, on arrive à stocker 30 % des données de l’humanité et d’ici 2030 on ne pourra stocker que 3 % », nous affirme Biomemory. Avec l’ADN, il sera possible d’enregistrer toujours plus de données, et à l’heure des IA (génératives) qui en sont extrêmement consommatrices, cette solution a le vent en poupe.

1 Go par jour dès l’année prochaine

C’est d’ailleurs un cas d’usage mis en avant : permettre aux entreprises de garder leurs données brutes, alors « qu’aujourd’hui, elles sont obligées de les agréger, et ça perd de la valeur ». Le stockage ADN pourrait aussi permettre à des sociétés de garder leurs données sans les mettre entre les mains d’hébergeurs (étrangers ou non).

Il reste néanmoins du travail. « Aujourd'hui, on arrive à stocker un kilo octet par jour », reconnait Biomemory. Mais les perspectives d’évolution sont là : « L'idée, c'est d'arriver en 2025 à stocker un Go par jour. De continuer à progresser pour arriver à l'ordre d’un Po par jour en 2030 ». Cela donnerait 11,6 Go/s.

Réutiliser tout ce qui est standard

À cette date, l’entreprise espère proposer une machine « capable d'écrire, de lire et de stocker jusqu'à un Eo de données », dans une baie 42U. Le choix de la baie 42U n’est pas un hasard : « c’est standard et pas cher ».

Biomemory ne s’en cache pas : elle mise au maximum sur tout ce qui est standard pour réutiliser les briques déjà disponibles et ne pas réinventer la roue lorsque ce n’est pas nécessaire. On peut d’ailleurs voir que les cartes de stockage sont au format carte de crédit, et ce n'est évidemment pas un hasard.

D’un point de vue pratique, il est prévu de stocker un Po par carte (voir image au-dessus), les données se trouvant uniquement dans la partie grise sur la gauche (un micro puits contenant l’ADN).

La « technologie est prête », mais il reste du travail

L’intégration du stockage ADN se fait comme n’importe quelle autre solution de stockage : « L’interfaçage dans le monde du datacenter (le monde extérieur) est transparent pour l'utilisateur ». « Si vous avez des manipulations de données en termes d’objets, de fichiers ou de blocs, pour nous, cela ne change rien. On transcode du binaire en ADN ». Un « traducteur » en language ADN est disponible en bas de cette page.

Biomemory nous affirme que, aujourd’hui, sa « technologie est prête », mais qu’il reste beaucoup de travail : intégration, miniaturisation, automatisation et parallélisation, par exemple. Le système dans la baie 42U pourrait, comme un disque dur ou un SSD, contenir plusieurs modules de lecture et/ou d’écriture en fonction des besoins.

ADN biosourcée et biocompatible

D’un point de vue technique (sans entrer dans les détails), Biomemory utilise des encres pour stocker les données. Oui, on pourrait parler d’imprimantes à jet d’encre. Contrairement à ses concurrents qui utilisent de la « chimie lourde » pour son ADN, Biomemory se sert d’ADN biosourcée. Elle nous indique d’ailleurs avoir « le brevet bloquant pour pouvoir faire de l'ADN en production biosourcée ».

Plusieurs avantages. Déjà, la chimie lourde « c’est 1 000 à 10 000 fois plus cher ». Mais la solution de Biomemory est surtout biocompatible : « on peut rejeter l'ADN dans de l'eau, ce n’est pas toxique », alors que les « autres ont des problématiques de recyclage ». L’entreprise utilise 16 encres différentes et 4 enzymes pour fabriquer l’ADN.

Concernant les encres, Biomemory s’appuie encore une fois sur ce que propose l’industrie, dont la précision des gouttes atteint le picolitre. Mais ses machines ne sont pas encore à ce niveau, et elle ne sait pas encore si elle va passer par le nanolitre avant de descendre au picolitre.

La lecture est « facile » grâce au séquençage. Ce que l’industrie, là encore, sait parfaitement bien faire, avec une vitesse actuelle de 400 Go/s. La lecture chez Biomemory est cependant de l’ordre du Mo par jour actuellement, mais cela va augmenter.

« Les réactions d'écriture prennent un peu de temps. L'idée, c'est donc d'en faire beaucoup en parallèle », nous explique l’entreprise. Pour résumer, l’ADN de Biomemory sera toujours plus rapide à lire qu’à écrire, mais il est possible de paralléliser l’écriture, ce qui permet d’arriver à un « équilibre ».

Espace et défense : deux secteurs intéressés

Nous demandons à Biomemory s’il est envisageable d’avoir une machine de plus petite taille pour écrire de l’ADN et stocker des données en dehors d’un datacenter. Au hasard, pour un usage dans l’espace, où les connexions sont limitées, alors que de gigantesques quantités de données sont produites.

La réponse est oui : « on a déjà des gens qui nous sollicitent sur le sujet ». D’autant que l’ADN utilisé par Biomemory serait « hyper stable » et pas spécialement sensible aux rayons dans l’espace. La défense est aussi un sujet pour l’entreprise.

Endurance et prix

Actuellement, le stockage ADN est certifié pour 153 ans. Pourquoi 153, demandons-nous ? « On s’est arrêtés à 153 ans dans les tests de vieillissement », nous répond la société. Mais l’ADN peut rester stable pendant des dizaines de milliers, voire des millions d’années.

Terminons avec un mot sur le prix : « L'idée, c'est que [le stockage ADN] soit moins cher que les bandes ». La cible définie par le marché du stockage ADN pour 2030 est entre 1 et 2,5 dollars par To. « On est confiant qu'on peut atteindre » cet objectif, nous affirme la société en guise de conclusion.

Prototype de baie 42U avec une capacité de stockage de 1 Eo.

Commentaires (2)


Ah, chez eux aussi ils ont rempli leur dossier Crédit Impôt Recherche ?

Boah, je suis cynique, mais le stockage ADN, en vrai, ça me fait rêver. C'est juste qu'on en parle depuis bien trop longtemps pour penser que ça sera prêt en 2030, mais malgré tout, c'est bien d'avancer, quel que soit le rythme.
Ils veulent passer de 1 Ko/jour actuellement à 1 Go/jour en 2025...

Ben il va falloir y mettre un gros gros coup d'accélérateur et tout de suite maintenant...
.
Modifié le 07/06/2024 à 17h32

Historique des modifications :

Posté le 07/06/2024 à 17h30


Ils veulent passer de 1 Ko/jour actuellement à 1 Go/jour en 2025...

Ben il va falloir y mettre un un gros d'accélérateur et tout de suite maintenant...

Posté le 07/06/2024 à 17h30


Ils veulent passer de 1 Ko/jour actuellement à 1 Go/jour en 2025...

Ben il va falloir y mettre un un gros d'accélérateur et tout de suite maintenant...

Posté le 07/06/2024 à 17h30


Ils veulent passer de 1 Ko/jour actuellement à 1 Go/jour en 2025...

Ben il va falloir y mettre un un gros d'accélérateur et tout de suite maintenant...

Posté le 07/06/2024 à 17h30


Ils veulent passer de 1 Ko/jour actuellement à 1 Go/jour en 2025...

Ben il va falloir y mettre un un gros d'accélérateur et tout de suite maintenant...

Posté le 07/06/2024 à 17h30


Ils veulent passer de 1 Ko/jour actuellement à 1 Go/jour en 2025...

Ben il va falloir y mettre un un gros d'accélérateur et tout de suite maintenant...

Posté le 07/06/2024 à 17h32


Ils veulent passer de 1 Ko/jour actuellement à 1 Go/jour en 2025...

Ben il va falloir y mettre un gros gros coup d'accélérateur et tout de suite maintenant...
.

Fermer