Hive : analyse d’un « Drive » P2P chiffré de bout en bout, développé en partenariat avec Inria
Attention, arrêtes tranchantes
Le 06 décembre 2022 à 07h25
11 min
Internet
Internet
La startup française Hive vient de s’associer avec Inria pour travailler plus intensément sur les technologies du P2P. L’occasion de plonger dans HiveDrive, son fonctionnement particulier et ses caractéristiques. David Gurlé, président et fondateur de l'entreprise, a également répondu à nos questions.
La société Hive a été fondée par David Gurlé, un nom que certaines personnes reconnaîtront. L’ingénieur français a notamment travaillé chez Microsoft, où il a dirigé les efforts de l’entreprise dans le domaine des communications en temps réel, sur des produits comme NetMeeting, Windows Messenger, Exchange IM, Exchange Conferencing Server, Live Communications Server, Office Communications Server et Skype. Il a également travaillé chez Reuters.
En 2012, il fonde sa propre entreprise, Perzo. Basée à Palo Alto (Californie), elle officie dans le domaine des messageries, mais avec une solution chiffrée de bout en bout, le client ayant ses propres clés. La société est rachetée par un consortium bancaire deux ans plus tard et renommée Symphony. David Gurlé en est alors le PDG. La valorisation de l’entreprise dépasse le milliard de dollars en 2020.
Hive est sa nouvelle création. La société, installée cette fois à Cannes, a levé 7 millions d’euros en mai dernier. En septembre, Hive lance la première version de son Drive, auquel manquent de nombreuses fonctions. Depuis, trois autres versions sont arrivées, à raison d’une par mois, avec à chaque fois des ajouts significatifs.
Penchons-nous de plus près sur ce service, premier représentant d’une entreprise qui envisage le cloud sous l’angle du pair-à-pair.
HiveDrive : d’abord la théorie
Le fonctionnement de ce Drive est particulier. Le service proposé est à la fois distribué et décentralisé. Pas de structure centrale de contrôle donc, les fichiers placés sur le Drive étant fractionnés et répartis chez les autres distributeurs.
Sur ce fonctionnement pair-à-pair vient se greffer un chiffrement de bout en bout, y compris pour les métadonnées. En plus du compte qu’il faut créer pour accéder au client, il faut choisir une clé de chiffrement que l’on sera seul à posséder et qu’il faut donc entreposer avec soin. HiveDrive prévient des avantage et inconvénient principaux de cette méthode : l’entreprise ne peut pas lire les données, mais ces dernières sont perdues si vous n’avez plus la clé.
Comme tout système P2P, l’efficacité générale dépend du nombre de personnes utilisant le service. Chaque fichier est fractionné en plusieurs dizaines de morceaux, qui voyagent vers les autres utilisateurs. À ces fichiers, Hive ajoute le même nombre, que l’on peut considérer de copies de sauvegardes, elles aussi envoyées aux autres utilisateurs. Si un fichier est ainsi divisé en 50 morceaux, 100 sont répartis chez les autres. Tant que Hive dispose de 50 fractions sur les 100, le fichier peut être reconstitué.
L’architecture se veut donc résiliente. Hive garantit également l’intégrité des données. Chaque fragment de fichier a sa propre signature, toute altération de cette dernière provoquant la suppression du fragment. Les nœuds eux-mêmes de l’infrastructure – les personnes ayant installé l’application – contrôlent ces fragments et les reconstituent s’ils détectent qu’il n’en reste pas assez pour une reconstitution.
Hive met également en avant la consommation moindre d’énergie qu’un tel système suppose. Contrairement aux infrastructures cloud classiques, les ordinateurs utilisés par ce Drive n’ont pas vocation à toujours rester allumés. Selon l’entreprise, le service doit se contenter des machines allumées et de l’espace mis à disposition par ses utilisateurs. Quand certaines sont éteintes, d’autres prennent le relai, grâce aux fragments supplémentaires de fichiers. HiveDrive est également capable de détecter les ordinateurs toujours allumés, qui deviennent alors déclarés comme tels et utilisés en priorité par le service pour « éviter des redondances inutiles »
Dans la pratique, des angles encore coupants
Les nouvelles moutures sortant en début du mois, la dernière date du 2 décembre et apporte des améliorations notables. Cependant, comme nous allons le voir, on est clairement sur un produit en cours d’élaboration. Impossible donc de le comparer à un produit fini ou de l’utiliser comme tel.
L’installation du client est simple. Il vous faudra les identifiants du compte ainsi que la chaine de caractères créée pour servir de clé. On choisit ensuite le nombre de Go que l’on souhaite consacrer au service. L’espace consacré est celui que vous pourrez utiliser pour stocker des données. Il s’agit en fait d’un espace mis à disposition des autres, le service vous octroyant le même espace pour vos propres fichiers. Cette taille peut être modifiée dans les paramètres.
L’application – disponible uniquement en anglais – se présente comme une fenêtre affichant les dossiers et fichiers. Il n’y a pas d’intégration dans l’Explorateur de Windows ou le Finder de macOS, les deux plateformes sur lesquelles elle est disponible. Pour envoyer des données sur HiveDrive, on peut se servir du clic droit ou utiliser le glisser/déposer, mais pour un seul fichier à la fois.
C’est une limitation importante du client actuel. Si vous souhaitez avoir des dossiers, il va falloir en créer dans l’application (via le clic droit) puis sélectionner les fichiers à envoyer un par un. Selon les cas de figure, ce fonctionnement est très vite rébarbatif.
On note également que les transferts sont lents, surtout en téléversement. Il nous faut ainsi en moyenne 20 à 25 secondes pour un fichier de 4 Mo. Pour les fichiers plus importants, c’est bien sûr plus long, mais le temps n’est pas multiplié. Par exemple, pour 97 Mo, l’envoi des données a pris 35 secondes. Ce même fichier, en téléchargement, n’a pris que quelques secondes, le tout sur une connexion fibrée 1 Gb/s chez Orange. Notez que le service étant en cours de construction, la taille maximale des fichiers est de 500 Mo.
En termes de fonctions, on fait très vite le tour, car HiveDrive ne fait pour l’instant que du stockage pur et dur. Autour, les carences sont légion. On ne peut pas obtenir d’informations sur les fichiers envoyés (par exemple pour vérifier la taille avant un téléchargement), utiliser directement les données depuis une autre application comme on le ferait avec un autre Drive, accéder aux paramètres depuis la fenêtre principale ou encore récupérer cette dernière depuis une icône dans la barre des tâches ou le Dock.
HiveDrive dépose quand même une icône dans la zone de tray (en bas à droite sur Windows et à droite de la barre de menu sur macOS). C’est la seule manière d’ouvrir la fenêtre principale, puisque même l’icône ajoutée sur le bureau, dans le menu Démarrer ou dans le dossier Applications de macOS ne fait qu’ouvrir la petite fenêtre du tray. Cette dernière affiche un résumé de l’espace consommé et permet d’ouvrir les paramètres.
Ces derniers sont pour l’instant sommaires. En plus de quelques informations sur le stockage, on ne peut changer que le nombre de Go consacrés à HiveDrive. Dans l’onglet « Info » en haut, on trouve une liste des pairs, avec des informations dont la précision surprend : les adresses IP et la géolocalisation. HiveDrive indique la ville pour les personnes connectées en France, sinon le pays.
Sur ce point, Hive nous a rapidement confirmé que ces informations allaient prochainement disparaître et n’étaient présentes que durant une partie de la phase de test.
Réseau distribué : le dada de David Gurlé
Nous nous sommes entretenus avec David Gurlé, fondateur et président de Hive. Nous avons voulu notamment savoir pourquoi il se lançait dans cette aventure : « On peut dire que je suis né avec l’informatique distribuée, car c’était à l’époque le sujet de ma thèse. C’est pour moi un domaine de prédilection ».
L’ingénieur nous explique avoir commencé à mettre en œuvre cette distribution chez Perzo, mais c’est surtout chez Skype qu’il a pu travailler sur le sujet. Avance rapide jusqu’en 2018 où, à la tête de Symphony, il se rend compte que la facture de l’hébergement chez Google grimpe en flèche. Il propose alors au conseil d’administration une idée proche de HiveDrive, mais qui ne passe pas.
« On peut dire que je suis en retraite semi-active. Je ne voulais plus faire d’opérationnel, mais je voulais infuser cette idée », ajoute David Gurlé, qui aimerait un cloud comme les « pères de l’Internet » imaginaient alors l’infrastructure. Un cloud qui serait également « plus responsable et économique ».
Mais pourquoi un partenariat avec Inria ? « Nous avons clairement des problèmes conséquents d’optimisation », nous répond le président. C’est notamment le cas sur la capacité de redondance, c’est-à-dire l’empreinte de stockage réelle d’un fichier avec tous les mécanismes de contrôle et d’intégrité.
Le partenariat se fera surtout sur l’intelligence artificielle, pour la partie modélisation et simulation. L’entreprise compte également sur l’expertise d’Inria pour lui signaler « les problèmes que nous ne connaissons pas encore ».
Interrogé sur le modèle commercial, l’ingénieur indique que le service va rester gratuit encore pendant un moment. À compter du deuxième trimestre 2023, il sera officiellement proposé au grand public, entrepreneurs et petites entreprises, sur la base d’un modèle fondé sur l’espace partagé.
Hive établira un cours basé sur l’offre et la demande en matière de stockage. Si une personne propose plus d’espace qu’elle n’en consomme, elle sera rémunérée. Dans le cas contraire, il faudra payer. Ce cours sera assorti d’un coefficient basé sur cinq facteurs :
- Quantité (espace proposé)
- Qualité (type de stockage)
- Disponibilité (le temps que la machine reste allumée)
- Empreinte énergétique (le type d’énergie consommée, quand l’information existe)
- Valeur communautaire (l’engagement de l’utilisateur pour faire connaître Hive)
C’est ainsi que Hive « fera son beurre » : 5 % de frais sur l’ensemble des transactions.
« On est clairement dans une phase d’élaboration »
Nous avons ensuite abordé la longue liste des carences actuelles de HiveDrive. Sur ce point, David Gurlé a rapidement répondu : la version de janvier se débarrassera de la fenêtre servant actuellement à envoyer et récupérer des données. Elle n’existait que pour pouvoir tester le service. « On est clairement dans une phase d’élaboration », nous signale David Gurlé, qui a insisté plusieurs fois sur ce statut de test.
La prochaine mouture introduira l’intégration dans l’Explorateur de Windows, celle dans le Finder étant prévue le mois suivant. Une version pour Linux doit bien arriver, mais plus tard.
L’intégration dans le gestionnaire de fichiers gommera quelques-uns des plus gros défauts ergonomiques de l’application actuelle, notamment sur la gestion du glisser/déposer et l’accessibilité des données depuis d’autres applications. Le fonctionnement, pour l’instant synchrone, deviendra asynchrone et pourra ainsi gérer les envois et réceptions multiples.
Durant le premier trimestre 2023 arriveront également les applications mobiles. D’abord une version Android – « parce que nous avons d’abord recruté un ingénieur pour cette plateforme » – puis une application iOS le mois suivant.
L’actuel panneau « Info » dans paramètres sera complètement modifié le mois prochain lui aussi. Les adresses IP disparaîtront au profit d’informations plus riches sur ce qui se passe dans le réseau. Pour la version française par contre, il faudra attendre un peu plus car elle n’arrivera pas avant juin « au plus tard ».
HiveDrive, bien que nous ne puissions pas le recommander pour l’instant, est donc un projet intéressant que nous suivrons de près. L’arrivée d’un nouveau Drive ne serait pas si marquée s’il ne proposait pas une architecture distribuée et chiffrée de bout en bout. Au vu des moyens mis en œuvre et du partenariat avec Inria, le service pourrait bien apporter quelque chose de réellement frais dans ce paysage contrôlé par quelques gros acteurs américains.
Enfin, HiveDrive n'est que le premier d'une série de services. D'autres arriveront plus tard, notamment HiveCompute qui promet l'exécution d'applications sur HiveNet, un HiveVault pour les documents sensibles, ainsi que HiveShare, promettant des partages de fichiers sans limite de taille. Nous aurons bien sûr l'occasion de revenir sur ces produits quand ils seront disponibles.
Hive : analyse d’un « Drive » P2P chiffré de bout en bout, développé en partenariat avec Inria
-
HiveDrive : d’abord la théorie
-
Dans la pratique, des angles encore coupants
-
Réseau distribué : le dada de David Gurlé
-
« On est clairement dans une phase d’élaboration »
Commentaires (32)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 06/12/2022 à 07h58
J’adore le concept et je suis totalement en phase avec sa vision décentralisée du net. Je suis prêt à mettre un peu de stockage gratuitement sous deux conditions:
Le 06/12/2022 à 08h27
+1
Le 06/12/2022 à 10h42
Absolument d’accord !
Je rêverais que toutes les boxs des FAI puissent héberger un disque dur et que le service ou ce genre de concept de distribution/hébergement soit intégré directement sur la box. Là, ça serait vraiment résiliant, avec une capacité de stockage faramineuse…
Le 06/12/2022 à 08h36
Je reste dubitatif sur la disponibilité et la rapidité, voir même l’espace de stockage que cela engloutirait à terme. Le P2P c’est bien pour le partage, mais pour stocker de la donnée perso, je suis pas encore convaincu.
A qui ce n’est pas arrivé en P2P de DL un gros fichier et le DL s’arrête brusquement avant la fin et met du temps à redémarrer parce qu’il manque une partie ? :)
J’ai du mal à voir le réel intérêt vis à vis d’un cloud FR chiffré qui n’a pas plus accès à tes données, si ce n’est le prix, et ca reste à voir pour le coup.
Le 06/12/2022 à 09h18
Moi j’ai découvert “Garage” au Capitole du Libre :
https://garagehq.deuxfleurs.fr/
C’est pas vraiment la même chose (car ça expose une interface S3) mais ça rejoins un peu Hive par le coté distribué.
En tous cas, comme vous je suivrais Hive avec attention.
Je n’ai pas l’impression que ce soit Opensource par contre.
Or surtout pour du stockage je ne me vois pas poser mes données sur un service que je ne peux pas répliquer sur ma propre infra (typiquement, il m’arrive de stocker à la fois sur un minio local & sur wazabi en S3) : Q’est ce qui se passe si la société se fait racheter ?
Il est vrai que , par contre, ça complique singulièrement la monétisation du service.
Le 06/12/2022 à 10h37
En P2P, on stocke rarement un fichier, mais plutôt des morceaux.
Dès lors, une indisponibilité ne peut être palliée, mais rien ne dit qu’un téléchargement doit se faire dans l’ordre.
Perso, je suis pour ce type de solution à une seule condition: être sûr de pouvoir moi-même héberger le 50% des données. Ainsi, on profite des autres pour la redondance et la vitesse.
Le 06/12/2022 à 11h11
Un morceau de fichier est un fichier.
Comme tu le dis, on se fiche de l’ordre, mais une indispo reste une indispo, quel que soit l’ordre.
Tu n’es pas vraiment d’accord avec lui alors, parce qu’une box FAI c’est pas trop linux et opensource :).
Ca ferait aussi un énorme gaspillage de disques et et d’énergie ? Sur le principe ce serait pas une mauvaise idée. Mais par exemple, n’ayant pas ce besoin, je devrais payer la conso du disque et laisser de la bande passante pour quelque chose que je n’utilise pas, mwé.
Le 06/12/2022 à 10h59
Je me demande à quel point un plugin “freenet” ne rendrait pas des services similaires.
D’un point de vue technique il y a des similitudes (stockages de fichiers découpés, distribution du stockage p2p, performance pas terrible ) …
Ne manque que la simplicité d’accès, et le “serveur de conservation” en somme.
Donc tu fais un plugin, tu gères le rafraichissement des clés (pour ne pas perdre les fichiers), une interface sympa, un cache locale…
Ceci est juste un exercice de pensée, pas pour dire que ce produit ne sert à rien ou autre.
Le 06/12/2022 à 12h36
Le stockage est déjà évaluable, il faut que le réseau supporte au moins 2 fois le volume de données que tu écris, donc vu que ça s’applique tout le monde, on sait ce qu’il en est, il faudra certainement proposer au moins le double pour être rémunéré.
Faut surtout comparer aux solutions actuelles où un serveur stocke la donnée, souvent deux fois ou plus via le RAID, avec éventuellement une autre sauvegarde ailleurs. Finalement c’est plutôt un moyen de ramener le stockage chez les utilisateurs plutôt que dans le datacenter, toutefois pas sûr que remettre des NAS chez tout le monde améliore l’efficacité énergétique par rapport à un datacenter.
C’est ce que ça devoir gérer le système de distribution pour rediffuser un morceau vers un pair quand un autre disparait afin qu’il y en ai toujours au moins 2 prêts à envoyer.
Sauf que si c’est un laptop qui est utilisé, comment va faire le système pour gérer des ordinateurs avec 1To qui tournent 2h par jour en soirée vs un 500Go qui tourne H24 ? C’est là qu’il peut avoir l’effet des parties manquantes, mais a priori contrairement à un OneDrive, on dispose toujours d’une copie du fichier sur son poste, donc c’est plutôt un outil de sauvegarde que de cloud storage.
C’est effectivement une alternative, qui permet surtout de se passer des grosses infra serveur, donc de diminuer les coûts. A voir ce que donnera la réalité.
Le 06/12/2022 à 12h54
En datacenter, l’espace disque est quand même optimisé bien souvent (dédup, compression..).
Je n’ai pas compris qu’une partie du stockage restait sur le disque pour ma part, mais que tout était envoyé. C’est peu être pas super clair…
La plupart des hébergements ont une offre gratuite, et pour de gros volumes tu peux facilement avoir du 1To à 5€ Mois, avec pas mal d’options supplémentaires (les liens de partage par exemple) et c’est dispo H24 près de chez toi. Tu vas pas chercher des bribes de fichiers aux 4 coins de la planète.
Ca peut être intéressant, il faut voir l’évolution ! Je disais juste que je reste dubitatif :)
Le 06/12/2022 à 12h56
C’est vrai que ça ressemble beaucoup à Freenet. Sauf que la dernière fois que je l’avais testé (il y a 10 ans), les données n’étaient pas persistantes. Donc si un document n’était pas lu pendant une longue durée, elle disparaissait du cache de chaque ordinateur jusqu’à être perdu intégralement du réseau.
Le 06/12/2022 à 13h35
C’est là qu’interviens la monétisation du service, si tu peu être rémunéré pour mettre à dispo des ressources, tu n’as pas forcement à être un utilisateur du drive.
Reste à voir ce qu’on pourrait faire de cette monétisation.
Mais c’est un début de concret pour le web décentralisé, si je n’ai pas d’usage pour un drive, mais que mettre à dispo mes ressources contre rémunération me permettait d’utiliser un autre service, pourquoi pas.
Il y a tout un écosystème à construire.
Le 06/12/2022 à 13h57
Donc la finalité c’est des PC qui tournent H24 dans des pays du tiers monde pour gagner des pépettes sur le stockage en P2P (à l’instar des cryptos) ? :)
Le 06/12/2022 à 13h56
S’il n’y a pas la même sécurité quant à la disponibilité des données, une telle solution a un réel intérêt quant à la confidentialité de celles-ci quand on la compare à un cloud chiffré.
En effet, la sécurité d’une donnée chiffrée n’est pas garantie dans le temps : mécanisme de chiffrement qui peut être cassé à un instant t+1, puissance de calcul des ordinateurs qui réduit le temps de calcul pour déchiffrer en brute force ou assimilé… une donnée chiffrée aujourd’hui doit être à considérer comme non chiffrée lorsqu’analysée dans une poignée d’années. Or, dans le cas d’un cloud, une entreprise donnée (et, donc, avec le CLOUD Act, les services de renseignement US) ont accès à toutes les données de façon complète, avec l’opportunité de casser le chiffrement à moyen ou long terme.
Dans le cas d’un stockage distribué, personne (sauf le propriétaire desdites données qui peut les récupérer localement) n’a accès en un instant donné à l’intégralité des données. Donc même s’il devient possible de déchiffrer des paquets, ça risque d’être insuffisant pour faire de l’analyse/exploitation de données.
Le souci est qu’on a un risque d’accès aux données en cas d’indisponibilité d’une partie critique non accessible (clients distribués non joignables car éteints, interruption au niveau d’un backbone…), donc ça reste à mes yeux une solution à n’envisager que pour de la sauvegarde distribuée supplémentaire (par exemple : j’ai des données locales, une sauvegarde sur mon NAS, et je me permets du coup une réplication sur Hive en supplément).
Le 06/12/2022 à 14h50
StorJ a essayé ce business model….
Je ne suis pas sûr qu’ils aient rémunéré grand monde ^^;
Le 06/12/2022 à 15h32
J’ai gagné quelque dollars avec STORJ à l’époque sur un serveur que j’utilisais peu, le réseau fonctionne pour les opérateurs, à voir pour les clients.
Le 06/12/2022 à 16h32
faut se lever très très tôt pour rentrer dans ses frais avec Storj.
et encore, ils boostaient les rewards en 2020-2021.
en un an j’ai du gagner 20€ pour 4To de partage, directement depuis la freebox (vive le NAS et les VM dans la delta). ça paie peut-être 25% d’un disque. en gros pour entrer dans mes frais il me faut 8 ans de partage? mais lol.
Le 07/12/2022 à 07h20
J’étais clairement pas rentable non plus. Je deviendrais peut être client pour mes backup.
Le 06/12/2022 à 16h38
Connais pas :) j’irais jeter un oeil.
Cloud Acte en France ? Et puis pour ma part, si je chiffre mes données, c’est pas pour me protéger du Gouv. C’est pour me protéger dans le cas ou mes données tomberaient dans les mains d’un tiers mal intentionné, quel qu’il soit, hébergeur inclus.
Sinon tu devrais aller voir combien de temps et de puissance il faudrait pour casser un AES-256. Le quantique n’étant pas encore là, je pense que tu peux dormir tranquille. Le cas échéant, tu aurais largement le temps de retirer tes données avant que quelqu’un s’y attaque.
Rien n’est impossible, mais on est dans le domaine de l’imaginaire, que tant de monde s’entende sur un sujet qui leur rapporterait si peu :)
Le 06/12/2022 à 15h07
Oui, on est d’accord sur le logiciel de la box ;-).
Par contre, tous les windows on onedrive, utilisé par quand même beaucoup de personnes, Dropbox, google drive pour les plus communs, tous US friendly. Donc j’imaginais une offre de service de cloud proposé par un prestataire qui vends des Box et qui les utilises pour proposer ce genre de service. Le consommateur pourrait avoir un rabais sur sa facture pour la consommation supplémentaire d’électricité s’il accepte de prendre un disque sur la box, et on aurait les avantages du cloud français/européen, avec un cryptage de bout en bout avec une difficulté pour avoir tous les fichiers en même temps (pour les personnes non autorisées), ce qui, par les temps qui court, est à mon sens intéressant.
Le 06/12/2022 à 17h38
je ne pense pas qu’on puisse “retirer ses données”. Tu peux jamais garantir que quelqu’un n’en a pas une copie (même chiffrée) quelque part.
Tout repose sur le chiffrement… si il cède, tu peux plus rien prouver.
Le 06/12/2022 à 18h00
Après si on va dans la psychose, le P2P n’est pas fiable non plus…
Le 06/12/2022 à 18h31
Carrément pas, je suis d’accord.
La seule chose vraiment fiable en terme de confidentialité si l’on ne fait pas confiance au chiffrement c’est le disque dur ou le SSD chez toi planqué dans un mur. Mais par contre c’est sur que c’est moins fiable dans le temps.
C’est pour ça que jusqu’à preuve du contraire on peut, à mon avis, faire confiance aux algo de chiffrement (il reste toujours un doute sur l’implémentation, la génération des clés,…).
Après c’est à chacun de faire son propre compromis , aussi en fonction de la sensibilité des données.
Le 06/12/2022 à 19h24
C’est moins pratique pour accéder aux données à distance quand c’est dans le mur 😄
Mais on est bien d’accord.
Le 06/12/2022 à 19h57
C’est très prometteur J’attends avec INpatience une béta linux.
Cela me semble un peu bancal comme modèle. Au début, il suffira que les premiers utilisateurs mettent tous un gros espace à disposition sans réellement consommer (le temps de s’habituer à l’outil) pour qu’il faille rémunérer plein de gens : les premiers mois le produit coûte plus qu’il ne rapportera…
Le 06/12/2022 à 21h51
L’idée est super intéressante. J’avais creusé un peu le sujet pour avoir des pti’ parc de postes sans serveurs de fichiers. Je suis tombé sur Syncthing et Resilio. L’un est open source, les deux sont cross plateforme.
Mais comme dit plus haut, ça peut poser des soucis de confidentialité. Ça reste toujours intéressant pour des groupes de travail. Par contre, les solutions que j’ai testé étaient taillés pour du LAN.
Le 06/12/2022 à 22h19
Je ne voudrais pas couper l’enthousiasme de certains, mais le principe du drive de Hive me fait penser à un système de Ponzi.
En effet les premiers arrivés pourront profiter de plus d’espace au fur et à mesure que de nouveaux utilisateurs arriverons, mais si le système s’essouffle les derniers n’auront que des miettes. Certes le système de récompense / coût pourrait en théorie équilibrer les usages, mais si les gens sont prêts à gagner de l’argent, si ça devient payant assez vite il va y avoir du turnover, voir de l’abandon rapide…
D’autant que stocker des données sous forme de fragments avec redondance, peut-être avec de la déduplication, de la compression et, je suppose, un mécanisme de parité comme un raid 5, ça doit potentiellement prendre plus de place que les données initiales.
Donc pour que ça fonctionne chacun devra certainement fournir plus de stockage que de données stockées, dans un rapport de 2 pour 1 par exemple.
Le 07/12/2022 à 10h39
Le CLOUD Act touche tous les clouds dont la société-mère est aux USA, même si les serveurs sont en France. Autant dire que vu l’état du “cloud souverain” à l’heure actuelle, nous sommes toustes concerné⋅e⋅s par le CLOUD Act vu que 99% des services proposés le sont par des entreprises US (Amazon, Microsoft, Apple…).
Et c’est bien pour ça que je parle de “demain” : on n’est jamais à l’abri de découvrir du jour au lendemain une faiblesse dans un algo de chiffrement qui mette à mal toute la chaîne de sécurité. Et ce qui est vrai aujourd’hui n’est pas garanti demain. On sait par exemple depuis les affaires sorties sur la NSA que les services de renseignement moissonnent des données chiffrées en très grande quantité pour pouvoir les déchiffrer “un jour” (d’ailleurs, les ordinateurs quantiques sont aussi regardés de très près par les services de renseignement pour leur capacité théorique à remettre à plat tous les mécanismes de chiffrement).
Et retirer les données n’est pas une solution : une fois qu’on a confié nos données à un tiers, rien ne garantit qu’elles ne soient pas stockées (chez ce tiers ou chez un service de renseignement habilité à aller farfouiller chez ce tiers).
Le 07/12/2022 à 11h18
Non, 99% de l’offre n’est pas US. pCloud, kdrive, leviia, icedrive, shadow drive, tresorit, etc… C’est juste ceux qui me passent par la tête, il doit y en avoir une sacrée liste… Mega même ? Australie (je ne sais pas s’ils ont un accord).
Mais bon, de toute façon la n’est pas le sujet, je m’en cogne du gouv US. J’ai jamais compris cette fixation sur le gouv US.
Genre ils vont engager des démarches chez MS pour récupérer tes fichiers dans un DC FR qui leur appartient, pour ensuite coller un supercalculateur quelques années dessus pour tenter de casser le chiffrage, le tout pour accéder à tes photos de vacances et tes papiers administratifs ? Mais lol :)
On est 8 Milliards sur terre, vous pensez vraiment que moi petit pécore du coin sans histoire ils vont s’intéresser à mes données chiffrées ? Je le redis donc, si je chiffre mes données, c’est pas pour me protéger d’un gouvernement, mais pour me protéger de tiers mal intentionnés. Quand bien même ils s’intéressaient à moi, ne t’inquiète pas que P2P ou pas et chiffrement ou pas, il sauront bien s’incruster dans ta vie numérique. Mais vu que je ne pense pas compromettre la sécurité d’un Etat ca devrait allé…
Pour ce qui est du reste, comme dit dans les échanges plus haut, si tu pars dans la psychose, le P2P n’est pas plus fiable. Et si, il y a des garanties chez les tiers…
Le 07/12/2022 à 12h53
C’est pas le premiers à vouloir faire un “disque virtuel multibloc + réplication P2P des blocs”.
Le fait de chiffrer les blocs (ou chiffrer le FS du disque virtuel) c’est juste un détail.
Si ce genre d’offre n’a pas pris c’est qu’il est infiniment plus simple, plus pérenne, plus sécurisé et moins onéreux d’acheter un disque SSD et de le backuper/répliquer sur d’autres disques SSD.
Le SSD de 1To est à 100 euros. Pour 1000 euros t’as un stockage de 1To répliqué 9 fois.
Le 07/12/2022 à 15h50
Quand on travaille dans la recherche, on apprend vite que tout peut être critique en terme de données exploitable. Ce n’est pas la donnée singulière qui importe, c’est la masse de données et ses traitements & recoupements qui vont lui donner de la valeur. Plus il y a de donnée, plus elle va permettre de créer des profils (exploités par les États, les data brokers, les cibleurs, les démarcheurs, etc.). Jusqu’à la fuite et la revente de ces données pour de l’usurpation d’identité, et j’en passe.
Le 07/12/2022 à 17h06
Là n’est pas le sujet. La donnée est chiffrée donc inaccessible, ca s’arrête la. Et sur un Cloud hors société US. Le gars qui est soucieux au point de passer par un P2P comme hive uniquement pour des raisons de sécurité, je pense qu’il est assez intelligent pour choisir un hébergeur de l’UE.
Donc pas besoin d’aller dans des scénarios fantastiques…
Par rapport à ton message : le cloud Act, ca ne veut pas dire que la donnée est automatiquement mise à dispo de l’état US et qu’ils l’agrègent dans des bases, qu’ils ont le droit d’accéder et indexer tout ce qui concerne une boite US. Un petit rappel ; il faut un mandat délivré par un tribunal, pour qu’en suite ils fassent la demande à l’hébergeur, qui va à son tour analyser cette demande avant de donner son accord (ou pas). Donc si je reprends mon exemple, il faut que moi, petit pécore Français noyé dans 8 Milliards de personnes, l’état US délivre un mandat pour ma personne (Il faut une raison valable !) pour accéder à des données chiffrées qu’ils pourront hypothétiquement cracker un jour (surement très lointains). Pour regrouper mes photos et mes doc administratifs avec d’autres docs qu’ils auraient sur moi :)
Bref, on ne va pas tourner des heures sur le sujet :)
Je reste toujours aussi dubitatif sur hive !