Bluesky est-il décentralisé ?

Décentralisation quantique

Bluesky et son protocole AT sont souvent décrits comme décentralisés, à la manière de Mastodon. Mais est-ce bien le cas ? La question fait débat.

Vincent Hermann

Le 21 novembre 2024 à 16h34

7 min

Réseaux sociaux

Sociaux

Bluesky est actuellement sous les feux des projecteurs. L’effet boule de neige semble enclenché et on peut voir un nombre croissant de comptes importants partir de X pour des cieux plus cléments. Chez Science, on lit la même chose au sujet de la communauté scientifique.

Bluesky attire pour plusieurs raisons, en plus du critère classique de nouvel horizon. D’une part, des fonctions de blocage et de modération nettes et précises. D’autre part, l’affichage chronologique par défaut des publications, loin des algorithmes poussant à l’engagement. Et que cet engagement se fasse sur les impressions de publicités ou sur les réactions de comptes Premium n’y change rien.

Que sait-on de Bluesky ? C’était initialement un projet incubé chez Twitter par Jack Dorsey en personne. Le fondateur de Twitter souhaitait tester l’idée d’un protocole open source pour un réseau de micro-blogging. Cette idée a accouché du protocole AT, qui est effectivement open source, sous double licence Apache 2.0 et MIT. Jack Dorsey, lui, a quitté l'entreprise en mai.

Ce protocole a été pensé initialement pour permettre un fonctionnement décentralisé et fédéré, comme le propose Mastodon. Mais peut-on dire que Bluesky est réellement décentralisé ? La réponse n'est pas si simple.

Un serveur, un relai et une vue entrent dans un bar

Lorsque l’on parle de Bluesky, on évoque le réseau dans son intégralité. Mais ce réseau se compose en fait de trois parties, comme l’entreprise l’explique dans sa documentation : les serveurs, les relais et les vues d’applications.

Les serveurs constituent les réservoirs de données personnelles. Un utilisateur peut y stocker toutes ses informations, dont ses publications et tout ce qui sert à l’identifier (nom de connexion, mots de passe, clés cryptographiques) ou encore la liste des personnes suivies. Les PDS (Personal Data Server) gèrent également la mise en relation avec les services en fonction des requêtes. Il peut y avoir autant de PDS que l’on souhaite et tout le monde peut en créer un. En théorie.

Sur les relais en revanche, tout change. Leur mission est de parcourir tous les PDS, d’agréger et indexer le contenu pour en produire un énorme flux unique de données en streaming, souvent appelé firehose dans le jargon. Ce flux est ensuite mis à disposition de tout l’écosystème atproto (protocole AT). Les relais agissent comme un moteur de recherche.

Quant aux vues d’application (App View), elles constituent la face visible de l’iceberg. Une App View est ce qui permet d’afficher des informations exploitables à partir du flux agrégé. Elle réalise un assemblage à partir des critères définis aussi bien par la requête que les différents paramètres. Par exemple, afficher le flux personnel ou les résultats d’une recherche, tout en masquant certains résultats, par exemple provenant des personnes bloquées.

Que peut-on faire soi-même ?

Certaines actions peuvent être entreprises par les utilisateurs, du moins sur le papier. Monter un serveur personnel est le plus simple, Bluesky fournissant de nombreuses informations sur GitHub et jusqu’à un conteneur pour simplifier l’installation. Mais, comme son nom l’indique, un serveur de données personnelles ne peut héberger que ses propres informations. Il n’est pas question de créer une instance comme le fait Mastodon. On ne peut y inviter personne.

Sur les relais, c’est nettement plus compliqué. Dans sa documentation, Bluesky explique que tout le monde peut en héberger un, mais que c’est « un service assez gourmand en ressources ». Gourmand comment ? Très vorace en fait, car les relais arpentent l’intégralité des PDS pour en indexer le contenu. Certaines estimations tablent sur un minimum de 4,5 To à l’installation et d’une croissance minimale de 18 Go par jour pour les seules données JSON, sans parler des données brutes, beaucoup plus volumineuses, d’un facteur 10 selon Gavin Anderegg. Ce dernier rappelle d’ailleurs que ces chiffres ne tiennent pas compte du récent emballement dans les inscriptions sur Bluesky.

Concernant les vues d’applications, techniquement tout le monde peut en développer. Dans l’idée d’ailleurs, Bluesky parle de vue pour évoquer un prisme permettant de représenter des données depuis un flux brut. Si la seule utilisation actuelle est faite dans le cadre d’un service de micro-blogging, le protocole AT peut a priori être utilisé pour tout et n’importe quoi.

Pour le reste, tout est du ressort strict de l’entreprise. Bluesky contrôle notamment deux éléments importants : les DID:PLC et les DM. Les premiers représentent, dans les grandes lignes, les identifiants des utilisateurs. Les seconds sont les messages privés, qui ne sont pas pris en charge par le protocole AT. Les données correspondantes ne sont donc pas présentes dans les PDS, mais gérées directement par Bluesky de manière séparée.

Bluesky n’est ni fédéré, ni décentralisé… pour l’instant

Le protocole AT a été pensé pour être décentralisé. Dans la pratique, Bluesky ne l’est pas. La possibilité de créer facilement un PDS n’est qu’un petit élément parmi d’autres. Même si l’on peut créer des relais, leur mise en œuvre est complexe et sans doute bien trop onéreuse en stockage et bande passante pour être intéressante.

On ne peut pas dire que Bluesky soit actuellement décentralisé, et encore moins fédéré. Il y a bien un centre, et il est géré par l’entreprise Bluesky. Sans son relai, rien ne fonctionne. Chaque serveur de données personnelles ne sert ainsi que comme petit réservoir pour les informations d’une personne, incapable de fonctionner par lui-même.

Pour Gavin Anderegg, ce n’est ni bien ni mauvais : ce n’est que le fonctionnement actuel, qui pourrait changer. Il estime en effet que l’équipe en charge du réseau se dirige petit à petit vers la décentralisation, mais que la tâche reste immense au vu des choix techniques. En outre, il souligne la grande ouverture du protocole, qui permet de voir l’intégralité du flux, puisque toutes les informations y sont publiques.

Cet aspect du réseau est d’ailleurs moins connu et peut avoir toute son importance : rien de ce que vous publiez sur Bluesky n’est privé. On peut s’en rendre compte facilement en allant dans les options de vie privée et sécurité. Là, un réglage propose de masquer le compte aux personnes non connectées à Bluesky. Cependant, on est averti : « Bluesky est un réseau ouvert et public. Ce paramètre limite uniquement la visibilité de votre contenu sur l’application et le site Web de Bluesky, et d’autres applications peuvent ne pas respecter ce paramètre. Votre contenu peut toujours être montré aux personnes non connectées par d’autres applications et sites Web ». Les profils privés n’existent pas sur le réseau. Une page résume la situation sur les données publiques et privées.

Commentaires (38)

Abonnez-vous pour prendre part au débat

Déjà abonné ? Se connecter

Cet article est en accès libre, mais il est le fruit du travail d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.

Accédez en illimité aux articles

Profitez d’un média expert et unique

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Abonnez-vous

Aqua Abonné

Le 21/11/2024 à 16h51

Betterige a encore frappé !

Wikipedia

ça lie très bien avec l'article d'hier où les commentaires mettaient le côté supposé fédéré et décentralisé de Bluesky en avant
Merci Vincent!

Alexandre Laurent Équipe

Modifié le 21/11/2024 à 17h27

Haha bien vu pour Betterige ;-)

C'est précisément la conversation, très riche, enclenchée entre hier et ce matin qui nous a motivé à synthétiser les choses et essayer de les rendre accessibles au plus grand nombre !

C'est aussi le fait qu'on lit partout que BS est un réseau "décentralisé", alors que comme le montre Vincent, c'est un peu plus compliqué que ça...

D'ailleurs @Vincent_H on aura peut-être intérêt à faire un article du même genre sur ActivityPub, histoire de

Vincent Hermann Équipe

Le 21/11/2024 à 17h09

dada55 Abonné

Le 21/11/2024 à 18h00

On veut la version ActivityPub ! <3

Merci @VincentHermann pour l'article !

JK Abonné

Le 21/11/2024 à 17h22

Threads, nous dit-on, serait compatible avec ActivityPub, voire serait une instance parmi les autres ? Instance encore plus énorme que mastodon.social ?

SebGF Abonné

Modifié le 21/11/2024 à 18h42

Je pense que ça doit être plus une couche de compatibilité dans le cas de Threads qu'autre chose. Meta a quand même une très forte expérience sur le fonctionnement des médias sociaux et les enjeux techniques, il serait con de reposer sur un protocole tiers alors qu'ils ont très certainement tout ce qu'il leur faut à la maison avec des années de développement et perfectionnement.

Donc je vois plus son intégration ActivityPub comme un moyen d'interco pour se connecter au Fediverse que comme un backend pur. Un peu comme les bus d'événement chez les Cloud Provider par exemple, qui ont tous une compatibilité Apache Kafka / Kafka Connect (car produit très à la mode dans le domaine) mais qui reposent sur un logiciel propriétaire du CSP.

Cette couche de compatibilité est, évidemment, un moyen de faciliter la migration d'une solution à l'autre. On le voit aussi dans le domaine des SDK autour de l'IA générative où les autres concurrents émulent les API d'OpenAI dans les leurs. Celles-ci sont devenues un standard de fait en raison de la rapide adoption de leurs produits. C'est aussi utilisé dans la stratégie du EEE comme l'a subi XMPP en son temps.

dada55 Abonné

Le 21/11/2024 à 21h03

Threads est compatible mais il demande que l'instance avec laquelle il s'interconnecte publie publiquement son contenu.
Par exemple, mon instance est configurée par défaut en privé. Si mes membres veulent avoir un compte public, ça nécessite une action de leur part et c'est tout l'intérêt. Ils et elles doivent être conscient que c'est un choix important.

Je ne suis, donc, pas compatible avec Threads et c'est de la merde, en gros.

Attention, une instance privée ne veut pas dire que les publications ne sont pas visible de l'extérieur. On discute avec la terre entière sans souci. Ça veut juste dire que, sans compte, tu ne peux pas tout voir de l'extérieur.

Aqua Abonné

Modifié le 21/11/2024 à 22h03

Voilà y a ça, d'une part et puis y a la méthode.

Une vue un peu biaisée d'un hébergeur d'une instance Mastodon de 2 utilisateurs: Y a quelques mois (un peu plus d'un an en fait), Meta a invité "confidentiellement" les administrateurs.ices des "grosses" instances Mastodon à causer fédération. Il s'en est suivi un débat ouvert, pas du tout confidentiel, autour de "oui/non pourquoi/comment avec quelles conséquences" on pourrait accepter de fédérer avec les serveurs de Threads.

Un article ici par exemple : https://hub.fosstodon.org/facebook-fosstodon-fedi

De nombreuses instances (invitées ou pas par Méta) on eu cette conversation en interne et ont conclu selon les cas "on bloque les serveurs méta" ou "on va bien voir" ou "mais si allons-y, fédérons". (blocage préventif puisque la fédération n'était encore qu'en projet et pas du tout effective à ce moment là).

Dans la première catégorie y a celleux qui savent bien comment marchent les machines à emmerdification comme Facebook et qui ont bien compris qu'il ne s'agit là que d'une nouvelle mouture du Embrace Extend Extinguish d’antan. (les barbus des années 90 reconnaîtront).

Dans la dernière catégorie, y a Mastodon.social, l'instance de Eugene. et la direction qu'il prend (pousser son instance promotionnellement au détriment des autres) est pas super bien perçue. J'ai plus les chiffres du moment mais je serais pas étonné que mastodon.social représente 1/4 ou plus des utilisateurs.ices actifs de Mastodon. Alors que initialement, l'objectif était justement de pousser à des myriades de petites instances à taille humaine. Et donc mastodon.social ne s'oppose pas à threads et n'a pas il me semble une attitude hostile envers Meta. (normalement y a le meme de Gandalf "Fly you fools" qui arrive à ce moment là).

A titre perso, sur mon instance de 2, j'ai bloqué Threads.

Gilbert_Gosseyn Abonné

Le 22/11/2024 à 10h16

Je suis preneur d'un tel article.

bingo.crepuscule

Le 21/11/2024 à 22h26

Bluesky c'est c'est comme twitter et game of thrones, plus on en parlera, moins j'aurais envie d'y aller.

tipaul Abonné

Le 22/11/2024 à 11h22

Tu as bien tort : GoT, c'est super (si on aime le genre)

SebGF Abonné

Le 21/11/2024 à 17h01

Merci pour ce récap, c'est intéressant.

Je pense qu'il y a dans tous les cas une idée fondamentalement différente entre ActivityPub utilisé par Mastodon (entre autres) et AT Protocol de Bluesky.

La fédération et la décentralisation ont, à mon sens, quelques petites subtilités.

ActivityPub, techniquement, c'est comme un email : des messages (événements) placés dans des boites in et out. Il est vraiment abstrait de l'application qui l'implémente. C'est là où la fédération diffère un peu de la décentralisation, car ça signifie qu'on interconnecte une multitude de produits différents via un protocol commun (Mastodon, PeerTube, PixelFed, etc, utilisent ActivityPub alors que ce sont des logiciels différents). Un peu comme HTTP sert à faire causer plein de technos et produits différents. La fédération n'est pas une nécessité en soi et une instance Mastodon peut vivre de manière isolée (réseau social interne d'entreprise par exemple).

L'idée du décentralisé à la Bluesky, je la vois au sens où on a un service (ici : un média social) mais dont on peut instancier soi-même certains composants pour rejoindre une ruche collective qui elle, est centralisée. De ma compréhension de l'explication du protocole AT et de son implem de Bluesky, c'est grosso merdo comme du Bittorrent où le tracker (une partie centralisée, mais potentiellement multiple) s'occupe de la mise en relation avec les Peers (qui seraient un mix du PDS et Relay je dirais de prime abord). La diff avec la fédération, c'est qu'ici, le produit décentralisé n'est pas autonome, car il lui manque l'annuaire central. Mais comme ce produit décentralisé est rattaché à un service (ce que n'est pas Mastodon, par exemple), c'est une architecture qui s'explique aussi.

aeris22

Modifié le 21/11/2024 à 20h07

Petite remarque quand même, mais qui a son importance. L’usage d’un relay n’est PAS obligatoire.
Il est utilisé pour des questions de performance, mais le protocole est prévu pour fonctionner sans, et c’est officiellement dans la doc, et AT encourage officiellement à s’en passer.

https://atproto.com/guides/glossary#relay
Relays are an optimization and are not strictly necessary. An AppView could communicate directly with PDSes (in fact, this is encouraged if needed). The Relay serves to reduce the number of connections that are needed in the network.

Bluesky
Given all that, our proposed methodology here of networking through Relays instead of server-to-server isn’t prescriptive. The protocol is actually explicitly designed to work both ways.

Donc absolument aucun problème à ce qu’actuellement seul BS en fasse tourner un ou que ça ne soit à la portée que de gros moyens.

Et dire « sans relay, rien ne fonctionne » est donc faux.

Vincent Hermann Équipe

Le 22/11/2024 à 10h00

Alors j'ai hésité à entrer dans les détails à ce moment. Parce qu'en effet ils le disent, ils le recommandent mais... ils ne l'appliquent pas eux-mêmes. En pratique, le Bluesky actuel ne fonctionne pas sans le relai de Bluesky. Ensuite tout dépend ce que l'on veut faire. Oui on peut créer une App View qui va chercher directement des PDS, mais on ne parle plus de Bluesky proprement dit dans ce cas. Est-ce que ce passage de la doc n'est pas fait pour les "autres" cas de figure, dans des utilisations qui ne sont pas de type micro-blogging ?

aeris22

Le 22/11/2024 à 12h07

Ce n’est pas vraiment qu’ils ne l’appliquent pas eux-même, c’est qu’ils sont justement dans le cas où ils doivent optimiser et mettre un relay.
Les petites instances d’appview n’ont pas d’intérêt à un relai et peuvent discuter avec les PDS directement. Les grosses instances d’appview écrouleraient le réseau sans relai, en bombardant les PDS en permanence.

Rien n’empêche de monter son appview et son PDS et de fédérer avec le réseau conventionnel. Ça resterait BlueSky. ’fin pour être plus exact, ça resterait ATProto, avec une instance non BS à la fois en PDS et en AppView.
Un peu comme le fait d’avoir mamot.social sur le Fediverse ne remet pas en question mastodon.social. Ça reste du Fediverse 😊

C’est à mon sens la grosse confusion. On est en train de comparer BlueSky (une instance) à ActivityPub (un protocole) quand on devrait comparer BlueSky (une instance) à mastodon.social (une instance) et ATProtocol (un protocole) à ActivityPub (un protocol).
Dire « ça ne sera plus BS » est à mon sens une erreur de compréhension et conduit à faire des erreurs de sens et de conclusion. C’est comme dire « mastodon.social est-il centralisé ». La réponse est dans la question 🤣 (Et d’ailleurs la réponse est « mastodon.social est plus centralisé que BS parce que BS a déjà pu se couper en plusieurs bouts, ce que mastodon.social est incapable de faire »).

Le vrai titre de l’article est « ATProtocol est-il décentralisé », BS n’étant qu’une instance d’AT et la question est justement de savoir s’il est possible d’en fédérer une 2nde (et la réponse est oui, avec ou sans relai)

Peckemys Abonné

Modifié le 22/11/2024 à 08h46

Qu'en est-il du modèle de financement de Bluesky ? Est-ce financé par des grands investisseurs ? Est-ce qu'il y a une chance que les services se dégradent au nom de la rentabilité ? Pour moi, cela reste un critère important pour que les gens et les institutions s'investissent sur cette plateforme.

Dj Abonné

Modifié le 22/11/2024 à 09h57

Oui c'est des fonds qui paient les factures en espérant un retour sur investissement plus tard comme l'explique Tris ici Les mauvaises habitudes de Twitter que vous devriez perdre sur Bluesky

"Bluesky deviendra un réseau social publicitaire à un moment donné, car il faut payer les serveurs, les techniciens, les modérateurs, les designers, etc. Il y aura donc une course à la visibilité. Vous n’êtes pas chez vous, dans votre salon.

Pour le moment, il y a une pause, car l’outil est en phase d’acquisition de public et quand on cherche à capter un public, on fait dans l’open-bar. Dès que les outils statistiques officiels arriveront, le vent commencera à tourner. Les entreprises arriveront et avec elles, les influenceurs.

"

Fabrice B.

Le 22/11/2024 à 09h10

En quoi les cieux de X ne sont pas cléments ?

Gorom Abonné

Le 23/11/2024 à 09h29

Je dirais une fâcheuse habitude de son propriétaire à polluer les cieux de manière générale.

127.0.0.1

Le 22/11/2024 à 10h48

D’autre part, l’affichage chronologique par défaut des publications, loin des algorithmes poussant à l’engagement.

De mémoire, BlueSky voulait faire un marketplace d'algorithmes où on pouvait publier/installer l'algo de son choix. Ca a changé ?

SebGF Abonné

Le 22/11/2024 à 11h03

Je sais pas sur ce point, mais actuellement la vue algo existe bien avec la timeline "Discover". Elle se personnalise avec les types de profils suivis et les "likes" donnés sur les posts. On peut aussi donner quelques centre d'intérêts génériques (photo, musique, etc).

Par contre la vue "Follow" et les Feeds sont en chronologique, comme Mastodon. Perso c'est ce que je préfère.

127.0.0.1

Le 22/11/2024 à 13h28

Moi aussi ca me semble parfaitement sensé d'avoir un algo pour "discover" et du chronologique pour les abonnements à des flux. Mais p-e parce que je suis vieux et que je m'abonne à peu de flux.

SebGF Abonné

Modifié le 22/11/2024 à 14h44

Pareil, j'aime le chrono, pas le bordel random. Et je ne m'abonne pas à trop de monde, c'est illisible.

Quand je vois sur Mastodon des personnes à 3k following, je comprend pas comment elles font.

Stéphane Bortzmeyer Abonné

Le 22/11/2024 à 11h33

Un autre récit de quelqu'un qui a essayé (de monter sa propre instance Bluesky) : https://melkat.blog/p/hosting-bsky

Nozalys Abonné

Le 22/11/2024 à 11h50

Qu'est-ce qui va empêcher les utilisateurs toxiques de Twitter d'aller intoxiquer aussi les gens sur Bluesky ?
Je veux dire, la modération ça ne suffit pas, même une hypothétique équipe ultra staffée de 10 000 modérateurs ne peuvent pas modérer des centaines de millions de messages envoyés par des dizaines de millions de gens.

Alors quoi d'autre, concrètement ? Pourquoi ce réseau serait-il mieux que les autres, alors qu'un réseau social n'est rien d'autre qu'un reflet de notre société, et que c'est notre société qui est toxique, agressive, cynique.

deathscythe0666 Abonné

Le 22/11/2024 à 12h16

Qu'est-ce qui va empêcher les utilisateurs toxiques de Twitter d'aller intoxiquer aussi les gens sur Bluesky ?

Si, quand tu signales, les comptes sont bloqués (au lieu d'être promus quand il s'agit de comptes alt right sur X), tu as déjà une amélioration importante par rapport à X. La modération ne peut pas être parfaite, mais tu seras mieux sur un réseau qui essaie au moins de modérer, par rapport à un réseau qui est plutôt dans la démarche inverse.

Timanu69

Le 22/11/2024 à 12h24

Je ne croix gammée ce qui se dit sur X

SebGF Abonné

Le 22/11/2024 à 13h06

Perso je l'avais déjà observé aux différents moments où on comparait Mastodon et Twitter et que plein de monde se montait le bourrichon sur le sujet. Pour moi y'a pas de question de mieux ou moins bien.

C'est juste différent.

Le Fediverse aussi est pourri par les travers de l'humanité. C'est juste que l'outil et le concept est différent, et il faut voir comment ça va évoluer.

Dans le cas de Bluesky, ils ont un système basé sur des étiquettes pour annoter le contenu produit par les utilisateurs et ainsi catégoriser ceux que les personnes veulent masquer ou non (dans l'article ils prennent l'exemple de photos d'araignées). Le système est disponible auprès de la ruche mais chacun peut aussi faire tourner le sien. Et il est possible de débrayer une partie des politiques proposées par le central de Bluesky. Il considère ainsi partager la charge de la modération avec la communauté de ce que j'ai compris.

C'est une approche différente de Mastodon qui confie la responsabilité aux maintainers d'instances uniquement (ajouté aux listes de blocages qui permettent de filtrer des instances).

Dans les deux cas (Mastodon et Bluesky), les utilisateurs conservent aussi des outils de modération personnelle avec le filtrage de profils et de contenus (mots clés, etc).

JK Abonné

Modifié le 22/11/2024 à 13h38

Perso, en tant qu'utilisateur Mastodon, j'ai bloqué 2 instances (dont les intérêts ne sont pas les miens) et quelques profils un peu chauds. Un peu comme sur LinkedIn où j'ai pu bloquer quelques agacés énervés, mais rien à voir avec Facebook qui continue à me suggérer des publications "out of interest" et où un bon tiers des commentaires sont lunaires ou "out of self-control"

SebGF Abonné

Le 22/11/2024 à 14h45

Pour le moment, jusqu'ici, je n'ai pas de suggestion de la part de Bluesky.

Et je ne regarde pas la timeline "Discover", ça évite donc la pollution :)

127.0.0.1

Modifié le 22/11/2024 à 16h12

Qu'est-ce qui va empêcher les utilisateurs toxiques de Twitter d'aller intoxiquer aussi les gens sur Bluesky ?

De part la nature du protocole AT, c'est le client Bluesky qui bloque les messages. Et il le fait à partir des labels posés sur les messages par les différents services de labeling: celui de Bluesky (non désactivable) et d'autres services de labeling (optionnels).

Un peu à la manière d'adblock: tu reçois toute la page HTML et adblock supprime les éléments gênants de la page en utilisant des listes de filtre.

Si tu trouves la modération de base du client Bluesky insuffisante, il faut espérer que tu trouves ton bonheur dans les services de labeling optionnels.

A l'inverse, ceux qui trouvent la modération de Bluesky trop forte devront prendre un autre client que celui de Bluesky.

lien

JK Abonné

Le 22/11/2024 à 12h47

Est-ce qu'il existe un serveur francophone Bluesky ? Je suis prêt à tester sur un petit serveur pas trop confidentiel et plutôt destiné au grand public.

Schismatrice

Le 23/11/2024 à 14h01

Je suis étonné que personne ne parle de Nostr en commentaire, c'est une alternative à X qui est vraiment décentralisée, pour le coup. Jack Dorsey y poste plus que sur tout autre réseau.

Neliger Abonné

Le 23/11/2024 à 15h22

C'est vrai que d'une manière générale, on en parle beaucoup moins que d'ActivityPub.

SebGF Abonné

Modifié le 25/11/2024 à 07h23

Le créateur de l'instance Fosstodon, Kev Quirk, a posté un point de vue intéressant sur l'avenir du web fédéré.

Il pointe également un gros défaut de ActivityPub qui est, lui aussi, son besoin en ressources. Etant donné que son profil (et celui des autres admins de l'instance) est automatiquement suivi, il a 26k followers, résultant que s'il devait héberger une instance pour lui-même, elle devrait mettre en cache l'activité de ces personnes. Il avait aussi partagé (et rappelé dans ce billet) que Mastodon peut DDoS un site web (le sien, en l'occurrence) à cause de la génération de vignettes.

@AlexandreLaurent

@VincentHermann

si jamais vous abordez ActivityPub de la même façon, Kev a fait pas mal de retour d'expérience dessus. Il expérimente aussi l'idée d'une instance limitée à 500 utilisateurs, payante, avec 500.social.

Ferd Équipe

Le 25/11/2024 à 07h50

J’ai du mal à comprendre pourquoi l’instance mettrait en cache l’activité des followers, c’est pas plutôt l’inverse, mettre en cache l’activité des gens qu’il suit ?

fdorin Abonné

Le 25/11/2024 à 08h35

Toutes les interactions d'un utilisateur appartiennent à cet utilisateur. Autrement dit, c'est le profil de l'utilisateur qui stocke tous ses posts bien sûr, mais aussi ses réactions, ses commentaires, etc. quel que soit le contenu visé (y compris sur une autre instance).

De ce fait, une instance mastodon, pour récupérer les réactions, commentaires, etc des utilisateurs des autres instances, à besoin de récupérer (d'où la mise en cache) les informations pour chaque utilisateur, en particulier les followers dans la mesure où ils sont plus prompt à voir le contenu, et donc à y réagir.

La mise en cache ne se fait pas par profil (enfin j'espère

), mais par instance. Le nombre de follower qu'il indique pour son instance, c'est juste pour donner un ordre d'idée du nombre de profils qui sont récupérés (fédérés, = en provenance de l'extérieur de l'instance) afin de pouvoir afficher les différentes interactions avec les profils locaux (= de l'instance) sur sa propre instance.

SebGF Abonné

Le 25/11/2024 à 13h26

Oui c'est au niveau de la fédération, car l'instance doit récupérer les événements produits par les interactions (inbox/outbox, fonctionnement d'ActivityPub). Dans son cas, avec 26k followers, une publication sur mastodon entraîne autant d'événements au travers de la Fédération. Sans oublier les réponses, les notifications de "favorite", les repost, etc.

Pour donner un ordre d'idée, le profil avec le plus d'abonnements serait mastodon.social avec 822k, suivi par celui de George Takei à 400k.

Fosstodon a fait x10 sur son coût d'hébergement lors des grosses vagues de migration. À l'époque où je m'étais inscrit dessus, leur hébergement coûtait dans les $200/mois. C'est l'une des raisons pour lesquelles elle est passée sur invitation.