Bluesky n’utilise pas les données pour entrainer ses IA, mais d’autres le peuvent

Le 28 novembre à 08h57

Le 28 novembre à 08h57

Commentaires (8)

Vous devez être abonné pour pouvoir commenter.

Abonnez-vous
votre avatar
Autant dire que les Meta, Alphabet (Google), Amazon et Microsoft se frottent les mains et sont déjà partis à l'assaut de ces données.
votre avatar
De toute façon il faut rappeler que tout ce qui est public est... public. Et donc n'importe qui peut faire n'importe quoi avec.
votre avatar
Oui mais non. En théorie il y a quand même des cadres pour limiter ce que l'on peut faire des données publiques, que ce soit dans les conditions générales des plateformes ou encore par la Loi.

En théorie...
votre avatar
En théorie j'ai besoin d'un permis pour conduire une voiture. En théorie ;)

N'oublions pas que le mot d'ordre reste : Ask for forgiveness, not permission.

La portée de mon message était : prenez conscience que tout le monde n'et pas un Chevalier Blanc de Vertu et qu'il y a des requins qui vont forcément scrapper.
votre avatar
Comme OpenAI ou NVIDIA ? :D
votre avatar
Pas que. Cf Clearview par exemple.

Et autres réseaux encore moins bien intentionnés qui collectent les données publiques sans savoir ce qui en est fait. (sans oublier évidemment le renseignement étatique et j'en passe)

Au final, c'est un problème vieux comme le Web : si c'est public, c'est public et c'est récupérable / exploitable par n'importe qui et n'importe quoi.
votre avatar
Bluesky indique donc réfléchir à l’arrivée d’un nouveau paramètre qui, à l’instar du fichier robots.txt des sites web, pourrait indiquer si les données d’un compte peuvent être reprises.
RFC 35140 Do-Not-Stab. :stress:
votre avatar
à noter que PLOS ONE a publié ce mois-ci un article scientifique qui publie un jeu de données encore plus gros : https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0310330. Le jeu de données est ici : https://zenodo.org/records/11082879 et n'a pas encore été dépublié.
The dataset contains the complete post history of over 4M users (81% of all registered accounts), totaling 235M posts.

Bluesky n’utilise pas les données pour entrainer ses IA, mais d’autres le peuvent

Fermer