Reddit a décidé de bloquer l’archivage par Internet Archive pour éviter le scraping des IA
2 min
IA et algorithmes
IA
Le réseau social a décidé de bloquer l’archivage de ses pages de discussion par Internet Archive pour éviter le scraping effectué par des entreprises d’IA, explique The Verge.
Reddit et l’IA générative est une histoire compliquée. L’entreprise, dont le CEO d’OpenAI Sam Altman possède 9 % des parts, a rapidement rendu son API payante en réaction à la vague de l’IA générative. L’entreprise a maintenu ce projet malgré une fronde importante de ses utilisateurs.
Plus récemment, l’entreprise expliquait qu’elle envisageait de vérifier ses utilisateurs avec l’outil de scan d’iris de Sam Altman pour contrer les messages générés par IA.
Maintenant, Reddit explique vouloir bloquer l’indexation de ses pages détaillées des publications, les commentaires et les pages de profils de ses utilisateurs par l’outil d’archivage Wayback Machine. À The Verge, l’entreprise explique : « Internet Archive fournit un service pour tout le web, mais nous avons été informés de cas où des entreprises spécialisées dans l’intelligence artificielle enfreignent les politiques des plateformes, y compris la nôtre, et extraient des données de Wayback Machine ». Reddit va permettre à Internet Archive d’archiver seulement sa page d’accueil.
« Nous entretenons une relation de longue date avec Reddit et continuons à discuter de ce sujet avec eux », a expliqué à nos confrères le directeur de la Wayback Machine, Mark Graham.
Commentaires (10)
Abonnez-vous pour prendre part au débat
Déjà abonné ou lecteur ? Se connecter
Cet article est en accès libre, mais il est le produit d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.
Accédez en illimité aux articles d'un média expert
Profitez d'au moins 1 To de stockage pour vos sauvegardes
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
Abonnez-vousModifié le 12/08/2025 à 10h23
Reddit n'est plus là pour servir les internautes. Il est désormais là pour servir les boîtes d'IA avec du vrai contenu créé par des humains. Vous êtes la marchandise. Fuyez Reddit.
(cf. https://sebsauvage.net/links/?eXzeCw et https://sebsauvage.net/links/?jw2UHw)
Ah oui, et pour s'assurer que vous êtes une bonne marchandise humaine productrice de vrai contenu, Reddit envisage de vous "certifier d'origine humaine" : https://sebsauvage.net/links/?pkosYw
Le 12/08/2025 à 11h23
Le 12/08/2025 à 10h20
- Copyright ? Les textes postés sur les forums n'appartiennent pas à Reddit
- Charge CPU ? C'est Wayback qui la supporte
- Idéologie ? Généralement, c'est malsain...
Le 12/08/2025 à 10h41
Le 12/08/2025 à 13h40
Dans tous les cas, la poule aux œufs d'or de reddit, c'est le contenu poste par des membres.
Dès que je cherche une info un peu technique ou un avis un minimum sérieux, j'applique un tag "site:reddit.com" depuis que Google ne remonte que des sites de merde boosté au SEO.
Donc si des boîtes veulent entraîner leur modèles sur du contenu de qualité, reddit fait partie des incontournables et ce dernier veut être rémunéré pour ça.
Le 12/08/2025 à 10h27
Tous ces sites se rendent compte qu'il n'auront rien pour fournir des contenus. Les IAs ça ne regardent pas les pubs ou ne produit pas de contenu digne de confiance. Il y a du y avoir des rencontres avec ces boites d'IA et elles ont simplement dit que de payer pour ce contenu est sur la pile des idées à penser un jour peut être.
(La liste est-elle complète... hmm pas sur)
M'est avis que l'IA est le plus gros scandale de l'histoire de l'informatique.
Le 12/08/2025 à 10h42
Le 12/08/2025 à 11h06
Et bien évidement vendre à l'un et se faire piller par les autres ne les intéresse que moyennement.
Après il faut voir les termes de l'exclusivité du contrat. M'est avis que Reddit préfèrerait vendre à tous. Ou alors le chèque est bien lourd. Mais je n'y crois que peu : 60m$ avec un CA frôlant le demi milliard...
Le 12/08/2025 à 16h59
Le 17/08/2025 à 16h42
Signaler un commentaire
Voulez-vous vraiment signaler ce commentaire ?