Connexion Abonnez-vous

Submergée de prépublications générées par IA sur l’IA, arXiv va modérer plus strictement

Les IA parlent pseudoscientifiquement aux IA au sujet de l'IA

Submergée de prépublications générées par IA sur l’IA, arXiv va modérer plus strictement

La plateforme de preprints arXiv ne va plus accepter aucune prépublication d'articles de synthèse ou d'argumentaires sur l'IA. Elle explique ce changement par l'avalanche d'articles de ce genre générés par IA sur la plateforme.

Le 04 novembre à 14h13

Les articles générés par IA pullulent aussi dans la sphère scientifique. Certains chercheurs ne se gênent pas pour utiliser ChatGPT ou une autre IA générative pour éditer des articles à foison, se rendre visibles dans leur communauté et polluer les plateformes de prépublication d'articles (le terme anglais « preprint » est couramment utilisé dans le milieu) comme arXiv. D'autant que sur cette plateforme, après deux articles validés par leurs pairs, les chercheurs peuvent mettre en ligne leurs articles sans modération a priori.

Envahie par des preprints générés par IA

Résultat : la plateforme historique (arXiv existe depuis 1991) de la prépublication scientifique est submergée de preprints générés par IA, notamment sur l'intelligence artificielle. Sur son blog, l'équipe d'arXiv a publié un billet expliquant qu' « au cours des dernières années, arXiv a été inondé d'articles. L'IA générative et les grands modèles linguistiques ont contribué à cette avalanche en facilitant et en accélérant la rédaction d'articles, en particulier ceux qui ne présentent pas de nouveaux résultats de recherche ».

Il reste 72% de l'article à découvrir.

Déjà abonné ? Se connecter

Cadenas en colère - Contenu premium

Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.

Accédez en illimité aux articles

Profitez d'un média expert et unique

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Commentaires (6)

votre avatar
Exercice n°27, compléter la suite:

1/ Nourrir une vache avec de la nourriture issue d'une vache => Creutzfeldt-Jakob.
2/ Les animaux et populations consanguines => dégénérescence
3/ L'IA qui génère de l'IA => ?
votre avatar
On peut y voir une analogie humaine. Un LLM qui ne ne fait que pomper dans ses propres générations, deviendra médiocre.
Les humains sont pareils, tous ceux qui sont dans l'entre-soi sans place pour la différence et l'intellect allant de pair avec la confrontation avec la différence, mentale, verbale, au mieux vivotent, au pire dépérissent intellectuellement.
votre avatar
Pour le point 1/, je pensais que le problème était apparu quand ils avaient arrêté de cuir les farines animales (Mais voyons, ça coute cher de cuir la nourriture des animaux).
votre avatar
3/ L'IA qui génère de l'IA => ?
L'entraînement de modèle sur des données générées par les mêmes types de modèle entraîne une forte dégénérescence et ça se case la gueule en très peu de générations de mémoire. Il y a eu plusieurs publications à ce sujet.
votre avatar
De vraies publis, ou générées par IA ? :D
votre avatar
Pour le point 3, je crois qu'on appelle ça de la consanguinité dans l'IA
(pas certaine cela dit)

Submergée de prépublications générées par IA sur l’IA, arXiv va modérer plus strictement

  • Envahie par des preprints générés par IA

  • Une politique de modération resserrée

  • Des preprints popularisés depuis le Covid et massivement utilisés dans l'entrainement des IA

Fermer