ArXiv bannira pour un an les chercheurs qui déposent des articles bourrés de « slop » IA

The Vergeil y a 1 h

Livres ouverts sur le bureau d'una biblioteca académica — Photo: Mikhail Nilov / Pexels

ArXiv, le serveur de préimpressions en libre accès, a annoncé une nouvelle sanction visant à empêcher la diffusion d'« AI slop » dans les articles académiques. Les auteurs d'articles comportant des contenus générés par IA que l'auteur n'a manifestement pas vérifiés ne pourront plus déposer sur ArXiv pendant un an. Le message principal de la politique a été transmis par le président de la section informatique Thomas Dietterich dans une publication sur X.

Le critère central de la déclaration de Dietterich est la « preuve incontestable » que l'auteur n'a pas vérifié le résultat de la sortie LLM. Cette preuve comprend des références hallucinées, des citations qui n'appartiennent pas à d'autres études, et des lignes de « méta-commentaire » laissées par un modèle d'IA sans l'aval de l'auteur. La présence d'un livre, d'un article ou d'un nom d'auteur fictif dans les citations peut déclencher directement la sanction.

ArXiv a publié depuis 1991 environ 2,3 millions de préimpressions en sciences physiques, mathématiques, informatique, biologie quantitative et finance statistique. La plate-forme s'est développée comme alternative aux processus de revue avant publication dans le monde académique, mais au cours des trois dernières années les préoccupations sur la qualité des contenus ont augmenté en parallèle de la diffusion des outils LLM. L'équipe de modération d'ArXiv, opérée depuis Cornell University, regroupe environ 200 bénévoles.

Dietterich a indiqué que le filtre post-soumission avait identifié, ces dernières semaines, des articles portant « un marqueur ouvert de faible qualité ». Vendredi, il a déclaré : « Même une erreur dans des citations peut nuire directement à la recherche scientifique ; l'absence de vérification par l'auteur des sorties LLM crée un risque systémique. » Selon la nouvelle règle, les futures soumissions devront être acceptées « dans un lieu de revue par les pairs reconnu ».

Le terme « AI slop » s'est imposé dans l'écosystème web ces deux dernières années comme un usage informel pour désigner des contenus de faible qualité, générés par IA et non revus. Dans le monde académique, le terme a acquis une définition plus stricte : un article dont l'exactitude n'a pas été vérifiée parce qu'un contenu généré par un LLM est entré dans le processus de transfert académique sans validation ni édition par l'auteur.

La décision a suscité des réactions variées dans le secteur académique. Le chercheur de Hugging Face Yacine Jernite a déclaré sur X : « Si ArXiv n'avait pas pris cette mesure, l'ensemble du cycle de revue par les pairs aurait été érodé. » À l'inverse, le chercheur postdoctoral à Carnegie Mellon Ryan Cotterell a commenté : « Il subsiste un risque substantiel de faux positifs identifiant comme portant une signature IA un texte scientifique normal ; la méthodologie de détection d'ArXiv devrait être partagée publiquement. »

La méthodologie de détection d'ArXiv n'a pas été détaillée dans les communications actuelles. Dietterich a précisé que ce travail repose sur une revue manuelle par l'équipe de modération et non sur des outils automatisés de détection d'IA. Les scientifiques ont demandé des règles claires et un processus d'appel transparent.

Le débat américain sur la régulation de l'IA touche également ce sujet. Les National Academies of Sciences, Engineering, and Medicine (NASEM), dans un rapport publié en janvier 2026, recommandaient « d'adapter le processus de revue par les pairs à l'ère de l'IA de manière à préserver la qualité du transfert académique ». La décision d'ArXiv peut se lire comme la première réponse importante d'infrastructure académique après le rapport NASEM.

Les serveurs alternatifs de préimpressions n'ont pas encore indiqué comment ils réagiront à la politique d'exclusion d'ArXiv. Les politiques de modération différant entre SSRN (Social Sciences Research Network), BioRxiv et ChemRxiv, les auteurs bannis d'ArXiv pourraient se tourner vers d'autres plates-formes. Le Committee on Publication Ethics (COPE) a annoncé qu'il préparerait cette année un document de politique détaillé sur ce sujet.

Dietterich a indiqué que la décision concerne la section informatique mais que d'autres sections d'ArXiv pourraient examiner la même politique. La sanction est annoncée comme entrant en vigueur le 1er juin 2026. La section informatique d'ArXiv a publié environ 95 000 préimpressions en 2025 ; l'effet de la nouvelle règle devrait être mesurable au trimestre à venir.

Cet article est un résumé éditorial assisté par IA basé sur The Verge. L'image est une photo d'archive de Mikhail Nilov sur Pexels.