Dans le cadre des nouveaux services proposés par l’infrastructure Istex, opérée par l’Inist-CNRS, voici la troisième présentation d’un outil autonome et interopérable pour la fouille de textes ou TDM (Text and Data Mining).
Après topRefExtract en novembre, voici un autre web service de fouille de textes qui s’intéresse aux références citées : bibCheck contrôle les références bibliographiques.
Son objectif ? Il identifie la nature d’une référence : il repère s’il s’agit d’une référence rétractée, hallucinée ou juste.
La méthode ? Il prend en entrée ces différents cas :
– un DOI seul ;
– une référence avec ou sans DOI ;
– une url vers un PDF ;
– un PDF (uniquement via IA Factory, voir ci-dessous)
Il vérifie la présence de chaque référence dans Crossref. S’il la retrouve, le web service vérifie alors dans le Problematic Paper Screener* si la publication est ou non rétractée. Il peut également estimer qu’une référence est hallucinée quand le DOI ne correspond pas au titre et au premier auteur.
Son utilisation ? Comme pour une partie des autres web services :
– via Lodex, un outil open source de visualisation et de traitement de données structurées développé à l’Inist. Cette plateforme permet d’importer vos données, de les traiter selon vos besoins, avec nos web services, de visualiser les résultats de façon dynamique et enfin de les publier sous forme de site web.
– via IA Factory, interface de chargement de corpus et d’exécution d’outils TDM : le traitement s’effectue à partir d’un document PDF dans lequel sont repérées les références citées.
– via une ligne de commandes (outils curl, wget, ou autres, pour des utilisateurs plus avancés)
Venez consulter le catalogue des web services ISTEX TDM pour trouver des outils d’aide à l’analyse de données et de textes.
Valérie Bonvallot pour l’équipe TDM
*Cabanac, G., Labbé, C., & Magazinov, A. (2022). The ‘Problematic Paper Screener’ automatically selects suspect publications for post-publication (re)assessment.
Presented at WCRI 2022: 7th World Conference on Research Integrity. arXiv preprint. https://doi.org/10.48550/arXiv.2210.04895
Besoin d'aide ?
Consultez notre Faq, la documentation Istex ou nos tutoriels
N’hésitez pas à nous contacter si besoin, nous reviendrons rapidement vers vous !