Dans le cadre des nouveaux services proposés par l’infrastructure Istex, opérée par l’Inist-CNRS, voici la présentation de 2 outils autonomes et interopérables pour la fouille de textes ou TDM (Text and Data Mining).

Vous devez rédiger rapidement un résumé en anglais ? Vous devez détecter des résumés ou de courts textes générés par l’intelligence artificielle ? Deux web services répondent à ces besoins.

textSummarize

Son objectif ? Il résume un texte scientifique en anglais.

La méthode ?

Nous vous proposons un modèle de résumé qui s’appuie sur Bart entraîné sur le jeu de données CNN-dailymail

Pour plus de détails, consultez la fiche descriptive du web service ici

aiAbstractCheck

Son objectif  ? Il détecte si le résumé d’un texte scientifique a été généré par une intelligence artificielle, quelle que soit la langue.

La méthode ?  Le modèle a été entraîné sur un mélange de résumés provenant d’Istex, et de résumés générés par plusieurs modèles de langage (LLMs).

Pour plus de détails, consultez la fiche descriptive du web service ici .

Leur utilisation ?
Rassurez-vous , vous n’avez pas besoin de comprendre les méthodes sous-jacentes pour utiliser ces outils.
Ils sont accessibles de différentes manières :
– via Lodex, un outil open source de visualisation et de traitement de données structurées développé à l’Inist. Cette plateforme permet d’importer vos données, de les traiter selon vos besoins, avec nos web services, de visualiser les résultats de façon dynamique et enfin de les publier sous forme de site web.

– via une ligne de commandes (outils curl, wget, ou autres) pour des utilisateurs plus avancés

N’oubliez pas que d’autres outils sont à votre disposition pour indexer vos documents.

 Venez consulter le catalogue des web services ISTEX TDM pour explorer tous les outils d’aide à l’analyse de données et de textes.

Valérie Bonvallot pour l’équipe TDM

besoin d'aideBesoin d'aide ?

Besoin d'aide ?

Consultez notre Faq, la documentation Istex ou nos tutoriels

N’hésitez pas à nous contacter si besoin, nous reviendrons rapidement vers vous !

Écrivez-nous

fermer la modale