
Istex met à votre disposition une nouvelle collection de corpus spécialisés pour illustrer les possibilités de ses web services de fouille de textes (TDM). Ces outils, développés entre 2021 et 2026, permettent d’analyser et d’enrichir des données scientifiques. Deux versions de cette collection sont disponibles, reflétant l’évolution des fonctionnalités et des besoins de la communauté recherche. Elles exploitent des documents issus du réservoir Istex.
Deux versions pour deux étapes clés
- Version 2025 : Première édition présentant les résultats des web services développés entre 2021 et 2025. Ce corpus, en anglais et allemand, a pour objectif de montrer les possibilités de fouille de textes et de proposer un modèle d’utilisation de Lodex via des représentations graphiques.
- Version 2026 : Mise à jour incluant les nouveautés entre mars 2025 et avril 2026. Ce corpus élargi couvre désormais quatre langues (anglais, français, russe, allemand) et intègre 10 nouveaux web services, développés par l’Inist-CNRS ou ses partenaires.
Une collection conçue pour la communauté scientifique
Ces corpus sont accessibles à toute personne de l’enseignement supérieur et de la recherche souhaitant explorer la fouille de textes sur des données Istex. Ils sont constitués de documents sélectionnés pour leur capacité à illustrer les possibilités offertes par les web services, sans post-traitement d’homogénéisation afin de préserver la diversité des formes d’écriture (ex. : « usa » et « u.s.a »).
Chaque corpus est accompagné :
- D’un modèle Lodex pour lancer différents web services sur des données Istex
- De graphiques interactifs permettant de visualiser les résultats des traitements
- D’une documentation pour guider les utilisateurs dans la réutilisation des requêtes et des outils
Retrouvez la collection Web Services ici sur la page dédiée https://corpus.istex.fr/instance/webservices-collection et explorez le corpus TDM2 pour découvrir l’ensemble des web services de fouille de textes, avec une mise en avant des nouveautés de l’année écoulée.
Valérie Bonvallot pour l’équipe TDM (Text & Data Mining – Fouille de textes)
Besoin d'aide ?
Consultez notre Faq, la documentation Istex ou nos tutoriels
N’hésitez pas à nous contacter si besoin, nous reviendrons rapidement vers vous !