26 mars 2026 : Fouille de textes
Grobid : extraire et structurer des données provenant de publications scientifiques
Lire l'article
25 septembre 2025 : Fouille de textes
datatableExtract : un outil pour récupérer les tableaux dans un document PDF
Lire l'article
6 mars 2017 : Enrichissements
Océrisation du corpus Nature
Lire l'article
11 avril 2016 : Enrichissements
Sprint #8 d’ISTEX-DATA : « Docteur Levenshtein »
Lire l'article