Après le chargement du bouquet PLoS, l’ingestion de ressources en libre accès se poursuit dans Istex avec SciELO, une base de revues scientifiques publiées principalement en Amérique latine.

SciELO (Scientific Electronic Library Online) est une initiative de la Fondation pour le soutien à la recherche de l’État de São Paulo au Brésil (FAPESP), du Conseil national brésilien pour le développement scientifique et technologique (CNPq) et du Centre latino-américain et caribéen d’information sur les sciences de la santé (BIREME).

 

Comme pour PLoS, les données SciELO nous ont été fournies gracieusement par Patrice Lopez (Société Science-Miner). Elles ont été identifiées et moissonnées à partir de la base Unpaywall, puis converties dans un format TEI et enrichies à l’aide des outils de « l’écosystème Grobid » (appellation non-officielle regroupant de nombreux outils disponibles sur le compte github de P. Lopez).

 

Les publications du bouquet SciELO d’Istex couvrent une période allant de 1909 à 2024 avec plus de 346 000 articles issus de 500 revues dont les plus représentées sont :

  • Arquivos de Neuro-Psiquiatria
  • Memórias do Instituto Oswaldo Cruz
  • Cadernos de Saúde Pública
  • Ciência Rural

Au total, 6 langues sont présentes dans ce bouquet : anglais, portugais, espagnol, français, italien et allemand. La langue anglaise est majoritairement représentée avec 179 885 articles. A noter que le portugais arrive en 2ème langue avec 156 194 documents, soit 98% de documents de langue portugaise en plus dans Istex.

 

Les domaines couverts sont :

  • Sciences agricoles
  • Sciences sociales appliquées
  • Sciences biologiques
  • Ingénierie
  • Sciences exactes et sciences de la Terre
  • Sciences de la santé
  • Sciences humaines
  • Linguistique, Lettres et Arts
  • Psychanalyse

 

D’un point de vue technique, ce corpus est traité comme la plupart des bouquets issus des négociations avec les éditeurs. Chaque document est disponible :

  • dans un format XML source (XML-JSON dans notre cas)
  • dans sa version PDF originale
  • dans une version XML-Mods
  • dans une version XML-TEI
  • et dans plusieurs formats générés par notre chaîne de traitement, ce qui inclut les enrichissements « teeft » et  « nb » (extraction de mots-clés et catégorisation automatique)

 

Comme pour les autres bouquets dans Istex , les documents SciELO peuvent être utilisés à des fins de TDM (Text & Data Mining ou fouille de textes) car ils sont libres de droits.

 

Grâce à l’ajout de ce bouquet, Istex dépasse les 30 millions de documents avec 30 064 284 objets documentaires appartenant à 52 bouquets multidisciplinaires que vous pouvez aller interroger dans Istex Search.

 

Ce nombre augmentera encore prochainement avec l’ajout de nouveaux bouquets issus d’acquisitions ainsi que d’autres bouquets en libre accès, qui sont d’ores et déjà prévus.

 

Nous vous souhaitons une bonne consultation.

Stéphanie, pour l’équipe Istex

 

 

besoin d'aideBesoin d'aide ?

Besoin d'aide ?

Consultez notre Faq, la documentation Istex ou nos tutoriels

N’hésitez pas à nous contacter si besoin, nous reviendrons rapidement vers vous !

Écrivez-nous

fermer la modale