« Traduire, c’est avoir l’honnêteté de s’en tenir à une imperfection allusive. » (Michel Leiris)

Depuis IBM 701

« We transmit thoughts by means of speech »¹ : voici la première phrase traduite du russe vers l’anglais, en 1954, par la machine IBM 701 a.k.a. le cerveau. Aujourd’hui, de lInitiative d’Helsinki, au projet Traduction et Science ouverte, en passant par le projet ANR Matos, la traduction automatique est au cœur des préoccupations sociales, scientifiques et politiques internationales.

Istex renfermant plus de sept siècles d’archives scientifiques, il offre d’explorer l’aspect diachronique de la traduction automatique. C’est cet objectif que nous nous sommes fixées en créant un corpus annoté. Ce nouveau corpus spécialisé, intitulé Machine Translation, rejoint la nouvelle collection Traduction de data.istex.

Machine à écrire

Vers un Babel Fish² ?

Le corpus Machine Translation est issu d’un travail multidisciplinaire mêlant recherche documentaire, TAL et terminologie. Il se compose de 7 160 documents annotés. Pour annoter ces documents, nous avons créé une terminologie bilingue (français-anglais) comprenant des noms de méthodes, de techniques et d’outils appartenant au domaine de la traduction automatique (Systran, table de traduction, triangle de Vauquois). Cette terminologie a été projetée sur le texte intégral. Les occurrences des termes détectés permettent notamment de construire un graphique de flux montrant l’évolution temporelle des approches de la traduction automatique. On y distingue 3 trois approches fondamentales : la Rule Based-Machine Translation approche originelle, à base de règles et de dictionnaires , la Statistical Machine Translation qui, comme son nom le laisse présumer, fonctionne par méthode statistique et utilise des corpus parallèles et, finalement, la Neural Machine Translation qui manipule des réseaux de neurones, tels les fameux Deepl ou ChatGPT.

Nos résultats seront présentés dans le cadre de l’atelier ARTS qui se déroule pendant le colloque CORIA TALN RJCRI RECITAL 2023.

Mathilde pour l’équipe Istex

————————

¹ « La parole sert à traduire nos pensées » cf. les Archives IBM.

² Le Babel Fish est une espèce de poisson imaginée par Douglas Adams dans Le Guide du voyageur galactique. Il permet, une fois enfoncé dans l’oreille, de comprendre n’importe quelle langue.

besoin d'aideBesoin d'aide ?

Besoin d'aide ?

Consultez notre Faq, la documentation Istex ou nos tutoriels

N’hésitez pas à nous contacter si besoin, nous reviendrons rapidement vers vous !

Écrivez-nous

fermer la modale