Histoire du GETA

Histoire du GETA

Le GETA (Groupe d’Étude pour la Traduction Automatique) était une équipe pluridisciplinaire formée d’informaticiens et de linguistes. Les thèmes de recherche du GETA concernent tous les aspects théoriques, méthodologiques et pratiques de la TAO (Traduction Assistée par Ordinateur), et plus généralement de l’informatique multilingue. Le GETA est issu du CETA (1961- 1971), laboratoire pionnier de la TA en France.

Historique du GETA (jusqu’en 2006)

Les recherches en TA, puis en TAO, ont été menées à Grenoble depuis 1961 au CETA, devenu GETA en 1971. Nos recherches peuvent s’articuler en trois grandes périodes, 1961-70, 1971-85, et 1986-99.

1961-70 est l’époque pionnière, où, sous la direction du Prof. B. Vauquois, le CETA (Centre d’Etudes pour la Traduction Automatique), laboratoire propre du CNRS, construisit le premier système de “deuxième génération” au monde, fondé sur le passage par un “langage pivot” hybride, et l’expérimenta sur de très importants volumes de textes. Il s’agissait alors de TA sans préédition ni postédition , que nous appelons aujourd’hui TA du veilleur. Cette période se caractérise par l’application éclairée de la théorie des langages formels et de leur compilation au problème de la TA, ainsi que par l’intégration de théories linguistiques de pointe, avec en particulier le passage par un “langage pivot”.

Les recherches continuèrent à partir de 1971 dans le cadre d’un laboratoire universitaire associé au CNRS, le GETA (Groupe d’Etude pour la Traduction Automatique), dirigé par B. Vauquois jusqu’à son décès le 30/9/85. Le GETA est membre de l’IMAG, depuis la création de ce dernier en 1986.

De 1971 à 1980, le GETA, se tournant vers la TA du réviseur, élabora et expérimenta une nouvelle méthodologie de la TAO (approche transfert multiniveau) et un générateur de systèmes de TAO (Ariane-78) permettant d’écrire des maquettes ou des prototypes de TAO multilingue à l’aide de langages spécialisés pour la programmation linguistique (langages symboliques de règles de production).

De 1981 à 1987-88, le GETA participa activement à des transferts de technologie vers l’industrie (projet ESOPE, puis projet national PN-TAO de l’ADI en 81-82 et 83-87), tout en réalisant en interne un système “préopérationnel” russe-français pour la DRET, plusieurs études pour le projet Eurotra, et en aidant divers groupes étrangers à construire des maquettes ou des prototypes de systèmes de TA. Le système Ariane-78 fut profondément remanié et étendu, et donna naissance à l’actuel Ariane-G5.

La disparition de B. Vauquois, au milieu du PN-TAO, pour lequel sa participation était très importante, fut un grand choc. De 1986 à 1990, l’équipe s’efforça de mener à bien les diverses actions en cours, tout en se restructurant et en diminuant son activité de développement et d’expérimentation en vraie grandeur au profit d’une recherche plus fondamentale. À partir de 1988-90, considérant que le transfert technologique sur la TAO du réviseur avait été effectué, le GETA réorienta sa recherche vers la TAO individuelle, qui comporte deux volets, la TAO du traducteur et la TAO du rédacteur.

Les travaux principaux concernent la TAO du rédacteur et sont regroupés dans le projet LIDIA. L’idée de base est d’offrir à un rédacteur unilingue la possibilité de rédiger dans sa langue, et, au prix d’un dialogue de standardisation et de clarification (le moins lourd et le plus convivial possible), d’être traduit dans plusieurs langues, sans révision. Il s’agit donc de TAO fondée sur le dialogue (DBMT, pour Dialogue-Based Machine Translation) et de préédition indirecte, mais c’est bien la machine qui traduit. En TAO du traducteur, on étudie les aspects informatiques et ergonomiques liés à la construction d’outils de bureautique linguistique destinés à des traducteurs (professionnels ou occasionnels).

Les recherches en cours s’articulent autour de thèmes à dominante informatique, linguistique, et ergonomique, avec en particulier des études sur les techniques de désambiguïsation interactive, sur les bases lexicales multilingues par acceptions, sur l’intégration de possibilités d’apprentissage assisté par ordinateur (AAO), pour la découverte individuelle de connaissances linguistiques, et sur l’expérimentation de techniques modernes de génie logiciel pour (re)construire des outils informatiques (langages et environnements spécialisés pour linguistes et lexicographes) adaptés aux différents types de TAO, et en particulier à la TAO individuelle du futur.