En bref
L’équipe GETALP (Groupe d’Étude en Traduction Automatique/Traitement Automatisé des Langues et de la Parole) est née en 2007 lors de la création du LIG.
Issue de l’union vertueuse de chercheurs en traitement de l’écrit et de la parole, le GETALP est une équipe pluridisciplinaire (informaticiens, linguistes, phonéticiens, traducteurs et traiteurs de signaux, …) dont l’objectif est d’aborder tous les aspects théoriques, méthodologiques et pratiques de la communication et du traitement de l’information multilingue (écrite ou orale).
La méthodologie de travail du GETALP s’appuie sur des allers-retours continus entre collectes de données, investigations fondamentales, développement de systèmes opérationnels, applications et évaluations expérimentales.
Points saillants
- Approche écologique :
- Une des spécificités du GETALP est sa volonté de se confronter à la diversité des situations d’usage de la langue écrite ou parlée : multiplicité des langues, des locuteurs, des dialectes, des cultures, des contextes sociaux ou applicatifs ; avec une disposition particulière pour les « longues traines » (langues peu dotées, locuteurs atypiques, …).
- Démarche agnostique :
- L’histoire de l’équipe, et les cultures scientifiques diverses qui y sont rassemblées, permettent de mettre en synergie méthodes expertes et empiriques, analyse à grande échelle (big data) et analyse de phénomènes nécessitant une annotation fine (beautiful data), modèles et induction, etc.
- Pluridisciplinarité :
- La dynamique de l’équipe GETALP est liée en partie à la complémentarité de ses membres, permettant une approche « en largeur », de la collecte de ressources à l’évaluation de systèmes ; de la compréhension de phénomènes communicatifs aux applications industrielles.
- Avec l’humain au centre :
- Pour assister l’humain dans des situations de communication et d’interaction, il est nécessaire de l’inclure dans les processus automatisés (approches semi-supervisées, interactives, collaboratives, analyse de traces et d’erreurs des systèmes).
- Production d’outils et de ressources :
- Le GETALP développe et distribue librement des outils et des ressources (plate-forme Web de développement coopératif de bases lexicales multilingues, collecte de corpus écrits et oraux pour le traitement des langues peu dotées, collecte de corpus multimodaux dans des contextes d’interaction, système collaboratif de post-édition et d’évaluation de traductions automatiques, services web pour la langue, etc.)
Axes de recherche
Les activités de recherche de l’équipe GETALP s’articulent autour de deux axes principaux, guidés par des valeurs d’éthique, d’ouverture et de responsabilité sociétale.
Le premier axe porte sur les méthodes scientifiques employées et développées au sein de l’équipe. L’équipe développe des méthodes innovantes pour l’analyse, le traitement et la modélisation des langues naturelles. Nous nous intéressons particulièrement aux points suivants :
- Les méthodes permettant l’analyse, la collecte, le traitement et la représentation des données et ressources pour permettre la découverte de connaissances, le partage et l’accessibilité des connaissances humaines.
- La construction, l’application et la vérification de théorie et d’approche de modélisation pour contribuer à l’avancement des connaissances fondamentales en apprentissage automatique et en linguistique computationnelle.
- Le développement d’outils et de plateformes pour l’outillage du TAL pour diffuser les outils au monde économique et soutenir le travail des linguistes.
- Le développement de méthodes d’évaluation pour mesurer non seulement la performance des systèmes, mais aussi leur impact sociétal.
- Le développement et l’évaluation de méthodes d’explication de modèles de traitement automatique du TAL pour rendre les modèles de TAL plus transparents et interprétables afin de favoriser leur adoption dans des domaines sensibles et de renforcer la confiance des utilisateurs.
Les méthodes du premier axe contribuent au deuxième axe qui porte sur les tâches du TAL et les applications du TAL. L’équipe se concentre particulièrement sur :
- La traduction automatique (écrit, parole, visuel).
- La transcription automatique de la parole.
- Le traitement multilingue et multimodal.
- L’analyse linguistique automatique (classification de document, compréhension de texte ou parole, analyse syntaxique et sémantique de texte ou parole…).
- Le traitement des interactions humaines et humaines-machines telles que le traitement de l’affect en interaction.
- La documentation des langues.
Ecosystème local, national et international
Le GETALP bénéficie d’un écosystème local riche et collabore avec d’autres équipes du LIG (en liaison avec les applications mentionnées ci-dessus) et avec d’autres laboratoires grenoblois. Au niveau national et international, le GETALP est un acteur reconnu de la communauté de recherche en traitement des langues naturelles et de la parole (nombreux projets collaboratifs et industriels, organisation en 2012 de JEP-TALN-RECITAL, etc.). Enfin, un point remarquable est son réseau international de collaborations et de contacts sur tous les continents, qui fait du GETALP un acteur de terrain particulièrement pertinent et crédible pour contribuer au Graal théorique et technologique du multilinguisme.