|Site de l'université Grenoble Alpes|
 

Programme 2 - Traitement Automatique des Langues

 

Resp. Olivier Kraif (MCF)

Les recherches du programme TAL s’articulent autour d’un objet central, partagé avec le programme 1 : les corpus électroniques (principalement écrits). Ces corpus peuvent être envisagés de deux manières : d’une part, comme ressource pour le TAL (pour le développement et l’évaluation des outils d’analyse morphosyntaxique, d’analyse sémantique, de traduction, de classification, etc.) ; d’autre part, ils constituent un objet d’étude pour l’observation (en linguistique, en lexicographie, en terminologie, en didactique des langues, dans le domaine des humanités numériques, etc.). Dans cette deuxième perspective, le TAL intervient à différentes étapes de la chaine de traitement : reformatage et mise en oeuvre des normes d’encodage, annotation morphologique, syntaxique et sémantique, indexation, recherche, développement d’interfaces d’interrogation, extraction de statistiques et de données langagières, etc. Les projets liés à ce programme, très divers dans leurs objectifs, concernent ces différentes perspectives, à partir de corpus de types variés : corpus de manuscrits et d’annotations d’auteurs, corpus spécialisés de SMS et de tweets, corpus multilingues parallèles et comparables, corpus d’écrits scientifiques, etc.