|Site de l'université Grenoble Alpes|
 

Sylvain Hatier


Doctorant - Contractuel

Allocataire : Bourse Région ARC5

Sujet de thèse : Identification et analyse linguistique du lexique scientifique transdisciplinaire. Approche outillée sur un corpus d’articles de recherche en SHS

Responsabilités scientifiques  :

Coordonnées personnelles

Mail : sylvain.hatier@univ-grenoble-alpes.fr

Publications

2016


  • Hatier, S. Identification et analyse linguistique du lexique scientifique transdisciplinaire. Approche outillée sur un corpus d'articles de recherche en SHS (Thèse de doctorat). Université Grenoble Alpes, Grenoble. Consulté de http://www.theses.fr/s94109
    Résumé : Identification et analyse linguistique du lexique scientifique transdisciplinaire. Approche outillée sur un corpus d'articles de recherche en SHS
  • Hatier, S., Augustyn, M., Yan, R., Tran, T. T. H., Tutin, A., & Jacques, M. - P. French cross-disciplinary scientific lexicon: extraction and linguistic analysis. Dans T. Margalitadze & G. Meladze (éD.), Proceedings Of The Xvii Euralex International Congress Lexicography & Linguistic Diversity (p. 355–365). Présenté à XVII EURALEX International congress, Tbilisi: Ivane Javakhishvili Tbilisi State University.
    Résumé : This paper presents the work we carried out to extract and structure a specialized lexicon based on a corpus of French scientific articles in the fields of humanities and social sciences. The characteristics of the targeted lexicon may be summarized as follows: it is not domain-related inasmuch as it is shared by various disciplines; it serves to express the specific operations, naming the objects and exposing the results of research processes. In this view, the targeted lexicon studies here is genre-related. We designed this cross-disciplinary scientific lexicon (CSL) as a resource for several purposes: it may serve natural language processing, e.g. as a stoplist for automatic terms identification, as well as foreign language teaching. Indeed, students and scholars in the sciences need to acquire familiarity with the rhetoric of the research article, thus needing to master these words. We present here the two-stage creation of this lexicon: first, it was semi-automatically extracted from a corpus of 500 research articles spanning ten disciplines. Second, it was manually structured to reflect the semantics and rhetoric of science. This structure takes into account the lexico-syntactic properties of CSL nouns, adjectives, verbs and adverbs. The resource will be freely available for academic purposes.
  • Hatier, S., & Yan, R. Élaboration semi-automatique d’une ressource de patrons verbaux. Dans I. Smilauer & J. Kostov (éD.), Actes De La ConfRence Conjointe Jep-Taln-Recital 2016 (Vol. 9 : ELTAL, p. 38-47). Présenté à JEP-TALN-RECITAL 2016, Paris: ATALA/AFCP.
    Résumé : This study focuses on the semi-automatic elaboration of verbal patterns resource. We explore more specifically Cross-Disciplinary Lexicon verbs, a lexicon which plays an essential role in reasoning and discourse organizing in academic writing. This work is based upon a parsed corpora of French scientific articles, from which we automatically extracted subcategorization frames. These frames are then manually gathered, according to CPA model, and combined with a verbal meaning. The verbal patterns resource, designed for the didactic purpose of academic writing and reading, lists the most frequent verbal constructions in this genre. User thus has access, for each verbal meaning, to preferential syntactical collocates and constructions
  • Yan, R., & Hatier, S. L'extraction et la modélisation de patrons lexico-syntaxiques pour leur enseignement en FLE : un exemple à partir du verbe montrer. Linguistik Online, 78(4), 93-112.
    Résumé : This study focuses on scientific writing and aims at improving verbal patterns teaching for L2 learners. Using a French corpus of scientific articles in humanities and social sciences (Scientext), we have collected and modelized lexicosyntactic patterns for the verb montrer and two of its synonyms. We aim at extracting specific structures for those three semantically close verbs, assuming that their semantic proximity will also be revealed in similar syntactic properties. We thus create a set of verbal patterns, with cooccurrence informations, to combine them to a tool designed to help L2 learners in their scientific writing.

2015


  • Hatier, S., & Yan, R. Comparaison de constructions verbales entre un corpus d’apprenants et un corpus d'articles de recherche. Communication orale à un colloque international présenté à 8es Journées Internationales de Linguistique de Corpus (JLC2015), Orléans, France. Consulté de http://jlc2015.sciencesconf.org/conference/jlc2015/pages/Programme1sept2015.pdf
    Résumé : Nous opérons une comparaison entre scripteurs non-natifs et experts afin d'identifier comment les apprenants chinois de français emploient les verbes les plus fréquents (montrer, considérer, décrire, expliquer) dans l’écrit scientifique. Les questions que nous posons ici sont les suivantes : quels types de constructions verbales les apprenants utilisent-ils le plus fréquemment et quelles sont les constructions qui leur posent le plus de problèmes ? Afin de répondre à ces questions, nous effectuons une comparaison semi-automatique des constructions verbales présentes dans les deux corpus analysés syntaxiquement.

  • Tran, T. T. H., & Hatier, S. L’annotation sémantique pour l’enseignement/apprentissage des marqueurs polylexicaux à fonction métadiscursive à l’appui du corpus. Communication orale à un colloque international présenté à 8es Journées Internationales de Linguistique de Corpus, Orléans, France. Consulté de http://jlc2015.sciencesconf.org/conference/jlc2015/pages/Programme1sept2015.pdf
  • Tutin, A., Tran, T. T. H., Kraif, O., & Hatier, S. French collocations of cross-disciplinary scientific lexicon. Dans . Présenté à PARSEME 5th general meeting (COST action), Iași, Romania.
    Mots-clés : Scientext, Termith.

2014


  • Colloque international des Etudiants chercheurs en DIdactique des langues et en Linguistique. Colloque international des Etudiants chercheurs en DIdactique des langues et en Linguistique. Dans J. Bardet, A. Baudrillart, M. Carrissimo-Bertola, E. Charles, R. Gauthier, S. Courchinoux, et al. (éD.), . Présenté à Colloque international des Etudiants chercheurs en DIdactique des langues et en Linguistique, Grenoble, France: Lidilem. Consulté de https://hal.archives-ouvertes.fr/search/index/?qa[collection_t][]=CEDIL

  • Hatier, S., Tutin, A., Jacques, M. - P., Jacquey, E., & Kister, L. Catégorisation sémantique des noms simples du lexique scientifique transdisciplinaire. Présentation présenté à Congrès ACFAS, colloque 330 : Étude de lexiques à vocation particulière : approches théoriques, méthodologiques, pédagogiques et multidisciplinaires, 14 mai, Montréal. Consulté de http://www.acfas.ca/evenements/congres/programme/82/300/330/c

2013

  • Hatier, S. Extraction des mots simples du lexique scientifique transdisciplinaire dans les écrits de sciences humaines : une première expérimentation. Dans Actes De La 15E Rencontres Des ÉTudiants Chercheurs En Informatique Pour Le Traitement Automatique Des Langues (Recital'2013) (p. 138–149). Présenté à RECITAL'2013, Les Sables d'Olonne, France.
    Résumé : Nous présentons dans cet article les premiers résultats de nos travaux sur l'extraction de mots simples appartenant au lexique scientifique transdisciplinaire sur un corpus analysé morpho-syntaxiquement composé d'articles de recherche en sciences humaines et sociales. La ressource générée sera utilisée lors de l'indexation automatique de textes comme filtre d'exclusion afin d'isoler ce lexique de la terminologie. Nous comparons plusieurs méthodes d'extraction et montrons qu'un premier lexique de mots simples peut être dégagé et que la prise en compte des unités polylexicales ainsi que de la distribution seront nécessaires par la suite afin d'extraire l'ensemble de la phraséologie transdisciplinaire.
  • Jacquey, E., Tutin, A., Kister, L., Jacques, M. - P., Hatier, S., & Ollinger, S. Filtrage terminologique par le lexique transdisciplinaire scientifique : une expérimentation en sciences humaines. Dans Tia 2013 (p. 121-128).
    Résumé : Nous examinons les interactions syntaxiques entre termes et lexique transdisciplinaire avec un objectif de reconnaissance automatique des termes en texte intégral dans le discours scientifique des sciences du langage. Nous réalisons une expérience sur un corpus d'articles scientifiques (155 157 occurrences - 42 articles de Scientext) pour déterminer dans quelle mesure et sous quelles conditions les unités du lexique transdisciplinaire (ULT) sont délimiteurs de termes (T). Après une annotation terminologique validée manuellement (ACABIT et TERMOSTAT), un lexique transdisciplinaire est projeté dans les textes. L'analyse quantitative et qualitative des résultats permet de conclure que les ULT sont majoritairement délimiteurs de termes. Les résultats montrent que : (1) le statut d'ULT doit être raffiné (unité phraséologique transdisciplinaire ou langue générale ayant un rôle de délimiteur), (2) la contribution du lexique transdisciplinaire doit être corrélée à une classification sémantique des ULT pour définir les différents rôles joués, (3) certaines ULT sont en intersection avec le domaine de spécialité d'où un biais réductible par l'intégration d'autres disciplines des sciences humaines (archéologie, psychologie, philosophie, etc.).
--- Exporter la sélection au format