|Site de l'université Grenoble Alpes|
 

Corpus "Littéracie avancée"

 

Remerciements :
Nous remercions les collègues qui ont bien voulu collecter et nous envoyer les textes qui constituent le corpus. Nous remercions, bien sûr, les étudiants qui ont accepté de donner leur texte pour servir la recherche.
Nous remercions aussi le Consortium Corpus Ecrits, intégré à la TGIR Huma-Num, qui nous a alloué des fonds pour la constitution de ce corpus.

Le site original du projet est consultable ici

Objectifs :
Ce corpus a été constitué à partir d’écrits d’étudiants de la licence première année au master 2ème année (écrits universitaires comme des mémoires ou des fiches de lecture et écrits professionnels comme des lettres de motivation et comptes-rendus). Les disciplines sont pour l’essentiel sciences du langage, didactique du français, sciences de l’éducation ; sont notamment représentés des écrits de futurs enseignants de français.
Ce corpus a pour but de permettre des analyses sur les compétences rédactionnelles en français langue maternelle à un niveau avancé et peut également servir de ressource didactique pour la formation à l’écrit.

Composition :
Le corpus est constitué de 11 sous-corpus répondant aux critères suivants :
Au moins 10 textes relevant des mêmes conditions de production, c’est-à-dire même genre de texte, même discipline, même consigne donnée aux étudiants, même niveau (mais pas nécessairement la même promotion d’étudiants : on peut avoir par ex. deux promos consécutives).
Le détail est donné dans le fichier Présentation du corpus (ici)

Les responsables du corpus : F. Rinck, M.-P. Jacques, F. Boch, membres du LIDILEM, Université Grenoble-Alpes

Téléchargements
Chaque archive contient le sous-corpus en 4 versions* :

  1. format doc
  2. format pdf
  3. format txt
  4. format xml : un en-tête de type TeiHeader, contenant les méta-données qui décrivent le sous-corpus (date, licence, niveau d’étude, etc.) + un balisage structurel du texte

* certains sous-corpus ne sont actuellement disponibles qu’aux formats txt et xml.

L’ensemble du corpus est libre de droits, disponible sous licence CC BY-NC-SA
Pour une éventuelle utilisation commerciale, nous consulter.

Présentation du corpus
Dossiers L2
Rapports L3
Lettres motivation M1
Comptes-rendus M1
Analyses M1
TER M1
TER M1 (PDF)
Comptes-rendus M2 (professionnels)
Comptes-rendus M2 (articles)
Synthèses M2
Parties théoriques de mémoires M1
Mémoires M2

Les corpus sont disponibles aussi via Ortolang que nous remercions pour leur aide.

Dernière date de mise à jour  : 21 mars 2015

Document Joint :