|Site de l'université Grenoble Alpes|
 

EmoBase : base de données multilingue

 

Le site de la base de données EmoBase, issu du projet EMOLEX et inauguré en juin 2013 fête son premier anniversaire : c’est l’occasion de dresser un bilan positif !

Issue du projet franco-allemand ANR DFG EMOLEX, EmoBase regroupe des corpus comparables (journalistiques et littéraires) en français, anglais, allemand, espagnol et russe de 130 millions de mots environ par langue.

Elle contient aussi des corpus parallèles alignés dans les couples français-anglais, français-allemand, français-espagnol et français-russe d’un total de 78 millions de mots.

Depuis sa mise en ligne il y a un an, EmoBase a été déjà visitée plus de 3 000 fois par des utilisateurs d’une vingtaine de pays (Allemagne, Espagne, Etats-Unis, France, Italie, Russie, Tunisie, etc.).

EmoBase est constituée de trois modules :

  • EmoConc : interface d’interrogation des corpus en cinq langues avec concordancier, extraction des cooccurrents syntaxiques et comparaison automatique des profils combinatoires (analyses multivariées)
  • EmoLing : interface permettant de faire des calculs statistiques et de comparer les profils combinatoires des mots d’émotions, à partir des dépouillements effectués par les linguistes de l’équipe et des codages qu’ils ont effectués selon une grille d’analyse syntactico-sémantique
  • EmoProf : interface destinée aux enseignants / apprenants du français langue étrangère, comportant des cartes heuristiques et des séquences didactiques.

La documentation méthodologique est disponible en français et en anglais sur le site pour les modules EmoConc et EmoProf.

Olivier Kraif & Iva Novakova