|Site de l'université Grenoble Alpes|
 

Corpus littéraire Phraséotext

 

Le corpus est librement consultable (après inscription) à l’adresse suivante :
http://phraseotext.u-grenoble3.fr/lexicoscope/

La composition du corpus littéraire français s’inspire de la classification adoptée par le Brown Corpus entre « belles lettres » (la littérature reconnue comme telle) et « general fiction » (l’étiquette désignant une production romanesque contemporaine moins considérée par la critique). S’y ajoute une deuxième distinction entre ce corpus littéraire et un corpus paralittéraire classifié selon des critères génériques éditoriaux (maisons d’éditions spécifiques et, à l’intérieur de celles-ci, collections spécifiques ; romans de science-fiction, policiers, sentimentaux). Les métadonnées permettent de partitionner le corpus en fonction de ces critères.

Les corpus latins analysés sont composés de deux genres littéraires en prose, unis par leur caractère oratoire (les rhéteurs Cicéron et Sénèque le Père ; les historiens Salluste, César, Tite-Live et Tacite). Les 80 textes latins représentent plus de 3 millions de mots.