Le projet CEFRLex : des lexiques "gradués" selon l'échelle du CECR pour l'enseignement des langues étrangères
Lien vers le site officiel : http://cental.uclouvain.be/cefrlex/
Le projet CEFRLex est un projet collaboratif international visant à proposer, pour chacune des principales langues européennes, un lexique pédagogique décrivant la distribution de fréquence des mots sur les niveaux du Cadre européen commun de référence pour les langues (CECR ou CEFR en anglais). Voici un exemple tiré de FLELex, la version francophone :
Lemme | POS | A1 | A2 | B1 | B2 | C1 | C2 | Total |
voiture | NOM | 633,3 | 598,5 | 428,7 | 202,7 | 271,9 | 25,9 | 461,5 |
abandonner | VER | 35,5 | 62,3 | 104,8 | 79,8 | 73,6 | 28,5 | 78,2 |
en bas | ADV | 34,9 | 28,5 | 13 | 32,8 | 1,6 | 0 | 24 |
sous réserve de | PREP | 0 | 0 | 0,361 | 0 | 0 | 0 | 0,03 |
kilo | NOM | 40,3 | 29,9 | 10,2 | 0 | 1,6 | 0 | 19,8 |
Les fréquences rapportées dans chaque ressource ont été estimées sur des corpus de textes issus de manuels pédagogiques ou de livres simplifiés. Il s'agit donc de matériaux auxquels sont réellement confrontés les apprenants d'une langue étrangère. Les fréquences en ensuite été normalisées selon une procédure décrite dans François et al. (2014).
Langues :
- Français : FLELex
- Suédois : SVALex et SweLLex
- Anglais
- Espagnol (en cours)
- Néerlandais (NT2Lex, en cours)
Certaines de ces ressources sont disponibles à la consultation ou au téléchargement à l'adresse suivante : http://cental.uclouvain.be/cefrlex/
Partenaires
- UCLouvain - CENTAL (FLELex, SVAlex, NT2Lex, EFLLex, ...)
- Université Aix-Marseille (FLELex)
- Gotheburg University (SVALex, SweLLex)
- KULeuven (NT2Lex)
L’équipe (ordre alphabétique)
- Coordinateur scientifique : Dr. Thomas François
- Équipe scientifique : Thomas François, Núria Gala, Anaïs Tack, Elena Volodina, Ildikó Pilán, Luise Dürlich, Patrick Watrin, Cédrick Fairon, Piet Desmet, Stian Rødven Eide, Hannes Heidarsson.
- Développement web : Dorian Ricci, Anaïs Tack, Baptiste Degryse, Brayan Delmée, Thomas François
Publications :
- Dürlich, L. and François, T. EFLLex: A Graded Lexical Resource for Learners of English as a Foreign Language In Proceedings of the 11th International Conference on Language Resources and Evaluation (LREC 2018). Miyazaki, Japan, 7-12 May.
- Tack, A. and François, T. and Desmet, P. and Fairon, C. NT2Lex: A CEFR-Graded Lexical Resource for Dutch as a Foreign Language Linked to Open Dutch WordNet In Proceedings of the 13th Workshop on Innovative Use of NLP for Building Educational Applications (NAACL 2018).
- Volodina, E. and Pilán, I. and Llozhi, L. and Degryse, B. and François, T. SweLLex: second language learners’ productive vocabulary In Proceedings of the joint 5th NLP4CALL and 1st NLP4LA workshops (SLTC 2016), November 16, Umea, Sweden.
- François, T. and Volodina, E. and Ildikó, P. and Tack, A. SVALex: a CEFR-graded lexical resource for Swedish foreign and second language learners In Proceedings of the 10th International Conference on Language Resources and Evaluation (LREC 2016). Portoroz, Slovenia, 23-28 May, pp. 213-219.
- Tack, A. and François, T. and Ligozat, A.-L., and Fairon, C. Evaluating Lexical Simplification and Vocabulary Knowledge for Learners of French: Possibilities of Using the FLELex Resource In Proceedings of the 10th International Conference on Language Resources and Evaluation (LREC 2016). Portoroz, Slovenia, 23-28 May, pp. 230-236.
- François, T., Gala, N., Watrin, P. et Fairon, C. FLELex: a graded lexical resource for French foreign learners In the 9th International Conference on Language Resources and Evaluation (LREC 2014). Reykjavik, Iceland, 26-31 May.
Communications :
- Bruges, July, 6, 2018, Conference CALL 2018
Auteurs : Thomas François, Núria Gala, Elena Volodina, AnaÏs Tack, Ildikó Pilán, Luise Dürlich, Patrick Watrin, Piet Desmet and Cédrick Fairon
Communication : "The CEFRLex project: multilingual CEFRLex graded lexical resources for foreign language learning, teaching and research" - Louvain-la-Neuve, May 18, 2018, PLIN Day.
Auteurs : Thomas François et Barbara De Cock
Communication : "ELELex : a CEFR-graded lexical resource for Spanish as a foreign language" - Leuven, February 10, 2017, Computational Linguistics in the Netherlands 27 (CLIN 2017).
Auteurs : Anaïs Tack, Thomas François, Piet Desmet and Cédrick Fairon
Communication : "Introducing NT2Lex: A Machine-readable CEFR-graded Lexical Resource for Dutch as a Foreign Language"