Les cahiers du CENTAL

Louvain-La-Neuve

> Les cahiers du CENTAL

La collection Cahiers du CENTAL est une publication du Centre de traitement automatique du langage. Ses objectifs principaux sont de contribuer à la diffusion des travaux en linguistique et linguistique informatique et de participer à la promotion de ces disciplines. Elle est publiée par les Presses universitaires de Louvain.

Si vous souhaitez être informé par courrier électronique dès qu'une nouvelle publication est disponible, nous vous proposons de remplir notre formulaire.

 

Index:

eLexicography in the 21st Century: New Challenges, New Applications. Proceedings of eLex 2009 - 2010
Les tables  La grammaire du français par le menu - 2010
Description linguistique pour le traitement automatique du français - 2008
WAC3 - 2007
Le langage SMS - 2006
SMS pour la science - 2006
Verbum ex machina - 2006
Le français m'a tuer - 2006
Le poids de mots - 2004

 > Cahiers du Cental

Volume 7

 

"eLexicography in the 21st Century: New Challenges, New Applications. Proceedings of eLex 2009"
Sylviane Granger and Magali Paquot (eds)

The field of lexicography is undergoing a major revolution. The rapid replacement of the traditional paper dictionary by electronic dictionaries opens up exciting possibilities but also constitutes a major challenge to the field. The eLexicography in the 21st Century: New Challenges, New Applications conference organized by the Centre for English Corpus Linguistics of the Université catholique de Louvain in October 2009 aimed to bring together the many researchers around the world who are working in the fast developing field of electronic lexicography and to act as a showcase for the latest lexicographic developments and software solutions in the field. The conference attracted both academics and industrial partners from 30 different countries who presented electronic dictionary projects dealing with no less than 22 languages.
The resulting proceedings volume bears witness to the tremendous vitality and diversity of research in the field.
The volume covers a wide range of topics, including:

  • the use of language resources for lexicographic purposes, in the form of lexical databases like WordNet or corpora of different types
  • innovative changes to the dictionary structure afforded by the electronic medium, in particular multiple access routes and efficient integration of phraseology
  • specialised dictionaries (e.g. SMS dictionaries, sign language dictionaries)
  • automated customisation of dictionaries in function of users’ needs
  • exploitation of Natural Language Processing tools
  • integration of electronic dictionaries into language learning and teaching tools.

ISBN 978-2-87463-211-2

Sommaire
Commander

  Up

Volume 6

  

"Les tables
 La grammaire du français par le menu
"

par T. Nakamura, E. Laporte, A. Dister, C. Fairon.

Linguiste de talent, Christian Leclère a été pendant plus de 30 ans l’un des piliers du lexique-grammaire. Bien loin de l’image du savant dans sa tour d’ivoire (fût-elle de Jussieu), il a mené ses recherches sur la syntaxe des verbes, l’argot ou le figement tout en cultivant un sens unique du contact humain.

Ses collègues et amis lui rendent hommage dans cet ouvrage, au travers d’un ensemble d’articles évoquant directement ou indirectement quelques-uns de ses sujets de prédilection. Cette mosaïque de contributions témoigne non seulement du rôle scientifique majeur que Christian Leclère a joué, mais également des amitiés qui se sont tissées tout au long des années qu’il a passées sur le pont du LADL.

Préface par Jean-Claude Chevalier
Avec les contributions de :
Anne Abeillé et François Mouret, Jorge Baptista, Andrée Borillo, Pierre-André Buvet, Catherine Camugli Gallardo, Mirella Conenna, Matthieu Constant, Emilio D’Agostino, Annibale Elia, Karën Fort, Michel Gouet et Simonetta Vietri, Laurence Danlos, Benoît de Cornulier, Michele De Gioia, Dana-Marina Dumitriu et Ancuta Guta, Gaston Gross, Amr Helmy Ibrahim, So-Yun Kim, Jee-Sun Nam, Georges Kleiber, Jean René Klein, Tita Kyriacopoulou, Nunzio La Fauci, Béatrice Lamiroy, Éric Laporte, Danielle Leeman et Céline Vaguer, Peter A. Machonis, Ignazio Mauro Mirto, Pedro Mogorrón Huerta, Christian Molinier, Argyro Moustaki, Kozué Ogata, Mavina Pantazara, Sébastien Paumier, Mireille Piot, Comme Antoinette Renouf, Corinne Rossari, Morris Salkoff, Yoichiro Tsuruga, Harald Ulland

ISBN 978-2-87463-204-4

Sommaire
Commander

  Up

Volume 5
  

"Description linguistique pour le traitement automatique du français"
par M. Constant, A. Dister, L. Emirkanian, S. Piron.

Le Traitement automatique du langage repose largement sur l’exploitation de ressources linguistiques : dictionnaires, grammaires, thésaurus, corpus, etc. Aujourd’hui, ces ressources langagières digitales et les technologies du langage qui les manipulent sont devenues essentielles pour assurer la survie des langues dans la société de l’information.

Malgré les nombreux projets portant sur l’analyse automatique du français, les ressources consacrées à cette langue restent souvent insuffisantes. Les recherches présentées dans ce volume ont pour objectif principal de contribuer à combler cette lacune. Elles s’inscrivent dans l’approche linguistique en traitement automatique des langues et montrent la nécessité de décrire finement les phénomènes linguistiques, quel que soit le domaine auquel ils appartiennent.

Ces descriptions, couplées à la création ou à l’exploitation d’outils manipulant de vastes ensembles de données, permettent ainsi de rendre plus performants les traitements automatisés de la langue, comme la traduction automatique, le résumé de texte, la recherche d’information...

ISBN 978-2-87463-138-2

Sommaire
Commander

Rectificatifs : Piron - Nakamura - Widlocher

  Up

Volume 4
  

"Building and Exploring Web Corpora"

WAC

More and more people are using data for linguistic and NLP research. The Web as Corpus workshop (WAC) provides a venue for exploring how we can use it effectively and the advancements to which this could lead.

This book is a collection of the talks presented at the 3rd WAC in Louvain-la-Neuve (Belgium). The focus is on the description of Web corpus collection projects, the exploration of Web data characteristics from a linguistics/NLP perspective, and on the use of crawled Web data for NLP purposes.

CLEANEVAL

Any use of Web data requires that it be cleaned in order to get rid of unwanted material iuncluding, for example, HTML markup, navigation bars, adversisements. To date there has been no sharing of resources or expertise in this particular domain and the cleaning has often been done minimally. Cleaneval was an exercise aimed at promoting collaboration and improving our understanding of the issues. Results and perspectives are presented in this book.

ISBN 978-2-8746-3048-8

Sommaire
Commander

  Up

Volume 3,1
 

"Le langage SMS" par C. Fairon, J.R. Klein, S. Paumier

Pour la première fois, une étude scientifique propose une vision du « langage SMS ». Refusant de se fier aux intuitions ou aux impressions, les auteurs de cette étude linguistique, basée sur un corpus de données authentiques, bousculent les idées reçues. La brièveté des messages est-elle une règle ? Tout le monde utilise-t-il les mêmes abréviations ? Ces jeux de langue sont-ils nouveaux ? Est-ce un langage de jeunes ? Est-ce la ruine de l’orthographe française ?

Ce livre entraîne le lecteur dans les coulisses de ce projet scientifique avant de lui faire découvrir les trésors d’inventivité linguistique dont font preuve les usagers du SMS. Amateur de SMS, simple usager ou spécialiste de la langue... ce livre s’adresse à toute personne intéressée par le langage SMS ou par les méthodes d’investigation utilisées pour étudier la langue.

Accessible au grand public, mais sans concession sur la rigueur scientifique, cet ouvrage répondra également aux attentes des étudiants et des chercheurs qui y trouveront détails techniques et données chiffrées présentant la plus grande base de données linguistiques destinées à l’étude du langage SMS.

Vol 1 : ISBN 2-87463-048-4

Commander

  Up


Volume 3,2

 

 

"SMS pour la science" par C. Fairon, J.R. Klein, S. Paumier

En quelques années, la communication par SMS est passée du rang de simple procédé technique au rang de véritable phénomène de société. Intrigués, les sociologues, psychologues, linguistes et autres spécialistes des langues ou de la communication se penchent donc depuis peu sur ces nouvelles pratiques de communication, souvent située dans le cadre plus large de la communication médiée par ordinateur. Quand il est question de la langue, du “langage SMS”, les chercheurs mettent en avant la difficulté d'obtenir des données authentiques sur lesquelles faire reposer leurs études. Le premier objectif du corpus SMS pour la science est de répondre à cette attente en mettant à la disposition de la communauté scientifique un large corpus de SMS collectés dans un cadre expérimental contrôlé.

Le corpus diffusé sur ce CD-ROM est l'un des plus grands corpus de SMS existant à l'heure actuelle. Il compte 30.000 SMS rassemblés en Belgique francophone dans le cadre du projet “Faites don de vos SMS à la science” sous l'égide de deux centres de recherche de l'Université catholique de Louvain : le Centre de traitement automatique du langage (CENTAL) et le Centre d'études sur les lexiques romans (CELEXROM).

Deux particularités font de cette base de données une ressource exceptionnelle : TRANSCRIPTIONS : tous les messages ont été transcrits dans un français “normalisé”. Le logiciel d'interrogation permet de faire des recherches dans le texte standardisé et d'afficher les SMS originaux qui contiennent des variantes graphiques du mot recherché. PROFILS SOCIOLINGUISTIQUES : près de 90% des 2436 auteurs dont les messages sont rassemblés dans ce corpus ont répondu à un questionnaire sociolinguistique et à des questions portant sur leur pratique du SMS. Ces informations sont disponibles dans l'interface de consultation et peuvent également servir de critères de recherche.

Vol 2 : ISBN 2-87463-028-4

Commander
Télécharger une version d'évalutation du corpus

  Up


Volumes 2.1 et 2.2

 

"Verbum ex machina…" par P. Mertens, C. Fairon, A. Dister, P. Watrin

Les technologies du langage sont au cœur de cet ouvrage qui propose un panorama des recherches actuelles en traitement automatique des langues naturelles (TALN). Aux frontières de la linguistique et de l’informatique, le TALN s’est fait connaître du grand public au travers d’applications commerciales à succès telles que la correction orthographique et grammaticale, la traduction automatique ou encore la reconnaissance et la génération de la parole. Derrière la relative efficacité et - parfois - l’apparente simplicité et de ces outils se cachent de nombreux problèmes fondamentaux liés à la nature même des langues qui « résistent » à l’analyse informatique.

À l’heure où l’on bâtit la société de l’information, le traitement automatique des langues devient plus que jamais incontournable, car les langues - sous leur réalisation orale ou écrite - constituent l’un des principaux vecteurs de l’information. Rechercher, trier, résumer, analyser l’information à grande échelle et dans de nombreuses langues sont autant de tâches qui requièrent des logiciels « intelligents », capables de faire une percée dans le sens des textes.

La conférence internationale TALN 2006 a réuni durant quatre jours à Leuven (Belgique) quelque 150 spécialistes impliqués dans la recherche universitaire et la recherche en entreprise. Linguistes, informaticiens, statisticiens, psychologues, ils présentent dans ce volume leurs travaux actuels qui illustrent les défis rencontrés ainsi que les récentes avancées du traitement automatique du langage.

Vol 1 : ISBN 2-87463-023-3
Vol 2 : ISBN 2-87463-024-1

Sommaire
Commander

  Up

Volume 1
 

"Le français m'a tuer"

Parmi les sujets qui, dans l’enseignement supérieur, posent question, l’orthographe occupe une place de choix. Sans tomber dans un défaitisme stérile, on peut sans crainte reprendre le constat de La Fontaine et déclarer que si tous n’en meurent pas, tous en sont frappés. Ce « mal » semble affecter en effet la quasi-totalité des étudiants, qu’ils optent pour les sciences humaines ou exactes.

Malgré les cours de remise à niveau, de propédeutique ou de remédiation qui fleurissent dans toutes les écoles supérieures et les universités, en dépit de la nouvelle réforme de l’orthographe (1990), les écrits des étudiants – de la copie d’examen au courrier adressé à l’institution en passant par les rapports de stage, les mémoires, etc. – restent truffés d’erreurs parfois grossières. On ne peut donc que saluer la clairvoyance de cet étudiant qui définissait la francophonie comme « un ensemble de pays qui ont en commun l’usure de la langue française »…

Ce constat d’usure suscite chez les enseignants des sentiments divers : inquiétude ou colère parfois, résignation ou obstination sûrement. Mais entre ces extrêmes, n’y aurait-il pas d’autres voies à explorer ? Tel est le propos de cet ouvrage, qui rassemble quelques voix autorisées de la recherche et de l’enseignement contemporains en Belgique et en France. et qui constitue les actes du Colloque "L'orthographe française à l'épreuve du supérieur" organisé par l'Institut Libre Marie Haps, le 27 mai 2005

ISBN 2-87463-020-9

Sommaire

Commander

    Up
 > Hors-série    
 

 "Le poids des mots" par G. Purnelle, C. Fairon et A. Dister

Les actes de ces JADT 2004 (2 vol./1200 pages) ont été publiés aux Presses Universitaires de Louvain et sont disponibles à l'adresse suivante : http://www.i6doc.com/doc/poidsmots

La statistique textuelle est une discipline 'transversale' qui intéresse de nombreux secteurs des sciences humaines. On retrouve par exemple dans cet ouvrage des travaux portant sur l'analyse du discours politique, l'analyse littéraire, la lexicométrie, l'analyse stylométrique, la linguistique de corpus, le traitement automatique du langage, etc.

Le poids des mots (vol.1 et 2). Actes des 7es Journées internationales d'Analyse statistique des Données Textuelles édité par Gérald PURNELLE, Cédrick FAIRON et Anne DISTER. Presses universitaires de Louvain, 2004

Vol 1 : ISBN 2-930344-49-0
Consulter le contenu de ce livre sur Books.Google

Vol 2 : ISBN 2-930344-50-4
Consulter le contenu de ce livre sur Books.Google

  Up

 

> Liens:

- Comité scientifique, comité de redaction et secrétariat de rédaction
- Lire quelques extraits de la collection "Les Cahiers du Cental" sur Google Books