Les cours

CENTAL

> Les cours

Pour vous permettre de vous faire une idée sur le contenu du programme, nous proposons ci-dessous le descriptif de plusieurs cours faisant partie du programme :

  • FLTR 2620 : Traitement automatique du langage


    Découvrez les enjeux et les modèles de base du traitement automatique du langage. Le fossé est bien grand entre « l’ordinateur intelligent » que nous décrivent les oeuvres de fictions (A. I. de Steven Spilberg, 2001 l’Odyssée de l’espace de Kubrick, 1968 etc.) et les capacités actuelles des machines « intelligentes ». Comment doter une machine d’un lexique et d’une grammaire ? Quelle est l’architecture type d’un logiciel de TAL ? En quoi l’ambiguïté de la langue est-elle une difficulté pour la machine ?
    Ce cours est donné par C. Fairon, « linguiste-informaticien » et directeur du Centre de traitement automatique du langage de l’UCL.

  • GELI 2009 : Traitement automatique de la parole


    Un ordinateur peut-il « parler » ou « entendre » ? Parler ou entendre sont des activités que l’on attribue habituellement à des êtres animés, la question peut donc surprendre. Mais vous savez probablement qu’il existe aujourd’hui des logiciels capables de faire automatiquement la lecture d’un texte et de prononcer. Si vous prenez le train, vous aurez remarqué que dans de nombreuses gares, les annonces orales sont réalisées par une voix automatique (en fait, il s’agit de messages composés dynamiquement à l’aide de morceaux de phrases préenregistrés : le train de <horaire> à destination de <lieu> a un retard probable de <durée>). La « synthèse vocale » est une technique qui dépasse cette approche par messages préenregistrés en générant automatiquement une représentation phonétique du texte à prononcer puis en produisant le message audio correspondant à cette représentation phonétique en accolant des phonèmes préenregistrés. Plusieurs phénomènes, comme les liaisons ou l’intonation doivent aussi être pris en compte pour générer des énoncés qui semblent naturels. Les applications pour de tels systèmes sont très nombreuses : par exemple, elles peuvent fournir aux personnes mal voyantes une plus meilleure accessibilité aux informations textuelles.
    A l’inverse, il est également possible de concevoir des logiciels qui transcrivent la parole en texte. Dans ce cas, la chaîne parlée est découpée en phonèmes et un programme informatique tente ensuite de retrouver les mots et reconstituer les phrases qui ont été prononcées.
    Ce cours est donné par Thierry Dutoit, professeur aux FPMS, spécialiste du traitement du signal, auteurs de plusieurs livres et de brevets d’invention dans ce domaine.

  • CLIG 2250 : Méthodologie de l’analyse de corpus en linguistique


    Pour fonder scientifiquement les études linguistiques sur des matériaux authentiques, représentant fidèlement la réalité qui va être observée, on utilise souvent des « corpus ». Comment constituer ces corpus (rassembler tous les documents existant ou un « échantillon ») ? Comment s’assurer de la représentativité du corpus : représente-t-il toute la diversité du phénomène que je souhaite observer et dans une distribution fidèle à la réalité ?
    Ce cours est donné par trois professeurs impliqués dans de nombreux projets de recherche centrés sur la constitution et l’utilisation de corpus. Liesbeth Degand (analyse qualitative), Anne-Catherine Simon (corpus oraux) et Cédrick Fairon (traitement informatique).

  • CLIG 2009 : Panorama des applications en ingénierie linguistique


    Ce cours est organisé sous la forme d’un cycle de conférences présentant les recherches actuelles de l’ingénierie linguistique ayant pour but la mise au point de nouvelles applications et de nouveaux services. Des chercheurs belges et internationaux, actifs dans les universités ainsi que dans les entreprises, sont invités à venir présenter leurs travaux. En parallèle avec ce cycle de conférences, les étudiants suivent par eux-mêmes un parcours pédagogique en formation à distance.