> Qu'est-ce que le TAL?
Le Traitement automatique du langage naturel - TALN (ou ingénierie linguistique, linguistique computationnelle, ingénierie des langues, génie linguistique) est l’application de la connaissance des langues à l’élaboration de systèmes informatiques intelligents capables de reconnaître, de comprendre, d’interpréter et de reproduire le langage humain sous ses différentes formes.
- Pour découvrir les objectifs du TAL, lisez l'introduction au TAL proposée par Guy Deville et Virginie Barthel
- On trouvera des informations complémentaires très intéressantes sur l’ingénierie linguistique dans ces publications en ligne:
- Principes l’informatique linguistique, par Jean-Baptiste Berthelin (Groupe langage et cognition, Limsi, Paris).
- Survey of the State of the Art in Human Language Technology (Ronald A. Cole, Joseph Mariani, Hans Uszkoreit, Annie Zaenen, Victor Zue: ed.) - Les technologies linguistiques en Europe.
"Introduction au TAL" par Guy Deville et Virginie Barthel
L’utilisation de votre ordinateur ne serait-elle pas simplifiée s’il suffisait de lui dire ce qu’il doit faire, et si cet ordinateur pouvait répondre oralement à vos requêtes, ou vous poser les questions adéquates ? Quelques mots suffiraient pour utiliser votre téléphone, sélectionner un CD, ouvrir les vitres de votre voiture ou obtenir des informations sur le trafic routier. Ne serait-il pas plus facile de donner un texte à traduire à votre ordinateur plutôt que de devoir le traduire soi-même? Ces deux questions ne sont que de minces exemples de ce que l’ingénierie des langues peut nous offrir.
On peut affirmer que le langage naturel dans toute sa complexité n’est pas calculable, à cause des nombreuses ambiguïtés possibles dues aux différents sens des mots (la sémantique) et aux différentes manières d’agencer ceux-ci dans les différentes langues (la syntaxe). De plus, l’utilisation que nous faisons de ce langage déjà complexe rend les choses encore plus difficiles: notre manière de parler quotidienne est soumise à diverses variantes qui sont absentes des grammaires descriptives et des dictionnaires. Nous ne parlons pas comme nous écrivons, notre accent est différent selon notre région.
Il est cependant possible de modéliser une partie du langage humain à des fins d’automatisation, c’est-à-dire de manière à ce qu’il puisse être reconnu, compris, interprété et reproduit par un ordinateur. Concrètement, l’ingénierie linguistique inclut toute une série de techniques et de ressources linguistiques. Les premières se traduisent par des logiciels informatiques et les secondes constituent des bases de connaissances susceptibles d’être exploitées par ces mêmes logiciels.
L’ingénierie linguistique permet de vivre en toute convivialité avec la technologie. Nous pouvons utiliser notre connaissance du langage pour développer des systèmes capables de reconnaître à la fois la parole et l’écrit, de comprendre un texte suffisamment en profondeur pour être capables de le traiter et d’en extraire des informations, de le traduire dans différentes langues et de générer aussi bien un discours oral qu’un texte imprimé.
Les débouchés dans le secteur de l’ingénierie linguistique comprennent tous les domaines des technologies de l’information appliquées au traitement du langage naturel parlé et écrit (interfaces homme-machine, reconnaissance et synthèse de la parole, outils d’aide à la traduction de documents, dictionnaires électroniques...).
Face à l’évolution des technologies liées à l’informatisation et à l’utilisation de ces technologies dans notre quotidien, le besoin de personnel qualifié dans le domaine des industries de la langue et des laboratoires de recherche va sans cesse croissant. Ce site vous présentera de façon détaillée la formation à suivre pour obtenir le diplôme de second cycle en ingénierie linguistique.