Les documents accessibles ici constituent une annexe à l’article suivant :
Bernard COULIE, Bastien KINDT et Tamar PATARIDZE, Lemmatisation automatique des sources en géorgien ancien, dans Le Muséon : revue d’études orientales, 126/1-2 (2013), p. 161-201. DOI:10.2143/MUS.126.1.2983536. Voir cette page.
Cette étude présente les principes de lemmatisation adoptés par ces auteurs pour réaliser un dépouillement lexical exhaustif des sources écrites en géorgien ancien. De tels travaux permettent ensuite de réaliser des index, des concordances lemmatisées et d’autres listes lexicographiques, à l’instar de ce qui est fait à l’Institut orientaliste de l’UCL pour la langue grecque.
La lecture de cet article conditionne la bonne compréhension de la nature des outils mis à disposition. Toutes les données linguistiques utilisées ont été générées par les chercheurs de l’Institut orientaliste de Louvain. Les développements informatiques permettant la constitution des index, des concordances et des listes sont le fruit d’une collaboration avec le CENTAL.
Ces outils portent sur la version géorgienne du Discours 1 de Grégoire de Nazianze, dans ses deux traductions, celle d’Euthyme et celle d’Éphrem, telles qu’éditées dans
Sancti Gregorii Nazianzeni opera. Versio iberica, I. Orationes I, XLV, XLIV, XLI, editae a H. METREVELI et al. (Corpus Christianorum. Series Graeca, 36 ; Corpus Nazianzenum, 5), Turnhout – Leuven, 1998, p. 1-17.
Quatre documents sont accessibles :
1) la concordance lemmatisée complète des deux traductions de la version ;
2) la liste du vocabulaire commun aux deux traducteurs ;
3) la liste du vocabulaire spécifique à la traduction d’Éphrem ;
4) la liste du vocabulaire spécifique à la traduction d’Euthyme .