Extrait du chapitre sur l’infinitif

Le projet

J’ai co-écrit avec Zeng Yi (曾怡) un manuel de grec ancien en mandarin.

À partir de trois chapitres de ce manuel, j’ai réalisé un ePub3.3 nativement accessible, enrichi et interactif, dans le cadre d’un mémoire encadré par Fabien Torre et Karolina Suchecka, à l’Université de Lille.

Le lexique de fin de manuel

1. Génération du XML

La première étape du traitement a consisté à :

  • Récupérer les flat XML à partir des fichiers .odt stylés XML
  • Modifier et affiner le balisage du flat XML
    • XSLT
  • Ajouter un premier basilage linguistique du grec grâce à des algorithmes
    • XSLT
  • Constituer un lexique de fin à partir du vocabulaire de chaque chapitre
    • XSLT
XML enrichi avec Perseus et Stanza

2. Enrichissement avec des outils de TAL

La seconde étape a consisté à enrichir les fichiers XML avec des outils de traitement automatique des langues [TAL].

  • Le module Perseus proposé par l’API Stanza a permis d’ajouter une analyse :
    • python3
    • des parties du discours (nom, verbe, adjectif…)
    • morphologique (indicatif présent actif…)
    • en dépendances universelles (analyse syntaxique de la proposition)
  • Relier chaque mot au lexique de fin permet d’indiquer sa ou ses traduction(s)
    • XSLT
Interface du manuel au format ePub

3. Réalisation de l'ePub et construction d’une interface utilisateur

Il ne restait alors plus qu’à…

  • Générer l’ePub 3.3 nativement accessible
    • XSLT
  • Construire une interface utilisateur permettant de visualiser les résultats de l’enrichissement TAL sous la forme d’indices optionnels
    • JavaScript
  • Embarquer cette interface dans l’ePub