/ Publications

Corpus numériques


Triangle et la TEI

Des différentes disciplines du laboratoire naissent des projets d’Humanités Numériques variés dont certains impliquent un travail d’archivage ou d’édition en ligne. Depuis sa création en 2005, le laboratoire Triangle suit les recommandations et s’intéresse aux évolutions des guidelines de la Text Encoding Initiative et d’autres formats XML.

En 2005, Ludovic Frobert dirige l’édition numérique annotée du corpus de L’Echo de la Fabrique et la petite presse ouvrière lyonnaise 1831-1835, premier journal de revendication ouvrière lyonnaise. Samantha Saïdi et Carole Boulai, deux ingénieures du laboratoire, entament l’année suivante une collaboration avec Mark Olsen de l’ARTFL Project (Division of the Humanities de l’Université de Chicago) dans le but d’utiliser le moteur Philologic pour proposer des fonctionnalités avancées de recherche dans le corpus. Elles sont alors amenées à transformer le corpus en TEI Lite pour rendre possible l’adoption de cet outil, finalisée en 2007.

Entre 2008 et 2012, l’ingénieure Séverine Gedzelman travaille au développement d’un logiciel conçu par le chercheur Jean-Claude Zancarini, pour la comparaison, l’alignement et l’annotation de textes XML-TEI. Cet outil, HyperMachiavel, aboutira dès 2012 à la mise en ligne du corpus parallèle des différentes traductions du Prince de Machiavel : l’HyperPrince. Une seconde version de l’outil et de l’édition est en cours de développement.

En parallèle, Anne Verjus, directrice de recherche au CNRS, démarre en 2011, avec Samantha Saïdi et Carole Boulai, le travail nécessaire à l’édition d’un nouveau corpus au format XML TEI : Le Roman des Morand, correspondance familiale sous l’Empire. Cette édition, publiée en 2013 avec l’outil Omeka met à disposition un ensemble de lettres encodées en TEI accompagné de fonctionnalités de recherche avec filtres, d’ index d’entités nommées, de visualisations sous forme de cartes et lignes de temps. Ce projet a été l’occasion pour les ingénieures du laboratoire de mettre en place les premières initiations à la TEI à destination des chercheurs, notamment grâce à la création de formulaires adaptés à la création de fichiers XML TEI pour l’éditeur XML Oxygen.

En 2014, une équipe internationale commence à travailler à une édition analytique et commentée de l’Histoire d’Italie (La Storia d’Italia) de Francesco Guicciardini (1483-1540), ouvrage phare de l’historiographie italienne et européenne de la première modernité. Ce projet, coordonné par Paola Moreno (Université de Liège) prévoit l’élaboration d’une édition numérique des multiples strates du texte accompagnée de réflexions sur l’évolution de la langue et de la pensée de Guicciardini que les ratures, corrections, ajouts et réécritures effectués cinq années durant sur 7 manuscrits successifs donnent à voir. En juin 2015, 4 membres du laboratoire Triangle présentent les travaux effectués, au sein de cette équipe, sur l’exorde du texte : Jean-Claude Zancarini et Jean-Louis Fournel ont contribué à son commentaire, tandis qu’Elise Leclerc et Samantha Saïdi ont proposé une plateforme de lecture parallèle de l’exorde contenant, entre autres, l’édition au format XML-TEI des 13 rédactions de l’exorde que contiennent les 7 manuscrits, dont la visualisation repose sur une adaptation de l’outil EVT (Edition Visualization Technology, Pr. R. Rosselli del Turco et Chiara Di Petro, de l’Université de Turin) afin de permettre la vue en parallèle des segments de l’exorde et d’aligner les facsimilés avec les trois types d’édition critique proposés pour chaque folio (édition diplomatico-interprétative, état du folio avant toute intervention, état du folio après les interventions de Guicciardini).

Liste des corpus numériques développés à Triangle

  • Storia d’Italia
    Edition numérique de l’Exorde de la Storia d’Italia de Francesco Guicciardini