Colloque Documents anciens et reconnaissance automatique des écritures manuscrites
Description
Nombre de projets incluent aujourd’hui une étape d’acquisition automatique du texte dans leur chaîne de production ou d’exploitation des données. Plusieurs plateformes de transcription et différents moteurs HTR sont maintenant disponibles. L’intégration de cette technologie dans des chaînes de traitement de plus en plus efficaces a entraîné une automatisation des tâches qui remet en question la place du chercheur dans le processus d’établissement du texte. Cette nouvelle pratique, gourmande en données, rend pressant le besoin de rassembler, et donc d’harmoniser les corpus nécessaires à la constitution de corpus d’entraînement, mais aussi leur mise à disposition pour améliorer la qualité des résultats de l’HTR.
Dans le cadre du projet CREMMALab soutenu par le DIM MAP, l’École nationale des chartes (centre Jean Mabillon) en partenariat avec le LAMOP et le LabEX Hastec organise les 23 et 24 juin 2022 un colloque mêlant questions philologiques et techniques pour faire un état des lieux scientifique de l’HTR pour les documents anciens. Nous ferons le point à cette occasion sur l’HTR et ses outils, ses résultats, ses apports et les nouvelles pratiques qu’induit son utilisation dans les projets d’édition et d’exploitation des documents. Cet événement permettra de rassembler une communauté internationale de chercheurs, aujourd’hui grandissante, pour échanger autour de l’usage de l’HTR dans leurs projets scientifiques.
Enfin, ce colloque repose sur la volonté de traiter la thématique de l’HTR tout en l’articulant à des problématiques scientifiques de constitution et/ou d’exploitation des corpus. Nous souhaitons également questionner les aspects pratiques de l’utilisation de cette technologie (développement de moteur HTR, d’interface de transcription, d’interface utilisateurs pour utiliser et entrainer des modèles, etc.), tout en soulevant ses enjeux méthodologiques et son impact sur les données de la Recherche.
Colloque organisé les 23 et 24 juin 2022 à l’École nationale des chartes.
Programme
23 juin
Présentations
9:15-9:30 : Accueil des participants
9:30-9:45 : Discours d'ouverture et présentation des projets CREMMA et CREMMALAB
Elsa Marguin-Hamon, directrice de la recherche et des relations internationales, École nationale des chartes
9:45-10:15 : CremmaLab projects: Transcription guidelines and HTR models for French medieval manuscripts
Jean-Baptiste Camps, maître de conférence, École nationale des chartes, CJM
Ariane Pinche, post-doctorante, École nationale des chartes, CJM
10:15-10:45 :HTR fine‑tuning for medieval manuscripts models: strategies and evaluation
Sergio Torres Aguilar, post-doctorant, École nationale des chartes, CJM
Vincent Jolivet, responsable de la mission projets numériques, École nationale des chartes
10:45-11:15 : Pause
11:15-11:45 : Une cursive du 17e siècle
Élodie Paupe, assistante-doctorante, université de Neuchâtel et chargée de projet pour les AAEB
11:45-12:15 : Un modèle ouvert pour la reconnaissance automatique des manuscrits du théâtre espagnol du Siècle d’Or
Cuéllar Álvaro, PhD Student, University of Kentucky
12:15-14:00 : Pause déjeuner
14:00-14:30 : New Developments in Kraken and eScriptorium
Benjamin Kiessling, ingénieur de recherche, PSL
Peter Stokes, directeur d’étude, EPHE
14:30-15:00 : De Transkribus à eScriptorium : retour(s) d’expérience sur l’usage d’outils d’HTR appliqués à un corpus d’imprimés espagnols du XIXe siècle
Élina Leblanc, post-doctorante, unité d’espagnol, faculté des lettres, université de Genève
Pauline Jacsont, collaboratrice scientifique, unité d’espagnol, Faculté des lettres, université de Genève
15:00-15:30 :Lettres en lumières
Florian Fizaine, doctorant, archives départementales de la Côte-d’Or
Édouard Bouyé, directeur des archives départementales de la Côte-d’Or
15:30-16:00 : Pause
16:00-16:30 : Les archives inquisitoriales (Portugal) sous HTR : le projet TraPrInq (Transcribing the court records of the Portuguese Inquisition, 1536-1821)
Hervé Baudry, chercheur au CHAM-Centro de Humanidades (Universidade Nova de Lisboa). Responsable du projet TraPrInq.
16:30-17:00 : Segmentation Mode for Archival Documents with Highly Complex Layout
Daniel Stökl Ben Ezra, directeur d’étude, EPHE
Marina Rustow, professor, Princeton University
Devorah Witty, software developper, The Research software compagny
17:00-17:30 : SegmOnto – A Controlled Vocabulary to Describe Historical Textual Sources
Simon Gabay, maître-assistant, université de Genève
Ariane Pinche, post-doctorante, École nationale des chartes, CJM
Kelly Christensen, docteure, INRIA
17:30-17:45 : Clôture de la journée
24 juin
Présentations
9:15-9:30 : Accueil des participants
9:30-10:00 : FoNDUE - A Lightweight HTR Infrastructure for Geneva
Simon Gabay, maître-assistant, université de Genève
10:00-10:30 : From HTR to Critical Edition: A Semi-Automatic Pipeline
Daniel Stoekl Ben Ezra, directeur d’étude, EPHE
Hayim Lapin, professor, University of Maryland, College Park
Bronson Brown-Devost, post-doctoral researcher, Scripta Qumranica Electronica
Pawel Jablonski, PhD student, EPHE
10:30-11:00 : Break
11:00-11:30 : Analyse, Reconnaissance et Indexation des manuscrits CHAM
Anne-Valérie Schweyer, chercheuse CNRS, Centre Asie du Sud-Est (CASE-EHESS-INALCO),
Jean-Christophe Burie, professeur des universités, Université de La Rochelle
Tien Nam Nguyen, doctorant, Université de La Rochelle
11:30-12:00 : Expérimentations pour l’analyse automatique de sources chinoises anciennes
Marie Bizais-Lillig, maître de conférences, université de Strasbourg,
Chahan Vidal-Gorène, doctorant, École nationale des Chartes et EPHE
12:00-14:00 : Pause déjeuner
14:00-14:30 : Sharing HTR datasets with standardized metadata: the HTR‑United initiative
Alix Chagué, doctorante, EPHE, Université de Montréal, Inria
Thibault Clérice, responsable pédagogique du master TNAH, École nationale des chartes, CJM
14:30-15:00 : EpiSearch. Recognising Ancient Inscriptions in Epigraphic Manuscripts
Federico Boschetti, researcher; Institute for Computational Linguistics “A. Zampolli” – CNR, Pisa / VeDPH, Ca’ Foscari University of Venice
Tatiana Tommasi, MA student; Ca’ Foscari University of Venice
15:00-15:30 : HTR of Handwritten Paleographic Greek Text as a Function of Chronology
Platanou Paraskevi, postgraduate student, Athens University of Economics and Business
15:30-16:00 : Pause
16:00-16:30 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiques : vers une compréhension des recensements de Paris de l’entre‑deux guerre
Thomas Constum, doctorant, LITIS EA4108, université Rouen Normandie
16:30-17:00 : Retour d’expériences sur l’utilisation comparée de plusieurs de dispositifs de transcription numérique d’archives de fouilles archéologiques
Christophe Tufféry, ingénieur de recherche à l’Institut national de recherches archéologiques préventives, doctorant à CY Cergy Paris Université, en partenariat avec l’Institut national du patrimoine.
17:00-18:30 : Clôture de la journée - Moment de convivialité (pot de clôture)
Organisateurs
Comité d’organisation : Ariane Pinche et Floriane Chiffoleau
Comité scientifique : Jean-Baptiste Camps, Alix Chagué, Thibault Clérice, Frédéric Duval, Vincent Jolivet, Benjamin Kiessling, Nicolas Perreaux, Ariane Pinche, Laurent Romary, Peter Stokes
Comité d’organisation : Ariane Pinche et Floriane Chiffoleau
Comité scientifique :Jean-Baptiste Camps, Alix Chagué, Thibault Clérice, Frédéric Duval, Vincent Jolivet, Benjamin Kiessling, Nicolas Perreaux, Ariane Pinche, Laurent Romary, Peter Stokes
Conférence
2.10 : Clôture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"
2.10 : Clôture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"
2.8 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiques
2.8 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiques
2.7 : HTR of Handwritten Paleographic Greek Text as a Function of Chronology
2.7 : HTR of Handwritten Paleographic Greek Text as a Function of Chronology
2.6 : EpiSearch. Recognising Ancient Inscriptions in Epigraphic Manuscripts
2.6 : EpiSearch. Recognising Ancient Inscriptions in Epigraphic Manuscripts
2.1 : FoNDUE - A Lightweight HTR Infrastructure for Geneva
2.1 : FoNDUE - A Lightweight HTR Infrastructure for Geneva
1.3 : HTR fine tuning for medieval manuscripts models: strategies and evaluation
1.3 : HTR fine tuning for medieval manuscripts models: strategies and evaluation
2.5 : Sharing HTR datasets with standardized metadata: the HTR United initiative
2.5 : Sharing HTR datasets with standardized metadata: the HTR United initiative
2.9 : Retour d’expériences sur l’utilisation comparée de plusieurs de dispositifs de transcription …
2.9 : Retour d’expériences sur l’utilisation comparée de plusieurs de dispositifs de transcription numérique d’archives de fouilles archéologiques
1.10 : Segmentation Mode for Archival Documents with Highly Complex Layout
1.10 : Segmentation Mode for Archival Documents with Highly Complex Layout
2.2 : From HTR to Critical Edition: A Semi-Automatic Pipeline
2.2 : From HTR to Critical Edition: A Semi-Automatic Pipeline
1.7 : De Transkribus à eScriptorium : retour(s) d’expérience sur l’usage d’outils d’HTR appliqués à…
1.7: De Transkribus à eScriptorium : retour(s) d’expérience sur l’usage d’outils d’HTR appliqués à un corpus d’imprimés espagnols du XIXe siècle
Intervenants
Docteure en langues et littérature médiévales (Lyon 3, 2021
Thésard en littérature grecque (2000)
Chargé d’enseignement à l’université de Genève
Titulaire d'un doctorat en Histoire, histoire de l'art et archéologie (Université Paris-Saclay (ComUE), 2019)
Chercheur en anthropologie historique
Doctorante, EPHE, Université de Montréal, Inria (2022)
Chercheur en humanités numériques
Auteur d'une thèse en Lettres et civilisations antiques à Lyon en 2022
Directeur d'études à l’École Pratique des Hautes Études, section des sciences historiques et philologiques
Docteur en géographie. Directeur technique de l'association SIG L-R, Systèmes d'information géographique (en 1997)
Auteur d'un rapport de stage en Master 2 professionnel, Patrimoine écrit et édition numérique, à Tours, en 2015. Auteur d'une thèse en Etudes italiennes à Grenoble Alpes en 2019
Philologue, enseignante, secrétaire générale de la Société jurassienne d’Emulation (SJE). Assistante doctorante à la chaire de philologie classique de l'Université de Neuchâtel depuis 2017