Documents anciens et reconnaissance automatique des écritures manuscrites
- niveau 1 niveau 2 niveau 3
- document 1 document 2 document 3

Descriptif
Documents anciens et reconnaissance automatique des écritures manuscrites
Nombre de projets incluent aujourd’hui une étape d’acquisition automatique du texte dans leur chaîne de production ou d’exploitation des données. Plusieurs plateformes de transcription et différents moteurs HTR sont maintenant disponibles. L’intégration de cette technologie dans des chaînes de traitement de plus en plus efficaces a entraîné une automatisation des tâches qui remet en question la place du chercheur dans le processus d’établissement du texte. Cette nouvelle pratique, gourmande en données, rend pressant le besoin de rassembler, et donc d’harmoniser les corpus nécessaires à la constitution de corpus d’entraînement, mais aussi leur mise à disposition pour améliorer la qualité des résultats de l’HTR.
Dans le cadre du projet CREMMALab soutenu par le DIM MAP, l’École nationale des chartes (centre Jean Mabillon) en partenariat avec le LAMOP et le LabEX Hastec organise les 23 et 24 juin 2022 un colloque mêlant questions philologiques et techniques pour faire un état des lieux scientifique de l’HTR pour les documents anciens. Nous ferons le point à cette occasion sur l’HTR et ses outils, ses résultats, ses apports et les nouvelles pratiques qu’induit son utilisation dans les projets d’édition et d’exploitation des documents. Cet événement permettra de rassembler une communauté internationale de chercheurs, aujourd’hui grandissante, pour échanger autour de l’usage de l’HTR dans leurs projets scientifiques.
Enfin, ce colloque repose sur la volonté de traiter la thématique de l’HTR tout en l’articulant à des problématiques scientifiques de constitution et/ou d’exploitation des corpus. Nous souhaitons également questionner les aspects pratiques de l’utilisation de cette technologie (développement de moteur HTR, d’interface de transcription, d’interface utilisateurs pour utiliser et entrainer des modèles, etc.), tout en soulevant ses enjeux méthodologiques et son impact sur les données de la Recherche.
Le programme du colloque organisé les 23 et 24 juin 2022 est disponible ici: https://www.canal-u.tv/chaines/enc/colloques-et-journees-d-etude/2022/c…
Vidéos
1.1 : Ouverture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"
1.1 : Ouverture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"
1.3 : HTR fine tuning for medieval manuscripts models: strategies and evaluation
1.3 : HTR fine tuning for medieval manuscripts models: strategies and evaluation
1.5 : Un modèle ouvert pour la reconnaissance automatique des manuscrits du théâtre espagnol du Siè…
1.5 : Un modèle ouvert pour la reconnaissance automatique des manuscrits du théâtre espagnol du Siècle d’Or
1.6 : New Developments in Kraken and eScriptorium
1.6 : New Developments in Kraken and eScriptorium
1.7 : De Transkribus à eScriptorium : retour(s) d’expérience sur l’usage d’outils d’HTR appliqués à…
1.7: De Transkribus à eScriptorium : retour(s) d’expérience sur l’usage d’outils d’HTR appliqués à un corpus d’imprimés espagnols du XIXe siècle
1.9 : Les archives inquisitoriales (Portugal) sous HTR : le projet TraPrInq (Transcribing the court…
1.9 : Les archives inquisitoriales (Portugal) sous HTR : le projet TraPrInq (Transcribing the court records of the Portuguese Inquisition, 1536-1821)
1.10 : Segmentation Mode for Archival Documents with Highly Complex Layout
1.10 : Segmentation Mode for Archival Documents with Highly Complex Layout
1.11 : SegmOnto – A Controlled Vocabulary to Describe Historical Textual Sources
1.11 : SegmOnto – A Controlled Vocabulary to Describe Historical Textual Sources
2.1 : FoNDUE - A Lightweight HTR Infrastructure for Geneva
2.1 : FoNDUE - A Lightweight HTR Infrastructure for Geneva
2.2 : From HTR to Critical Edition: A Semi-Automatic Pipeline
2.2 : From HTR to Critical Edition: A Semi-Automatic Pipeline
2.3 : Analyse, Reconnaissance et Indexation des manuscrits CHAM
2.3 : Analyse, Reconnaissance et Indexation des manuscrits CHAM
2.4 : Expérimentations pour l’analyse automatique de sources chinoises anciennes
2.4 : Expérimentations pour l’analyse automatique de sources chinoises anciennes
2.5 : Sharing HTR datasets with standardized metadata: the HTR United initiative
2.5 : Sharing HTR datasets with standardized metadata: the HTR United initiative
2.6 : EpiSearch. Recognising Ancient Inscriptions in Epigraphic Manuscripts
2.6 : EpiSearch. Recognising Ancient Inscriptions in Epigraphic Manuscripts
2.7 : HTR of Handwritten Paleographic Greek Text as a Function of Chronology
2.7 : HTR of Handwritten Paleographic Greek Text as a Function of Chronology
2.8 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiques
2.8 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiques
2.9 : Retour d’expériences sur l’utilisation comparée de plusieurs de dispositifs de transcription …
2.9 : Retour d’expériences sur l’utilisation comparée de plusieurs de dispositifs de transcription numérique d’archives de fouilles archéologiques
2.10 : Clôture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"
2.10 : Clôture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"
Intervenants et intervenantes
Agrégé de lettres, docteur de l'université Paris-Nanterre, enseigne la langue et la littérature françaises et vit dans les bois au Portugal (2007)
Thésard en littérature grecque (2000)
Auteur d'une thèse de doctorat de productique, automatique et informatique industrielle à l'université de Lille 1 en 1995
Professeur à La Rochelle Université, Laboratoire Informatique, Image et Interaction (L3i) (en 2023)
Conservateur des bibliothèques. Docteur en Études médiévales (Paris 4, 2016). Maître de conférences à l'École nationale des chartes. Spécialiste de la stylométrie.
Doctorante, EPHE, Université de Montréal, Inria (2022)
Chercheur en humanités numériques
Auteur d'une thèse en Lettres et civilisations antiques à Lyon en 2022
Économiste.
Enseignant à l'Université Paris-Sud (en 2015).
Diplômé d'un doctorat en sciences économiques (Dijon, 2014) et d'un master en économie de l'énergie et de l'environnement (Institut National des Sciences et Techniques du Nucléaire).
Maître de conférences à l'Université de Savoie Mont-Blanc (2021).
Chargé d’enseignement à l’université de Genève
Chercheur en anthropologie historique
Auteur d'un rapport de stage en Master 2 professionnel, Patrimoine écrit et édition numérique, à Tours, en 2015. Auteur d'une thèse en Etudes italiennes à Grenoble Alpes en 2019
Directrice de la recherche et des relations internationales de l’École nationale des chartes - PSL (en 2023)
Philologue, enseignante, secrétaire générale de la Société jurassienne d’Emulation (SJE). Assistante doctorante à la chaire de philologie classique de l'Université de Neuchâtel depuis 2017
Docteure en langues et littérature médiévales (Lyon 3, 2021
Docteur en histoire (Paris 1, 1992)
Directeur d'études à l’École Pratique des Hautes Études, section des sciences historiques et philologiques
Enseigne au King's College London (2014)
Titulaire d'un doctorat en Histoire, histoire de l'art et archéologie (Université Paris-Saclay (ComUE), 2019)
Docteur en géographie. Directeur technique de l'association SIG L-R, Systèmes d'information géographique (en 1997)
Diplômé de l'Inalco en 2017 (arménien, texte et linguistique)