1.2 : CremmaLab projects
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
- audio 1 audio 2 audio 3
Descriptif
par Jean-Baptiste Camps (ENC) et Ariane Pinche (ENC)
L’étape d’acquisition du texte est première dans la plupart de nos entreprises de recherche, qu’il s’agisse d’édition de texte, d’études linguistiques, philologiques et historiques, ou de traitement massif de corpus. Pour produire des corpus textuels de qualité, il est crucial de pouvoir partager librement, en en garantissant l’interopérabilité, les données que nous produisons, et, in fine, de proposer à la communauté scientifique des modèles réutilisables. Pour répondre à ces besoins, et plus spécifiquement aux besoins des médiévistes, le projet CREMMALAB propose des réflexions méthodologiques sur les protocoles de transcriptions des corpus afin d’optimiser des modèles d’HTR à travers la rédaction d’un guide de transcription et la mise à disposition de modèles d’HTR. Nous présenterons les premiers résultats de ces travaux à travers le traitement de deux corpus massifs : un corpus de romans de chevalerie et un corpus de textes hagiographiques, pris en diachronie (xiiie‑xve siècle).
Intervenant
Thème
Notice
Dans la même collection
-
2.10 : Clôture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"PincheAriane
2.10 : Clôture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"
-
2.8 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiquesPincheAriane
2.8 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiques
-
2.7 : HTR of Handwritten Paleographic Greek Text as a Function of ChronologyPincheAriane
2.7 : HTR of Handwritten Paleographic Greek Text as a Function of Chronology
-
2.6 : EpiSearch. Recognising Ancient Inscriptions in Epigraphic ManuscriptsBoschettiFederico
2.6 : EpiSearch. Recognising Ancient Inscriptions in Epigraphic Manuscripts
-
2.4 : Expérimentations pour l’analyse automatique de sources chinoises anciennesVidal-GorèneChahan
2.4 : Expérimentations pour l’analyse automatique de sources chinoises anciennes
-
2.3 : Analyse, Reconnaissance et Indexation des manuscrits CHAMSchweyerAnne-ValérieBurieJean-Christophe
2.3 : Analyse, Reconnaissance et Indexation des manuscrits CHAM
-
2.1 : FoNDUE - A Lightweight HTR Infrastructure for GenevaGabaySimon
2.1 : FoNDUE - A Lightweight HTR Infrastructure for Geneva
-
1.3 : HTR fine tuning for medieval manuscripts models: strategies and evaluationTorres AguilarSergioJolivetVincent
1.3 : HTR fine tuning for medieval manuscripts models: strategies and evaluation
-
2.5 : Sharing HTR datasets with standardized metadata: the HTR United initiativeChaguéAlixClériceThibault
2.5 : Sharing HTR datasets with standardized metadata: the HTR United initiative
-
2.9 : Retour d’expériences sur l’utilisation comparée de plusieurs de dispositifs de transcription …TufféryChristophe
2.9 : Retour d’expériences sur l’utilisation comparée de plusieurs de dispositifs de transcription numérique d’archives de fouilles archéologiques
-
1.10 : Segmentation Mode for Archival Documents with Highly Complex LayoutStoeklDaniel
1.10 : Segmentation Mode for Archival Documents with Highly Complex Layout
-
2.2 : From HTR to Critical Edition: A Semi-Automatic PipelineStoeklDaniel
2.2 : From HTR to Critical Edition: A Semi-Automatic Pipeline
Avec les mêmes intervenants
-
2.10 : Clôture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"PincheAriane
2.10 : Clôture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"
-
2.8 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiquesPincheAriane
2.8 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiques
-
2.7 : HTR of Handwritten Paleographic Greek Text as a Function of ChronologyPincheAriane
2.7 : HTR of Handwritten Paleographic Greek Text as a Function of Chronology
-
1.11 : SegmOnto – A Controlled Vocabulary to Describe Historical Textual SourcesGabaySimonPincheAriane
1.11 : SegmOnto – A Controlled Vocabulary to Describe Historical Textual Sources