Conférence
Notice
Lieu de réalisation
École nationale des chartes
Langue :
Français
Crédits
Yanet Hernandez (Montage), Jean-Baptiste Camps (Intervention), Ariane Pinche (Intervention)
Conditions d'utilisation
Droit commun de la propriété intellectuelle
Citer cette ressource :
Jean-Baptiste Camps, Ariane Pinche. ENC. (2022, 23 juin). 1.2 : CremmaLab projects , in Documents anciens et reconnaissance automatique des écritures manuscrites. [Vidéo]. Canal-U. https://www.canal-u.tv/133331. (Consultée le 15 octobre 2024)

1.2 : CremmaLab projects

Réalisation : 23 juin 2022 - Mise en ligne : 5 septembre 2022
  • document 1 document 2 document 3
  • niveau 1 niveau 2 niveau 3
Descriptif

par Jean-Baptiste Camps (ENC) et Ariane Pinche (ENC)

L’étape d’acquisition du texte est première dans la plupart de nos entreprises de recherche, qu’il s’agisse d’édition de texte, d’études linguistiques, philologiques et historiques, ou de traitement massif de corpus. Pour produire des corpus textuels de qualité, il est crucial de pouvoir partager librement, en en garantissant l’interopérabilité, les données que nous produisons, et, in fine, de proposer à la communauté scientifique des modèles réutilisables. Pour répondre à ces besoins, et plus spécifiquement aux besoins des médiévistes, le projet CREMMALAB propose des réflexions méthodologiques sur les protocoles de transcriptions des corpus afin d’optimiser des modèles d’HTR à travers la rédaction d’un guide de transcription et la mise à disposition de modèles d’HTR. Nous présenterons les premiers résultats de ces travaux à travers le traitement de deux corpus massifs : un corpus de romans de chevalerie et un corpus de textes hagiographiques, pris en diachronie (xiiie‑xve siècle).

Intervention

Dans la même collection

Avec les mêmes intervenants et intervenantes