Conférence
Notice
Lieu de réalisation
École nationale des chartes
Langue :
Anglais
Crédits
Simon Gabay (Intervention), Ariane Pinche (Intervention)
Conditions d'utilisation
Droit commun de la propriété intellectuelle
Citer cette ressource :
Simon Gabay, Ariane Pinche. ENC. (2022, 23 juin). 1.11 : SegmOnto – A Controlled Vocabulary to Describe Historical Textual Sources , in Documents anciens et reconnaissance automatique des écritures manuscrites. [Vidéo]. Canal-U. https://www.canal-u.tv/133480. (Consultée le 25 avril 2025)

1.11 : SegmOnto – A Controlled Vocabulary to Describe Historical Textual Sources

Réalisation : 23 juin 2022 - Mise en ligne : 5 septembre 2022
  • document 1 document 2 document 3
  • niveau 1 niveau 2 niveau 3
Descriptif

par Simon Gabay, Ariane Pinche et Kelly Christensen

Our initiative aims to design a controlled vocabulary for the description of the layout of textual sources: SegmOnto. Following a codicological approach rather than a semantic one, it is designed as a generic typology, coping with a maximised number of cases rather than answering specific needs. Systematise the layout description has a double objective: on the one hand it facilitates the exchange of annotated data and therefore the training of better models for image segmentation (a crucial preliminary step for text recognition), on the other hand, it allows the development of a shared post-processing workflow and pipeline for the transformation of ALTO or PAGE files into DH standard formats such as RDF or TEI.

Intervention

Dans la même collection

Avec les mêmes intervenants et intervenantes