1.11 : SegmOnto – A Controlled Vocabulary to Describe Historical Textual Sources

Durée : 00:46:14 -Réalisation : 23 juin 2022 -Mise en ligne : 5 septembre 2022
  • document 1 document 2 document 3
  • niveau 1 niveau 2 niveau 3
  • audio 1 audio 2 audio 3

par Simon Gabay, Ariane Pinche et Kelly Christensen

Our initiative aims to design a controlled vocabulary for the description of the layout of textual sources: SegmOnto. Following a codicological approach rather than a semantic one, it is designed as a generic typology, coping with a maximised number of cases rather than answering specific needs. Systematise the layout description has a double objective: on the one hand it facilitates the exchange of annotated data and therefore the training of better models for image segmentation (a crucial preliminary step for text recognition), on the other hand, it allows the development of a shared post-processing workflow and pipeline for the transformation of ALTO or PAGE files into DH standard formats such as RDF or TEI.

Lieu de réalisation
École nationale des chartes
Langue :
Simon Gabay (Intervenant), Ariane Pinche (Intervenant)
Conditions d'utilisation
Droit commun de la propriété intellectuelle
Citer cette ressource :
Simon Gabay, Ariane Pinche. ENC. (2022, 23 juin). 1.11 : SegmOnto – A Controlled Vocabulary to Describe Historical Textual Sources. [Vidéo]. Canal-U. (Consultée le 9 juin 2023)

Dans la même collection

Avec les mêmes intervenants