1.10 : Segmentation Mode for Archival Documents with Highly Complex Layout
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
- audio 1 audio 2 audio 3
Descriptif
par Daniel Stoekl Ben Ezra
Using eScriptorium together with kraken as an infrastructure, we developed a simple but highly efficient procedure for reducing the amount of human labor necessary for creating large amounts of segmentation ground truth for documents with highly complex layouts, i.e., documents comprising regions with lines at eight different angles. Our specific project deals with medieval documents in Hebrew script in Judeo‑Arabic, Aramaic and Hebrew from the Cairo Genizah, including letters, legal documents, lists, notes and accounts. There are about 40,000 documentary texts from the Genizah, of which only about 5,000 have been transcribed. Therefore, our current aim is to create enough data to be able to train a global segmentation model with a very large number of classes, so that it can segment complex layouts in a single step.
Thème
Notice
Dans la même collection
-
2.10 : Clôture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"PincheAriane
2.10 : Clôture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"
-
2.8 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiquesPincheAriane
2.8 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiques
-
2.7 : HTR of Handwritten Paleographic Greek Text as a Function of ChronologyPincheAriane
2.7 : HTR of Handwritten Paleographic Greek Text as a Function of Chronology
-
2.6 : EpiSearch. Recognising Ancient Inscriptions in Epigraphic ManuscriptsBoschettiFederico
2.6 : EpiSearch. Recognising Ancient Inscriptions in Epigraphic Manuscripts
-
2.4 : Expérimentations pour l’analyse automatique de sources chinoises anciennesVidal-GorèneChahan
2.4 : Expérimentations pour l’analyse automatique de sources chinoises anciennes
-
2.3 : Analyse, Reconnaissance et Indexation des manuscrits CHAMSchweyerAnne-ValérieBurieJean-Christophe
2.3 : Analyse, Reconnaissance et Indexation des manuscrits CHAM
-
2.1 : FoNDUE - A Lightweight HTR Infrastructure for GenevaGabaySimon
2.1 : FoNDUE - A Lightweight HTR Infrastructure for Geneva
-
1.3 : HTR fine tuning for medieval manuscripts models: strategies and evaluationTorres AguilarSergioJolivetVincent
1.3 : HTR fine tuning for medieval manuscripts models: strategies and evaluation
-
2.5 : Sharing HTR datasets with standardized metadata: the HTR United initiativeChaguéAlixClériceThibault
2.5 : Sharing HTR datasets with standardized metadata: the HTR United initiative
-
2.9 : Retour d’expériences sur l’utilisation comparée de plusieurs de dispositifs de transcription …TufféryChristophe
2.9 : Retour d’expériences sur l’utilisation comparée de plusieurs de dispositifs de transcription numérique d’archives de fouilles archéologiques
-
2.2 : From HTR to Critical Edition: A Semi-Automatic PipelineStoeklDaniel
2.2 : From HTR to Critical Edition: A Semi-Automatic Pipeline
-
1.7 : De Transkribus à eScriptorium : retour(s) d’expérience sur l’usage d’outils d’HTR appliqués à…LeblancElina
1.7: De Transkribus à eScriptorium : retour(s) d’expérience sur l’usage d’outils d’HTR appliqués à un corpus d’imprimés espagnols du XIXe siècle
Avec les mêmes intervenants
-
2.2 : From HTR to Critical Edition: A Semi-Automatic PipelineStoeklDaniel
2.2 : From HTR to Critical Edition: A Semi-Automatic Pipeline
Sur le même thème
-
Séminaire HN Lab 1 : Le HTR appliqué à l’histoire de l’Art : présentation du travail de Léa Marone…
Le HN Lab propose un séminaire de recherche qui prend la forme d’une présentation de problématiques théoriques ou pratiques, de présentations de réalisations (achevées ou en cours) d’une durée de 30
-
Tutoriel XQuery (1)
Explorer le langages XQuery
-
Tutoriel XQuery (2)
Explorer le langage XQuery
-
Tutoriel XQuery (3)
Explorer le langage XQuery
-
-
-
-
-
Tutoriel XSLT (2)
Explorer le langage XSLT
-
-
Tutoriel XSLT (4)
Explorer le langage XSLT
-
Tutoriel XSLT (5)
Explorer le langage XSLT