Notice
1.10 : Segmentation Mode for Archival Documents with Highly Complex Layout
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
Descriptif
par Daniel Stoekl Ben Ezra
Using eScriptorium together with kraken as an infrastructure, we developed a simple but highly efficient procedure for reducing the amount of human labor necessary for creating large amounts of segmentation ground truth for documents with highly complex layouts, i.e., documents comprising regions with lines at eight different angles. Our specific project deals with medieval documents in Hebrew script in Judeo‑Arabic, Aramaic and Hebrew from the Cairo Genizah, including letters, legal documents, lists, notes and accounts. There are about 40,000 documentary texts from the Genizah, of which only about 5,000 have been transcribed. Therefore, our current aim is to create enough data to be able to train a global segmentation model with a very large number of classes, so that it can segment complex layouts in a single step.
Thème
Dans la même collection
-
2.10 : Clôture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"
PincheAriane2.10 : Clôture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"
-
2.8 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiques
PincheAriane2.8 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiques
-
2.7 : HTR of Handwritten Paleographic Greek Text as a Function of Chronology
PincheAriane2.7 : HTR of Handwritten Paleographic Greek Text as a Function of Chronology
-
2.6 : EpiSearch. Recognising Ancient Inscriptions in Epigraphic Manuscripts
BoschettiFederico2.6 : EpiSearch. Recognising Ancient Inscriptions in Epigraphic Manuscripts
-
2.4 : Expérimentations pour l’analyse automatique de sources chinoises anciennes
Vidal-GorèneChahan2.4 : Expérimentations pour l’analyse automatique de sources chinoises anciennes
-
2.3 : Analyse, Reconnaissance et Indexation des manuscrits CHAM
SchweyerAnne-ValérieBurieJean-Christophe2.3 : Analyse, Reconnaissance et Indexation des manuscrits CHAM
-
2.1 : FoNDUE - A Lightweight HTR Infrastructure for Geneva
GabaySimon2.1 : FoNDUE - A Lightweight HTR Infrastructure for Geneva
-
1.3 : HTR fine tuning for medieval manuscripts models: strategies and evaluation
Torres AguilarSergioJolivetVincent1.3 : HTR fine tuning for medieval manuscripts models: strategies and evaluation
-
2.5 : Sharing HTR datasets with standardized metadata: the HTR United initiative
ChaguéAlixClériceThibault2.5 : Sharing HTR datasets with standardized metadata: the HTR United initiative
-
2.9 : Retour d’expériences sur l’utilisation comparée de plusieurs de dispositifs de transcription …
TufféryChristophe2.9 : Retour d’expériences sur l’utilisation comparée de plusieurs de dispositifs de transcription numérique d’archives de fouilles archéologiques
-
2.2 : From HTR to Critical Edition: A Semi-Automatic Pipeline
StoeklDaniel2.2 : From HTR to Critical Edition: A Semi-Automatic Pipeline
-
1.7 : De Transkribus à eScriptorium : retour(s) d’expérience sur l’usage d’outils d’HTR appliqués à…
LeblancElina1.7: De Transkribus à eScriptorium : retour(s) d’expérience sur l’usage d’outils d’HTR appliqués à un corpus d’imprimés espagnols du XIXe siècle
Avec les mêmes intervenants et intervenantes
-
2.2 : From HTR to Critical Edition: A Semi-Automatic Pipeline
StoeklDaniel2.2 : From HTR to Critical Edition: A Semi-Automatic Pipeline
Sur le même thème
-
ANR PORTIC - Partie I : « Naviguer avec la base de données PORTIC » (coordinatrice : Christine Plum…
PlumejeaudChristineSofiaPierre NiccolòJournée de restitution du projet ANR PORTIC
-
ANR PROTIC - Introduction
MarzagalliSilviaJournée de restitution du programme ANR PORTIC - Introduction
-
ANR PORTIC - Partie II : « Projet PORTIC : négocier l’écriture d’une enquête » (coordinateur : Robi…
MouratRobin deCharlesLoïcMarzagalliSilviaGirardPaulMazoyerBéatriceJournée de restitution du programme ANR PORTIC
-
L’apport des Humanités numériques à la recherche historique : SIG et Web sémantique en Centre Viet…
SchweyerAnne-ValérieMermetEricAnalyse du paysage au Centre Vietnam via des annotations sur cartes et photos dans Oronce Fine.
-
Cartes en ligne : un outil de science ouverte
BayoumiHalaCartes en ligne : un outil de science ouverte
-
Les outils de géolocalisation du consortium Huma-Num Projets Time Machine
MermetEricLes outils de géolocalisation du consortium Huma-Num Projets Time Machine
-
Gallicarte : Géolocaliser les documents numérisés de BnF Gallica
Gallicarte : Géolocaliser les documents numérisés de BnF Gallica
-
En quoi l’IA transforme les pratiques dans l’enseignement supérieur et la recherche
GanasciaJean-GabrielConférence inaugurale de rentrée des Écoles Doctorales de l'Université Toulouse - Jean Jaurès donnée par le professeur Jean-Gabriel Ganascia, spécialiste de l’intelligence artificielle, des humanités
-
Humanités Numériques – Intelligence Artificielle (IA), littérature et technologies #6 – Saga Tom Ca…
PorlierChristopheBertaniNicolaHumanités Numériques – Intelligence Artificielle (IA), littérature et technologies #6 – Saga Tom Castle – Focus sur des éléments du second opus
-
Humanités Numériques – Intelligence Artificielle (IA), littérature et technologies #5 – À l’occasio…
PorlierChristopheBertaniNicolaHumanités Numériques – Intelligence Artificielle (IA), littérature et technologies #5 – À l’occasion de la sortie du second roman de la saga Tom Castle
-
Restituer la charpente du logis des Sept Vertus
SalamagneAlainGaugainLucieUn projet de recherche mené au sein du Centre d’études supérieures de la Renaissance (Université de Tours/CNRS). Un projet associant le Laboratoire de Mécanique Gabriel Lamé (LaMé, Orléans-Tours) et
-
Restituer un logis disparu
SalamagneAlainGaugainLucieUn projet de recherche mené au sein du Centre d’études supérieures de la Renaissance (Université de Tours/CNRS). Un projet associant le Laboratoire de Mécanique Gabriel Lamé (LaMé, Orléans-Tours) et