Notice
1.3 : HTR fine tuning for medieval manuscripts models: strategies and evaluation
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
Descriptif
par Sergio Torres Aguilar (ENC) et Vincent Jolivet (ENC)
In this presentation we intend to explore different practical questions about HTR modeling in order to determine at what point a model reaches the necessary robustness and a sufficiently broad-level of generalization to serve as a pre-trained base to raise a new specialized model. For this end, we use several HTR ground-truth documents from medieval cartularies and registers ranging from 12th to 15th centuries and we will evaluate two aspects: (1) the creation of robust models by trying to calculate the learning break‑point and the minimum amount of ground truth necessary to achieve good generalization performances from a limited collection of documents and (2) the process of fine‑tuning in the aim to quickly specialize a robust model, used here as a pre-trained base, on a type of source other than those used during training.
Thème
Dans la même collection
-
2.10 : Clôture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"
PINCHE Ariane
2.10 : Clôture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"
-
2.8 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiques
PINCHE Ariane
2.8 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiques
-
2.7 : HTR of Handwritten Paleographic Greek Text as a Function of Chronology
PINCHE Ariane
2.7 : HTR of Handwritten Paleographic Greek Text as a Function of Chronology
-
2.6 : EpiSearch. Recognising Ancient Inscriptions in Epigraphic Manuscripts
BOSCHETTI Federico
2.6 : EpiSearch. Recognising Ancient Inscriptions in Epigraphic Manuscripts
-
2.4 : Expérimentations pour l’analyse automatique de sources chinoises anciennes
VIDAL-GORèNE Chahan
2.4 : Expérimentations pour l’analyse automatique de sources chinoises anciennes
-
2.3 : Analyse, Reconnaissance et Indexation des manuscrits CHAM
SCHWEYER Anne-Valérie
BURIE Jean-Christophe
2.3 : Analyse, Reconnaissance et Indexation des manuscrits CHAM
-
2.1 : FoNDUE - A Lightweight HTR Infrastructure for Geneva
GABAY Simon
2.1 : FoNDUE - A Lightweight HTR Infrastructure for Geneva
-
2.5 : Sharing HTR datasets with standardized metadata: the HTR United initiative
CHAGUé Alix
CLéRICE Thibault
2.5 : Sharing HTR datasets with standardized metadata: the HTR United initiative
-
1.10 : Segmentation Mode for Archival Documents with Highly Complex Layout
STOEKL Daniel
1.10 : Segmentation Mode for Archival Documents with Highly Complex Layout
-
2.9 : Retour d’expériences sur l’utilisation comparée de plusieurs de dispositifs de transcription …
TUFFéRY Christophe
2.9 : Retour d’expériences sur l’utilisation comparée de plusieurs de dispositifs de transcription numérique d’archives de fouilles archéologiques
-
2.2 : From HTR to Critical Edition: A Semi-Automatic Pipeline
STOEKL Daniel
2.2 : From HTR to Critical Edition: A Semi-Automatic Pipeline
-
1.7 : De Transkribus à eScriptorium : retour(s) d’expérience sur l’usage d’outils d’HTR appliqués à…
LEBLANC Elina
1.7: De Transkribus à eScriptorium : retour(s) d’expérience sur l’usage d’outils d’HTR appliqués à un corpus d’imprimés espagnols du XIXe siècle
Avec les mêmes intervenants et intervenantes
-
1.6 : Table ronde « Les défis des bases de données iconographiques aujourd’hui »
JOLIVET Vincent
ROBINEAU Régis
FRUNZEANU Eduard
NURRA Federico
LEGRAND Françoise
1.2.3 : Table ronde « Les défis des bases de données iconographiques aujourd’hui »
Sur le même thème
-
Base de données et cartographie. Pour une nouvelle approche des monastères latins dans les États la…
ARTAUD Florian
À travers son projet doctoral, Florian Artaud propose une relecture des institutions monastiques latines dans les États latins d’Orient, en les abordant sous l’angle de la territorialité. Au cœur de
-
L'IA comme aide à la recherche : l'expérimentation du traitement automatique des langues appliqué a…
MENU Ariane
Ariane Menu (direction scientifique et technique, Inrap) présente ici un exemple d'utilisation du traitement automatique des langues pour repérer des mots-clés dans un corpus de texte et montre
-
The Templar Citadel of Tartous through Images: Digital Tools to Reveal its Origins and Reconstruct …
MERCURI Lorenzo
Dans cette communication, Lorenzo Mercuri explore sous un angle renouvelé la citadelle templière de Tartous, en Syrie, grâce aux apports des outils numériques. En croisant histoire, archéologie et
-
Traiter les inscriptions et graffitis de l’Orient latin : l’environnement numérique de l’ERC GRAPH-…
INGRAND-VARENNE Estelle
Dans cette communication, Estelle Ingrand-Varenne présente l’environnement numérique de travail développé dans le cadre du projet ERC GRAPH-EAST (2021–2027), consacré aux inscriptions et graffitis en
-
L’apport des humanités numériques à l’étude des grafiiti dans les lieux saints : prospecter, enregi…
DUSSART Clément
Clément Dussart présente, dans le cadre du projet ERC GRAPH-EAST, les apports des humanités numériques à l’étude des graffiti dans les lieux saints de l’Orient chrétien médiéval. Photogrammétrie,
-
The Crusades Regesta: A Database for the Study of the Latin East
GUTGARTS Anna
BOM Myra Miranda
Dans cette communication, Anna Gutgarts et Myra M. Bom présentent l'histoire et les enjeux de la base de données The Crusades Regesta. Cette base de données, initiée par Jonathan Riley-Smith, est
-
Présentation du projet MistraNum. L’usage et l’apport des nouvelles technologies sur le site archéo…
YOTA Élisabeth
Élisabeth Yota présente, dans cette communication, un projet de recherche alliant études byzantines et humanités numériques, consacré à l'étude et à la valorisation patrimoniale du site médiéval de
-
Le portail numérique Φραγκικά-Frankika : un nouvel élan pour l’histoire de la Grèce franque et lati…
TRéLAT Philippe
VOISIN Ludivine
MEYER-FERNANDEZ Geoffrey
Dans cette communication, Geoffrey Meyer-Fernandez, Philippe Trélat et Ludivine Voisin présentent le portail Φραγκικά-Frankika, un projet de recherche numérique porté par l’École française d’Athènes
-
Le projet EyCon: Vision par ordinateur et archives photographiques des conflits coloniaux
FOLIARD Daniel
SCHUH Julien
Le projet EyCon: Vision par ordinateur et archives photographiques des conflits coloniaux
-
Le projet CollEx Persée ArchéoAl. Enrichissements de toponymes et alignements d'identifiants numéri…
MACQUIN Agnès
Le projet CollEx Persée ArchéoAl. Enrichissements de toponymes et alignements d'identifiants numériques
-
Visualiser les données des sources ottomanes : modélisation et spatialisation des réseaux de fondat…
Visualiser les données des sources ottomanes : modélisation et spatialisation des réseaux de fondations pieuses de Bosnie avec Gephi
-
ANR PORTIC - Partie I : « Naviguer avec la base de données PORTIC » (coordinatrice : Christine Plum…
PLUMEJEAUD Christine
SOFIA Pierre Niccolò
Journée de restitution du projet ANR PORTIC