Conférence

Notice

Lieu de réalisation

École nationale des chartes

Langue :

Anglais

Crédits

Yanet Hernandez (Montage), Sergio Torres Aguilar (Intervention), Vincent Jolivet (Intervention)

Conditions d'utilisation

Droit commun de la propriété intellectuelle

Citer cette ressource :

Sergio Torres Aguilar, Vincent Jolivet. ENC. (2022, 23 juin). 1.3 : HTR fine tuning for medieval manuscripts models: strategies and evaluation , in Documents anciens et reconnaissance automatique des écritures manuscrites. [Vidéo]. Canal-U. https://www.canal-u.tv/133332. (Consultée le 14 janvier 2026)

1.3 : HTR fine tuning for medieval manuscripts models: strategies and evaluation

Réalisation : 23 juin 2022 - Mise en ligne : 6 octobre 2022

document 1 document 2 document 3
niveau 1 niveau 2 niveau 3

Descriptif

par Sergio Torres Aguilar (ENC) et Vincent Jolivet (ENC)

In this presentation we intend to explore different practical questions about HTR modeling in order to determine at what point a model reaches the necessary robustness and a sufficiently broad-level of generalization to serve as a pre-trained base to raise a new specialized model. For this end, we use several HTR ground-truth documents from medieval cartularies and registers ranging from 12th to 15th centuries and we will evaluate two aspects: (1) the creation of robust models by trying to calculate the learning break‑point and the minimum amount of ground truth necessary to achieve good generalization performances from a limited collection of documents and (2) the process of fine‑tuning in the aim to quickly specialize a robust model, used here as a pre-trained base, on a type of source other than those used during training.

Intervention / Responsable scientifique

Torres Aguilar

Sergio

Titulaire d'un doctorat en Histoire, histoire de l'art et archéologie (Université Paris-Saclay (ComUE), 2019)

Jolivet

Vincent

Chercheur en anthropologie historique

Thème

Discipline :

Edition, édition électronique et multimédia

Humanités numériques

Dans la même collection

Conférence

00:02:29

Favoris

2.10 : Clôture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"

Pinche

Ariane

2.10 : Clôture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"
12.10.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:31:44

Favoris
2.8 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiques

Pinche

Ariane

2.8 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiques
Humanités numériques
12.10.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:13:20

Favoris
2.7 : HTR of Handwritten Paleographic Greek Text as a Function of Chronology

Pinche

Ariane

2.7 : HTR of Handwritten Paleographic Greek Text as a Function of Chronology
Humanités numériques
12.10.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:22:52

Favoris
2.6 : EpiSearch. Recognising Ancient Inscriptions in Epigraphic Manuscripts

Boschetti

Federico

2.6 : EpiSearch. Recognising Ancient Inscriptions in Epigraphic Manuscripts
Humanités numériques
12.10.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:39:16

Favoris
2.4 : Expérimentations pour l’analyse automatique de sources chinoises anciennes

Vidal-Gorène

Chahan

2.4 : Expérimentations pour l’analyse automatique de sources chinoises anciennes
Humanités numériques
12.10.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:33:03

Favoris
2.3 : Analyse, Reconnaissance et Indexation des manuscrits CHAM

Schweyer

Anne-Valérie

Burie

Jean-Christophe

2.3 : Analyse, Reconnaissance et Indexation des manuscrits CHAM
Humanités numériques
12.10.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:34:18

Favoris
2.1 : FoNDUE - A Lightweight HTR Infrastructure for Geneva

Gabay

Simon

2.1 : FoNDUE - A Lightweight HTR Infrastructure for Geneva
Humanités numériques
12.10.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:34:41

Favoris
2.5 : Sharing HTR datasets with standardized metadata: the HTR United initiative

Chagué

Alix

Clérice

Thibault

2.5 : Sharing HTR datasets with standardized metadata: the HTR United initiative
Humanités numériques
06.10.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:21:07

Favoris
2.9 : Retour d’expériences sur l’utilisation comparée de plusieurs de dispositifs de transcription …

Tufféry

Christophe

2.9 : Retour d’expériences sur l’utilisation comparée de plusieurs de dispositifs de transcription numérique d’archives de fouilles archéologiques
Humanités numériques
06.10.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:23:00

Favoris
1.10 : Segmentation Mode for Archival Documents with Highly Complex Layout

Stoekl

Daniel

1.10 : Segmentation Mode for Archival Documents with Highly Complex Layout
Humanités numériques
06.10.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:23:25

Favoris
2.2 : From HTR to Critical Edition: A Semi-Automatic Pipeline

Stoekl

Daniel

2.2 : From HTR to Critical Edition: A Semi-Automatic Pipeline
Humanités numériques
06.10.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:19:55

Favoris
1.7 : De Transkribus à eScriptorium : retour(s) d’expérience sur l’usage d’outils d’HTR appliqués à…

Leblanc

Elina

1.7: De Transkribus à eScriptorium : retour(s) d’expérience sur l’usage d’outils d’HTR appliqués à un corpus d’imprimés espagnols du XIXe siècle
Humanités numériques
05.10.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3

Voir tout

Avec les mêmes intervenants et intervenantes

Conférence

01:01:06

Favoris
1.6 : Table ronde « Les défis des bases de données iconographiques aujourd’hui »

Jolivet

Vincent

Robineau

Régis

Frunzeanu

Eduard

Nurra

Federico

Legrand

Françoise

1.2.3 : Table ronde « Les défis des bases de données iconographiques aujourd’hui »
Base de données
24.05.2023
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3

1.3 : HTR fine tuning for medieval manuscripts models: strategies and evaluation

Dans la même collection

2.10 : Clôture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"

2.8 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiques

2.7 : HTR of Handwritten Paleographic Greek Text as a Function of Chronology

2.6 : EpiSearch. Recognising Ancient Inscriptions in Epigraphic Manuscripts

2.4 : Expérimentations pour l’analyse automatique de sources chinoises anciennes

2.3 : Analyse, Reconnaissance et Indexation des manuscrits CHAM

2.1 : FoNDUE - A Lightweight HTR Infrastructure for Geneva

2.5 : Sharing HTR datasets with standardized metadata: the HTR United initiative

2.9 : Retour d’expériences sur l’utilisation comparée de plusieurs de dispositifs de transcription …

1.10 : Segmentation Mode for Archival Documents with Highly Complex Layout

2.2 : From HTR to Critical Edition: A Semi-Automatic Pipeline

1.7 : De Transkribus à eScriptorium : retour(s) d’expérience sur l’usage d’outils d’HTR appliqués à…

Avec les mêmes intervenants et intervenantes

1.6 : Table ronde « Les défis des bases de données iconographiques aujourd’hui »

Sur le même thème

Causeries Culture - Humanités Numériques, Intelligence Artificielle, littérature et technologies #6

Faire une histoire des territoires en contexte montagneux : l’organisation de l’espace par les fonc…

Digital Benin: a digital platform connecting the displaced royal artefacts from Benin Kingdom

Multilinguality and data access: an area studies librarian’s perspective

InVisto : Base de données pour l’histoire du livre et de l’édition vietnamienne en Cochinchine (18…

Comment s’orienter dans la forêt des ressources et des outils numériques ?

Base de données et cartographie. Pour une nouvelle approche des monastères latins dans les États la…

L'IA comme aide à la recherche : l'expérimentation du traitement automatique des langues appliqué a…

Présentation du projet MistraNum. L’usage et l’apport des nouvelles technologies sur le site archéo…

Le portail numérique Φραγκικά-Frankika : un nouvel élan pour l’histoire de la Grèce franque et lati…

The Templar Citadel of Tartous through Images: Digital Tools to Reveal its Origins and Reconstruct …

Traiter les inscriptions et graffitis de l’Orient latin : l’environnement numérique de l’ERC GRAPH-…