Notice
2.4 : Expérimentations pour l’analyse automatique de sources chinoises anciennes
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
Descriptif
par Marie Bizais-Lillig et Chahan Vidal-Gorène
Dans cette présentation, nous nous proposons de rendre compte d’une expérience de transcription automatisée de textes xylographiés de la Chine impériale, à partir d’un très petit jeu de données (50 images). Bien que particulièrement lisibles, ces documents très denses présentent un double défi pour les HTR tant au niveau du sens de lecture du contenu que du très grand nombre de caractères différents à reconnaître, variété impossible à représenter en apprentissage. Le propos questionnera tout d’abord les choix de transcription réalisés et leur impact sur la capacité des modèles à apprendre efficacement en situation de one-shot learning, puis nous aborderons la question du sens de lecture du résultat produit et des différentes approches mises en place avec et sans apprentissage machine.
Thème
Dans la même collection
-
2.10 : Clôture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"
PincheAriane2.10 : Clôture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"
-
2.8 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiques
PincheAriane2.8 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiques
-
2.7 : HTR of Handwritten Paleographic Greek Text as a Function of Chronology
PincheAriane2.7 : HTR of Handwritten Paleographic Greek Text as a Function of Chronology
-
2.6 : EpiSearch. Recognising Ancient Inscriptions in Epigraphic Manuscripts
BoschettiFederico2.6 : EpiSearch. Recognising Ancient Inscriptions in Epigraphic Manuscripts
-
2.3 : Analyse, Reconnaissance et Indexation des manuscrits CHAM
SchweyerAnne-ValérieBurieJean-Christophe2.3 : Analyse, Reconnaissance et Indexation des manuscrits CHAM
-
2.1 : FoNDUE - A Lightweight HTR Infrastructure for Geneva
GabaySimon2.1 : FoNDUE - A Lightweight HTR Infrastructure for Geneva
-
1.3 : HTR fine tuning for medieval manuscripts models: strategies and evaluation
Torres AguilarSergioJolivetVincent1.3 : HTR fine tuning for medieval manuscripts models: strategies and evaluation
-
2.5 : Sharing HTR datasets with standardized metadata: the HTR United initiative
ChaguéAlixClériceThibault2.5 : Sharing HTR datasets with standardized metadata: the HTR United initiative
-
1.10 : Segmentation Mode for Archival Documents with Highly Complex Layout
StoeklDaniel1.10 : Segmentation Mode for Archival Documents with Highly Complex Layout
-
2.9 : Retour d’expériences sur l’utilisation comparée de plusieurs de dispositifs de transcription …
TufféryChristophe2.9 : Retour d’expériences sur l’utilisation comparée de plusieurs de dispositifs de transcription numérique d’archives de fouilles archéologiques
-
2.2 : From HTR to Critical Edition: A Semi-Automatic Pipeline
StoeklDaniel2.2 : From HTR to Critical Edition: A Semi-Automatic Pipeline
-
1.7 : De Transkribus à eScriptorium : retour(s) d’expérience sur l’usage d’outils d’HTR appliqués à…
LeblancElina1.7: De Transkribus à eScriptorium : retour(s) d’expérience sur l’usage d’outils d’HTR appliqués à un corpus d’imprimés espagnols du XIXe siècle
Sur le même thème
-
The Templar Citadel of Tartous through Images: Digital Tools to Reveal its Origins and Reconstruct …
Dans cette communication, Lorenzo Mercuri explore sous un angle renouvelé la citadelle templière de Tartous, en Syrie, grâce aux apports des outils numériques. En croisant histoire, archéologie et
-
Traiter les inscriptions et graffitis de l’Orient latin : l’environnement numérique de l’ERC GRAPH-…
Ingrand-VarenneEstelleDans cette communication, Estelle Ingrand-Varenne présente l’environnement numérique de travail développé dans le cadre du projet ERC GRAPH-EAST (2021–2027), consacré aux inscriptions et graffitis en
-
L’apport des humanités numériques à l’étude des grafiiti dans les lieux saints : prospecter, enregi…
DussartClémentClément Dussart présente, dans le cadre du projet ERC GRAPH-EAST, les apports des humanités numériques à l’étude des graffiti dans les lieux saints de l’Orient chrétien médiéval. Photogrammétrie,
-
The Crusades Regesta: A Database for the Study of the Latin East
GutgartsAnnaBomMyra MirandaDans cette communication, Anna Gutgarts et Myra M. Bom présentent l'histoire et les enjeux de la base de données The Crusades Regesta. Cette base de données, initiée par Jonathan Riley-Smith, est
-
Présentation du projet MistraNum. L’usage et l’apport des nouvelles technologies sur le site archéo…
YotaÉlisabethÉlisabeth Yota présente, dans cette communication, un projet de recherche alliant études byzantines et humanités numériques, consacré à l'étude et à la valorisation patrimoniale du site médiéval de
-
Le portail numérique Φραγκικά-Frankika : un nouvel élan pour l’histoire de la Grèce franque et lati…
TrélatPhilippeVoisinLudivineMeyer-FernandezGeoffreyDans cette communication, Geoffrey Meyer-Fernandez, Philippe Trélat et Ludivine Voisin présentent le portail Φραγκικά-Frankika, un projet de recherche numérique porté par l’École française d’Athènes
-
Le projet EyCon: Vision par ordinateur et archives photographiques des conflits coloniaux
FoliardDanielSchuhJulienLe projet EyCon: Vision par ordinateur et archives photographiques des conflits coloniaux
-
Le projet CollEx Persée ArchéoAl. Enrichissements de toponymes et alignements d'identifiants numéri…
MacquinAgnèsLe projet CollEx Persée ArchéoAl. Enrichissements de toponymes et alignements d'identifiants numériques
-
Visualiser les données des sources ottomanes : modélisation et spatialisation des réseaux de fondat…
Visualiser les données des sources ottomanes : modélisation et spatialisation des réseaux de fondations pieuses de Bosnie avec Gephi
-
ANR PORTIC - Partie I : « Naviguer avec la base de données PORTIC » (coordinatrice : Christine Plum…
PlumejeaudChristineSofiaPierre NiccolòJournée de restitution du projet ANR PORTIC
-
ANR PROTIC - Introduction
MarzagalliSilviaJournée de restitution du programme ANR PORTIC - Introduction
-
ANR PORTIC - Partie II : « Projet PORTIC : négocier l’écriture d’une enquête » (coordinateur : Robi…
MouratRobin deCharlesLoïcMarzagalliSilviaGirardPaulMazoyerBéatriceJournée de restitution du programme ANR PORTIC