Conférence
Notice
Lieu de réalisation
École nationale des chartes
Langue :
Français
Crédits
Yanet Hernandez (Montage), Chahan Vidal-Gorène (Intervention)
Conditions d'utilisation
Droit commun de la propriété intellectuelle
Citer cette ressource :
Chahan Vidal-Gorène. ENC. (2022, 24 juin). 2.4 : Expérimentations pour l’analyse automatique de sources chinoises anciennes , in Documents anciens et reconnaissance automatique des écritures manuscrites. [Vidéo]. Canal-U. https://www.canal-u.tv/133347. (Consultée le 27 juillet 2024)

2.4 : Expérimentations pour l’analyse automatique de sources chinoises anciennes

Réalisation : 24 juin 2022 - Mise en ligne : 12 octobre 2022
  • document 1 document 2 document 3
  • niveau 1 niveau 2 niveau 3
Descriptif

par Marie Bizais-Lillig et Chahan Vidal-Gorène

Dans cette présentation, nous nous proposons de rendre compte d’une expérience de transcription automatisée de textes xylographiés de la Chine impériale, à partir d’un très petit jeu de données (50 images). Bien que particulièrement lisibles, ces documents très denses présentent un double défi pour les HTR tant au niveau du sens de lecture du contenu que du très grand nombre de caractères différents à reconnaître, variété impossible à représenter en apprentissage. Le propos questionnera tout d’abord les choix de transcription réalisés et leur impact sur la capacité des modèles à apprendre efficacement en situation de one-shot learning, puis nous aborderons la question du sens de lecture du résultat produit et des différentes approches mises en place avec et sans apprentissage machine.

Intervention

Dans la même collection

Sur le même thème