Notice
1.5 : Un modèle ouvert pour la reconnaissance automatique des manuscrits du théâtre espagnol du Siècle d’Or
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
Descriptif
par Álvaro Cuéllar (University of Kentucky)
Le projet ETSO, Estilometría aplicada al Teatro del Siglo de Oro (Cuéllar et Vega García-Luengos 2017-2022) (https://etso.es/), se propose de collecter et d’analyser à travers des techniques stylométriques le plus grand nombre de pièces de théâtre espagnol du Siècle d’Or. Un nombre important de ces textes ne se retrouvent que dans des témoignages manuscrits, pour lesquels il a fallu entreprendre un processus de transcription automatique à l’aide de Transkribus. L’entraînement du modèle « Spanish Golden Age Manuscripts (Spelling Modernization) 1.0 » a nécessité 3 250 116 mots et il est capable de moderniser automatiquement le texte, en obtenant un Character Error Rate (CER) de 10,54 % dans le validation set. Grâce à ce modèle, nous avons pu transcrire quelque 400 manuscrits de pièces du Siècle d’Or. Parmi tous les textes, un a retenu l’attention : La francesa Laura. Cette pièce de théâtre anonyme a été alignée stylométriquement avec l’ensemble du corpus du dramaturge Lope de Vega (1562-1635).
Intervention
Thème
Dans la même collection
-
2.10 : Clôture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"
PincheAriane2.10 : Clôture Colloque "Documents anciens et reconnaissance automatique des écritures manuscrites"
-
2.8 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiques
PincheAriane2.8 : Reconnaissance et extraction d’informations dans des tableaux manuscrits historiques
-
2.7 : HTR of Handwritten Paleographic Greek Text as a Function of Chronology
PincheAriane2.7 : HTR of Handwritten Paleographic Greek Text as a Function of Chronology
-
2.6 : EpiSearch. Recognising Ancient Inscriptions in Epigraphic Manuscripts
BoschettiFederico2.6 : EpiSearch. Recognising Ancient Inscriptions in Epigraphic Manuscripts
-
2.4 : Expérimentations pour l’analyse automatique de sources chinoises anciennes
Vidal-GorèneChahan2.4 : Expérimentations pour l’analyse automatique de sources chinoises anciennes
-
2.3 : Analyse, Reconnaissance et Indexation des manuscrits CHAM
SchweyerAnne-ValérieBurieJean-Christophe2.3 : Analyse, Reconnaissance et Indexation des manuscrits CHAM
-
2.1 : FoNDUE - A Lightweight HTR Infrastructure for Geneva
GabaySimon2.1 : FoNDUE - A Lightweight HTR Infrastructure for Geneva
-
1.3 : HTR fine tuning for medieval manuscripts models: strategies and evaluation
Torres AguilarSergioJolivetVincent1.3 : HTR fine tuning for medieval manuscripts models: strategies and evaluation
-
2.5 : Sharing HTR datasets with standardized metadata: the HTR United initiative
ChaguéAlixClériceThibault2.5 : Sharing HTR datasets with standardized metadata: the HTR United initiative
-
1.10 : Segmentation Mode for Archival Documents with Highly Complex Layout
StoeklDaniel1.10 : Segmentation Mode for Archival Documents with Highly Complex Layout
-
2.9 : Retour d’expériences sur l’utilisation comparée de plusieurs de dispositifs de transcription …
TufféryChristophe2.9 : Retour d’expériences sur l’utilisation comparée de plusieurs de dispositifs de transcription numérique d’archives de fouilles archéologiques
-
2.2 : From HTR to Critical Edition: A Semi-Automatic Pipeline
StoeklDaniel2.2 : From HTR to Critical Edition: A Semi-Automatic Pipeline