Notice
Cluster 7 : Une philologie centrée sur les données. Réflexions autour d’un centre de ressources pour l’analyse computationnelle des textes.
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
Descriptif
Cette communication a été enregistrée lors des journées Biblissima+ 2022– Innovations numériques et sources anciennes : comment préparer l’avenir ?
Auteur :
Jean-Baptiste Camps est Maître de conférences en philologie computationnelle au Centre Jean Mabillon (CJM) de l’École nationale des chartes (ENC – PSL)
Résumé de la communication :
Dans la chaîne de traitement pour l’enrichissement des données, articulant intelligence humaine et intelligence artificielle, le cluster 7 s’intéresse aux étapes qui suivent la récupération d’images et l’acquisition automatique du texte, et qui sont celles de la normalisation et de l’enrichissement des données sur les corpus étudiés, ainsi que l’exploitation notamment quantitative de ces données. L’exposé présente différents outils créés en contexte sur des corpus annotés (Boudams pour la segmentation ; Pie pour la normalisation et la lemmatisation, Pyrrha pour la post-correction ; Falcon pour aligner computationnellement des textes et procéder à une collation automatique). Il présente aussi d’autres exploitations pour l’analyse computationnelle des données annotées, comme l’analyse paléographique ou scriptométrique d’un texte, la stylométrie pour mesurer les variations stylistiques individuelles et répondre aux questions souvent débattues des attributions des textes, ou mêmes des mélodies.
Dans la même collection
-
Introduction et conférence inaugurale
Comment permettre à tous ceux qui s’intéressent aux cultures écrites anciennes de constituer et d’enrichir leurs corpus de sources, de la numérisation des artefacts à l’analyse profonde des textes ?
-
Conclusions des journées Biblissima +
Comment permettre à tous ceux qui s’intéressent aux cultures écrites anciennes de constituer et d’enrichir leurs corpus de sources, de la numérisation des artefacts à l’analyse profonde des textes ?
-
Définir des stratégies de dissémination des données et des codes sources : la démarche proposée par…
Comment permettre à tous ceux qui s’intéressent aux cultures écrites anciennes de constituer et d’enrichir leurs corpus de sources, de la numérisation des artefacts à l’analyse profonde des textes ?
-
Cluster 6 : Relever les défis du patrimoine musical.
Comment permettre à tous ceux qui s’intéressent aux cultures écrites anciennes de constituer et d’enrichir leurs corpus de sources, de la numérisation des artefacts à l’analyse profonde des textes ?
-
Le cluster 5b, Élaboration d’un laboratoire d’analyse et d’annotation de sources anciennes (fondé s…
Comment permettre à tous ceux qui s’intéressent aux cultures écrites anciennes de constituer et d’enrichir leurs corpus de sources, de la numérisation des artefacts à l’analyse profonde des textes ?
-
Cluster 3. L’intelligence artificielle et la reconnaissance de formes et d’écritures manuscrites.
Comment permettre à tous ceux qui s’intéressent aux cultures écrites anciennes de constituer et d’enrichir leurs corpus de sources, de la numérisation des artefacts à l’analyse profonde des textes ?
-
Cluster 4 : L’analyse approfondie des systèmes graphiques anciens
Comment permettre à tous ceux qui s’intéressent aux cultures écrites anciennes de constituer et d’enrichir leurs corpus de sources, de la numérisation des artefacts à l’analyse profonde des textes ?
-
Cluster 1 : Vers l’interopérabilité des corpus d’images.
Comment permettre à tous ceux qui s’intéressent aux cultures écrites anciennes de constituer et d’enrichir leurs corpus de sources, de la numérisation des artefacts à l’analyse profonde des textes ?
-
Cluster 2 : Comment prendre en compte les données d’analyse des matériaux et les rendre cherchables…
Comment permettre à tous ceux qui s’intéressent aux cultures écrites anciennes de constituer et d’enrichir leurs corpus de sources, de la numérisation des artefacts à l’analyse profonde des textes ?
-
LES CLUSTERS DE BIBLISSIMA+
Comment permettre à tous ceux qui s’intéressent aux cultures écrites anciennes de constituer et d’enrichir leurs corpus de sources, de la numérisation des artefacts à l’analyse profonde des textes ?
-
Cluster 5a : TEI et épigraphie, de l’Antiquité à l’époque moderne
Comment permettre à tous ceux qui s’intéressent aux cultures écrites anciennes de constituer et d’enrichir leurs corpus de sources, de la numérisation des artefacts à l’analyse profonde des textes ?