Conférence
Notice
Lieu de réalisation
Visioconférence
Conditions d'utilisation
Droit commun de la propriété intellectuelle
Citer cette ressource :
La forge numérique. (2022, 29 avril). Cluster 7 : Une philologie centrée sur les données. Réflexions autour d’un centre de ressources pour l’analyse computationnelle des textes. , in Journées Biblissima+ 2022. [Vidéo]. Canal-U. https://www.canal-u.tv/136268. (Consultée le 27 avril 2025)

Cluster 7 : Une philologie centrée sur les données. Réflexions autour d’un centre de ressources pour l’analyse computationnelle des textes.

Réalisation : 29 avril 2022 - Mise en ligne : 10 janvier 2023
  • document 1 document 2 document 3
  • niveau 1 niveau 2 niveau 3
Descriptif

Cette communication a été enregistrée lors des journées Biblissima+ 2022– Innovations numériques et sources anciennes : comment préparer l’avenir ?

Auteur

Jean-Baptiste Camps est Maître de conférences en philologie computationnelle au Centre Jean Mabillon (CJM) de l’École nationale des chartes (ENC – PSL)

Résumé de la communication

Dans la chaîne de traitement pour l’enrichissement des données, articulant intelligence humaine et intelligence artificielle, le cluster 7 s’intéresse aux étapes qui suivent la récupération d’images et l’acquisition automatique du texte, et qui sont celles de la normalisation et de l’enrichissement des données sur les corpus étudiés, ainsi que l’exploitation notamment quantitative de ces données. L’exposé présente différents outils créés en contexte sur des corpus annotés (Boudams pour la segmentation ; Pie pour la normalisation et la lemmatisation, Pyrrha pour la post-correction ; Falcon pour aligner computationnellement des textes et procéder à une collation automatique). Il présente aussi d’autres exploitations pour l’analyse computationnelle des données annotées, comme l’analyse paléographique ou scriptométrique d’un texte, la stylométrie pour mesurer les variations stylistiques individuelles et répondre aux questions souvent débattues des attributions des textes, ou mêmes des mélodies.

Dans la même collection