Conférence
Notice
Lieu de réalisation
Ined, Campus Condorcet - Paris Aubervilliers
Langue :
Français
Détenteur des droits
Benoit de Courson (institut Max Planck de Freiburg)
Conditions d'utilisation
Droit commun de la propriété intellectuelle
DOI : 10.60527/q2wb-fd03
Citer cette ressource :
Ined. (2025, 27 mai). Gallicagram : un outil de lexicométrie pour explorer de grands corpus diachroniques. [Vidéo]. Canal-U. https://doi.org/10.60527/q2wb-fd03. (Consultée le 14 janvier 2025)

Gallicagram : un outil de lexicométrie pour explorer de grands corpus diachroniques

Réalisation : 27 mai 2025 - Mise en ligne : 22 décembre 2024
  • document 1 document 2 document 3
  • niveau 1 niveau 2 niveau 3
Descriptif

par Benoit de Courson (doctorant en sciences sociales à l’institut Max Planck de Freiburg, Allemagne)

Gallicagram est un logiciel de lexicométrie, destiné à mesurer l’évolution au cours de temps de la fréquence de mots ou syntagmes dans de grands corpus. Pour parer aux écueils, largement documentés, de Ngram Viewer, il se concentre sur des corpus de périodiques homogènes et, dans la mesure du possible, sur des corpus ouverts. On y trouvera notamment la presse de Gallica, les archives du journal Le Monde, ou encore les revues de la plateforme Persée (la RFS, les Annales, les Actes...). Ses bases de données de fréquences d’occurrence sont accessibles par API. La séance illustrera les mérites et limites de l’application. Elle développera (selon le temps disponible) trois exemples : les grèves sous la IIIe République entre Gallica et Charles Tilly, le taux de masculinité dans Le Monde depuis 1945 et une illustration de la récente thèse de Bernard Lahire, "l’oubli du réel" en sociologie.

Retrouvez la présentation sur la page dédiée des Séances des Lundis de l'Ined, proposées par le service méthodes statistiques