Notice
Gallicagram : un outil de lexicométrie pour explorer de grands corpus diachroniques
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
Descriptif
par Benoit de Courson (doctorant en sciences sociales à l’institut Max Planck de Freiburg, Allemagne)
Gallicagram est un logiciel de lexicométrie, destiné à mesurer l’évolution au cours de temps de la fréquence de mots ou syntagmes dans de grands corpus. Pour parer aux écueils, largement documentés, de Ngram Viewer, il se concentre sur des corpus de périodiques homogènes et, dans la mesure du possible, sur des corpus ouverts. On y trouvera notamment la presse de Gallica, les archives du journal Le Monde, ou encore les revues de la plateforme Persée (la RFS, les Annales, les Actes...). Ses bases de données de fréquences d’occurrence sont accessibles par API. La séance illustrera les mérites et limites de l’application. Elle développera (selon le temps disponible) trois exemples : les grèves sous la IIIe République entre Gallica et Charles Tilly, le taux de masculinité dans Le Monde depuis 1945 et une illustration de la récente thèse de Bernard Lahire, "l’oubli du réel" en sociologie.
Retrouvez la présentation sur la page dédiée des Séances des Lundis de l'Ined, proposées par le service méthodes statistiques