Fichier vidéo Fichier vidéo Fichier vidéo Fichier audio

Cours/Séminaire

Notice

Lieu de réalisation

Lyon

Langue :

Français

Crédits

Urfist de Lyon (Organisation de l'évènement), Margherita Parigini (Intervention)

Détenteur des droits

urfist@univ-lyon1.fr

Conditions d'utilisation

CC BY-NC-SA (Attribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions)

Citer cette ressource :

Margherita Parigini. Callisto. (2023, 19 janvier). #CocoPySHS 2022/2023 - Séance 3 - Mettre en oeuvre une stratégie de traitement automatique de la langue en littérature : fine tuning d'un modèle BERT pour la détection du doute dans les écrits de Italo Calvino , in Les coulisses du code - Python pour les SHS - #CocoPySHS. [Vidéo]. Canal-U. https://www.canal-u.tv/146163. (Consultée le 10 janvier 2026)

#CocoPySHS 2022/2023 - Séance 3 - Mettre en oeuvre une stratégie de traitement automatique de la langue en littérature : fine tuning d'un modèle BERT pour la détection du doute dans les écrits de Italo Calvino

Réalisation : 19 janvier 2023 - Mise en ligne : 12 septembre 2023

document 1 document 2 document 3
niveau 1 niveau 2 niveau 3

Descriptif

Réalisant une thèse sur l'auteur italien Italo Calvino, Margherita a eu l'occasion de constituer un corpus annoté de passages caractéristiques du style de l'auteur. Souhaitant explorer une autre stratégie d'analyse, elle s'est formée à la programmation scientifique en Python et a utilisé ce corpus pour entraîner un modèle de détection de ces passages. Dans sa présentation, elle insiste aussi sur les difficultés qu'elle a rencontré mais aussi sur l'importance du traitement des données antérieur à l'entraînement du modèle. Cette expérience lui a aussi permis d'initier de nouvelles collaborations, et à publier son analyse dans une conférence d'humanités numériques.

Intervention / Responsable scientifique

Parigini

Margherita

Thème

Disciplines :

Documentation

Les séances du programme 2022 2023

Le descriptif du programme CoCoPySHS et la documentation sont disponibles sur cette page GitHub : https://github.com/pyshs/cocopyshs.

Dans la même collection

Cours/Séminaire

00:46:52

Favoris
#CocoPySHS 2022/2023 - Séance 5 - La traduction de R vers Python : enjeux pratiques et épistémiques

Gruson-Daniel

Célya

Lemercier

Claire

Schultz

Emilien

Présentation de Célya Gruson-Daniel (Inno3), Claire Lemercier (Sciences Po) et Emilien Schultz (Medialab).
Science ouverte
Python (langage de programmation)
Analyse des données -- Logiciels
Reproductibilité (sciences)
Épistémologie
12.09.2023
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Cours/Séminaire

00:30:04

Favoris
#CocoPySHS 2022/2023 - Séance 4 - Répondre au défi de la reproductibilité d'une recherche en humani…

Beligné

Max

Comment rendre accessibles partiellement des données? Comment développer une interface avec le processus Django ? Cette intervention décrit les différentes étapes et propose un retour d'expérience
Python (langage de programmation)
Reproductibilité (sciences)
30.08.2023
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Cours/Séminaire

00:51:27

Favoris
#CocoPySHS 2022/2023 - Séance 2 - Recommandations pour la programmation scientifique par un contrib…

Bussonnier

Matthias

Présentation de Matthias Bussonnier (dev. open source et open science à QuanSight), Recommandations pour la programmation scientifique par un contributeur open source à la science ouverte
Python (langage de programmation)
30.11.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Cours/Séminaire

00:54:19

Favoris
#CocoPySHS 2021/2022 - Séance 2 - Reproductibilité de l'enquête SOSP - State of Open Science Practi…

Le Béchec

Mariannig

Schultz

Emilien

Pour cette deuxième séance, Mariannig est revenue sur l'enquête collective qu'elle a coordonné sur les pratiques de science ouverte des chercheurs et de leurs usages d'outils numériques, dont les
Python (langage de programmation)
Science ouverte
04.11.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Cours/Séminaire

00:27:18

Favoris
#CocoPySHS 2021/2022 - Séance 3 - Utilisation de scripts Python en amont d'Iramuteq pour l'analyse …

Loubère

Lucie

Pour cette troisième séance, Lucie montre ses pratiques peu visibles de transformation des données, en amont de l'usage d'un logiciel spécialisé (dans ce cas, Iramuteq). La programmation en langage
Science ouverte
Données de la recherche
Python (langage de programmation)
04.11.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Cours/Séminaire

00:49:28

Favoris
#CocoPySHS 2021/2022 - Séance 1 - Pois-chiche et "Franken-Code" - Verrouillage technologique et ali…

Salord

Tristan

Pour cette première séance, Tristan est revenu sur la stratégie qu'il a développé pour rendre vivantes des données d'ingrédients afin d'éclairer l'usage des légumineuses dans l'alimentation. Pour cela
Python (langage de programmation)
Science ouverte
04.11.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Cours/Séminaire

00:30:23

Favoris
#CocoPySHS 2021/2022 - Séance 4 - Python en code et no-code pour la cartographie de réseaux

Anderson-González

Maya

Gruson-Daniel

Célya

Pour cette quatrième séance, Maya et Célya font un retour d'expérience de deux projets menés au sein du cabinet de conseil en innovation ouverte Inno3 sur la cartographie de réseaux. La mise en
Science ouverte
Données de la recherche
Python (langage de programmation)
Cartographie -- Informatique
Programmation
04.11.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Cours/Séminaire

00:52:07

Favoris
#CocoPySHS 2022/2023 - Séance 1 - Des notebooks Jupyter pour découvrir les usages de Python pour le…

Schultz

Emilien

Des notebooks Jupyter pour découvrir les usages de Python pour les SHS - pourquoi ? comment ? pour quel résultat ?
Python (langage de programmation)
02.11.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3

Voir tout

#CocoPySHS 2022/2023 - Séance 3 - Mettre en oeuvre une stratégie de traitement automatique de la langue en littérature : fine tuning d'un modèle BERT pour la détection du doute dans les écrits de Italo Calvino

Dans la même collection

#CocoPySHS 2022/2023 - Séance 5 - La traduction de R vers Python : enjeux pratiques et épistémiques

#CocoPySHS 2022/2023 - Séance 4 - Répondre au défi de la reproductibilité d'une recherche en humani…

#CocoPySHS 2022/2023 - Séance 2 - Recommandations pour la programmation scientifique par un contrib…

#CocoPySHS 2021/2022 - Séance 2 - Reproductibilité de l'enquête SOSP - State of Open Science Practi…

#CocoPySHS 2021/2022 - Séance 3 - Utilisation de scripts Python en amont d'Iramuteq pour l'analyse …

#CocoPySHS 2021/2022 - Séance 1 - Pois-chiche et "Franken-Code" - Verrouillage technologique et ali…

#CocoPySHS 2021/2022 - Séance 4 - Python en code et no-code pour la cartographie de réseaux

#CocoPySHS 2022/2023 - Séance 1 - Des notebooks Jupyter pour découvrir les usages de Python pour le…

Sur le même thème

Comment les machines apprennent ?

Comment une IA peut-elle faire la conversation ?

Panorama des outils propriétaires et open source

Interagir efficacement avec un agent conversationnel

Les modèles de langue : usages et enjeux sociétaux

Déploiement d'IA sécurisées en local appliqué aux données sensibles et open source

Interroger ses documents avec des grands modèles de langage : méthode RAG

Extraire de l'information dans la littérature scientifique avec TDM Factory

Fouille de textes et IA : enjeux juridiques et réglementaires

7-Mathdoc : 30 années au service de la communauté mathématique

6-Mathdoc : 30 années au service de la communauté mathématique

5-Mathdoc : 30 années au service de la communauté mathématique