Notice
#CocoPySHS 2022/2023 - Séance 3 - Mettre en oeuvre une stratégie de traitement automatique de la langue en littérature : fine tuning d'un modèle BERT pour la détection du doute dans les écrits de Italo Calvino
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
Descriptif
Réalisant une thèse sur l'auteur italien Italo Calvino, Margherita a eu l'occasion de constituer un corpus annoté de passages caractéristiques du style de l'auteur. Souhaitant explorer une autre stratégie d'analyse, elle s'est formée à la programmation scientifique en Python et a utilisé ce corpus pour entraîner un modèle de détection de ces passages. Dans sa présentation, elle insiste aussi sur les difficultés qu'elle a rencontré mais aussi sur l'importance du traitement des données antérieur à l'entraînement du modèle. Cette expérience lui a aussi permis d'initier de nouvelles collaborations, et à publier son analyse dans une conférence d'humanités numériques.
Intervention
Thème
Documentation
Les séances du programme 2022 2023
Le descriptif du programme CoCoPySHS et la documentation sont disponibles sur cette page GitHub : https://github.com/pyshs/cocopyshs.
Dans la même collection
-
#CocoPySHS 2022/2023 - Séance 5 - La traduction de R vers Python : enjeux pratiques et épistémiques
Gruson-DanielCélyaLemercierClaireSchultzEmilienPrésentation de Célya Gruson-Daniel (Inno3), Claire Lemercier (Sciences Po) et Emilien Schultz (Medialab).
-
#CocoPySHS 2022/2023 - Séance 4 - Répondre au défi de la reproductibilité d'une recherche en humani…
BelignéMaxComment rendre accessibles partiellement des données? Comment développer une interface avec le processus Django ? Cette intervention décrit les différentes étapes et propose un retour d'expérience
-
#CocoPySHS 2022/2023 - Séance 2 - Recommandations pour la programmation scientifique par un contrib…
BussonnierMatthiasPrésentation de Matthias Bussonnier (dev. open source et open science à QuanSight), Recommandations pour la programmation scientifique par un contributeur open source à la science ouverte
-
#CocoPySHS 2021/2022 - Séance 2 - Reproductibilité de l'enquête SOSP - State of Open Science Practi…
Le BéchecMariannigSchultzEmilienPour cette deuxième séance, Mariannig est revenue sur l'enquête collective qu'elle a coordonné sur les pratiques de science ouverte des chercheurs et de leurs usages d'outils numériques, dont les
-
#CocoPySHS 2021/2022 - Séance 3 - Utilisation de scripts Python en amont d'Iramuteq pour l'analyse …
LoubèreLuciePour cette troisième séance, Lucie montre ses pratiques peu visibles de transformation des données, en amont de l'usage d'un logiciel spécialisé (dans ce cas, Iramuteq). La programmation en langage
-
#CocoPySHS 2021/2022 - Séance 1 - Pois-chiche et "Franken-Code" - Verrouillage technologique et ali…
SalordTristanPour cette première séance, Tristan est revenu sur la stratégie qu'il a développé pour rendre vivantes des données d'ingrédients afin d'éclairer l'usage des légumineuses dans l'alimentation. Pour cela
-
#CocoPySHS 2021/2022 - Séance 4 - Python en code et no-code pour la cartographie de réseaux
Anderson-GonzálezMayaGruson-DanielCélyaPour cette quatrième séance, Maya et Célya font un retour d'expérience de deux projets menés au sein du cabinet de conseil en innovation ouverte Inno3 sur la cartographie de réseaux. La mise en
-
#CocoPySHS 2022/2023 - Séance 1 - Des notebooks Jupyter pour découvrir les usages de Python pour le…
SchultzEmilienDes notebooks Jupyter pour découvrir les usages de Python pour les SHS - pourquoi ? comment ? pour quel résultat ?
Sur le même thème
-
Wikicafé avec Daniel Mietchen : Liens entre Wikidata et la recherche : Scholia, médecine et mathéma…
MietchenDanielDaniel Mietchen est biophysicien et wikimédien. Tout au long de sa carrière, il a travaillé avec les projets wikis, proposant des outils qui permettent d'accompagner les pratiques de recherche des
-
Wikicafé avec Innocent Azilan : Valoriser la science des pays africains francophone à travers les C…
AzilanInnocent AwuvéInnocent Azilan est doctorant en sciences de l'information et de la communication. Grâce à son expérience comme journaliste et chercheur au Togo, il propose ici un panorama de la construction de la
-
Restitution de l’enquête sur les besoins en communication des revues du périmètre lyonnais
ChollierVincentPiquetMarieVincent Chollier et Marie Piquet (Prairial, Université Lumière Lyon 2) présentent ici les résultats d'une enquête menée auprès des revues SHS du périmètre sur leur besoins en communication.
-
JSO CNRS 2024 | Discours d'ouverture
PetitAntoineJournée science ouverte au CNRS 2024 – Discours d'ouverture avec Antoine Petit (CNRS)
-
Politique du MESR sur les services et infrastructures numériques
Journée science ouverte au CNRS 2024 – Politique du MESR sur les services et infrastructures numériques avec Arnauld Leservot (MESR / DGRI / SSRI / A7)
-
Mise en place de la fédération de l’European Open Science Cloud (EOSC)
BeckmannVolkerJournée science ouverte au CNRS 2024 – Mise en place de la fédération de l’European Open Science Cloud (EOSC) avec Volker Beckmann (MESR / DGRI / SSRI / A7)
-
Le CNRS dans la construction de la fédération EOSC
DumouchelSuzanneJournée science ouverte au CNRS 2024 – Le CNRS dans la construction de la fédération EOSC avec Suzanne Dumouchel (DDOR CNRS)
-
Politique du CNRS en matière d’infrastructures numériques pour le calcul intensif, le traitement et…
Journée science ouverte au CNRS 2024 – Politique du CNRS en matière d’infrastructures numériques pour le calcul intensif, le traitement et le stockage de données avec Denis Veynante (DDOR CNRS)
-
Services numériques fédérés du CNRS à destination des infrastructures de recherche (EquipEx+ FITS)
MacchiÉtienneJournée science ouverte au CNRS 2024 – Services numériques fédérés du CNRS à destination des infrastructures de recherche (EquipEx+ FITS) avec Pierre-Etienne Macchi (CC-IN2P3 CNRS)
-
Nouvelle offre de services pour l’hébergement de moyens informatiques, le stockage, le traitement e…
LavalléePierre-FrançoisJournée science ouverte au CNRS 2024 – Nouvelle offre de services pour l’hébergement de moyens informatiques, le stockage, le traitement et la mise à disposition de données massives avec Pierre
-
Les avancées de la coalition internationale sur la réforme de l'évaluation de la recherche (CoARA)
RoussetSylvieJournée science ouverte au CNRS 2024 – Les avancées de la coalition internationale sur la réforme de l'évaluation de la recherche (CoARA) avec Sylvie Rousset (DDOR CNRS)
-
Retour sur l'intégration des nouveaux principes d'évaluation pour les sections du comité national
JobardFabienJournée science ouverte au CNRS 2024 – Retour sur l'intégration des nouveaux principes d'évaluation pour les sections du comité national avec Fabien Jobard (CPCN)