Notice
#CocoPySHS 2022/2023 - Séance 3 - Mettre en oeuvre une stratégie de traitement automatique de la langue en littérature : fine tuning d'un modèle BERT pour la détection du doute dans les écrits de Italo Calvino
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
Descriptif
Réalisant une thèse sur l'auteur italien Italo Calvino, Margherita a eu l'occasion de constituer un corpus annoté de passages caractéristiques du style de l'auteur. Souhaitant explorer une autre stratégie d'analyse, elle s'est formée à la programmation scientifique en Python et a utilisé ce corpus pour entraîner un modèle de détection de ces passages. Dans sa présentation, elle insiste aussi sur les difficultés qu'elle a rencontré mais aussi sur l'importance du traitement des données antérieur à l'entraînement du modèle. Cette expérience lui a aussi permis d'initier de nouvelles collaborations, et à publier son analyse dans une conférence d'humanités numériques.
Intervention
Thème
Documentation
Les séances du programme 2022 2023
Le descriptif du programme CoCoPySHS et la documentation sont disponibles sur cette page GitHub : https://github.com/pyshs/cocopyshs.
Dans la même collection
-
#CocoPySHS 2022/2023 - Séance 5 - La traduction de R vers Python : enjeux pratiques et épistémiques
Gruson-DanielCélyaLemercierClaireSchultzEmilienPrésentation de Célya Gruson-Daniel (Inno3), Claire Lemercier (Sciences Po) et Emilien Schultz (Medialab).
-
#CocoPySHS 2022/2023 - Séance 4 - Répondre au défi de la reproductibilité d'une recherche en humani…
BelignéMaxComment rendre accessibles partiellement des données? Comment développer une interface avec le processus Django ? Cette intervention décrit les différentes étapes et propose un retour d'expérience
-
#CocoPySHS 2022/2023 - Séance 2 - Recommandations pour la programmation scientifique par un contrib…
BussonnierMatthiasPrésentation de Matthias Bussonnier (dev. open source et open science à QuanSight), Recommandations pour la programmation scientifique par un contributeur open source à la science ouverte
-
#CocoPySHS 2021/2022 - Séance 2 - Reproductibilité de l'enquête SOSP - State of Open Science Practi…
Le BéchecMariannigSchultzEmilienPour cette deuxième séance, Mariannig est revenue sur l'enquête collective qu'elle a coordonné sur les pratiques de science ouverte des chercheurs et de leurs usages d'outils numériques, dont les
-
#CocoPySHS 2021/2022 - Séance 3 - Utilisation de scripts Python en amont d'Iramuteq pour l'analyse …
LoubèreLuciePour cette troisième séance, Lucie montre ses pratiques peu visibles de transformation des données, en amont de l'usage d'un logiciel spécialisé (dans ce cas, Iramuteq). La programmation en langage
-
#CocoPySHS 2021/2022 - Séance 1 - Pois-chiche et "Franken-Code" - Verrouillage technologique et ali…
SalordTristanPour cette première séance, Tristan est revenu sur la stratégie qu'il a développé pour rendre vivantes des données d'ingrédients afin d'éclairer l'usage des légumineuses dans l'alimentation. Pour cela
-
#CocoPySHS 2021/2022 - Séance 4 - Python en code et no-code pour la cartographie de réseaux
Anderson-GonzálezMayaGruson-DanielCélyaPour cette quatrième séance, Maya et Célya font un retour d'expérience de deux projets menés au sein du cabinet de conseil en innovation ouverte Inno3 sur la cartographie de réseaux. La mise en
-
#CocoPySHS 2022/2023 - Séance 1 - Des notebooks Jupyter pour découvrir les usages de Python pour le…
SchultzEmilienDes notebooks Jupyter pour découvrir les usages de Python pour les SHS - pourquoi ? comment ? pour quel résultat ?
Sur le même thème
-
Comprendre les archives : vers de nouvelles interfaces de recherche reposant sur l’annotation séman…
GuterhléNicolasCe webinaire s’inscrit dans le cadre de la 4ᵉ édition du Printemps de la donnée organisé par l’Atelier de la donnée dat@UBFC. Nicolas Gutehrle, doctorant en Traitement Automatique des Langues au
-
Mettre à disposition et valoriser ses données de recherche via le portail dat@UBFC
Liseron-MonfilsMaélysTabbouNadirTisserandHélèneCe webinaire s’inscrit dans le cadre de la 4ᵉ édition du Printemps de la donnée organisé par l’Atelier de la donnée dat@UBFC (Bourgogne-Franche-Comté). L’équipe de l’atelier a présenté à cette
-
C@fés Renatis - Retours sur l'usage de la resosurce OpenAlex
BraccoLaetitiaBordignonFrédérique2 retours d'usage de la ressource OpenAlex en bibliométrie par Frédérique Bordignon et Lætitia Bracco
-
Parlons Science ouverte #8 : ouvrir ses publications et préserver ses droits, quelles solutions ?
BattestiDanielBeauchampsCécilePierBenoîtEnregistrement d'un webinaire proposé par le CCSD le 12 mars 2024.
-
Journée "Cycle de vie / Gestion des données de la biologie" 01 - Science Ouverte et Données de la R…
BLANCIsabelleEnjeux : face à la numérisation de la recherche en biologie, la quantité et les débits de données vont croissant. Beaucoup d’équipes de recherche et de laboratoires utilisent encore des stratégies de
-
Les centres de ressources OPIDoR et DoRANum pour vous accompagner - Claire François
FrançoisClaireLes centres de ressources OPIDoR et DoRANum pour vous accompagner - Claire François, Directrice de l’INIST
-
Recherche Data Gouv dans l'écosystème EOSC - Isabelle Blanc
BLANCIsabelleGenovaFrançoiseRecherche Data Gouv dans l'écosystème EOSC : une contribution française majeure - Isabelle Blanc
-
Expansion à l'international : l'expérience du Centre de Données astronomiques de Strasbourg et RDA …
GenovaFrançoiseExpansion à l'international : l'expérience du Centre de Données astronomiques de Strasbourg et RDA France - Françoise Génova, Coordinatrice RDA France
-
Converger vers une culture du partage des données de la recherche, l’entrepôt Recherche Data Gouv e…
SansDamienConverger vers une culture du partage des données de la recherche, l’entrepôt Recherche Data Gouv et ses services - Damien Sans, Ingénieur d’étude data steward à la Direction pour la Science Ouverte d
-
Rôle et activités de l’IR* Huma-Num - Olivier Baude
BaudeOlivierRôle et activités de l’IR* Huma-Num - Olivier Baude, Directeur de l’IR* Huma-Num
-
BRGM / PNDB centres de référence thématiques Système Terre-Environnement : contribuer à la science …
NorvezOlivierChelleMichaëlBRGM/PNDB centres de référence thématiques Système Terre-Environnement : Contribuer à la science ouverte - Michaël Chelle, directeur du programme scientifique Données et Numérique du BRGM et Olivier
-
Politique des données, des algorithmes et des codes sources : focus sur les actions en faveur de l’…
BLANCIsabellePolitique des données, des algorithmes et des codes sources : focus sur les actions en faveur de l’ouverture et du partage des données de la recherche par Isabelle Blanc, Administratrice ministérielle