Chapitres
- Introduction11'01"
- Gudrun Ledegen, "Présentation de Lexico 3, logiciel de lexicométrie"34'12"
- Discussion13'21"
- Catherine Adam et Cécile Plaud, "Interpréter avec Alceste (ou IramuteQ)"33'08"
- Discussion15'21"
- Michel Jacobson, "Un entrepôt spécialisé pour les corpus de parole: la plateforme COCOON"38'28"
- Discussion16'01"
- Conclusion00'48"
Notice
Séminaire HN 2022 #1 - Utiliser des outils et des services numériques dans sa pratique d’analyse de discours (oraux et écrits)
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
Descriptif
Organisé par la Maison des sciences de l’homme en Bretagne depuis 2014, le séminaire Humanités numériques prend cette année la forme d’un cycle de trois séances qui propose une réflexion sur les pratiques de recherche dans un contexte de transformation numérique et de développement de la science ouverte. Il vise à interroger de manière critique et réflexive les conditions de production et de réutilisation des données dans la recherche en sciences humaines et sociales, mais aussi l’expérimentation de méthodes permettant de traiter et analyser ces données. Son objectif est d’ouvrir un espace de discussion sur ces différentes problématiques, en s’appuyant sur la présentation de projets de recherche en cours et sur la mise en partage de questionnements.
Cette séance animée par Jean-Baptiste Pressac (CRBC, CNRS/Université de Bretagne Occidentale) et Aurélie Hess (TEMOS, CNRS/Université Bretagne Sud).
Présentation de Lexico 3, logiciel de lexicométrie, Gudrun Ledegen (PREFics, Université Rennes 2)
Les logiciels de lexicométrie, ici présentés à travers Lexico 3, sont des outils d’exploration de grands corpus textuels qui permettent un va-et-vient entre la comparaison entre différentes variables qui viennent baliser les documents et un retour au texte. Si Lexico 3 présente des fonctionnalités proches d’un logiciel comme Iramuteq, il va être spécifiquement au service d’une analyse de discours (que d’une analyse de contenu avant tout). Le logiciel permet ainsi d’établir des liaisons transversales entre les mots fonctionnant en réseau : « le numérique complète-augmente la linéarité par des réticularités » (Mayaffre, 2015). Il s’agit d’une méthodologie d’étude du discours, dite exhaustive, systématique et automatisée, tout en laissant à l’analyste l’entière tâche d’interprétation des résultats obtenus. Les fonctionnalités complémentaires du logiciel Iramuteq – qui sera présenté par d’autres collègues lors de ce séminaire – seront ici particulièrement mises en lumière.
Interpréter avec Alceste (ou IramuteQ), Catherine Adam et Cécile Plaud (ENSTA Bretagne)
Une analyse de discours assistée par ordinateur (ADAO) réalisée à l’aide d’un logiciel d’analyse statistique de données textuelles, tel qu’ALCESTE ou IramuteQ semble particulièrement appropriée dans le cadre d’analyses transversales de corpus volumineux. L’ADAO permet non seulement de limiter la perte d’informations, inhérente à une analyse manuelle des données d’un vaste corpus, mais favorise aussi la distanciation du chercheur par rapport à ses données. Dans le cadre de cette communication, nous montrerons, au travers d’exemples d’usages de ce type de logiciel dans nos recherches en SHS, la valeur heuristique de la démarche. Elle offre la possibilité à la fois de découvrir de manière inductive d’autres aspects non analysés du corpus et d’obtenir une forme de confirmation ou d’infirmation des résultats obtenus manuellement. L’usage d’outils numériques dans des travaux de recherche, lorsqu’ils peuvent se révéler un soutien à la démarche, est à considérer. Bien entendu, un logiciel ne fournit pas à lui seul les résultats d’une recherche. Il est paramétré en fonction des hypothèses du chercheur. Ce dernier doit ensuite analyser et interpréter les données classifiées. Cependant, ce recours à l’outil numérique se révèle être une aide précieuse et un atout dans une méthodologie de la complexité.
Un entrepôt spécialisé pour les corpus de parole: la plateforme COCOON, Michel Jacobson (IR* Huma-Num, CNRS)
La plateforme Cocoon a été mise en place en 2006 et assure depuis plus de 15 ans des services de gestion pour les corpus oraux des chercheurs, des laboratoires et des projets en SHS. Elle donne accès actuellement à environ 6000 heures d’enregistrements de parole sur plus de 250 langues. Cette plateforme s’est montée autour d’une architecture d’entrepôt spécialisé sur les données orales enregistrées (audio, vidéo ou autres mesures physiologiques) accompagnées ou non d’annotations.
Les services assurés depuis le début sont ceux d’un entrepôt classique (stockage, accès, description, signalement, conservation). Au cours du temps, de nouvelles fonctionnalités sont venues enrichir les services parmi lesquelles nous pouvons citer à titre d’exemples : le versement dans un service d’archives intermédiaire (celui de l’opérateur CINES), l’alignement des métadonnées sur des référentiels largement partagés (VIAF, RAMEAU, GeoNames, Lexvo), une modélisation en EDM (Europeana Data Model), une exposition des métadonnées en mode web de données complétant celle en OAI-PMH, l’attribution d’identifiant de type DOI, etc.
Intervention
Thème
Documentation
Projet SADSUI (2020-2022), Gudrun Ledegen
Pour plus de renseignements sur ce projet : lien ici. (site consulté le 14-04-2022)
Lexico 3
Pour plus d'informations concernant ce logiciel : lien ici. (site consulté le 14-04-2022)
Logiciel Alceste
Pour plus d'informations, cliquez ici. (site consulté le 14-04-2022)
IRaMuTeQ
Pour vous renseigner sur ce logiciel, lien ici. (site consulté le 14-04-2022)
Plateforme COCOON
Site de la plateforme : lien ici. (site consulté le 14-04-2022)
Dans la même collection
-
Séminaire HN 2023 #2 - Humanités numériques et enjeux environnementaux
HessAuréliePressacJean-BaptisteNinassiBenjaminDescampsSarahBaillotAnneSéminaire HN 2023 #2 - Humanités numériques et enjeux environnementaux
-
Séminaire HN 2023 #1 - Modélisation des données en SHS : bases de données relationnelles, wikis, we…
PressacJean-BaptisteSimonsOlafLaubéSylvainHessAurélieMignonMorganeSéminaire HN 2023 #1 - Modélisation des données en SHS : bases de données relationnelles, wikis, web sémantique
-
Séminaire Humanités Numériques 2022 #3 - Concevoir et partager une édition numérique de corpus épis…
WilliamsGeoffreySchuweyChristopheMignonMorganeCharrier-VozelMarianneCaronMélindaParraMarinePeralez PeslierBénédicteWillaimePierreIdmhandFatihaChiffoleauFlorianeSéminaire Humanités Numériques 2022 #3 - Concevoir et partager une édition numérique de corpus épistolaires
-
Séminaire HN 2022 #2 - Intégrer l’ouverture des données et des méthodes à son projet de recherche
MignonMorganePressacJean-BaptisteDaireMarie-YvaneBenvegnú dos SantosAlineVasileAureliaVeilhanHélèneAucagneJuliePatatGwenaëlleDeuxième séance du cycle de séminaires "Humanités numériques" pour l'année 2022, organisée par la MSHB et co-animée par Jean-Baptiste Pressac (CRBC) et Morgane Mignon (MSHB).
-
Séminaire Humanités numériques #3 - TEI et modélisation des données de recherche
BurnardLouFroyeMarianneDanielJohannaLa Maison des sciences de l’homme en Bretagne a organisé en ligne le lundi 3 mai 2021, de 14h à 17h, la troisième édition de son séminaire Humanités numériques. Initialement prévu en mars
Sur le même thème
-
Une région qui pose des défis aux notions de territoire et de frontière : la Voïvodine (Serbie)
DjordjevićKsenijaLa situation géopolitique actuelle met au cœur de l’actualité la notion même de territoire et la pluralité des modes de rapport d’une population à son territoire, imposant de revenir aux fondamentaux
-
Humanités Numériques – Intelligence Artificielle (IA), littérature et technologies #6 – Saga Tom Ca…
PorlierChristopheBertaniNicolaHumanités Numériques – Intelligence Artificielle (IA), littérature et technologies #6 – Saga Tom Castle – Focus sur des éléments du second opus
-
Humanités Numériques – Intelligence Artificielle (IA), littérature et technologies #5 – À l’occasio…
PorlierChristopheBertaniNicolaHumanités Numériques – Intelligence Artificielle (IA), littérature et technologies #5 – À l’occasion de la sortie du second roman de la saga Tom Castle
-
Restituer le mobilier d’un logis royal
SalamagneAlainGaugainLucieUn projet de recherche mené au sein du Centre d’études supérieures de la Renaissance (Université de Tours/CNRS). Un projet associant le Laboratoire de Mécanique Gabriel Lamé (LaMé, Orléans-Tours) et
-
Restituer la charpente du logis des Sept Vertus
SalamagneAlainGaugainLucieUn projet de recherche mené au sein du Centre d’études supérieures de la Renaissance (Université de Tours/CNRS). Un projet associant le Laboratoire de Mécanique Gabriel Lamé (LaMé, Orléans-Tours) et
-
Restituer un logis disparu
SalamagneAlainGaugainLucieUn projet de recherche mené au sein du Centre d’études supérieures de la Renaissance (Université de Tours/CNRS). Un projet associant le Laboratoire de Mécanique Gabriel Lamé (LaMé, Orléans-Tours) et
-
Les référentiels et l’interopérabilité
GuichardBenjaminBenjamin Guichard présente les concepts d’interopérabilité et de référentiels, en mettant l'accent sur leur importance dans la mise en œuvre des principes FAIR
-
-
La valorisation numérique d’un corpus multilingue dans le cadre de l’ANR Eurasemploi
GuiheuxGillesPrésentation du projet par Gilles Guiheux, l'un des responsables scientifiques.
-
Données, recherche et éthique
Huitième séance, intitulée "Données, recherche et éthique", du colloque dhnord2023 "Humanités numériques et questions d'éthique : débats, enjeux, pratiques".
-
Éthique de la formation et formation à l’éthique en humanités numériques
Troisième séance, intitulée "Éthique de la formation et formation à l’éthique en humanités numériques", du colloque dhnord2023 "Humanités numériques et questions d'éthique : débats, enjeux, pratiques"
-
Humanités numériques, acteurs et éthique environnementale
Sixième séance, intitulée "Humanités numériques, acteurs et éthique environnementale", du colloque dhnord2023 "Humanités numériques et questions d'éthique : débats, enjeux, pratiques".