Chapitres
- Introduction11'01"
- Gudrun Ledegen, "Présentation de Lexico 3, logiciel de lexicométrie"34'12"
- Discussion13'21"
- Catherine Adam et Cécile Plaud, "Interpréter avec Alceste (ou IramuteQ)"33'08"
- Discussion15'21"
- Michel Jacobson, "Un entrepôt spécialisé pour les corpus de parole: la plateforme COCOON"38'28"
- Discussion16'01"
- Conclusion00'48"
Notice
Séminaire HN 2022 #1 - Utiliser des outils et des services numériques dans sa pratique d’analyse de discours (oraux et écrits)
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
Descriptif
Organisé par la Maison des sciences de l’homme en Bretagne depuis 2014, le séminaire Humanités numériques prend cette année la forme d’un cycle de trois séances qui propose une réflexion sur les pratiques de recherche dans un contexte de transformation numérique et de développement de la science ouverte. Il vise à interroger de manière critique et réflexive les conditions de production et de réutilisation des données dans la recherche en sciences humaines et sociales, mais aussi l’expérimentation de méthodes permettant de traiter et analyser ces données. Son objectif est d’ouvrir un espace de discussion sur ces différentes problématiques, en s’appuyant sur la présentation de projets de recherche en cours et sur la mise en partage de questionnements.
Cette séance animée par Jean-Baptiste Pressac (CRBC, CNRS/Université de Bretagne Occidentale) et Aurélie Hess (TEMOS, CNRS/Université Bretagne Sud).
Présentation de Lexico 3, logiciel de lexicométrie, Gudrun Ledegen (PREFics, Université Rennes 2)
Les logiciels de lexicométrie, ici présentés à travers Lexico 3, sont des outils d’exploration de grands corpus textuels qui permettent un va-et-vient entre la comparaison entre différentes variables qui viennent baliser les documents et un retour au texte. Si Lexico 3 présente des fonctionnalités proches d’un logiciel comme Iramuteq, il va être spécifiquement au service d’une analyse de discours (que d’une analyse de contenu avant tout). Le logiciel permet ainsi d’établir des liaisons transversales entre les mots fonctionnant en réseau : « le numérique complète-augmente la linéarité par des réticularités » (Mayaffre, 2015). Il s’agit d’une méthodologie d’étude du discours, dite exhaustive, systématique et automatisée, tout en laissant à l’analyste l’entière tâche d’interprétation des résultats obtenus. Les fonctionnalités complémentaires du logiciel Iramuteq – qui sera présenté par d’autres collègues lors de ce séminaire – seront ici particulièrement mises en lumière.
Interpréter avec Alceste (ou IramuteQ), Catherine Adam et Cécile Plaud (ENSTA Bretagne)
Une analyse de discours assistée par ordinateur (ADAO) réalisée à l’aide d’un logiciel d’analyse statistique de données textuelles, tel qu’ALCESTE ou IramuteQ semble particulièrement appropriée dans le cadre d’analyses transversales de corpus volumineux. L’ADAO permet non seulement de limiter la perte d’informations, inhérente à une analyse manuelle des données d’un vaste corpus, mais favorise aussi la distanciation du chercheur par rapport à ses données. Dans le cadre de cette communication, nous montrerons, au travers d’exemples d’usages de ce type de logiciel dans nos recherches en SHS, la valeur heuristique de la démarche. Elle offre la possibilité à la fois de découvrir de manière inductive d’autres aspects non analysés du corpus et d’obtenir une forme de confirmation ou d’infirmation des résultats obtenus manuellement. L’usage d’outils numériques dans des travaux de recherche, lorsqu’ils peuvent se révéler un soutien à la démarche, est à considérer. Bien entendu, un logiciel ne fournit pas à lui seul les résultats d’une recherche. Il est paramétré en fonction des hypothèses du chercheur. Ce dernier doit ensuite analyser et interpréter les données classifiées. Cependant, ce recours à l’outil numérique se révèle être une aide précieuse et un atout dans une méthodologie de la complexité.
Un entrepôt spécialisé pour les corpus de parole: la plateforme COCOON, Michel Jacobson (IR* Huma-Num, CNRS)
La plateforme Cocoon a été mise en place en 2006 et assure depuis plus de 15 ans des services de gestion pour les corpus oraux des chercheurs, des laboratoires et des projets en SHS. Elle donne accès actuellement à environ 6000 heures d’enregistrements de parole sur plus de 250 langues. Cette plateforme s’est montée autour d’une architecture d’entrepôt spécialisé sur les données orales enregistrées (audio, vidéo ou autres mesures physiologiques) accompagnées ou non d’annotations.
Les services assurés depuis le début sont ceux d’un entrepôt classique (stockage, accès, description, signalement, conservation). Au cours du temps, de nouvelles fonctionnalités sont venues enrichir les services parmi lesquelles nous pouvons citer à titre d’exemples : le versement dans un service d’archives intermédiaire (celui de l’opérateur CINES), l’alignement des métadonnées sur des référentiels largement partagés (VIAF, RAMEAU, GeoNames, Lexvo), une modélisation en EDM (Europeana Data Model), une exposition des métadonnées en mode web de données complétant celle en OAI-PMH, l’attribution d’identifiant de type DOI, etc.
Intervention
Thème
Documentation
Projet SADSUI (2020-2022), Gudrun Ledegen
Pour plus de renseignements sur ce projet : lien ici. (site consulté le 14-04-2022)
Lexico 3
Pour plus d'informations concernant ce logiciel : lien ici. (site consulté le 14-04-2022)
Logiciel Alceste
Pour plus d'informations, cliquez ici. (site consulté le 14-04-2022)
IRaMuTeQ
Pour vous renseigner sur ce logiciel, lien ici. (site consulté le 14-04-2022)
Plateforme COCOON
Site de la plateforme : lien ici. (site consulté le 14-04-2022)
Dans la même collection
-
Séminaire HN 2023 #2 - Humanités numériques et enjeux environnementaux
HessAuréliePressacJean-BaptisteNinassiBenjaminDescampsSarahBaillotAnneSéminaire HN 2023 #2 - Humanités numériques et enjeux environnementaux
-
Séminaire HN 2023 #1 - Modélisation des données en SHS : bases de données relationnelles, wikis, we…
PressacJean-BaptisteSimonsOlafLaubéSylvainHessAurélieMignonMorganeSéminaire HN 2023 #1 - Modélisation des données en SHS : bases de données relationnelles, wikis, web sémantique
-
Séminaire Humanités Numériques 2022 #3 - Concevoir et partager une édition numérique de corpus épis…
WilliamsGeoffreySchuweyChristopheMignonMorganeCharrier-VozelMarianneCaronMélindaParraMarinePeralez PeslierBénédicteWillaimePierreIdmhandFatihaChiffoleauFlorianeSéminaire Humanités Numériques 2022 #3 - Concevoir et partager une édition numérique de corpus épistolaires
-
Séminaire HN 2022 #2 - Intégrer l’ouverture des données et des méthodes à son projet de recherche
MignonMorganePressacJean-BaptisteDaireMarie-YvaneBenvegnú dos SantosAlineVasileAureliaVeilhanHélèneAucagneJuliePatatGwenaëlleDeuxième séance du cycle de séminaires "Humanités numériques" pour l'année 2022, organisée par la MSHB et co-animée par Jean-Baptiste Pressac (CRBC) et Morgane Mignon (MSHB).
-
Séminaire Humanités numériques #3 - TEI et modélisation des données de recherche
BurnardLouFroyeMarianneDanielJohannaLa Maison des sciences de l’homme en Bretagne a organisé en ligne le lundi 3 mai 2021, de 14h à 17h, la troisième édition de son séminaire Humanités numériques. Initialement prévu en mars
Sur le même thème
-
Le Crédit Foncier d’Extrême Orient dans la concession française de Tianjin (1907-1956) : un récit …
DesplainAuréliaLe Crédit Foncier d’Extrême Orient dans la concession française de Tianjin (1907-1956) : un récit visuel spatialisé
-
Atelier Heurist : étude de cas d'une migration (projet CairMod)
JohnsonIanAtelier Heurist : étude de cas d'une migration
-
Langue et culture créoles : Appréhender la population mauricienne à travers la socio-phonétique
ChadyShimeen-KhanFlorignyGuilhemLangue et culture créoles #13 - Appréhender la population mauricienne à travers la socio-phonétique
-
Langue et culture créoles : Pratiques langagières des jeunes
GeorgerFabriceChadyShimeen-KhanCauseries Sciences du langage - Langue et culture créoles #12 - Pratiques langagières des jeunes
-
[ChArtRes - Chœur d’Art et Restitution 3D] Le tour de chœur de Notre-Dame de Chartres de la Renais…
Exceptionnel d’un point de vue architectural, figurant parmi les rares clôtures de chœur conservées, le Tour de chœur de Notre-Dame de Chartres l'est aussi en tant qu’ouvrage majestueux de sculpture
-
[ChArtRes - Chœur d’Art et Restitution 3D] Restaurer le tour de chœur de la cathédrale de Chartres
Boudon-MachuelMarionJourd'heuilIrèneMéthivierAmélieLa restauration du tour de chœur de la cathédrale de Chartres, entreprise depuis 2015 par la Conservation régionale des monuments historiques, s’est accompagnée d'un projet de recherche financé par la
-
[ChArtRes - Chœur d’Art et Restitution 3D] Modéliser le tour de chœur de Chartres pour mieux le com…
Boudon-MachuelMarionJourd'heuilIrèneSerresBarthélémyCette vidéo dévoile les coulisses du projet en Humanités numériques, ChArtRes-Chœur d’Art et Restitution 3D, mené par l’Université de Tours/CESR, à la faveur de la restauration du tour de chœur de la
-
Quelle sociolinguistique critique, il y a 20 ans et aujourd’hui ? │ 04 octobre 2023, Paris
HellerMonicaConférence de Monica Heller │ Quelle sociolinguistique critique, il y a 20 ans et aujourd’hui? │ CNRS - Langues et Civilisations à Tradition Orale (LACITO) - SEDYL - Sorbonne Nouvelle
-
Séminaire HN 2023 #2 - Humanités numériques et enjeux environnementaux
HessAuréliePressacJean-BaptisteNinassiBenjaminDescampsSarahBaillotAnneSéminaire HN 2023 #2 - Humanités numériques et enjeux environnementaux
-
« Touching Digital Heritage » (mai 2023)
CapurroCarlottaCette présentation traite d'une approche innovante de la communication pour les musées et les collections patrimoniales, où une réplique interactive imprimée en 3D d'un objet est utilisée comme
-
Making Scents of the Past. Making Scents Last
BolMarjolijn[Version française en dessous de la version anglaise] (Mai 2023)
-
« Surprise Machines : Revealing Harvard Art Museums’ image collection. » (mai 2023)
RodighieroDarioSurprise Machines is a project of experimental museology aiming at visualizing Harvard Art Museums’ image collection, opening up unexpected vistas on 200,000 inaccessible objects. Part of the