Notice
Twitter et la linguistique située : réflexions méthodologiques à partir de l’exemple de tweets sur la métropole de Dijon-PUDD
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
Descriptif
Cette communication s’inscrit dans le cadre du projet de recherche interdisciplinaire POPSU visant à entre autres à analyser l’identité métropolitaine et identifier les intérêts des citoyens. Pour alimenter la discussion proposée, nous exploiterons un corpus original de 300 000 tweets collectés en temps réel depuis juillet 2019 dans le cadre du projet interdisciplinaire POPSU Dijon, hébergé à la MSH Dijon et dont le but est d’explorer les interactions des utilisateurs de Twitter lorsqu’ils parlent de Dijon et de la métropole.
Nous commencerons par discuter les aspects liés à la collecte de données Twitter :
- juridiques : protections des données personnelles, Open Data
- relatifs à la constitution du jeu de données : où placer le curseur entre l’exhaustivité des données recueillies et le risque de recueillir des données trop éloignées de l’objet d’étude (au niveau temporel, géographique ou thématique) ;
- techniques : liés à l’API gratuite de Twitter (différentes méthodes de collectes et leur exhaustivité) ;
- relatifs aux jeux de données dont les traitements ne nécessitent pas d’infrastructure Big Data
Les questionnements informatiques sont consubstantiels aux interrogations linguistiques qui ont émaillé l’ensemble de ce projet à l’interface entre informatique, linguistique et géographie. Les données collectées nous ont amenés à évaluer leur intégrité et leur mise en corpus ; cette phase de réflexion est fondamentale dans le cadre de l’analyse de discours, qui était le but initial du projet de recherche. Or, si l’intégrité du corpus n’est pas garantie, une analyse de discours ne peut être envisagée en tant que telle (cf. la définition séminale de Busse/Teubert 1994). Cette mise en défaut n’est toutefois pas rédhibitoire dans la mesure où les données Twitter peuvent alimenter d’autres réflexions linguistiques et amener à considérer d’autres nœuds entre matérialisations linguistiques et structures épistémiques. En tant que source de données hypersynchroniques, Twitter permet une analyse de phénomènes linguistiques contemporains et authentiques (cf. la réflexion menée dans Bach 2020) ; toutefois, Twitter n’est pas un instrument magique pour la linguistique située, et un certain nombre de desiderata sont à formuler en ce sens pour une démarche scientifique rigoureuse (c’est-à-dire falsifiable et en accord avec les innovations issues des autres champs de la cognition).
Avec les mêmes intervenants et intervenantes
-
SHS et valorisation partenariale. Une success story à écrire-PUDD
BachMatthieuDans le cadre des politiques publiques liées à l’innovation (PIA 1, 2, 3 et 4), dans le cadre du Plan de Relance national, dans le cadre des politiques régionales en faveur de l’innovation, et dans le
Sur le même thème
-
Formation à la veille Mir@bel : 3. navigation pour un utilisateur authentifié
DandieuClaireDecampLudovicTroisième volet de la formation à la veille de Mir@bel.
-
Il était une fois dans l'Ouest (d'Oïl) : des chorèmes, des territoires et des hommes...
LéonardJean-LéoLa situation géopolitique actuelle met au cœur de l’actualité la notion même de territoire et la pluralité des modes de rapport d’une population à son territoire, imposant de revenir aux fondamentaux
-
Formation à la veille Mir@bel : 2. navigation personnalisée
DandieuClaireDecampLudovicVerlengia BertanhaCarolinaDeuxième volet de la formation à la veille de Mir@bel.
-
[Podcast C'est pas donné] [S01:E02] Karine Pellerin et Caroline Moine
PetitMaximilienBrittoAugustoPellerinKarineMoineCarolineComment comprendre l’institutionnalisation de la question des données de recherche ? Est-ce qu’il existe un décalage entre les préconisations et les pratiques sur le terrain ? Comment passer du
-
Du terrain au smartphone : Création du dictionnaire Android du Bena
IdiatovDmitryDécouvrez comment, après plusieurs années de recherches et d'études, Dmitry Idiatov et Mark Van de Velde, en collaboration avec Uyên-To Doan-Rabier, ont créé une application dédiée à la langue Bena.
-
HTAL : de la collecte au dépôt
LéonJacquelineFaivreCamilleLe projet HTAL, Histoire du traitement automatique des langues est un fond inédit, composé d'environ 1000 documents. Jacqueline Léon, directrice de recherche émérite au CNRS, les a collectés tout au
-
Gérer et ouvrir mes données de recherche : les bonnes pratiques-PUDD
BouillardLénaProstRachelLiseron-MonfilsMaélysDans un esprit d’ouverture et de partage des savoirs scientifiques, l’équipe de documentalistes de l’Atelier de la donnée dat@UBFC viendra aborder les bonnes pratiques de gestion et d’ouverture des
-
Le nouveau catalogue de Quetelet-Progedo Diffusion-PUDD
PROGEDO a pour but de développer la culture des données pour la recherche en sciences sociales. Pour mener à bien cette mission Quetelet-Progedo-Diffusion rénove son portail d’accès aux données.
-
Catégorisation du discours parlementaire sur la citoyenneté britannique durant l’époque victorienne…
Durant la première moitié du XIXème siècle en Grande-Bretagne, le débat politique sur l’élargissement du suffrage révèle des approches divergentes sur les critères d’acquisition du statut de citoyen
-
Atelier de découverte Mir@bel - Seconde partie (pour les partenaires)
DescollongesAmélieSuite de la présentation de Mir@bel donnée par Amélie Descollonges, chargée du projet Rev@ntiq
-
Atelier de découverte Mir@bel - Première partie
DescollongesAmélieIntroduction à Mir@bel donnée par Amélie Descollonges, chargée du projet Rev@ntiq
-
L’annotation linguistique menée au sein du projet DALIH.
KhurshudyanVictoriaVidal-GorèneChahanPrésentation de cette plate-forme linguistique numérique unifiée en libre accès et open-source pour l'ensemble de la variation arménienne