Notice
Cultures visuelles en SHS. Construire un corpus de 470 000 images scientifiques avec du deep learning
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
Descriptif
Ce data paper décrit un grand corpus de 470 000 images extraits de 110 000 publications françaises de sciences humaines et sociales, soit l’ensemble des documents en libre accès indexés par le moteur de recherche spécialisé Isidore pendant l’année 2019. Ce corpus final couvre une grande diversité de formats (articles, thèses, ouvrages, mémoires, billets...), de disciplines et d’usages iconographiques et ouvre un nouveau terrain de recherche quantitatif sur l’étude des cultures visuelles scientifiques.
Le corpus a été constitué pour une étude commandée par le Ministère de la recherche sur l’usage des œuvres d’arts visuelles en sciences humaines et sociales, qui vise à préparer la mise en œuvre des licences collectives prévues à l’article 28 de la loi pour la programmation de la recherche de 2020. La collecte visait à produire un échantillon représentatif de 1500 images annotées manuellement pour définir leur statut légal au regard du droit d’auteur.
La réalisation de cette étude nous a contraint à problématiser la notion d’image scientifique en ligne. Contrairement aux attentes initiales, le dénombrement des images n’a pas été une procédure triviale. Elle a requis le développement en amont d’un modèle de classification par deep learning et l’élaboration d’une typologie des objets visuels usuellement présents dans ces publications. L’usage de la modélisation non à des fins d’exploration mais de définition initiale du corpus sera l’un des principaux thèmes de la présentation.
Pierre Carl Langlais (Université de Montpellier Paul-Valéry)
Intervention
Thème
Dans la même collection
-
Utiliser les R Notebooks en traitement automatique des langues. Un exemple de classification automa…
2e intervention de la 2e session du colloque DHNord 2021
-
Comment passer de l'entrepôt de données aux data papers ? Retour sur l'expérience de data.sciencesp…
3e intervention de la 8e session du colloque DHNord 2021
-
D'artefacts archéologiques à artefacts documentaires : les data papers en archéologie. Le cas du Jo…
BOUKACEM-ZEGHMOURI Chérifa
1ère intervention de la 1ère session du colloque DHNord 2021
-
Phoebus e-Balzac : édition numérique exhaustive d’un monument littéraire
2e intervention de la 4e session du colloque DHNord 2021
-
Le data paper : une nouvelle forme de publication scientifique en SHS
Table ronde de la 1ère journée du colloque DHNord 2021
-
HTR-United : mutualisons la vérité de terrain !
1ère intervention de la 8e session du colloque DHNord 2021
-
Découvrir le Journal of Digital History
Conférence plénière de la 2e journée du colloque DHNord 2021
-
Data papers et dissémination des données de la recherche : quelles pratiques en SHS ?
LE BéCHEC Mariannig
4e intervention de la 8e session du colloque DHNord 2021
-
Révéler les formes et logiques de citation des data papers en archéologie
2e intervention de la 1ère session du colloque DHNord 2021
-
Écrire des data papers en SHS : exemples et partage d’expériences
Table ronde de la 3e journée du colloque DHNord 2021
-
Adressbuch 1854
1ère intervention de la 2e session du colloque DHNord 2021
-
Vers un écosystème d'écriture et d'édition avec les données
SAURET Nicolas
2e intervention de la 8e session du colloque DHNord 2021
Avec les mêmes intervenants et intervenantes
-
Stéréotypes viraux : analyser les circulations historiques de l'image médiatique au prisme du deep …
LANGLAIS Pierre-Carl
3e intervention de la 1ère session du colloque DHNord 2020