Glitter makes SPARQL : glitter, un package R pour explorer et collecter des données du web sémantique
Descriptif
La collecte de données du web sémantique, formalisées selon le modèle RDF, nécessite l’élaboration de requêtes dans le langage dédié SPARQL. Ce langage, qui est aux données du web sémantique ce que SQL est aux bases de données relationnelles, a ainsi un objectif très spécifique et demeure assez méconnu des utilisateurs de données. Au contraire, R est un langage de programmation généraliste puisqu’il permet de gérer de nombreux aspects de la chaîne de traitements de données, depuis leur recueil jusqu’à leur valorisation (par des modèles, graphiques, cartes, rapports, applications, etc.).
Le package glitter permet aux utilisateurs de R sans connaissance préalable de SPARQL (analystes de données, chercheurs, étudiants) d’explorer et collecter les données du web sémantique. En effet, il permet à l’utilisateur de générer des requêtes SPARQL, de les envoyer aux points d’accès de son choix, et de recueillir les données correspondantes. Ces étapes sont ainsi intégrées à l’environnement R dans lequel l’utilisateur peut également réaliser les étapes d’analyse et de valorisation des données, dans une chaîne de traitement reproductible.
Dans cette présentation, les principales fonctionnalités du package glitter seront illustrées à partir d’exemples. Le package, quoique toujours en développement, est fonctionnel et documenté et peut être installé par les participants qui souhaitent le tester en suivant les instructions décrites sur cette page.
En savoir plus sur cette séance du séminaire R à l'Usage des Sciences Sociales : Pascal Cristofoli (EHESS), Bénédicte Garnier (Ined), Timothée Giraud (CNRS UAR RIATE), Élisabeth Morand (Ined)
Vidéos
Glitter makes SPARQL - Vidéo de l'intégralité
Glitter makes SPARQL : glitter, un package R pour explorer et collecter des données du web sémantique
Introduction : Projet RECIT et package glitter
Glitter makes SPARQL : glitter, un package R pour explorer et collecter des données du web sémantique (introduction)
Partie 1 : Web sémantique et web des données
Glitter makes SPARQL : glitter, un package R pour explorer et collecter des données du web sémantique (partie 1)
Partie 2 : Exemple d’exploration de Wikidata
Glitter makes SPARQL : glitter, un package R pour explorer et collecter des données du web sémantique (partie 2)
Partie 3 : Exemple de requête et valorisation - lieux de fiction
Glitter makes SPARQL : glitter, un package R pour explorer et collecter des données du web sémantique (partie 3)
Partie 4 : Dimensionnement des requêtes
Glitter makes SPARQL : glitter, un package R pour explorer et collecter des données du web sémantique (partie 4)
Partie 5 : Remarques sur les caractéristiques de glitter
Glitter makes SPARQL : glitter, un package R pour explorer et collecter des données du web sémantique (partie 5)
Partie 6 : Généralisation à l’usage d’autres endpoints
Glitter makes SPARQL : glitter, un package R pour explorer et collecter des données du web sémantique (partie 6)
Glitter makes SPARQL - Perspectives
Perspectives - Glitter, un package R pour explorer et collecter des données du web sémantique
Intervenants et intervenantes
Ingénieure de recherche CNRS spécialisée en analyses statistiques (logicel R). - Membre du "Laboratoire Environnement Ville Société" à l'ENS de Lyon (en 2024)