Web sémantique et Web de données

Description

Ce cours vous propose de vous former aux standards du Web de données et du Web sémantique. Il vous présentera les langages qui permettent  : de représenter et de publier des données liées sur le Web (RDF), d'interroger et de sélectionner très précisément ces données à distance et au travers du Web (SPARQL), de représenter des vocabulaires et de raisonner et déduire de nouvelles données pour enrichir les descriptions publiées (RDFS, OWL, SKOS) et enfin, de tracer et de suivre l’histoire des données (VOiD, DCAT, PROV-O, etc.).

À qui s'adresse ce cours ?

Ce cours s’adresse à des étudiants ou ingénieurs en informatique, notamment dans le domaine des systèmes d'information. Il peut être suivi en complément d’une formation classique aux technologies de base du Web.

Pré-requis 

Cours de niveau Licence, à destination de personnes ayant des connaissances de base en informatique, notamment sur les outils et langages classiques du Web (navigateurs Web, HTML de base, etc.), et la capacité à installer et exécuter des logiciels sur leurs machines (applications Java, etc.).

Plan du cours :

Partie 1 Vers un web de données liéesPartie 2 Le modèle de données RDFPartie 3 Le langage de requête SPARQLPartie 4 Ontologies et schémas RDFSPartie 5 Formalisation en OWLPartie 6 Des schémas particuliersPartie 7 Vers plus d’intégration de données

Les différents supports de ce cours sont constitutifs d'un MOOC en 7 semaines hébergé sur la plate-forme France Université Numérique : https://www.france-universite-numerique-mooc.fr/courses/inria/41002S02/session02/about

  

Vidéo pédagogique

Démos d'un Web de données liées
Collection
8 vidéos
Vers un web de données liées
  • GANDON Fabien
  • FARON-ZUCKER Catherine
  • CORBY Olivier
Cette première partie est une introduction générale à l'architecture du Web et à
l'évolution de son usage, d'un Web documentaire vers un Web de données.
Elle est axée sur une culture générale du web et de son évolution, pour
vous permettre de mieux comprendre la génèse des nouveaux standards qui
sont décrits dans la suite du cours.  Pour cela, cette première partie débute avec une vision générale et historique du Web pour se conclure sur une
première manipulation technique du Web de données.
02.03.2015
  • niveau 1 niveau 2 niveau 3
  • audio 1 audio 2 audio 3
  • document 1 document 2 document 3
Démos de la partie "Vers plus d’intégration de données"
Collection
9 vidéos
Vers plus d’intégration de données
  • GANDON Fabien
  • FARON-ZUCKER Catherine
  • CORBY Olivier
Cette dernière partie du cours "Web sémantique et Web de données" propose une conclusion ouverte du cours en abordant plusieurs initiatives pour intégrer toujours plus de données sur le Web.
Nous allons notamment voir comment décrire et tracer les données
publiées (VoID, DCAT, Prov-O), comment intégrer données et documents
avec la syntaxe RDFa pour RDF et comment exporter des données d’une base
relationnelle.
Nous terminerons en insistant sur l’existence d’autres standards que
nous ne couvrirons pas. Nous mentionnerons ainsi l’initiative LDP, qui
propose une interface d’accès aux données liées (une API REST). Nous
parlerons aussi d’une autre approche pour le raisonnement en reposant
sur des règles (RIF).
Enfin, nous conclurons la semaine et le MOOC en insistant sur
l’intégration des standards que nous avons vus
02.03.2015
  • niveau 1 niveau 2 niveau 3
  • audio 1 audio 2 audio 3
  • document 1 document 2 document 3
Démos sur des vocabulaires populaires
Collection
8 vidéos
Des schémas particuliers
  • GANDON Fabien
  • FARON-ZUCKER Catherine
  • CORBY Olivier
Cette sixième partie du cours vous propose de découvrir plusieurs schémas existants.
 Il existe maintenant de nombreux schémas qui
couvrent de nombreux domaines: les personnes, les documents, les droits
d'utilisation, les thésaurus, etc. Il existe même des annuaires et
moteurs de recherche pour trouver ces schémas. Par exemple, l'annuaire LOV (linked open vocabularies)
recense des vocabulaires très connus et liés entre eux par des
réutilisations de classes ou propriétés. Complètement différent, mais
très utile aussi, prefix.cc
vous permet de retrouver à quel espace de nommage est souvent lié un
préfixe et, par extension, à quel vocabulaire il peut être fait
référence.
Par conséquent, avant de réinventer un schéma, il
nous faut nous demander s’il n’en existe pas déjà un qui soit
réutilisable plus ou moin
02.03.2015
  • niveau 1 niveau 2 niveau 3
  • audio 1 audio 2 audio 3
  • document 1 document 2 document 3
Démos autours des schémas
Collection
8 vidéos
Ontologies et schémas RDFS
  • GANDON Fabien
  • FARON-ZUCKER Catherine
  • CORBY Olivier
Cette quatrième partie aborde le standard RDFS. 
Pour s’assurer de l’interprétation et de l’utilisation qui peut être faite des données, il est très utile de pouvoir publier leurs schémas
avec elles, c'est-à-dire un document si possible formel qui capture et
explique le sens, les catégories, les relations, les contraintes des
données et de leur structure. Pour cela, au-dessus de RDF se dresse la
pile des langages de schémas (ou ontologies) avec une expressivité et un
coût de calcul croissants : plus l’on monte dans la pile et plus
l’expressivité logique nous permet de capturer des aspects des
structures de données et de leurs primitives, mais aussi, plus les
raisonnements sur ces schémas sont coûteux. Le premier niveau
dit des schémas légers est celui de RDFS (RDF Schema) permettant de
déclarer et de décrire l
02.03.2015
  • niveau 1 niveau 2 niveau 3
  • audio 1 audio 2 audio 3
  • document 1 document 2 document 3
Démos autour de SPARQL
Collection
8 vidéos
Le langage de requête SPARQL
  • GANDON Fabien
  • FARON-ZUCKER Catherine
  • CORBY Olivier
Cette troisième partie du cours "Web sémantique et Web de données" aborde le langage et protocole SPARQL (qui se prononce "sparqueul" comme sparkle en Anglais).
La recommandation SPARQL fournit trois outils importants pour l’échange des données :

un langage de requête sur des graphes RDF permettant de spécifier le type de données recherchées ;
des formats pour représenter les résultats d'une requête ;
un protocole pour soumettre une requête à un serveur distant et recevoir les résultats, notamment à travers le protocole HTTP.

Allons découvrir cet "éclat" du Web...
02.03.2015
  • niveau 1 niveau 2 niveau 3
  • audio 1 audio 2 audio 3
  • document 1 document 2 document 3
Démos autour de RDF
Collection
8 vidéos
Le modèle de données RDF
  • GANDON Fabien
  • FARON-ZUCKER Catherine
  • CORBY Olivier
Cette deuxième partie du cours se concentre sur RDF.
RDF est la première brique des standards du web sémantique et  recouvre à la fois un modèle et plusieurs syntaxes, dont une en XML, pour publier des données à propos de tout et n'importe quoi sur le Web.
Il permet à quiconque de décrire des ressources, et notamment des
ressources du Web, comme par exemple l'auteur, la date de création, le
titre et les droits de diffusion d'un film. RDF est au web de données ce
que HTML était au web documentaire dans sa métaphore initiale : le
langage dans lequel on décrit, représente et relie des ressources à
échanger sur le web. Entrons ensemble dans ce "Resource Description
Framework"...
02.03.2015
  • niveau 1 niveau 2 niveau 3
  • audio 1 audio 2 audio 3
  • document 1 document 2 document 3
Démos à propos des ontologies OWL
Collection
7 vidéos
Formalisation en OWL
  • GANDON Fabien
  • FARON-ZUCKER Catherine
  • CORBY Olivier
Cette cinquième partie du cours "Web sémantique et Web de données" aborde le standard OWL.
Au-dessus de RDFS, la recommandation OWL (Ontology Web Language) est
une extension en trois fragments d’expressivité croissante: OWL Lite, OWL DL et OWL Full. Les différents fragments de cette extension sont basés sur une famille de langages appelée les logiques de description
qui permettent des déductions supplémentaires, telles que la
vérification de la cohérence d'un schéma, la classification automatique
des types afin de générer des hiérarchies, ou l'identification
automatique du type d'une ressource basée sur ses propriétés.
OWL permet la définition des classes en énumérant leur contenu ou par
union, intersection, complément et disjonction avec d’autres classes.
OWL permet également la caractérisation des propriétés (rest
02.03.2015
  • niveau 1 niveau 2 niveau 3
  • audio 1 audio 2 audio 3
  • document 1 document 2 document 3