portails documentaires et référentiels du web sémantique : exemples et enjeux à venir à partir...
DESCRIPTION
Présentation à l'occasion de la journée d'étude ALMA du 14 février 2014 organisée par les étudiants du Master 2 Histoire et document, Métiers des archives et des bibliothèques de l'université d'Angers et par l'Association des étudiants et diplômés en archivistique d'Angers (AEDAA).TRANSCRIPT
![Page 1: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/1.jpg)
Portails documentaires et
référentiels du Web sémantique : exemples et enjeux à venir à partir
de HDA-Lab et DBpedia
Les portails documentaires : un atout pour les archives ?
Journée d’étude ALMA
14 février 2014
Alexandre Monnin Paris 1, PhiCo, EXeCO
Inria, Wimmics Membre du réseau d’expert Open Data
d’Etalab
![Page 2: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/2.jpg)
Le portail Histoires des arts (HDA)
![Page 3: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/3.jpg)
Près de 5000 ressources agrégées et commentées pour l'enseignement de l'histoire des arts : dossiers pédagogiques, expositions virtuelles, vidéos... ainsi que des repères chronologiques par domaines artistiques (architecture, bande dessinée, littérature, jardins, musique, peinture, théâtre...).
• Toutes les périodes
• Toutes les civilisations
• Tous les domaines artistiques
Grande hétérogénéité des institutions impliquées (+300)
Grande hétérogénéité des contributeurs de ces institution au portail HDA
![Page 4: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/4.jpg)
Enjeux d’une indexation commune
• Un seul modèle pour toutes les institutions ?
• Un seul modèle pour tous les éléments du corpus ?
• Un seul domaine pour toutes les période ?
• Un seul modèle pour toutes les civilisations ?
• Un seul modèle pour tous les domaines artistiques ?
![Page 5: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/5.jpg)
? Three Rings for the Elven-kings under the sky, Seven for the Dwarf-lords in their halls of stone, Nine for Mortal Men doomed to die, One for the Dark Lord on his dark throne In the Land of Mordor where the Shadows lie. One Ring to rule them all, One Ring to find them, One Ring to bring them all and in the darkness bind them In the Land of Mordor where the Shadows lie.
![Page 6: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/6.jpg)
Se mettre d’accord
Autour d’une table ?
![Page 7: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/7.jpg)
Une grande table alors…
![Page 8: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/8.jpg)
Solution
Le tagging libre augmenté
libre en amont (pas d’anneau unique, faible barrière d’entrée)
augmenté en aval (une lingua franca post-hoc)
![Page 9: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/9.jpg)
Où trouver les entités/concepts dont nous avons besoin ?
![Page 10: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/10.jpg)
![Page 11: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/11.jpg)
DBpedia ?
![Page 12: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/12.jpg)
![Page 13: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/13.jpg)
![Page 14: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/14.jpg)
![Page 15: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/15.jpg)
![Page 16: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/16.jpg)
![Page 17: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/17.jpg)
![Page 18: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/18.jpg)
![Page 19: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/19.jpg)
![Page 20: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/20.jpg)
![Page 21: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/21.jpg)
En France: SemanticPedia (convention)
![Page 22: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/22.jpg)
• 8 semaines pour sémantiser 16 000 mots-clefs de HDA (données ouvertes disponibles sur data.gouv.fr).
• Mise en place dans le back-office de la plate-forme HDA d’un workflow semi-automatique de tagging lié à DBpedia (analyse des notices, et suggestion de liaison avec des URI de DBpedia aux utilisateurs)
![Page 23: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/23.jpg)
Verdict
Wikipedia répond aux besoins du tagging culturel
• 2012 : 77, 2 % des tags ont pu être liés à Wikipedia en français (en passant par la version anglaise à l’époque, chiffre qu’il faut donc revoir sensiblement à la hausse).
• 2012 : 83 % des tags utilisés l’ont été plus d’une fois par les visiteurs du site.
• Octobre 2012 : 100 % des 100 mots-clefs les plus fréquemment utilisés par les visiteurs du site sont appariés à Wikipedia/DBpedia.
![Page 24: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/24.jpg)
Enrichissement
• Désambiguïsation
• Gestion de la synonymie
• Descriptions
• Illustrations
• Coordonnées géographiques…
![Page 25: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/25.jpg)
Créer une boucle vertueuse réutilisation <-> contribution
Mobiliser les agents pour que les thèmes traités aient une représentation sur WP
Améliore DBpedia Améliore les applications qui utilisent DBPedia
etc.
De plus en plus d’initiatives impliquent des institutionnels (mapping parties avec Open Street Map, résidence au château de Versailles, etc.).
« nos établissements sont invités à leur tour à consolider, à enrichir ou à rectifier s’il y a lieu les données figurant sur Wikipédia, afin non seulement d’augmenter la qualité de ses articles en langue française, mais aussi son efficacité sur le Web sémantique. » (Aurélie Filippetti, 19 novembre 2012)
![Page 26: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/26.jpg)
Simplicité : pas d’appel aux couches supérieures du Web Sémantique
![Page 27: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/27.jpg)
Linked Open Data
• Use URIs as names for things
• Use HTTP URIs so that people can look up those names.
• When someone looks up a URI, provide useful information, using the standards (RDF*, SPARQL)
• Include links to other URIs. so that they can discover more things.
![Page 28: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/28.jpg)
Enrichissement multilingue
• Lien entre les différentes versions linguistiques de Wikipedia
= équivalents linguistique des entrées (dont des mots-clefs)
= recherche multilingue à coût quasi- nul (traduction des interfaces)
= désenclavement linguistique du corpus traité
![Page 29: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/29.jpg)
![Page 30: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/30.jpg)
Plus-value « sémantique »
A tester sur HDA-Lab : http://hdalab.iri-research.org/hdalab/
![Page 31: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/31.jpg)
Aujourd’hui
• Le projet Joconde Lab (http://jocondelab.iri-research.org/jocondelab/) a prolongé l’effort initié avec HDA-Lab.
• Corpus de 500.000 notices d'objets de toute nature (archéologie, beaux-arts, ethnologie, histoire, sciences et techniques...) valorisées par des parcours thématiques, des zooms et des expositions virtuelles, valorisé par des parcours thématiques dans les images.
• Même principe que HDA : 80 % des descripteurs utilisés sur Joconde sont couverts du Wikipedia
![Page 32: Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia](https://reader036.vdocuments.mx/reader036/viewer/2022081403/5560b38dd8b42af93b8b4865/html5/thumbnails/32.jpg)
Merci !