interopérabilité de l'information bibliographique et muséologique
Post on 16-Jan-2017
587 Views
Preview:
TRANSCRIPT
Interopérabilité de l’information bibliographique et muséologique
Mégadonnées et interopérabilitédans les humanités numériques
15 décembre 2015MESHS-Lille
dans le cadre du projetTECTONIQ (PEPS CNRS – Inter MSH, Université Lille 3)
Patrick Le BœufBibliothèque nationale de France
POURQUOI ? COMMENT ?
Musées et bibliothèques
apparentés…… mais différents
objets uniques essentiellemen
t
exemplaires de publications
essentiellement
Pourquoi en rendre les descriptions interopérables ?
Musées et bibliothèques
différents…… mais apparentés
aussi des objets non uniques aussi des objets uniques… et des objets qui se
répondent…
Comment en rendre les descriptions interopérables ?
5
Modélisation conceptuelle
« Belle Marquise, vos beaux yeux... »Structure de
données A
« Yeux Marquise !
beaux, belle, vos... »
« Beaux, vos yeux ; Marquise,
belle… »Structure de données B
Structure de données C
Formalisation des concepts communs
Quelle coïncidence !
• 1998 : version préliminaire du modèle CIDOC CRM par l’ICOM CIDOC
• 1997 : modèle FRBR par l’IFLA
7
CIDOC CRM(Conceptual Reference Model)
• Contexte organisationnel : ICOM : Conseil international des musées CIDOC : Comité international
pour la documentation• Matériau de départ :
CIDOC Relational Data Model• 430 entités en 1995 : devenu ingérable !• pas assez flexible
CIDOC Information Categories• liste des éléments de données communs
à 23 standards de description muséographique
La vision de Martin Doerr
Legacy systemsLegacy systemsData
basesPhénomènes du monde
?Conceptualisation
abstractisedonne une
approximation de explique,motive
organisent
se rapportent à
Données sous diverses formes
Structures de donnéeset modèles de présentation
9
FRBR(Functional Requirements for Bibliographic Records)
• Contexte organisationnel : IFLA : Fédération internationale des
associations de bibliothécaires et de bibliothèques
• Matériau de départ : Pas de modèle préalable Documents normatifs tels que ISBD
(International Standard Bibliographic Description)
FRBR :toute une famille de modèles
• 1998 : Functional Requirements for Bibliographic Records, FRBR
• 2009 : Functional Requirements for Authority Data, FRAD
• 2011 : Functional Requirements for Subject Authority Data, FRSAD
• En cours : fusion des trois modèles,FRBR-LRM (Library Reference Model)
11
Et si on se parlait ?• 2003 :
mise sur pied d’un groupe de travailsur l’harmonisation entre les modèles CIDOC CRM et FRBR
• Principe : « traduire » FRBR(entité-relation) en une extensiondu CIDOC CRM (orienté objet)
• Résultat : FRBROO
TRÈS BRÈVE PRÉSENTATION DU CIDOC CRM
13
Structure centraledu CIDOC CRM
E7 Activité
E39 Agent E28 Objet Conceptuel
E18 Chose Matérielle
E52 Laps de Temps E53 Lieu
E55 Type
E41
Appe
llatio
n
a pris part à a affecté
a occupé s’est déroulée dans
iden
tifie
sert à catégoriser
E5 Événement
14
Quelques notions fondamentales• E2 Entité Temporelle
• E4 Période
• E5 Événement
• E7 Activité
• Réunion de phénomènes formant un ensemble cohérent dans l’espace et dans le temps
• Introduit la notion de la participation de personnes et de la présence de choses
• Introduit les notions d’intention et d’influence
• Introduit la notion d’outils
• Tout ce qui se produit dans le temps (événements ou états)
Exemple• « L’artiste Théodore Géricault a peint son tableau Le Radeau
de la Méduse (INV4884) dans la ville de Paris en 1818-1819. »
15
E21 Personne
E41 Appellation
E55 Type
E41 Appellation
E65 Création
E12 Production
E38 Image
E35 Titre
E22 Objet Fabriqué
E42 Identifiant
E55 Type
E41 Appellation
E55 Type
E41 Appellation
E53 Lieu
E41 Appellation
E52 Laps de Temps
E50 Date
P1 est identifié par
P2 est de type
P1 est identifié par
P14 a été réalisé par
P14 a été réalisé par
P94 a crééP102 a pour titre
P65 présente comme visuel
P48 a pour identifiant préférentielP2 est d
e type
P1 est identifié par
P108 a produit
P7 a eu lieu dans
P1 est identifié parP2 est de type
P1 est identifié par
P4 a pour laps de temps
P78 est identifié par
= "Théodore Géricault"
= "artiste"= "Le Radeau de la Méduse"
= "INV4884"
= "tableau"= "Paris"= "ville"= "1818-1819"
E55 TypeP14.1 dans le rôle de= "peintre"
La « famille CIDOC CRM »
16
CRMsci
FRBR
oo
CRM
CRMarcheo CRMdig
CRMgeo
CRMinf
PRES
Soo
FRBRoo : données bibliographiquesPRESSoo : données sur les périodiquesCRMinf : modèle d’inférencesCRMsci : observations scientifiquesCRMgeo : modèle spatio-temporelCRMarcheo : données archéologiquesCRMdig : métadonnées de provenance
TRÈS BRÈVE PRÉSENTATION DE FRBROO ET PRESSOO
18
FRBROO
• Contexte organisationnel : IFLA CIDOC CRM SIG (Special Interest
Group)• Matériau de départ :
FRBR, FRAD, FRSAD CIDOC CRM
FRBROO :modéliser la notion de publication
F30 Publication
EventP4 has time-span
F32 Carrier Production
Event
F19 Publication
Work
F24 Publication Expression
F5 Item
E52 Time-Span
E50 Date
E52 Time-Span
E50 Date
P4 has time-span
P78 is identified by P78 is identified by
R3 is realised in
R6 carries
R24 created
R23 created a realisation of
R28 produced
20
Une extension à l’extension…• FRBR insuffisant pour rendre
compte de la complexité des périodiques
• FRBROO ne résout pas ce problème• 2013 : Centre international ISSN +
BnF développent PRESSOO
21
Démarched’élaboration de PRESSOO
• Matériau de départ : Manuel de l’ISSN expertise de spécialistes des périodiques
• Examen des éléments de donnéesrequis par le Manuel de l’ISSN traduction de leur sémantique
dans la structure de FRBROO
quand ça coince, déclarationde nouvelles classes et propriétés
PRESSOO
Z1Serial
Transformation
Y… F18SerialWork
ContinuationsRemplacemen
tsScissions
FusionsZ2
AbsorptionZ3
Separation
Z5Issuing
Rule Change
Z12Issuing
Rule
Y16 replaced (was replaced through)
Y16 replaced with (was introduced through)
USAGES CONCRETS DE LA FAMILLE CIDOC CRM
CIDOC CRM et ses « fils » :des modèles adaptés aux techniques du Web sémantique ?
• OUI et NON à la fois OUI :
• Structure Classe – propriété – Classetrès proche de celle des triplets RDF
NON :• « Propriétés typées » difficiles à exprimer en RDF• Difficultés pour implémenter dates imprécises• Pas de préconisation pour traitement des chaînes
de caractères ou représentation des identifiants• Modèles conceptuels abstraits
plutôt qu’ontologies « prêtes à l’usage »
27
Usages de FRBROO
• FRBROO conçu au départ pour la communauté bibliothéconomique (qui ne se l’est pas encore vraiment approprié)
• D’autres communautés y ont vu un potentiel pour leur domaine, notamment dans les humanités numériques : HuCit SAWS Biblissima …
28
HuCit• Matteo Romanello (King’s College) : PhD sur la notion
de citations canoniques de textes de l’Antiquité : comment reconnaître automatiquement
ces citations au sein d’une publication moderne ? comment les traiter automatiquement
pour identifier le texte cité ? comment s’en servir pour accéder directement
au texte identifié (hypertexte)ou pour permettre des études sur l’intertextualité ?
• Avec Michele Pasin, développement de l’ontologie Humanities Citation (HuCit) « qui vise à caractériser la sémantique des citations telles qu’elles sont normalement conçues et utiliséesdans les disciplines humanistes* »
* : (Matteo Romanello, Michele Pasin,An Ontological view of canonical citations, 2011)
29
HuCit et FRBROO
• HuCit développée comme uneextension de FRBROO, selonles mêmes principes que PRESSOO
• Chaque nouvelle classe introduitedans HuCit est une sous-classed’une classe de FRBROO ou du CIDOC CRM
• Idem pour les propriétés• Pas de modèle préexistant :
matériau de base = l’analyse de Matteo Romanello(son expertise, sa conceptualisation du domaine)
31
SAWS• Sharing Ancient WisdomS (SAWS)
Projet réunissant :• le King’s College (Londres)• l’institut Newman (Uppsala)• et l’Université de Vienne
focus :• étude des florilèges anciens
de propos et anecdotes (gnomologie)• comme outil d’approche de l’épistémé
des sociétés qui les ont produits ;• analyse de la complexité de ces matériaux• et de leurs interactions
32
SAWS et techniquesdu Web sémantique
• Besoin d’une ontologiepour décrire les liens entre textes distincts
• entre deux florilèges• entre un florilège et les sources qu’il cite
et au sein d’un même texte• Ces liens sont représentés
et stockés en RDF
33
SAWS et FRBROO
• Pour les mêmes raisons que HuCit, l’ontologie SAWS s’est construite comme une extension de FRBROO / CIDOC CRM
• Déclare des sous-classes très détaillées aux classes de FRBROO / CIDOC CRM
• Permet une description très fine de la structure (tant logique que matérielle)d’un manuscrit médiéval
• Les triplets RDF sont intégrésà l’encodage en TEI des florilèges édités
34
Biblissima• Projet 2012-2019 visant à améliorer les
outils de recherche sur les manuscrits médiévaux, notamment en utilisant les techniques du Web sémantique permettre l’interopérabilité entre des
bases de données existantes hétérogènes via une ontologie s’appuyant sur FRBROO,
sur laquelle sera construit « l’observatoire Biblissima »
• <http://bbf.enssib.fr/consulter/bbf-2013-05-0023-005>
35
Ontologie Biblissima• Domaine :
modélisation de l’histoire de la transmissiondes textes et de l’histoire des collections
• Type de questions auxquelles on espère pouvoir répondre grâce à cette ontologie : Combien de manuscrits à la feuille d’or
dans telle collection aujourd’hui dispersée ? Quelles copies de tel texte sont enluminées ? Combien de versions existe-t-il de tel texte ? Quels sont les seuls fragments par lesquels
tel texte est parvenu jusqu’à nous ? Etc.• <http://doc.biblissima-condorcet.fr/ontologie>
Merci de votre attention !
top related