représentation et accès: continuités et transformations. chapitre 4. métadonnées et...
Post on 21-Dec-2014
250 Views
Preview:
DESCRIPTION
TRANSCRIPT
Métadonnées et normalisation
INRIA
Seminaire 2008
par Sylvie Dalbin - ATDsylvieATD@aol.com
(2)
INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.2
Fil conducteur de l’intervention
1. Contexte de l’intervention
2. NormalisationContexte - Enjeux - Acteurs en présence
3. Modèles - Schémas1. Un modèle conceptuel métier : FRBR2. Succession cohérente d’outils : FRBR, RDA, MODS et ONIX3. Notation particulière : CRM4. Profil d’application : TEF5. Conteneur et transporteur : METS6. Livres numériques7. Schémas de concepts8. Composants transversaux9. Familles de schémas : cohérence métier
4. Conclusion1. Sur le plan technique 2. Sur le plan des métiers
1. CONTEXTE DE L’INTERVENTION
1.
INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.4
Préparer l’Atelier Fabriqué avec http://wordle
INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.5
Autres ?
Notez des noms de normes, recommandations ou modèles que vous connaissez ou sur lesquels
vous souhaiteriez des informations
2. NORMALISATION
Contexte
Enjeux
Acteurs en présence
2.
INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.7
Contexte
• L’information – fait partie intégrante de toute activité humaine
[F.Moreau] - La méta-information permet de localiser un bien informationnel et de décider de l’intérêt de le consommer
« La méta-information est ainsi indéniablement au cœur du processus de création de valeur à l’heure du numérique ».
• Les TIC – sont des technologies qui agissent sur l’information
– elles sont structurantes et modèlent les dispositifs
2.1
INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.8
Enjeux
• Standardisation - normalisation – Des formats des données numériques
Des méta-informations
– Des systèmes d’encodage ?
• Plusieurs strates complémentaires
Codage de base Unicode
Technique Technologies du Web
Structure Identifiants, schémas de ressources, méta-
informations
Encodage des contenus Nomenclatures, terminologies
2.2
INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.9
Acteurs en présence (1)
• Histoires, fonctionnements et périmètres variables
• Coordination : une nécessité• ISO TC46 avec ISO TC37
• L’ISO et l’IEEE (concepteur entre autres du LOM) en 2008
• ISO TC46 (Information et Documentation) et l’IETF en 2008
• Organes-clés pour l’infodoc• ISO TC46 - piloté actuellement par la France (C.Dhérent / Bnf)
– Un rôle essentiel, des moyens faibles au regard du travail réalisé et à réaliser
– Activité des groupes - les professionnels terrain sont absents !
• NISO - National Information Standards Organization
• Library of Congress : http://www.loc.gov/standards/
2.3
INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.10
Acteurs en présence (2)
• ISO et organes locaux• Comités centrés sur l’information et les TIC : JTC1 (TIC,
ISO/CEI), TC37 (Terminologie), TC46 (Infodoc)
• Internet et le Web• IETF - « groupe informel et auto-organisé » qui développe les
spécifications des standards de l'Internet : les RFC
• ICANN - organes normalisateurs du Web– IANA = bureau central d'enregistrement des activités IETF
• Autres organismes par métiers ou domaines• OASIS - consortium mondial, autour d’XML - DocBook, UDDI,…
• IEEE - à l’origine du LOM ; ADL - standards du e-learning
• IPTC, IFLA (bibliothèque), SMTPE (cinéma et télévision), …
2.3
3. MODELES - SCHEMAS
Quelques exemples
3.
INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.12
Un modèle conceptuel métier : FRBR
Entités du Groupe 2 - FRANAR « identifiants »
Entités du Groupe 3 - FRSAR « sujets »
Functional Requirements for Bibliographic Records, IFLA, initié en 1997
3.1
INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.13
3.2
Succession d’outils : FRBR et ….
« Or, pour gérer des données, ces gens-là (les geeks)
travaillent de la manière suivante : ils font de la
modélisation, puis des spécifications, et enfin ils
implémentent. Nous, pauvres bibliothécaires et
catalogueurs, le nez dans le guidon trop souvent, nous
avons commencé par créer un format d'implémentation
(MARC), s'appuyant quand même sur une norme (l'ISBD).
Mais mieux vaut tard que jamais, nous avons fini par faire la
modélisation et les spécifications de nos données
bibliographiques : ce sont les FRBR. » Figoblog, 10/03/05
INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.14
3.2 Succession d’outils : … RDA, MODS et ONIX
• Schémas et outils techniques en cours de révision !– Outils métiers
• RDA / description bibliographique
• FRAD / autorités
– Outils informatiques• MODS / remplacement de MARC en XML
• Compatible avec le format de livre ONIX (ONline Information eXchange)
INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.15
Notation particulière : CRM (1)
• Au cœur du modèle– Des évènements et des phénomènes temporels
– La modélisation de l’activité versus la description d’objets
Conceptual Reference Model (Museum!), ISO 2127:2006
Actions (Activity)
La Seconde Guerre mondiale, la bataille de Stalingrad, le tremblement de terre de Lisbonne, la naissance de Cléopâtre, la fête donnée pour mon anniversaire le 28 juin 1995, la conférence de Yalta, une tuile est tombée de mon toit, la conférence Inria de 2008, …
Début d’existence : naissance, création, formation, etc.
Fin d’existence : destruction, dissolution, mort, etc.
3.3
INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.16
Notation particulière : CRM (2)
« un Lieu » (E53 - Place )
« est identifié par » (P87 - identified by)
« une appellation » (E4 - Appellation)
• Des métadonnées libérées • Des applications à construire
« un élément physique fabriqué par l’homme » (E24 - Physical man-made thing)
« A par héritage des propriétés de tout objet physique »
« une localisation ou une position » (P53 - has former location)
« Dans un lieu précis » (E53 - Place)
QuickTime™ et undécompresseur sont requis pour visionner cette image.
3.3
INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.17
Profil d’application : TEF
• Thèses électroniques françaises, recommandation
Afnor 2006
• Composition de la recommandation – Un modèle pour le genre « thèse » s’appuyant sur les FRBR
• travail universitaire validé par des pairs, une œuvre de l’esprit, un document administratif pour la délivrance d’un diplôme national
– Un format informatique de structuration et d’encodage XML selon le vocabulaire Schematron. (binding)
– Un format informatique d’organisation des données selon le vocabulaire METS
3.4
INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.18
Conteneur et transporteur : METS
• Metadata Encoding and Transmission Standard– Maintenu par la LC
– Enveloppe pour transporter des ressources – Une carte de la structure (Structural Map) de l’objet METS – La liste des fichiers (File Section)– Cinq autres sections, facultatives et répétables en fonction des
ressources intégrées : l’en-tête, les métadonnées descriptives et administratives, les liens structurels entre les différents éléments de la carte, ainsi que des exécutables.
• Autre conteneur : MXF (Material eXchange Format)– Etabli par la SMPTE (Soc. Motion Picture & TV Engineers).
– Enveloppe unique : contenus (essences), métadonnées, informations administratives sur la ressource globale
3.5
INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.19
Livres numériques
DAISY
ePub de l’IDPF
format harmonisé ?
DocBook
• Digital Accessible Information System, Z39.86:2005Adopté par Braillenet en 2002 ;
• Structuration XML des livres audionumérique, DTBook Métadonnées spécifiques : navigation dans la structure du livre + synchronisation sonore
• Norme SMIL/XHTML du W3C
• acteurs variés (Adobe, Hachette, OCLC, universités…)• 3 spécifications: structure (OPS), format (OPF), conteneur
(OCF)• Vocabulaire établi à partir du DTBook (Daisy) et XHTML
• Depuis 1992, par OASIS - intégré aux outils bureautiques• Noyau standardisé extensible; modèle et schéma XML• Un vocabulaire intégrant la structure des documents et les
métadonnées (dont 3 éléments du DC)
3.6
INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.20
Schémas de concepts (1)
• Derrière des schémas, des modèles différents– TMF (ISO 16642:2003) - Terminological Markup Framework
– SKOS/RDF du W3C, Juin 2008 - thésaurus et classification pour la recherche
– NP25964 - projet de refonte des normes du thésaurus, pour l’indexation (et la recherche)
• Composants– Concepts et relations entre concepts ; termes reliés avec des
concepts et entre eux
– Entités - attributs - relation
3 modèles - 3 finalités différentesAtelier - étudier la représentation UML d’un schéma
3.7
INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.21
Composants transversaux
• Représentation de haut niveau– Modélisation qui convient dans de nombreux contextes (A)
– Développement de schémas normalisés, réutilisables (B)
• Utilisables dans d’autres schémas ou profils
• Exemples– Jeu de métadonnées générique : Dublin Core
– Eléments de données ou groupe d’éléments de données• Identifiants normalisés• Langues, Pays,…• Microformats : hCard (vCard), hCalendar,…• Certaines balises imposées dans (X)Html : rel: «license »• Schémas de concepts
3.8
INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.22
Familles de schémas : cohérence métier
3.9
4. EN CONCLUSION
Sur le plan technique
Sur le plan des métiers
Sur le plan de la normalisation
4.
INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.24
Sur le plan technique
• Des formalismes variés– Ne facilitant pas la prise en main de schémas ou modèles
• Qu’est-ce-qu’un schéma de représentation ?– Une entité globale (le profil d’application LOM Fr)
– Ou un ensemble de composants (langue, DRM,…)
• Correspondance entre schémas– Alignement conceptuel plutôt qu’alignement technique
– Utiliser Dublin Core comme un cadre général et non comme une spécification technique
4.1
INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.25
Sur le plan des métiers
• Continuum de la conception à l’exploitation des ressources– Métadonnées à la source : « recyclage infini » des métadonnées
produites, et non (re)création
– Ne pas rester à la lisière du document
4.1
INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.26
Annexe 1 - Outil : langage graphique UML
relation
entités
attributsDraft Schema np25964
top related