openmelodie adonis
DESCRIPTION
TRANSCRIPT
mise en ligne d’objets et d’images électroniques
Plan
• Problème posé• Structuration des données• Solution Open melodie• Processus d’indexation• Publication• Bilan
26/03/2010 – José Paumard – [email protected]
Problématique – 1
« Enregistrer ses données »• Expert SHS non informaticien• Souhaite mettre des données en ligne• Souhaite avoir le contrôle de ses données et de
leur structure– Il décide du format de la fiche d’indexation– Il décide de la façon dont les mettre en relation
• Il décide de leur publication
26/03/2010 – José Paumard – [email protected]
Problématique – 2
« Travailler en ligne »• Accessible via les navigateurs standard– Partie « auteur »– Partie consultation
• Intérêts supplémentaires : – Pas de logiciel spécial sur le poste client– Accessible de « partout »– Centralisation de l’administration (mises à jour,
backups, archivage pérenne)
26/03/2010 – José Paumard – [email protected]
Plan
• Problème posé• Structuration des données• Solution Open melodie• Processus d’indexation• Publication• Bilan
26/03/2010 – José Paumard – [email protected]
Étude de cas
• Trois corpus différents à mettre en ligne
Monnaies PersesPRN caractères
Registration no. caractères
BMC no. caractères
Metal caractères
Denomination caractères
Weight nombre
Iconography caractères
Bibliography caractères
Monnaies de LyciePRN caractères
Registration no. caractères
BMC no. caractères
Metal caractères
Denomination caractères
Weight nombre
Iconography caractères
Bibliography caractères
Sceaux CollonNom caractères
Titre caractères
Lieu de conservation caractères
Source des informations caractères
Numéro d’inventaire caractères
Type d’objet caractères
Type de sceau caractères
Matériau caractères
26/03/2010 – José Paumard – [email protected]
Enregistrer des données – 1
• Structurer des données comme on le souhaite– Problème d’adaptation 1 :
• Les bases SHS ont besoin de numéros d’inventaire, de mots-clés iconographiques, de matériaux, de lieux de conservation, etc…
• Les BD gèrent des nombres, des chaînes de caractères⇒Les types de données ne correspondent pas
26/03/2010 – José Paumard – [email protected]
Enregistrer des données – 2
• Structurer des données comme on le souhaite– Problème d’adaptation 2 :
• Dans une base SHS des objets de même nature peuvent être rangés dans des corpus différents– Plusieurs corpus de monnaies, de sceaux– Dans un même corpus : mélange de sceaux et de
monnaies• Les BD rangent les données de mêmes natures dans les
mêmes tables⇒La notion de table et de corpus correspondent mal
26/03/2010 – José Paumard – [email protected]
Enregistrer des données – 3
• Structurer des données comme on le souhaite– Problème d’adaptation 3 :
• Dans une base SHS des objets de même nature rangés dans des corpus différents n’ont pas les mêmes champs
• Dans une table en BD, tous les enregistrements ont les mêmes champs
⇒La notion de table et de corpus correspondent mal (bis)
26/03/2010 – José Paumard – [email protected]
Enregistrer des données – 4
• Structurer des données comme on le souhaite– Solution envisagée : adapter l’indexation des données
de sorte que des données de mêmes natures ont toujours la même indexation
⇒Problème « insurmontable »• Mettre d’accord des experts entre eux• Qui refait les indexations existantes ?
26/03/2010 – José Paumard – [email protected]
Requêtes – 1
• Requête classique : – R1 : trouver l’objet dont le numéro d’inventaire est
CGR 1234
Monnaies PersesPRN caractèresRegistration no. caractèresBMC no. caractèresMetal caractèresDenomination caractèresWeight nombreIconography caractèresBibliography caractères
Monnaies de LyciePRN caractèresRegistration no. caractèresBMC no. caractèresMetal caractèresDenomination caractèresWeight nombreIconography caractèresBibliography caractères
Sceaux CollonNom caractèresTitre caractèresLieu de cons. caractèresSource des infos caractèresNum. inv. caractèresType d’objet caractèresType de sceau caractèresMatériau caractères
Requête – 2
• « tous les objets » une requête par table⇒– Le nombre de requêtes augmente avec le nombre de
corpus
• Configuration de métadonnées sur les tables– Reconfiguration à chaque ajout de corpus– Nécessité de déclarer les champs sur lesquels vont
opérer les requêtes
• Problème de « passage à l’échelle »
26/03/2010 – José Paumard – [email protected]
Plan
• Problème posé• Structuration des données• Solution Open melodie• Processus d’indexation• Publication• Bilan
26/03/2010 – José Paumard – [email protected]
Solution Open melodie – 1
• On oublie qu’un corpus est une table– Donc on oublie qu’un objet « appartient » à une table
• Solutionne le problème du moteur de recherche– Pas de métadonnées à enregistrer– Une seule requête quel que soit le nombre de corpus
26/03/2010 – José Paumard – [email protected]
Solution Open melodie – 2
De quoi a-t-on besoin ?1) D’un typage « fort » des données– Un type « fort » = numéro d’inventaire
2) De créer des corpus possédant des champs– Création dynamique, enregistrement en base
3) D’un moteur de recherche qui sache : « trouver l’objet dont le numéro d’inventaire est 123 »« trouver tous les objets qui se trouvent au Louvre »
26/03/2010 – José Paumard – [email protected]
Typage fort
• On définit la notion de « type de champ »– Un type de champ représente la nature d’un champ
d’un corpus– Un champ doit être associé à un type de champ– Un même type peut être associé à plusieurs champs,
dans un même corpus, ou dans des corpus différents– Un type de champ est une entité Open melodie, il est
créé dynamiquement et enregistré en base
26/03/2010 – José Paumard – [email protected]
Monnaies PersesPRN caractèresRegistration no. caractèresBMC no. caractèresMetal caractèresDenomination caractèresWeight nombreIconography caractèresBibliography caractères
Type de champ - exemple
• Corpus dans une BD classique
champ
nom du champ type SQL
26/03/2010 – José Paumard – [email protected]
Monnaies PersesPRN Numéro d’inventaire caractèresRegistration no. Numéro d’inventaire caractèresBMC no. Numéro d’inventaire caractèresMetal Liste d’autorité : matériau caractèresDenomination Liste d’autorité : dénomination caractèresWeight Masse nombreIconography Liste de mots-clés icono caractèresBibliography Bibliographie caractères
Type de champ - exemple
• Corpus Open melodie
champ
nom du champ type du champ
26/03/2010 – José Paumard – [email protected]
Fonction des types de champs
• Identification des champs de même nature
Monnaies PersesPRN caractères
Registration no. caractères
BMC no. caractères
Metal caractères
Denomination caractères
Weight nombre
Iconography caractères
Bibliography caractères
Monnaies de LyciePRN caractères
Registration no. caractères
BMC no. caractères
Metal caractères
Denomination caractères
Weight nombre
Iconography caractères
Bibliography caractères
Sceaux CollonNom caractères
Titre caractères
Lieu de conservation caractères
Source des informations caractères
Numéro d’inventaire caractères
Type d’objet caractères
Type de sceau caractères
Matériau caractères
Nature du champ : Numéro d’inventaire
26/03/2010 – José Paumard – [email protected]
Solution Open melodie – 2
• Bilan :– Corpus : définit un format d’indexation
• Un corpus est associé à une liste de champs• Dans la pratique un corpus est un ensemble d’objets qui
partagent le même format d’indexation
– Champ : élément d’un corpus• Possède un type de champ
– Type de champ : définit la nature d’un champ– Objet : représente un objet du monde réel
• Un objet appartient à un corpus, possède une indexation
26/03/2010 – José Paumard – [email protected]
Solution Open melodie – 3
• Quelques règles :– Un objet peut appartenir à plusieurs corpus– Un type de champ peut être associé à autant de
champs que l’on veut, y compris dans un même corpus
– Indexation : action de renseigner les champs d’un objet pour un corpus donné
26/03/2010 – José Paumard – [email protected]
Solution Open melodie – 4
Notion d’ensemble• Corpus = structuration des objets au sens de
l’indexation• Ensemble = structuration des objets au sens de
la consultation– Nouvelle notion– Supporte les sous-ensembles– Permet de ranger des objets indépendamment des
corpus
26/03/2010 – José Paumard – [email protected]
Plan
• Problème posé• Structuration des données• Solution Open melodie• Processus d’indexation• Publication• Bilan
26/03/2010 – José Paumard – [email protected]
Processus d’indexation
• Open melodie offre trois façons d’indexer des objets– Indexation dans des grilles– Indexation dans des formulaires complets– Indexation par import massif de tableaux Excel
(cf démo)
26/03/2010 – José Paumard – [email protected]
Processus d’indexation – 1
• Indexation : processus Open melodie
26/03/2010 – José Paumard – [email protected]
Processus d’indexation – 2
• Adapté au travail à plusieurs indexeurs
26/03/2010 – José Paumard – [email protected]
Travail à plusieurs mains – 1
1) Isoler les données qui ne sont pas dans le même projet
2) Au sein d’un même projet, empêcher les fausses manipulations
3) Besoin d’un système de sécuritéAdministrateur, jeu de droits en lecture / écriture
26/03/2010 – José Paumard – [email protected]
Travail à plusieurs mains – 2
• Un projet est une « archive »– Les données d’une archive sont isolées des autres
archives– Une archive a un / des administrateurs
• Toute entité Open melodie doit vivre dans une archive– Rien ne vit à l’extérieur d’une archive– Cas des objets, corpus, champs, types de champs,
ensembles, etc…
26/03/2010 – José Paumard – [email protected]
Travail à plusieurs mains – 3
• À l’intérieur d’une archive : droits sur des entités– Statut publique / protégé / privé des entités– Type de droits : lecture / modification / effacement– Appliqués aux entités d’Open melodie, chaque entité
possède une étiquette de sécurité
• On peut regrouper les droits en « profils », et attribuer les profils à des utilisateurs
• À chaque opération sur une entité, Open melodie vérifie les droits– Contrôle au niveau IHM et à « bas niveau »
26/03/2010 – José Paumard – [email protected]
Processus de travail
• Objectif : la productivité– Optimiser le temps que l’on met à indexer les objets
• Processus complet pour toute indexation– Ergonomie optimisée pour limiter le nombre d’actions
• Trois processus d’indexations : – import massif– indexation dans des grilles– indexation par formulaire
26/03/2010 – José Paumard – [email protected]
Plan
• Problème posé• Structuration des données• Solution Open melodie• Processus d’indexation• Publication• Bilan
26/03/2010 – José Paumard – [email protected]
Publication
• Publication des données validées via des connecteurs XML– Connecteurs ad hoc pour publication dans des IHM
propres– Connecteurs OAI – PMH– Connecteurs SPARQL
26/03/2010 – José Paumard – [email protected]
Organisation générale
IHM d’administrationOpen melodie Base Open melodie
IHM de consultation MAVI
IHM de consultation FANA
Connecteur XML
Plan
• Problème posé• Structuration des données• Solution Open melodie• Processus d’indexation• Publication• Bilan
26/03/2010 – José Paumard – [email protected]
Conclusion : intérêt financier
• Mise en ligne classique
Projet ad hocDéveloppement d’une base de donnéesDéveloppement d’outils d’administrationDéveloppement de l’IHM de consultationDéveloppement OAI – PMHMigration des anciennes données
Entretien d’une application ad hoc sur un serveur mutualiséMaintenance corrective limitée dans le tempsPas de maintenance évolutive
26/03/2010 – José Paumard – [email protected]
Conclusion : intérêt financier
• Mise en ligne classique vs Open melodie
Projet ad hocDéveloppement d’une base de donnéesDéveloppement d’outils d’administrationDéveloppement de l’IHM de consultationDéveloppement OAI – PMHMigration des anciennes données
Entretien d’une application ad hoc sur un serveur mutualiséMaintenance corrective limitée dans le tempsPas de maintenance évolutive
Avec Open melodie--Développement de l’IHM de consultation--
Entretien d’une application mutualisée sur un serveur mutualiséMaintenance corrective Open melodieMaintenance évolutive Open melodieCommunauté d’utilisateurs
26/03/2010 – José Paumard – [email protected]
Bilan
• Plateforme logicielle en ligne• Support de projets différents dans la même
instance• Enregistrer des données structurées• Autoriser le travail à plusieurs mains• Proposer des processus de travail• Publier les données validées suivant les
standards en cours
26/03/2010 – José Paumard – [email protected]
Exploitation
• En ligne depuis 11/2009– Environ 10 indexeurs enregistrés– Plusieurs centaines d’objets créés, plusieurs milliers
de champs indexés– 4 versions de patches
• Documentation en ligne• Notice d’installation en ligne
26/03/2010 – José Paumard – [email protected]
Liens
• Blog :
http://openmelodie.blogspot.com/
• Téléchargement :
http://sourceforge.net/projects/openmelodie/
• Bêta-test :
http://www.achemenet.com/openmelodie-beta/
26/03/2010 – José Paumard – [email protected]