prepare your metadata - introductie
Post on 16-Jun-2015
131 Views
Preview:
DESCRIPTION
TRANSCRIPT
OVER DOMEINEN & IDENTIFIERS
Henk Vanstappen
PACKED vzw PYM workshop 2014-06-18
1. REALITY IS MESSY reality is messy
Carl Lagoze, 2001
Pieter Brueghel de Oude Pieter Brueghel I Pieter Bruegel, 1525-ca 1569 Bruegel, Pieter, 1525?-1569 Bruegel, Pieter de Oudere Bruegel, Pieter, l'ancien Bruegel, Pieter, d.ä. Brueghel, Pieter, o Velho Брейгель, Питер, ок.
האב, פיטר, לBrueghel, Pieter the Elder, 1528-1569 Breughel, Pieter, the Elder
PARIS
KLEED
KLEED
Mona Lisa Monna Lisa La Joconde La Gioconda Portrait de Mona Lisa,
(1479-1528); dite La Joconde
Inv . nr. 799 Gian Giacomo Caprotti
Mona Lisa Monna Lisa La Joconde La Gioconda Portrait de Mona Lisa,
(1479-1528); dite La Joconde
Inv . nr. 799 Gian Giacomo Caprotti LHOOQ
Interbellum 1918-1940 11 november 1918 - 1 september 1939 November 11th, 1918 to September 1st, 1939 ca. 1920 – ca. 1935
HET PROBLEEM
Resources niet uniek te identificeren Resources niet vindbaar Resources niet uitwisselbaar Extra metadata noodzakelijk
OPLOSSING#1: LIJSTJES lijsten afspraken maar: veel werk maar: probleme uitwisselbaarheid blijft
OPLOSSING#2: AUTHORITIES
OPLOSSING#3: ON LINE AUTHORITIES
OPLOSSING#4: LINKED OPEN DATA Machineleesbaar Persistent Uniek: domein+identifier
EXTERNE BRON (AUTHORITY)
• binnen een bepaald domein • unieke identificatie van resource • eventueel verrijkt met bijkomende
gegevens • te bevragen via http-protocol • syntax:
namespace (domein) + identifier
DOMEINEN & IDENTIFIERS
domein identifier Jansens Jan ISBN 978 0 5862 0747 5 HTML <a> EAD <name> AAT 300033618 Wordnet painting
DOMEINEN & IDENTIFIERS
namespace identifier viaf.org 95761864 wikipedia.org Pieter_Bruegel_the_Elder dbpedia.org Pieter_Bruegel_the_Elder geonames.org 2800867
PERSISTENTE URLS
base url identifier http://viaf.org/viaf/ 95761864/ http://wikipedia.org/ Pieter_Bruegel_the_Elder/ http://dbpedia.org/page/
Pieter_Bruegel_the_Elder/
http://geonames.org/ 2800867/
KWALITEITSEISEN URI (SYNTAX)
• Persistent en uniek • Enkel letters, cijfers, underscore, hyphen • Logische, eenvoudige opbouw • Human readable • Systeemonafhankelijk (geen query strings)
KWALITEITSEISEN URI (SYNTAX) Wel: http://collectie.museum.org/data/12345 http://museum.org/collectie/data/12345 http://museum.org/collectie/12345/data Niet: http://europeana.eu/portal/record/15503/E627F23EF13FA8E6584AF8706A95DB85908413BE.html http://www.culture.gouv.fr/public/mistral/joconde_fr?ACTION=CHERCHER&FIELD_1=REF&VALUE_1=000PE025604
KWALITEITSEISEN EXTERNE BRON
Inhoud • scope • volledigheid • correct • toegevoegde data (rijkdom) • koppeling met andere authorities
KWALITEITSEISEN EXTERNE BRON
Beheer • persistente bron • open licentie • uitbreidbaar Toegang • machineleesbaar (xml, json) • GUI (html) • API (OpenSearch, SRU, …)
VOORBEELD: VIAF Links: http://viaf.org/ http://viaf.org/viaf/95761864/ http://viaf.org/viaf/95761864/rdf.xml http://viaf.org/viaf/95761864/viaf.xml http://viaf.org/viaf/95761864/marc21.xml http://viaf.org/viaf/95761864/justlinks.json Queries: http://viaf.org/viaf/search?query=cql.any+%3D+”Brueghel, Pieter”&httpAccept=application/rss%2bxml
AGENDA Intro (Henk) Wat & hoe (Alina) • Welke bronnen zijn geschikt? • Persistente URI creëren Oefening: normaliseer en verrijk 10 objecten {pauze} Demo’s: • Data cleanen met Open Refine (Alina) • Systemen aanpassen: Adlib en CA (Jeroen & Joris) • Proof of the pudding: verrijkte collectiecatalogus (Bert)
AGENDA Intro (Henk) Wat & hoe (Alina) • Welke bronnen • Persistente URI Oefening: normaliseer en verrijk 10 objecten {pauze} Demo’s: • Data cleanen met Open Refine (Alina) • Systemen aanpassen: Adlib en CA (Jeroen & Joris) • Proof of the pudding: verrijkte collectiecatalogus (Bert)
OEFENING 1. Download CSV file bit.do/pyd 2. Beschrijf werken in CSV file 3. Selecteer relevante domeinen en voeg waar
mogelijk PURLs toe voor namen, concepten, locaties en agents
4. creeer een PID voor de werken 5. creeer een PID voor de beschrijvingen (data)
top related