introductie persistente identifiers

31
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009 Persistente Identifiers Hennie Brugman Technical coordinator CATCHPlus

Upload: juliavytopil

Post on 22-Dec-2014

510 views

Category:

Technology


0 download

DESCRIPTION

Presentatie gegeven aan Rijksmuseum op 1 december door Hennie Brugman; een introductie in persistent identifiers, met daarbij keuzemogelijkheden en de in CATCHPlus gemaakte keuze.

TRANSCRIPT

Page 1: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Persistente IdentifiersHennie Brugman

Technical coordinator CATCHPlus

Page 2: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Samenvatting• Wat is eigenlijk het probleem?• De basisoplossing• Wat is er beschikbaar: voorbeelden van

persistente identifiers• Wat doet CATCHPlus?• Zelf toepassen van persistente identifiers

– Welke keuzen? Stappen? Consequenties? Kansen?

Page 3: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Probleem:

• Steeds meer digitale objecten, met steeds meer identifiers– In web context: identifier = URL

• Steeds vaker extern aangeboden (web)

Page 4: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Probleem:Steeds meer verwijzingen•Web links•Contextualisering•Samenwerkingsverbanden•Virtuele collecties en tentoonstellingen

Page 5: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Probleem:

•Identifiers zijn vaak niet uniek

Page 6: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Probleem:

•Identifiers zijn vaak niet persistent

•Verwijzingen worden makkelijk ongeldig

Page 7: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Probleem

object_1

new_object_1

http://.../object_1

Page 8: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Basisoplossing • Ontkoppel naam/identifier en locatie(s)• Registreer combinaties van identifiers met locaties

in een tabel• Externe referenties gebruiken de identifier

Page 9: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Basisoplossing

object_1

new_object_1

id1

id1 http://.../object_1

Page 10: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Basisoplossing

new_object_1

id1

id1 http://.../new_object_1

Page 11: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Resolver dienst

new_object_1id1

“wat is huidige URLvoor id1?”

“http://.../new_object_1”

GET http://.../new_object_1

web-pagina

Page 12: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Naming Authority• Naming Authority: beheerder van de inhoud van de

tabel• NA heeft ook een unieke persistente identifier• Globaal geregistreerd waar de resolver voor de NA

is te vinden.

• Veel soorten persistente identifiers hebben de basisvorm:

<unieke-id-van-NA><unieke-locale-id>

Page 13: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Naming AuthorityGlobal repository

NA1 NA2 NA3

id-van-NA adres van resolver voor NA

id-van-object adres van object

Page 14: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Global resolvingGlobal repository

NA3

id1new_object_1

Local repository Local repository

Page 15: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Voorbeelden van PID oplossingen• Er bestaan een aantal verschillende oplossingen• Binnen erfgoed in NL spelen een rol

– Gewoon URLs gebruiken– URN-NBN – Handles– DOI– ARK– PURL

Page 16: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

http URL • http://identifiers.erfgoed.nl/local_id_1821

URN-NBN • urn:nbn:nl-local_id_1821

Handles • 10574/local_id_1821 • http://hdl.handle.net/10574/local_id_1821

DOI • doi:10.1594/PANGAEA.726855 • http://dx.doi.org/10.1594/PANGAEA.726855

ARK • http://identifiers.erfgoed.nl/ark:/128014/local_id_1821

PURL • http://purl.org/vocabularies/iconclass/concept1821

Page 17: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

HOST

NA

LOCAL IDXX

X

http URL • http://identifiers.erfgoed.nl/local_id_1821

URN-NBN • urn:nbn:nl-local_id_1821

Handles • 10574/local_id_1821 • http://hdl.handle.net/10574/local_id_1821

DOI • doi:10.1594/PANGAEA.726855 • http://dx.doi.org/10.1594/PANGAEA.726855

ARK • http://identifiers.erfgoed.nl/ark:/128014/local_id_1821

PURL • http://purl.org/vocabularies/iconclass/concept1821

Page 18: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Mogelijke selectie-criteria(1)Software ondersteuning

• Goede resolving oplossing voorhanden• Die is beproefd, stabiel en 100% betrouwbaar• Schaalbaar, met betrekking tot

– Aantallen identifiers– Performance

• Werkt globaal• Ook delen van objecten te identificeren• Metadata te associëren met identifiers• “actionable”: (ook) dmv http URLs te resolven• Ook ondersteuning voor identifier-beheerfuncties

Page 19: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Mogelijke selectie-criteria (2)Identifier beheer

• Beheer van identifiers onafhankelijk van– Systeembeheer– Web server beheer– Hosting van resolverdiensten

• Beheer vanuit collectie beheer systeem mogelijk– B.v. door verantwoordelijke collectiebeheerder

• Beheer is eenvoudig en efficient

Page 20: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Mogelijke selectie-criteria (3)Organisatie en beleid

• Welke keuzes maken partner-instellingen?• Betrouwbaarheid en duurzaamheid van de

dienstverleners• Beperkte en beheersbare kosten• Vrijheid om te switchen van dienstverlener

Page 21: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Wat doet CATCHPlus?1. Technisch

1. Local Handle System(s)

2. REST web service voor resolving en PID beheer

3. Web-prototype voor PID-beheer functionaliteit

4. Toepassen in enkele pilot-projecten

2. Organisatie en beleid

1. Duurzame hosting en dienstverlening

2. Informatie verstrekken

3. “tussenpersoon”

1. Tussen erfgoedinstellingen en –projecten

2. CATCH/CATCHPlus en andere NL en EU PID initiatieven

4. Streven naar bundeling van erfgoedbelangen

Page 22: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Wat doet CATCHPlus?1. Technisch

1. Local Handle Systems

2. REST web service voor resolving en PID beheer

3. Web-prototype voor PID-beheer functionaliteit

4. Toepassen in enkele pilot-projecten

2. Organisatie en beleid1. Duurzame hosting en dienstverlening

2. Informeren

3. Tussenpersoon

4. Streven naar bundeling van erfgoedbelangen

• Voldoet als enige aan alle criteria mbt software ondersteuning

• Eerste pilot (B en G): prefix voor NA aangevraagd en Local Handle System geïnstalleerd bij/door SARA

• Kosten: 50 dollar, plus 50 dollar per jaar

Page 23: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Wat doet CATCHPlus?1. Technisch

1. Local Handle Systems

2. REST web service voor resolving en PID beheer

3. Web-prototype voor PID-beheer user interface4. Toepassen in enkele pilot-projecten

2. Organisatie en beleid1. Duurzame hosting en dienstverlening

2. Informeren

3. Tussenpersoon

4. Streven naar bundeling van erfgoedbelangen

Web service• Resolving, aanmaken en beheer van Handles• SARA bouwt eerste versie in opdracht van CATCHPlus

User interface• Prototype tbv evaluatie door collectie-beheerders• Implementatie door bedrijfsleven

Page 24: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Wat doet CATCHPlus?

1. Technisch1. Local Handle Systems2. REST web service voor resolving en PID beheer3. Web-prototype voor PID-beheer functionaliteit

4. Toepassen in enkele pilot-projecten2. Organisatie en beleid

1. Duurzame hosting en dienstverlening2. Streven naar bundeling van erfgoedbelangen3. Informeren4. Tussenpersoon

Toekennen van persistente identifiers aan:

• Concepten in de Vocabulary Repository

• Deelcollectie van Beeld en Geluid

Interesse vanuit diverse andere erfgoedinstellingen en -projecten

Page 25: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Wat doet CATCHPlus?

1. Technisch1. Local Handle Systems2. REST web service voor resolving en PID beheer3. Web-prototype voor PID-beheer functionaliteit4. Toepassen in enkele pilot-projecten

2. Organisatie en beleid1. Duurzame hosting en dienstverlening2. Streven naar bundeling van erfgoedbelangen3. Informeren4. Tussenpersoon

EPIC (European Persistent Identifier Consortium)

• SARA (NL), CSC (Finland), GWDG (DLD), …

• (intentie tot aanbieden van) redundante en betrouwbare PID diensten tbv wetenschap en erfgoed

• Op basis van Handles

• Stakeholders kunnen deelnemen aan bestuur en o.m. meebeslissen over business model

• Europese mirror van de z.g. Global Handle Repository

Page 26: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Toepassen van persistente identifiers• Keuzen?• Stappen?• Consequenties?• Kansen?

Page 27: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Keuzen• Welke objecten krijgen een persistente identifier toegekend?

(versies, samenstellingen, verschillende formaten, ...)

• Wat is de relatie van die identifier met mogelijk al bestaande identifiers?

• Wat is het formaat van de aan te maken PIDs? (CoolURI?)

• Naar welke “landingspagina” wordt de PID geresolved? Welke informatie hoort daar wel en niet op?

• Verantwoordelijkheden voor creatie en beheer• Welke garanties mbt persistentie kunnen gegeven worden,

en hoe kan dat worden waargemaakt?• Oplossing voor hosting en dienstverlening

Page 28: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Stappen• Voor bestaande objecten

– Beleidskeuzen maken

– Bepaal URLs voor “landingspagina’s”

– Maak en publiceer PIDs

– Sla die PIDs locaal op, geassocieerd met/in plaats van intern object id

– Vervang referenties op basis van interne id’s door referenties op basis van PIDs

• Voor nieuwe objecten en collectiebeheer

– Integreer PID-creatie en -beheer in collectiebeheer-workflows en –tools

Page 29: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Consequenties

• Externe beschikbaarheid data en diensten afhankelijk van één cruciale dienst (mag dus geen ‘single point of failure’ zijn!)

• Identifier management wordt een expliciete taak• Commitment mbt persistentie moet worden waargemaakt• Tool-support voor PID management moet worden geregeld

(anders te arbeidsintensief en foutgevoelig)• Intern (re-)organiseren van data wordt eenvoudiger• Aanbieden digitale collectie aan derden wordt eenvoudiger,

consistenter en duurzamer (zeker i.c.m OAI)

Page 30: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Kansen• Mede vormgeven aan PID dienstverlening en de

voorwaarden waaronder dat gebeurt• Voortrekkersrol mbt publiceren museale collecties

op internet• Samenwerking met andere erfgoedinstellingen

– Minder eilandjes– Betere gezamenlijke belangenbehartiging– Kennis delen

Page 31: Introductie Persistente Identifiers

Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009

Vragen?