librisxl treffpunkt mikromarc
TRANSCRIPT
LIBRIS XLsystem, användardesign och vår syn på metadata
Tr*ffpunkt Mikromarc 6/11 2015
Markus Sköld & Fredrik Klingwall
Agenda
• Om LIBRIS
• Arbetsmetoder
• Format
• Länkad Data
• Tillämpningar
• Lärdomar
KB:s uppdrag och syfte
Insamling och beskrivning av svenska pliktexemplar.
Ansvarar för drift och utveckling av LIBRIS.
Tjänster och system för att tillhandahålla öppen data.
LIBRIS modellen
Martin Malmsten, LIBRIS 2012
Beslut att utveckla ett eget system
LIBRIS XL
2012 – utvecklingen kom igång• Motivation
– Ökade flöden av metadata – Nya materialtyper– Lättanvänt webbgränssnitt för katalogisering
• Länkad Data• Open Source
Visionen● Ett system för att hantera allt metadata på Kungl. Biblioteket● LIBRIS som “metadatamaster”● Databrunnar
○ Söka i allting samtidigt
Hur vi ville jobba …
Agile … Scrum … UX ...
Agila metoder
• Korta iterationer
• Lär av varje iteration
• Teamet prioriterar och planerar
https://www.flickr.com/photos/davegray/6865783267
Användarcentrerad utveckling
• I nära samarbete med användare genom intervjuer, tester och workshops
• Verktyg– User stories– Personor– Scenarior– Effektkarta
• Designprinciper– Intuitivt, flexibelt, inspirerande
Utvecklingen: Första året
• Svårt att bygga modernt och intuitivt gränssnitt
• Önskemål om fler funktioner
• Fortfarande MARC21 som lagringsformat
• Otillräcklig informationsmodell
HTTP://XKCD.COM/1425/
Bearbeta länkad data direkt
“Vi står inför ett helt nytt sätt att använda och dela data, med nya datatyper och fler bibliotek som ska in i den nationella katalogen. Nya datatyper kräver nya format och framtidens kataloger bygger både på nätverk och på relationer mellan informationsmängder. “
http://librisbloggen.kb.se/2013/04/08/libris-katalogisering-betaversion-av-nytt-katalogiseringsverktyg/
To boldly go ...
Slänga ut MARC21
Lagringsmodell baserad på öppen länkad data
… into terra incognita
• Utforskande arbete vs Deadlines
• Inte bara ”byta ut Voyager”
• Paradigmskifte– Pedagogiskt arbete– Förväntanshantering
Förväntanshantering
En konstant ström av aktiviteter, projekt och datakällor
Förvaltning och samordning med existerande system
Väldigt liten koordinering mellan teknologier, standarder och applikationer/tjänster pga brist på tid, kommunikation etc.
https://www.flickr.com/photos/base2wave/85497158
Samtidigt
• Andra projekt startade
– Som skulle baseras på LIBRISXL (som inte var “klart”)
Samtidigt
• Andra projekt startade
– Som skulle baseras på LIBRISXL (som inte var “klart”)
• Och avslutades …
– Baserade på LIBRISXL (som fortfarande inte var “klart”)
Omdefinition av LIBRIS XL
En modell bestående av:● Förutsägbara API:er
○ åtkomst○ sök○ lagring
● Länkad data● Igenkännbara former på data
○ Standardvokabulär (RDF)○ Syntax (JSON-LD)
https://www.flickr.com/photos/hey__paul/7511824068
Ny utgångspunkt
1.Infrastruktur
2.Katalogiseringsgränssnitt
3.Metadatakonvertering: MARC21 ->
JSON-LD (länkad data)
https://ww
w.flickr.com
/photos/kellarwilson/19652137273
Modeller, format och beskrivningar
000 03642cam a2200865 r4500 008 890111s1989 sw a j 6 000 1 swe 100 1 _ $a Jansson, Tove, $d 1914-2001 $0 191503 245 0 0 $a Mumintrollet.n Nr 1 /$c av Tove Jansson
”Hur svårt kan det vara att beskriva en …”
Egenskaper och värden
• Varierande praxis genom åren
• Inkonsekventa beskrivningar
• Undvika tidigare begränsningar
Strings vs Things
https://flic.kr/p/8qwF8J
Länkad data i praktiken
INTERNET
Hur funkar det?
• Tilldela identifierare (URI) till ett
ting.
– http:// ….
• Gör påståenden som beskriver
tinget.
• Länka tinget till andra ting
genom påståenden.
Bild skapad av Peter Krantz 2012
Påståenden
1. Denna sak har titeln ”Hur gick det sen?”
2. Den är skriven av Tove Jansson.
3. Det är en Illustrerad Bok.
4. Den är skriven på Svenska.
Påståenden om relaterade ting
1. Tove Jansson är en person.
2. Illustrerad Bok är en typ av kreativt verk.
3. Svenska heter Swedish på engelska.
{
@id: /resource/bib/816913,
@type: [Text, Monograph],
contentType: {
@id:/def/content/ComicOrGraphicNovel
},
qualifiedTitle: {
@type: Title,
titleValue: Hur gick det sen?
},
responsibilityStatement: av Tove Jansson
attributedTo: {
@id: /resource/auth/191503},
}
language: {@id: /def/languages/swe}
}
{
@id: /def/content/ComicOrGraphicNovel,
@type: Concept,
prefLabel: Tecknad serie / Serieroman
}
{
@id: /resource/auth/191503,
@type: Person,
familyName: Jansson,
givenName: Tove,
birthYear: 1914,
deathYear: 2001
}
{
@id: /def/languages/swe,
@type: [Language, Concept],
langCode: swe,
langTag: sv,
matches: http://id.loc.gov/vocabulary/iso639-2/swe,
notation: swe,
prefLabel: Svenska,
prefLabel_en: Swedish
}
Vokabulär
”Kontrollerade samlingar av termer som syftar till att beskriva kunskap om
en viss domän.”
LOVhttp://lov.okfn.org/dataset/lov/
@prefix bf: <http://bibframe.org/vocab/> .@prefix bibo: <http://purl.org/ontology/bibo/> .@prefix dc: <http://purl.org/dc/terms/> .@prefix prov: <http://www.w3.org/ns/prov#> .@prefix sdo: <http://schema.org/> .@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .@base <http://libris.kb.se/> .
</resource/bib/7149593> a bibo:Book ; bf:language </def/languages/swe> ; bf:responsibilityStatement "Tove Jansson, Tuulikki Pietilä" ; dc:title "Anteckningar från en ö" ; prov:wasAttributedTo </resource/auth/191503> ; prov:wasInfluencedBy [ a sdo:Person ; sdo:birthDate "1917"^^xsd:gYear ; sdo:deathDate "2009"^^xsd:gYear ; sdo:familyName "Pietilä" ; sdo:givenName "Tuulikki" ] .
</resource/auth/191503> a sdo:Person ; sdo:birthDate "1914"^^xsd:gYear ; sdo:deathDate "2001"^^xsd:gYear ; sdo:familyName "Jansson" ; sdo:givenName "Tove" .
Nyttan med öppen länkad data
• Ökad återanvändning
• Dra nytta av varandras arbete
• Effektivisera insamling och
produktion
• En värld utanför bibliotekten– Arkiv, museer
– Wikipedia, Google
– OCLC worldcat
• Nytta uppstår i användandet– Schema.org kan användas
idag!
"LOD Cloud Diagram as of September 2011" by Anja Jentzsch - Own work. Licensed under CC BY-SA 3.0 via Commons -
Nya möjligheter
Möjlighet att uttrycka nya aspekter
<meta property="bookFormat" content="EBook/DAISY3"/><meta property="isFamilyFriendly" content="true"/> <meta property="accessibilityFeature” content="largePrint/CSSEnabled"/><meta property="accessibilityFeature" content="highContrast/CSSEnabled"/><meta property="accessibilityFeature" content="resizeText/CSSEnabled"/><meta property="accessibilityFeature" content="displayTransformability"/><meta property="accessibilityFeature" content="longDescription"/><meta property="accessibilityFeature" content="alternativeText"/><meta property="accessibilityControl" content="fullKeyboardControl"/><meta property="accessibilityControl" content="fullMouseControl"/><meta property="accessibilityHazard" content="noFlashingHazard"/><meta property="accessibilityAPI" content="ARIA"/>
Nya söktjänster
Cherry• Ett experiment i att hitta relaterade
titlar
• Baserat på XL-infrastruktur
• Fulltextmatchning av recensioner,
utdrag ur texten och bloggposter.
Exemplarsinformation
Automatisk gallring
• Via feed
– OAIPMH / Atom
– Lokala systemet publicerar deleteposter
• Via API
– HTTP-request
– Autentisering via OAUTH2
Kräver LIBRIS-ID (URI)
id.kb.se
Vad ska ID.KB.SE innehålla?
Auktoriteter(Termer och deras objekt: personer, grupper, händelser, möten, platser, ämnen)
Definitioner(Material, roller, språk, geografiska koncept, vokabulär etc.)
Mappingar till andra definitioner och vokabulär(DC, Schema.org, BibFrame, RDAVocab, LoC, YSO, VIAF, WorldCat, Dewey.info, MeSH,
GeoNames, Lexvo, DBPedia, EDM, CIDOC, WikiData...)
Hur får vi nytta av ID.KB.SE?
Producenter av metadata kan använda sig av rekommenderade vokabulär och
auktoriteter direkt.
KB får bättre möjligheter att koordinera våra egna tjänster och arbetsflöden kring
samlingar och kataloger.
LIBRIS kan länka till sammanhängande basdata (istället för att kopiera poster).
Genom samarbeten kan t.ex. kulturarvsinstitutioner och andra nationalbibliotek koppla
ihop sin data (ex. Riksarkivet, Europeana, Muséer, etc.)
Vad händer med MARC egentligen?
Snart 50 år gammalt
”MARC predates the earliest expression of relational data modeling concepts
by three years”.
– ”Interpreting MARC: Where’s the Bibliographic Data?” / Jason
Thomale, 2012 (http://journal.code4lib.org/articles/3832)
Primärt lagringsformat: JSON-LD
LIBRIS XL kan leverera normaliserade MARC-poster till lokala system
Lessons learned
• Varför gör vi det här?
• Skulle vi gjort något annorlunda?
• Inte fastna i detaljer
• Våga ifrågasätta normer och praxis
– Hur ska datat användas?
• MVP (Minimum Viable Product)
Framtiden
Paradigmskiftet automatiserade metadataflöden
Bryta ner med tydliga mottagare där vi skapar värde
http://librisbloggen.kb.se/2015/10/13/libris-roadmap-oktober-2015/
• Bestånd
• Auktoriteter
• Bibliografiska poster
Open Source
Följ vårt arbete på nätet:
● http://github.com/libris
● http://librisbloggen.kb.se
Tack!
[email protected]@kb.se