metadatamodeller før og nå
DESCRIPTION
TRANSCRIPT
Metadatamodeller før og nå
November 2011Ole Husby
Dette er en presentasjon som er laget for et internt seminar om Linked data ved seksjon for fellestjenester ved NTNU UB den 3. november 2011. Utenfor denne konteksten kan den sikkert virke forvirrende her og der. Utvalget av tema og eksempler er sterkt preget av min bakgrunn fra BIBSYS, og er ikke nødvendigvis representativ for utviklingen.
Hovedtemaene er metadata og lenking, og hensikten er å lage en bakgrunn for metadatamodellering innen bibliotekene som har gått forut for dagens situasjon, da til og med Library of Congress publiserer planer om å skifte ut MARC med et rammeverk av linked data basert på RDF.
Linked data er svært overfladisk omtalt her, da dette er tema for egne innlegg i seminaret.
2011-11-03 [email protected]
This article may be too technical for most readers to understand. Please help improve this article to make it understandable to non-experts, without removing the technical details. The talk page may contain suggestions. (September 2010)
(Sitat fra http://en.wikipedia.org/wiki/MARC_standards)
En MARC-post
(PS: iso2709 koster CHF 58)
01041cam 2200265 a 450000100200000000300040002000 50017000240080041000410100024000820200025001060200 04400131040001800175050002400193082001800217100003 20023524500870026724600360035425000120039026000370 04023000029004395000042004685200220005106500033007 30650001200763^###89048230#/AC/r91^DLC^19911106082 810.9^891101s1990####maua###j######000#0#eng##^##$ a###89048230#/AC/r91^##$a0316107514 :$c$12.95^##$a 0316107506 (pbk.) :$c$5.95 ($6.95 Can.)^##$aDLC$cD LC$dDLC^00$aGV943.25$b.B74 1990^00$a796.334/2$220^ 10$aBrenner, Richard J.,$d1941-^10$aMake the team. $pSoccer :$ba heads up guide to super soccer! /$cR ichard J. Brenner.^30$aHeads up guide to super soc cer.^##$a1st ed.^##$aBoston :$bLittle, Brown,$cc19 90.^##$a127 p. :$bill. ;$c19 cm.^##$a"A Sports ill ustrated for kids book."^##$aInstructions for impr oving soccer skills. Discusses dribbling, heading, playmaking, defense, conditioning, mental attitude ,how to handle problems with coaches, parents, and other players, and the history of soccer.^#0$aSocc er$vJuvenile literature.^#1$aSoccer.^\
1973: BIBSYS Informasjonsanalyse
1976: UNITMARC
Tidlig navn på BIBSYS-MARC. Noe frigjort fra LCMARC og NORMARC
Nokså sterkt inspirert av LIBRIS-MARC, spesielt lenkefelter og sorteringsfelter
1976: BIBSYS I Datamodell
Hoveddokid er manifestasjon og eksemplar
Bidokid er eksemplar + klass
Klassifikasjonen er ikke biblioteksspesifikk men eksemplarspesifikk
[ Fra "Felles katalogisering" av Ole Husby, DATALIB -80 i Trondheim]
1980: BIBSYS-MARC
NORMARC og BIBSYSMARC forlater tegnsettinga i USMARC
BIBSYS mer online-orientert
- innfører alfabetiseringsfelt istf nonfiling chars
- innfører delfelt istf kontrollfelter
- forlater indikatorer
BIBSYS innfører autoritetsposter (henvisningsposter)
1980: Behov for lenking
Eksemplarlenking (021)
Flerbindverk (022/023)
Serier (022/023)
Analytter (seinere)
Musikkspor (seinere)
Men hvilke andre relasjoner glemte vi å lage lenker for?
021
Lenker eksemplarer til manifestasjoner
Konseptuelt forvirrende å ha dette som en del av MARC-formatet
MARC er "egentlig" et manifestasjonsformat
Felles vs lokale data
Lokale behov for særskilte bibliografiske elementer, eller særskilte regler
Lokale emnefelterLokale koder for behandling (bibliografier, kataloger)
I BIBSYS I på dokidnivåI BIBSYS II på bibkodenivå (indikator)
1980: Hierarkisk lenking
For flerbindsverk og serierLenking på flere nivå
Starten på en utvikling som vanskeliggjør utveksling mellom BIBSYS og andre.
022 / 023-lenker
Objektlenker og dokidlenkerNoe redundans i modellenKonseptuelt forvirrende å ha dette som en del av MARC-formatet
Hierarkisk lenking mellom dokid
[ Fra "Hierarchical linking in BIBSYS" av Ole Husby, ELAG 1981 i Essen]
1986: BIBSYS II datamodell
Nei til normaliseringModellering på de to nederste FRBR-nivåene (OBJEKTID og DOKID)Ny og bedre lenkestruktur, men fortsatt for mye MARC-inspirert491 for serierhefte/serie for flerbindsverk
MARC valgt ikke fordi det isolert er verdens beste metadataformat, men fordi ingen stilte noe spørsmål om riktighetenav hensyn til samvirke med alle andre system i verden
ER-modellen ble brukt ved BIBSYS II datamodellOBS: Skille mellom en konseptuell modell, logisk modell og fysisk modell
1992: WWW
Lenking blir omtrent hovedrolleinnehaver i hypertekst
Merk at hypertekst er eldre enn www (Ted Nelson & Xanadu)www-lenking mellom “dokumenter”Lenkene er enveis og går til URIerMerk identifikatorenes rolle i lenkingen
Noe av det mest geniale i www er egentlig den selvgående strukturen på URIs sammen med DNS
Merk forskjellen på en identifikator og en lokator
1994: Metadata > Dublin Core
“Metadata is structured data which describes the characteristics of a resource” (Chris Taylor)
1995: Dublin Core (OCLC+NCSA) National Center for Supercomputing Applications
Et forsøk på å etablere et felles format for nettdokumenter med formålet “to improve resource discovery on the net”
DC er i utgangspunktet et abstrakt format med 15 elementer, og etter hvert kvalifikatorer
Dublin Core er i større grad enn MARC utstyrt med semantikk som gjør supplerende katalogiseringsregler overflødig
Dublin Core elements
1. Title2. Creator3. Subject4. Description5. Publisher6. Contributor7. Date8. Type9. Format10.Identifier11.Source12.Language13.Relation14.Coverage15.Rights
1997: IFLA FRBR
FRBR
FRBR er en konseptuell modell som har hatt stor positiv innvirkning på vår forståelse av bibliografiske begreper. Også til en viss grad implementert, bl.a. i Worldcat.
Modellen har en del svakheter. Den er også vrien å implementere f.eks. når det gjelder expressions.
Merk: Tittel er attributt til et verk, mens Forfatter er en annen entitet, som har relasjon til verket
Seinere har vi fått FRAD oa
Normalisering og redundans
Hvor mange endringer må gjøres hvis man finner ut at Ibsen egentlig het Ipsen?
Hvor mange endringer må gjøres hvis Ole Husby skifter telefonnummer?
1999: SFX & OpenURL
Dette dreier seg også om lenking og metadata, via OpenURL
Prinsippet er just in time istf just in case. Eller sagt med andre ord: Appropriate linking
1999: RDF
Publisert av W3C i 1999:
Abstrakt datamodell og XML-syntaksSyntaks kalles ofte for serialisering
RDF-trippel = Subjekt + Predikat + Objekt
RDF<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:db="http://dbpedia.org/resource/"> <rdf:Description rdf:about="http://dbpedia.org/resource/Massachusetts"> <db:Governor> <rdf:Description rdf:about="http://dbpedia.org/resource/Deval_Patrick" /> </db:Governor> <db:Nickname>Bay State</db:Nickname> <db:Capital> <rdf:Description rdf:about="http://dbpedia.org/resource/Boston"> <db:Nickname>Beantown</db:Nickname> </rdf:Description> </db:Capital> </rdf:Description></rdf:RDF>
RDF / MARC<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:db="http://dbpedia.org/resource/"> <rdf:Description rdf:about="http://dbpedia.org/resource/Massachusetts"> <db:Governor> <rdf:Description rdf:about="http://dbpedia.org/resource/Deval_Patrick" /> </db:Governor> <db:Nickname>Bay State</db:Nickname> <db:Capital> <rdf:Description rdf:about="http://dbpedia.org/resource/Boston"> <db:Nickname>Beantown</db:Nickname> </rdf:Description> </db:Capital> </rdf:Description></rdf:RDF>
LDR*****crm##22*****#a#4500008870119q18601869xxunnn############rn####d040##$a[organization code]$c[organization code]043##$an-us---045##$aw6w605014$aE468.9$b.C324500$a[Cannon ball]$h[realia].260##$c[186-]$e(United States :$f[s.n.])300##$a1 cannon ball :$blead, gray ;$c10 cm. in diam.500##$aTitle supplied by cataloger.520##$a"12-pounder" cannon ball used in the Civil War.650#0$aOrdnance.651#0$aUnited States$xHistory$yCivil War, 1861-1865.
2004: Web 2.0
Navnet tok av etter O'Reilly Media Web 2.0 conference i 2004
Medfører deltaking, deling, samarbeid, sosiale media, mashups
Ikke spesielt interessant fra datamodellering/metadata, bortsett fra delingstanken og ønske om åpen tilgjengelighet
Sammenfaller med cloud computing, som vel ikke egentlig er en del av web 2.0
UBiT 2010-prosjektet, blogging, sosiale media, wiki
2005: Semantisk web
Introdusert av Tim Berners-LeeKalles av og til web of data eller web 3.0
2006: Linked data
Lansert av TimBL
En del av den semantiske weben
200x: Hvem kjører løpet?
ny tenkemåte: medvirkning: the Participatory web
de store (ISO ol) mister grepet
fordi 2.0?
• troen på en felles verdensomspennede standard blekner• flere standarder• er redundans et positivt eller negativt ord?
Linked open data
LOD = Linked data + åpen lisens
[ Fra "Linking resources" av Ole Husby, ELAG 2001 i Praha ]