bibliotheken und linked open data - erfahrungen und ideen aus der ub mannheim
DESCRIPTION
Invited Talk an der Staatsbibliothek zu Berlin - Preussischer Kulturbesitz 30. Juni 2011TRANSCRIPT
Bibliotheken und Linked Open Data –Erfahrungen und Ideen aus der UB Mannheim
Invited Talk an der Staatsbibliothek zu Berlin – Preußischer Kulturbesitz
30. Juni 2011
Kai EckertUniversitätsbibliothek Mannheim
NEU!Jetzt mit nochweniger Technik!
Übersicht
1. Lokales: Was machen wir in Mannheim und warum eigentlich?
2. Rechtliches: Wie offen ist Open Data , wer darf was und mit welchen Lizenzen?
3. Technisches: Wie verknüpft man Daten? Und warum wollen alle „Linked Data“?
4. Historisches: Historie und Linked Open Data Projekte in Deutschland
LOD an der UB Mannheim
• Juli 2010: Start des Linked Data Dienstes unter http://data.bib.uni-mannheim.de.
– Titeldaten von SWB und HeBIS, hauptsächlich unter Verwendung von Dblin Core (22 Millionen)
– Verknüpfungen zwischen Titeln des gleichen Werkes (ubma:equalsForClassification)
– Rudimentäre Umsetzung der RVK– Links zu DNB und FU Berlin
• März 2011: Freigabe des eigenen Katalogs (CC0).
Warum denn Linked Data?
• Technisch: Weil wir es wollen (und können)!– Begeisterung der beteiligten Personen für das
Semantic Web.– Entsprechender technischer Hintergrund.– „Ernsthafte“ Visionen:
• Erleichterung der Entwicklung neuer Anwendungen,• bessere/leichtere Integration mit Webdiensten (Tagging,
Wikipedia, …),• Ideale Plattform, um Projektergebnisse (wie die
Verknüpfung von Titeldaten oder Ergebnisse einer automatischen Erschließung) zur Verfügung zu stellen (Linked Open Projects).
Ja aber… warum freigeben?
• Rechtlich : Warum nicht?
– Freigabe von Daten ist kein großer Aufwand.
– Beim BSZ: gar kein Aufwand!
– Gibt es Gegenargumente?• Geschäftsmodell? Was, wenn ich dann Pleite gehe?
• Angst? Was, wenn jemand meine Fehler sieht?
• Neid? Was, wenn jemand damit Geld verdient?
• Rechtliche Bedenken? Was, wenn ich das gar nicht darf?
– Kein Grund, der dagegen spricht.
Aber…
… viele Gründe, die dafür sprechen…
Open Data
Open Bibliographic Data
Offene bibliographische Daten sind:
• “Offen”, d.h. die Daten können frei genutzt, wiederverwendet und weiterverbreitet werden, allenfalls unter der Einschränkung, dass der Urheber genannt werden muss (attribution) und veränderte Daten unter gleicher Lizenz veröffentlicht werden (sharealike).
• Daten oder Metadaten, die im Bibliotheksumfeld erzeugt werden, insbesondere Daten zur Erschließung und Katalogisierung.
http://www.opendefinition.org/bibliographic/
Wie gibt man Daten frei?
1. Rechtliche Voraussetzungenklären.
2. Daten von Drittanbieternidentifizieren.
3. Lizenzen und Verträgeprüfen.
4. Daten ggf. bereinigen.5. Daten unter Hinweis auf die gew ünschte
Lizenz zur Verfügung stellen (Download).6. Datenformat angeben, ggf. dokumentieren.
Welche Lizenz?
Das Urheberrecht kann „hinderlich“ sein im digitalen Zeitalter:
„Alle Rechte vorbehalten”
Einschränkungen des Urheberrechts
• Uneinheitlich, z.B.:– Persönlicher Gebrauch– (Nicht-kommerzieller Einsatz in der) Forschung,
Lehre– Zitate– Vervielfältigung teilweise gestattet und über
Verwertungsgesellschaften ausgeglichen (Kopien, Aufzeichnungen, …)
– Kritiken, Kommentare, Parodien– Nachrichten
Digitale Werke im Internet
• Urheber wollen eigentlich eine Nutzung.• Dazu muss jedem Nutzer das Recht zur
Nutzung eingeräumt werden: Lizenz.• Eine Lizenz zu verfassen ist nicht einfach und
für einen normalen Anwender bzw. Werkersteller kaum zu leisten.
• Im Internet kommt noch das Problem dazu, dass die Lizenz weltweit gelten muss.
• Trotzdem möchten Werkersteller ihre Rechte wahrnehmen und nicht alles erlauben.
Gibt es einen Mittelweg?
no rights reserved
all rights reserved
Die „Creative Commons“Idee
• 2001 in den USA von einer Gruppe um Lawrence Lessig gegründet.
• Befürchtung, dass das US Copyright (und andere Urheberrechtsgesetze) die Kreativität im Internet behindern.
• Ziel: Mehr „kreatives“ Material unter offenen, standardisierten Lizenzen verfügbar machen.
• Die Lizenzen sollen flexibel , leicht verständlich , leicht zu nutzen und weltweit gültig sein.
Die Creative CommonsLizenzen
• BY: Attribution
– Namensnennung
• SA: Sharealike
– Weitergabe untergleichen Bedingungen
• ND: No derivatives
– Keine Veränderungen
• NC: Non-commercial
– Kein kommerzieller Einsatz
Mehr Rechte vorbehalten
Weniger Rechte vorbehalten
Lizenzen für Open Data?
• BY: Attribuion
– Namensnennung
• SA: Sharealike
– Weitergabe untergleichen Bedingungen
• ND: No derivatives
– Keine Veränderungen
• NC: Non-commercial
– Kein kommerzieller Einsatz
Mehr Rechte vorbehalten
Weniger Rechte vorbehalten
about
about
metadata
Open Data Commons
• Creative Commons ist ausgelegt auf „kreative“Werke.
• Für Daten nicht optimal, da die Übertragung der Lizenzen auf Daten unter Umständen Probleme mit sich bringt.
• Open Data Commons orientiert sich an CreativeCommons und ist für Daten besser geeignet:
– ODC-BY: Attribution
– ODC-ODbL : Attribution-Share-Alike
No rights reserved: CC0 und PDDL
• Eigentlich keine Lizenzen, sondern sogenannte Waiver: Der Urheber erklärt öffentlich, von seinen Urheberrechten keinen Gebrauch zu machen.
• Ziel ist es, abhängig vom Rechtsraum zu erreichen, dass ein Werk faktisch „Public Domain“, also Allgemeingut wird.
• Denn z.B. in Deutschland kann das Urheberrecht weder aufgegeben, noch veräußert werden.
Warum nicht erst mal Non-Commercial?
• Jede Einschränkung der Rechte an Daten erschwert oder verhindert Interoperabilität:
– Non-commercial: Rechtliche Grauzone, Daten können nicht mit offenen Daten kombiniert werden.
– No-derivatives: Daten können nicht angereichert, sondern faktisch nur noch angezeigt werden.
• Beide Einschränkungen führen gemäß der Open Bibliographic Data Definition zu nicht offenen Daten!
Warum ist selbst CC-BY nicht genug?
• Die Namensnennung ist gut gemeint, aber bei einer Nutzung von Daten, Anreicherung, Wiederveröffentlichung usw. ist die vollständige Nennung aller Urheber technisch schwierig bis hin zu nahezu unmöglich.
• Beispiel: Ergebnis einer Datenbankabfrage aus einer Datenbank, die auf verschiedenen Quellen basiert. Wie identifiziert man, was genau woher kam?
Zusammenfassungfür Bibliotheksdaten
Denn nur Public Domain sichert die rechtliche Interoperabilität der Daten.
Public Domain!(CC0 oder PDDL)
Warum also Open Bibliographic Data?
• Open Access auch für Bibliotheksdaten, die mit Steuermitteln erstellt werden.
• Höhere Sichtbarkeit und Zugänglichkeit, wenn die Daten in Systemen außerhalb der Bibliothekswelt zum Einsatz kommen können.
• Rechtliche Kompatibilität für verteilte Daten.
• Gibt es ein Geschäftsmodell der Bibliotheken für Daten? Wenn ja, ist es durch Open Data gefährdet? Oder gibt es gar neue Chancen?
Die Zukunft von Bibliotheksdaten
• Ein möglichst stark vernetzter Knoten in der LOD-Cloud (Backbone des Semantic Web).
• Nicht mehr an eine Art oder einen Ort der Präsentation gebunden.
• Nicht mehr an einen alleinigen Zweck gebunden.
• Im Web auffindbar.
Linked Data
NEU!Jetzt mit nochweniger Technik!
Wir generieren Aussagen aus Daten
Wir generieren Aussagen aus Daten
Ich bin ein Leopard-Drückerfisch.
Wir generieren Aussagen aus Daten
Ich bin ein Leopard-Drückerfisch.
Ich gehöre zu den Drückerfischen.
Wir generieren Aussagen aus Daten
Ich bin ein Leopard-Drückerfisch.
Ich gehöre zu den Drückerfischen.
Ich bin 50 cm lang.
http://example.org/species/90020 http://example.org/common_name „Clown Triggerfish“.
Wir generieren Aussagen aus Daten
Ich gehöre zu den Drückerfischen.
Ich bin 50 cm lang.
http://example.org/species/90020 http://example.org/length_cm 50.
http://example.org/species/90020 http://example.org/common_name „Clown Triggerfish“.
Wir generieren Aussagen aus Daten
Ich gehöre zu den Drückerfischen.
http://example.org/species/90020 http://example.org/length_cm 50.
http://example.org/species/90020 http://example.org/common_name „Clown Triggerfish“.
http://example.org/species/90020 http://example.org/category http://example.org/triggerfish.http://example.org/triggerfish http://example.org/name „Drückerfisch“.http://example.org/triggerfish http://example.org/name „Triggerfish“.
Wir generieren Aussagen aus Daten
http://example.org/species/90020 http://example.org/triggerfish.http://example.org/category
http://example.org/species/90020 http://example.org/triggerfish.http://example.org/category
Triggerfish
http://example.org/name
http://example.org/species/90020 http://example.org/triggerfish.http://example.org/category
Triggerfish
http://example.org/name
Drückerfisch
http://example.org/name
http://example.org/species/90020 http://example.org/triggerfish.http://example.org/category
Triggerfish
http://example.org/name
http://data.bib.uni-mannheim.de/12344 Peter Tierliebdc:creator
Drückerfisch
http://example.org/name
http://example.org/species/90020 http://example.org/triggerfish.http://example.org/category
Triggerfish
http://example.org/name
http://data.bib.uni-mannheim.de/12344 Peter Tierliebdc:creator
Drückerfisch
http://example.org/name
dc:subject
http://example.org/species/90020 http://example.org/triggerfish.http://example.org/category
Triggerfish
http://example.org/name
http://data.bib.uni-mannheim.de/12344 Peter Tierliebdc:creator
dc:subject
http://lobid.org/14233
owl:sameAs
Drückerfisch
http://example.org/name
http://example.org/species/90020 http://example.org/triggerfish.http://example.org/category
Triggerfish
http://example.org/name
http://data.bib.uni-mannheim.de/12344 Peter Tierliebdc:creator
http://lobid.org/14233
owl:sameAs
http://dbpedia.org/resource/Triggerfish
owl:sameAs
Drückerfisch
http://example.org/name
dc:subject
http://example.org/species/90020 http://example.org/triggerfish.http://example.org/category
Triggerfish
http://example.org/name
http://data.bib.uni-mannheim.de/12344 Peter Tierliebdc:creator
http://lobid.org/14233
owl:sameAs
http://dbpedia.org/resource/Triggerfish
owl:sameAs
DBPediaDBPedia
Example.orgExample.org
UBMannheim
UBMannheim
Lobid.orgLobid.org
Drückerfisch
http://example.org/name
dc:subject
Bildnachweis: linkeddata.org
08.10.2007
20072007
Bildnachweis: linkeddata.org
07.11.2007
20072007
Bildnachweis: linkeddata.org
10.11.2007
20072007
Bildnachweis: linkeddata.org
28.02.2008
20082008
Bildnachweis: linkeddata.org
31.03.2008
20082008
Bildnachweis: linkeddata.org
18.09.2008
20082008
Bildnachweis: linkeddata.org
05.03.2009
20092009
Bildnachweis: linkeddata.org
27.03.2009
20092009
Bildnachweis: linkeddata.org
14.07.2009
20092009
Bildnachweis: linkeddata.org
22.09.2010
20102010
20102010
Die Schönheit von URIs
� Aussagen über Ressourcen können unabhängig von den Ressourcen selbst getätigt werden:
http://purl.org/dc/elements/1.1/creator
http://kaiec.org/me
http://doi.acm.org/10.1145/1298406.1298426
doi:10.1145/1298406.1298426 dc:creator http://kaiec.org/me
Verschiedene Orte!Verschiedene Besitzer!
Die Eindeutigkeit von URIs
� Eine URI beschreibt eindeutig und (hoffentlich) dauerhaft eine ganz bestimmte Ressource.
� http://kaiec.org/me
Aber: Eine Ressource kann durch verschiedene URIsbeschrieben werden
� urn:4321-12345
� http://gnd.dnb.de/data/person/12345
� http://ki.informatik.uni-mannheim.de/people/kai_eckert.html/#it
� …
� Keine Eineindeutigkeit!
Ist das ein Problem?
� Die Äquivalenz von URIs lässt sich jederzeit und von jedem als RDF Statement ausdrücken:
� urn:4321-12345 owl:sameAs ↵http://gnd.dnb.de/data/12345
� Dadurch lassen sich insbesondere auch Prädikate (Vokabular) gleichsetzen.
� So lassen sich transparent Datenbestände mit anderen Datenbeständen verknüpfen.
� → Linked Data
Exkurs: URI Syntax� <schema>:<Schema-spezifischer Teil>
� Beispiele
� http://www.bib.uni-mannheim.de/
� mailto:[email protected]
� http://purl.org/dc/elements/1.1/creator
� http://dublincore.org/2008/01/14/dcelements.rdf#creator
� info:lc/vocabulary/countries/af
� urn:nbn:de:gbv:089-3321752945
� urn:isbn:0345391802
� http://doi.acm.org/10.1145/1298406.1298426
� http://dx.doi.org/10.1145/1298406.129842
Exkurs: Verschiedene Schemata� http://...
� Lediglich eine registrierte Domain notwendig, um Eindeutigkeit zu sichern.
� Möglichkeit, URIs mit beliebigen Inhalten zu dereferenzieren (RDF!)
� PURL
� Dienst von OCLC mit dem Vorteil, dass URIs dereferenzierbar bleiben, selbst wenn man die eigene Domain wieder aufgibt.
� URN
� Eingeschränkt dereferenzierbar über Resolver-Dienste
� Aufwändige Registrierung über IANA
� info:
� Nicht dereferenzierbar, aber leichter zu registrieren als URN Namespaces.
Projekte
Projekte
• International: LCSH der Library of Congress, LIBRIS der schwedischen Nationalbibliothek (beide 2008).
• DNB: Gemeinsame Normdatei als Linked Data (März 2010)
• HBZ, BSZ: Open Data für Katalogdaten. (März 2010)
• UB Mannheim: Verknüpfungen zwischen HeBIS und SWB, Linked Data Aufbereitung. (Juli 2010)
• lobid.org (September 2010):
– Titeldaten als Linked Open Data
– Identifikatoren für Organisationen
• CultureGraph: Zentrale Identifier und Verknüpfung von Datensätzen.
• GESIS: Thesaurus für Sozialwissenschaften
• ZBW: Standardthesaurus Wirtschaft
• Europeana (Open Data als Voraussetzung, RDF-basiertes Datenmodell)
• …
10 Jahre Semantic Web
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
Linked Data Tutorial (Bizer et al.)
Tim Berners-Lee publiziert Prinzipien für Linked Data
Tim Berners-Lee’s Artikel in Scientific American zum Semantic Web
LOD Cloud, Linking Open Data Projekt
LIBRIS, LCSH.info
HBZ, DNB, UB Mannheim, …
LoC LCSH (Offiziell)
W3C LLD XG
DINI AG KIM
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
Linked Data Tutorial (Bizer et al.)
Tim Berners-Lee publiziert Prinzipien für Linked Data
Tim Berners-Lee’s Artikel in Scientific American zum Semantic Web
LOD Cloud, Linking Open Data Projekt
LIBRIS, LCSH.info
HBZ, DNB, UB Mannheim, …
LoC LCSH (Offiziell)
W3C LLD XG
DINI AG KIM
5 Jahre Linked Data
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
Linked Data Tutorial (Bizer et al.)
Tim Berners-Lee publiziert Prinzipien für Linked Data
Tim Berners-Lee’s Artikel in Scientific American zum Semantic Web
LOD Cloud, Linking Open Data Projekt
LIBRIS, LCSH.info
HBZ, DNB, UB Mannheim, …
LoC LCSH (Offiziell)
W3C LLD XG
DINI AG KIM
3 Jahre Linked Data in Bibliotheken
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
Linked Data Tutorial (Bizer et al.)
Tim Berners-Lee publiziert Prinzipien für Linked Data
Tim Berners-Lee’s Artikel in Scientific American zum Semantic Web
LOD Cloud, Linking Open Data Projekt
LIBRIS, LCSH.info
HBZ, DNB, UB Mannheim, …
LoC LCSH (Offiziell)
W3C LLD XG
DINI AG KIM
1 Jahr Linked Data in Deutschland
Es fängt gerade erst an!
Exkurs: Referenzen zu URIs
� URI Schemes
� http://www.iana.org/assignments/uri-schemes.html
� Info URIs (info:<NID>/<NSS>)
� http://info-uri.info/registry/OAIHandler?verb=ListRecords&metadataPrefix=oai_dc
� info:lc
− http://info-uri.info/registry/OAIHandler?verb=GetRecord&metadataPrefix=reg&identifier=info:lc/
� Uniform Resource Names (urn:<NID>:<NSS>)
� http://www.iana.org/assignments/urn-namespaces/
Credits und Lizenz
� Silo-Foto von Robert Linder, linder6580 (sxc.hu)
� Piratenflagge von Roger Kirby, theswedish (sxc.hu)
� Folien zu Open Data basieren auf einem Vortrag von Adrian Pohl:� http://www.slideshare.net/acka47/linked-open-data-in-der-
bibliothekswelt
� Folien zu Creative Commons basieren auf einer Vorlesung von Catharina Maracke.
� Diese Präsentation steht unter der Creative-Commons-Attribution-Share-Alike Lizenz:http://creativecommons.org/licenses/by-sa/3.0