normdaten im semantic web publizieren – das beispiel des ...€¦ · • seit august 2009...
TRANSCRIPT
www.zbw.eu
Normdaten im Semantic Web publizieren – das Beispiel des Standard-Thesaurus Wirtschaft
Joachim Neubert
Deutsche Zentralbibliothek für WirtschaftswissenschaftenLeibniz-Informationszentrum Wirtschaft
4. Leipziger Kongress für Information und Bibliothek17.3.2010
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 2
Überblick
1) Publikation des STW im Semantic Web2) Nutzung der publizierten STW-Daten für
a. Rechercheb. Sacherschließung
3) Weitere Terminologien4) Normdaten als Knotenpunkte im Linked Data Web
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 3
Standard-Thesaurus Wirtschaft
• wurde in den 1990er Jahren unter öffentlicher Förderung von vier wirtschaftswissenschaftlichen Institutionen entwickelt
• wird heute von der ZBW gepflegt und weiterentwickelt• umfasst ca. 6000 Deskriptoren in Deutsch und Englisch
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 4
Projektziele
• Den STW ins Web bringen• Benutzerinnen und Benutzer in themenorientierten
Suchen unterstützen• Eine einfache Nachnutzung durch Dritte ermöglichen
Rahmenbedingungen:• Offene Lizenz
Creative Commons (by-nc-sa)• Standardisiertes Format
schwierig – derzeit kein allgemein akzeptiertes Standard-Speicherformat für Thesauri (ISO 25964 work in progress) aber: SKOS war stabil und sah vielversprechend aus
Im Web nicht nur Dokumente, sondern einzelne Datenelemente bereitstellen und verknüpfen
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 5
Simple Knowledge Organisation System
• entwickelt mit dem Ziel, Schlagwortsysteme, Thesauri, Klassifikationen für das Semantic Web nutzbar zu machen
• beruht auf eindeutigen Identifiern (URIs) für Konzepte• erlaubt zu Konzepten Vorzugsbenennungen und
alternative Benennungen in beliebig vielen Sprachen• unterstützt die üblichen Thesaurusrelationen (broader,
narrower, related)• unterstützt Mapping verschiedener Thesauri
(exactMatch, closeMatch, broadMatch, narrowMatch, relatedMatch)
• erweiterbar• seit August 2009 Recommendation des W3C
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 6
Umsetzung
• Aufsetzen auf bestehendem Thesaurus-Pflegesystem: Systemumgebung und Geschäftsgänge konnten beibehalten werden
• Verarbeitung von textuellen Export-Dateien, Konvertierung und Erzeugung einer SKOS-Datei
• SKOS erwies sich als so flexibel erweiterbar, dass auch Non-Standard-Features des STW abgedeckt werden konnten
• Generierung aller weiteren Outputs aus der SKOS-Datei• Generierung der (X)HTML-Seiten und Einbettung der
Daten nach dem RDFa Standard• Aufbau eines STW Web Service• Bereitstellung eines SPARQL-Endpoints für frei
formulierte Abfragen
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 7
STW online Demo
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 8
STW online Demo
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 9
STW online Demo: Sprung in ECONIS
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 10
STW online Demo: Sprung in ECONIS
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 11
Überblick
1) Publikation des STW im Semantic Web2) Nutzung der publizierten STW-Daten für
a. Rechercheb. Sacherschließung
3) Weitere Terminologien4) Normdaten als Knotenpunkte im Linked Data Web
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 12
STW Web Service für erweiterte Nutzungsmöglichkeiten
• durch Web Service einfache Abfragemöglichkeit des STW• Programmierung ohne Semantic-Web-Kenntnisse möglich
z.B. /synonyms http://zbw.eu/beta/stw−ws/synonyms?query=umwelt−audit
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 13
STW-WS für die Recherche
• Anreicherung von Suchanfragen mit Synonymen auf Deutsch und Englisch
• Erweiterung von Suchanfragen mit Unterbegriffen, ggf. auch verwandten oder Oberbegriffen, und deren Synonymen
kann auch auf nicht deskribierte Bestände angewandt werden
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 14
Demo Retrieval: Suche „telearbeit“
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 15
Demo Retrieval: Synonyme und related Terms
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 16
Demo Retrieval: OR-Suche mit Synonymen
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 17
STW-WS für die Sacherschließung
• STW wird heute vor allem in der ECONIS-Datenbank der ZBW eingesetzt
• integriert in spezifische bibliothekarische Arbeitsumgebung (Pica3)
• Verfügbarkeit eines STW Web Service ermöglicht eine „leichtgewichtige“ Integration in völlig andere Arbeitsumgebungen
• Use case: Autoren-Upload in ein Repository
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 18
Demo Indexierung: Suggest-Funktion mit Verweisungen
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 19
Demo Indexierung: Suggest-Funktion mit Verweisungen
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 20
Weitere Terminologien
• Thesauri und Klassifikationen werden zunehmend Semantic Web-kompatibel im SKOS-Format veröffentlicht
• Beispiele:– Thesaurus Sozialwissenschaften– Deutsche Normdaten (SWD, PND, GKD)
(Prototyp angekündigt für Mitte 2010)– LCSH, Agrovoc, MeSH, GEMET, UKAT, GeoSciML
etc. (aktuelle Liste s. http://www.w3.org/2001/sw/wiki/SKOS/Datasets)
– DDC (http://dewey.info)• Wenn dafür SPARQL-Endpoints existieren, können diese
Daten mit einem einheitlichen Interface abgefragt und sehr einfach in Webservices (wie den STW-WS) eingebunden werden
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 21
Ausblick
• Normdaten, Thesauri, Klassifikationen – enthalten wohl definierte und voneinander
abgegrenzte Konzepte– sind schon heute untereinander durch
Crosskonkordanzen und Mappings vernetzt– werden von vertrauenswürdigen Institutionen gepflegt
• Im Linked Open Data Web können sie die Rolle von Linking Hubs übernehmen
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 22
Linked Open Data Web
Grafik; Richard Cyganiak, Chris Bizer
4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 23
Vielen Dank!
Fragen?
Links:http://zbw.eu/stwhttp://zbw.eu/beta/stw-wshttp://ceur-ws.org/Vol-538/ldow2009_paper7.pdf
Joachim NeubertDeutsche Zentralbibliothek für Wirtschaftswissenschaften (ZBW) Leibniz-Informationszentrum [email protected]