normdaten im semantic web publizieren – das beispiel des ...€¦ · • seit august 2009...

23
www.zbw.eu Normdaten im Semantic Web publizieren – das Beispiel des Standard-Thesaurus Wirtschaft Joachim Neubert Deutsche Zentralbibliothek für Wirtschaftswissenschaften Leibniz-Informationszentrum Wirtschaft 4. Leipziger Kongress für Information und Bibliothek 17.3.2010

Upload: others

Post on 14-Jun-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

www.zbw.eu

Normdaten im Semantic Web publizieren – das Beispiel des Standard-Thesaurus Wirtschaft

Joachim Neubert

Deutsche Zentralbibliothek für WirtschaftswissenschaftenLeibniz-Informationszentrum Wirtschaft

4. Leipziger Kongress für Information und Bibliothek17.3.2010

Page 2: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 2

Überblick

1) Publikation des STW im Semantic Web2) Nutzung der publizierten STW-Daten für

a. Rechercheb. Sacherschließung

3) Weitere Terminologien4) Normdaten als Knotenpunkte im Linked Data Web

Page 3: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 3

Standard-Thesaurus Wirtschaft

• wurde in den 1990er Jahren unter öffentlicher Förderung von vier wirtschaftswissenschaftlichen Institutionen entwickelt

• wird heute von der ZBW gepflegt und weiterentwickelt• umfasst ca. 6000 Deskriptoren in Deutsch und Englisch

Page 4: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 4

Projektziele

• Den STW ins Web bringen• Benutzerinnen und Benutzer in themenorientierten

Suchen unterstützen• Eine einfache Nachnutzung durch Dritte ermöglichen

Rahmenbedingungen:• Offene Lizenz

Creative Commons (by-nc-sa)• Standardisiertes Format

schwierig – derzeit kein allgemein akzeptiertes Standard-Speicherformat für Thesauri (ISO 25964 work in progress) aber: SKOS war stabil und sah vielversprechend aus

Im Web nicht nur Dokumente, sondern einzelne Datenelemente bereitstellen und verknüpfen

Page 5: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 5

Simple Knowledge Organisation System

• entwickelt mit dem Ziel, Schlagwortsysteme, Thesauri, Klassifikationen für das Semantic Web nutzbar zu machen

• beruht auf eindeutigen Identifiern (URIs) für Konzepte• erlaubt zu Konzepten Vorzugsbenennungen und

alternative Benennungen in beliebig vielen Sprachen• unterstützt die üblichen Thesaurusrelationen (broader,

narrower, related)• unterstützt Mapping verschiedener Thesauri

(exactMatch, closeMatch, broadMatch, narrowMatch, relatedMatch)

• erweiterbar• seit August 2009 Recommendation des W3C

Page 6: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 6

Umsetzung

• Aufsetzen auf bestehendem Thesaurus-Pflegesystem: Systemumgebung und Geschäftsgänge konnten beibehalten werden

• Verarbeitung von textuellen Export-Dateien, Konvertierung und Erzeugung einer SKOS-Datei

• SKOS erwies sich als so flexibel erweiterbar, dass auch Non-Standard-Features des STW abgedeckt werden konnten

• Generierung aller weiteren Outputs aus der SKOS-Datei• Generierung der (X)HTML-Seiten und Einbettung der

Daten nach dem RDFa Standard• Aufbau eines STW Web Service• Bereitstellung eines SPARQL-Endpoints für frei

formulierte Abfragen

Page 7: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 7

STW online Demo

Page 8: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 8

STW online Demo

Page 9: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 9

STW online Demo: Sprung in ECONIS

Page 10: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 10

STW online Demo: Sprung in ECONIS

Page 11: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 11

Überblick

1) Publikation des STW im Semantic Web2) Nutzung der publizierten STW-Daten für

a. Rechercheb. Sacherschließung

3) Weitere Terminologien4) Normdaten als Knotenpunkte im Linked Data Web

Page 12: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 12

STW Web Service für erweiterte Nutzungsmöglichkeiten

• durch Web Service einfache Abfragemöglichkeit des STW• Programmierung ohne Semantic-Web-Kenntnisse möglich

z.B. /synonyms http://zbw.eu/beta/stw−ws/synonyms?query=umwelt−audit

Page 13: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 13

STW-WS für die Recherche

• Anreicherung von Suchanfragen mit Synonymen auf Deutsch und Englisch

• Erweiterung von Suchanfragen mit Unterbegriffen, ggf. auch verwandten oder Oberbegriffen, und deren Synonymen

kann auch auf nicht deskribierte Bestände angewandt werden

Page 14: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 14

Demo Retrieval: Suche „telearbeit“

Page 15: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 15

Demo Retrieval: Synonyme und related Terms

Page 16: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 16

Demo Retrieval: OR-Suche mit Synonymen

Page 17: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 17

STW-WS für die Sacherschließung

• STW wird heute vor allem in der ECONIS-Datenbank der ZBW eingesetzt

• integriert in spezifische bibliothekarische Arbeitsumgebung (Pica3)

• Verfügbarkeit eines STW Web Service ermöglicht eine „leichtgewichtige“ Integration in völlig andere Arbeitsumgebungen

• Use case: Autoren-Upload in ein Repository

Page 18: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 18

Demo Indexierung: Suggest-Funktion mit Verweisungen

Page 19: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 19

Demo Indexierung: Suggest-Funktion mit Verweisungen

Page 20: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 20

Weitere Terminologien

• Thesauri und Klassifikationen werden zunehmend Semantic Web-kompatibel im SKOS-Format veröffentlicht

• Beispiele:– Thesaurus Sozialwissenschaften– Deutsche Normdaten (SWD, PND, GKD)

(Prototyp angekündigt für Mitte 2010)– LCSH, Agrovoc, MeSH, GEMET, UKAT, GeoSciML

etc. (aktuelle Liste s. http://www.w3.org/2001/sw/wiki/SKOS/Datasets)

– DDC (http://dewey.info)• Wenn dafür SPARQL-Endpoints existieren, können diese

Daten mit einem einheitlichen Interface abgefragt und sehr einfach in Webservices (wie den STW-WS) eingebunden werden

Page 21: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 21

Ausblick

• Normdaten, Thesauri, Klassifikationen – enthalten wohl definierte und voneinander

abgegrenzte Konzepte– sind schon heute untereinander durch

Crosskonkordanzen und Mappings vernetzt– werden von vertrauenswürdigen Institutionen gepflegt

• Im Linked Open Data Web können sie die Rolle von Linking Hubs übernehmen

Page 22: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 22

Linked Open Data Web

Grafik; Richard Cyganiak, Chris Bizer

Page 23: Normdaten im Semantic Web publizieren – das Beispiel des ...€¦ · • seit August 2009 Recommendation des W3C. 4. Leipziger Kongress für Information und Bibliothek, 17.3.2010

4. Leipziger Kongress für Information und Bibliothek, 17.3.2010 23

Vielen Dank!

Fragen?

Links:http://zbw.eu/stwhttp://zbw.eu/beta/stw-wshttp://ceur-ws.org/Vol-538/ldow2009_paper7.pdf

Joachim NeubertDeutsche Zentralbibliothek für Wirtschaftswissenschaften (ZBW) Leibniz-Informationszentrum [email protected]