wissenstechnologien am beispiel goethe-tour dr.-ing. katja hose steffen metzger pd dr.-ing. ralf...
TRANSCRIPT
![Page 1: Wissenstechnologien am Beispiel Goethe-Tour Dr.-Ing. Katja Hose Steffen Metzger PD Dr.-Ing. Ralf Schenkel Max-Planck-Institut für Informatik](https://reader035.vdocuments.mx/reader035/viewer/2022062512/55204d6449795902118ba695/html5/thumbnails/1.jpg)
Wissenstechnologienam Beispiel “Goethe-Tour”
Dr.-Ing. Katja Hose <[email protected]>Steffen Metzger <[email protected]>PD Dr.-Ing. Ralf Schenkel <[email protected]>
Max-Planck-Institut für Informatik
![Page 2: Wissenstechnologien am Beispiel Goethe-Tour Dr.-Ing. Katja Hose Steffen Metzger PD Dr.-Ing. Ralf Schenkel Max-Planck-Institut für Informatik](https://reader035.vdocuments.mx/reader035/viewer/2022062512/55204d6449795902118ba695/html5/thumbnails/2.jpg)
Tourismus-Projekt „Goethe-Tour“
Use-Case unter Einbeziehung von Umwelt-Community und Text-Grid
Ziel: Wirkungsstätten Goethes in Sachsen zu einer Reiseroute zusammenstellen
Erste Teilaufgabe: alle relevanten Orte finden
Später weitere Informationen über Orte sammeln
![Page 3: Wissenstechnologien am Beispiel Goethe-Tour Dr.-Ing. Katja Hose Steffen Metzger PD Dr.-Ing. Ralf Schenkel Max-Planck-Institut für Informatik](https://reader035.vdocuments.mx/reader035/viewer/2022062512/55204d6449795902118ba695/html5/thumbnails/3.jpg)
Aufwendige Suche
Problematische Aspekte:
Verschiedene Quellen mit verschiedenen Such-Interfaces
Diverse Schreibweisen z.B. „Goethe“, „Johann Wolfgang von Goethe“
Eingrenzung der Suche schwierig
zusätzliches Schlüsselwort „Aufenthalt“, „Reise“ ,… ?
Relevante Ergebnisse könnten ausgeschlossen werden
Dokumente müssen alle gelesen werden zur Extraktion des interessanten Wissens:
Orte, an denen Goethe war
Weitere Informationen zu den Orten, z.B.Befindet sich der Ort in Sachsen?
Gibt es dort interessante Sehenswürdigkeiten?
![Page 4: Wissenstechnologien am Beispiel Goethe-Tour Dr.-Ing. Katja Hose Steffen Metzger PD Dr.-Ing. Ralf Schenkel Max-Planck-Institut für Informatik](https://reader035.vdocuments.mx/reader035/viewer/2022062512/55204d6449795902118ba695/html5/thumbnails/4.jpg)
Föderierte Suche: WisNetGrid als Vermittler
?
?
?
?
?
?
- Keywordsuche (z.B. „Goethe Dresden“)- Metadatensuche (z.B. nach „Autor=Goethe“)
Automatische Anfrageerweiterung:„Goethe“→ „Johann Wolfgang von Goethe“
Öffentliche Daten
Community Grids
WWW
![Page 5: Wissenstechnologien am Beispiel Goethe-Tour Dr.-Ing. Katja Hose Steffen Metzger PD Dr.-Ing. Ralf Schenkel Max-Planck-Institut für Informatik](https://reader035.vdocuments.mx/reader035/viewer/2022062512/55204d6449795902118ba695/html5/thumbnails/5.jpg)
Anbindung neuer Quellen
Einheitliche Schnittstelle für Datenzugriff
Siehe Vortrag zur Datenanbindung
Kenntnis über lokale Metadatenschemata zur Umwandlung bei Metadatensuche
z.B. Autor → owner; Erstellungsdatum → date
2 Möglichkeiten:
1. Sicherstellung der Kompatibilität lokaler Suchkomponenten (in Kooperation mit Community)
2. Installation von WisNetGrid bereit gestellter Komponenten
→ Einfache Anbindung
![Page 6: Wissenstechnologien am Beispiel Goethe-Tour Dr.-Ing. Katja Hose Steffen Metzger PD Dr.-Ing. Ralf Schenkel Max-Planck-Institut für Informatik](https://reader035.vdocuments.mx/reader035/viewer/2022062512/55204d6449795902118ba695/html5/thumbnails/6.jpg)
Manuelle Textanalyse
Durch die Suche erhaltene Daten müssen manuell verarbeitet werden
→ Zeit- und damit kostenintensiv
• Weite Teile des Textes für eigentliche Suche uninteressant
• Lässt sich manuelle Textanalyse beschleunigen?
→ Querlesen!
Ist das Auffinden wichtiger Passagen automatisch unterstützbar?
→ Hervorherbung wichtiger Entitäten
![Page 7: Wissenstechnologien am Beispiel Goethe-Tour Dr.-Ing. Katja Hose Steffen Metzger PD Dr.-Ing. Ralf Schenkel Max-Planck-Institut für Informatik](https://reader035.vdocuments.mx/reader035/viewer/2022062512/55204d6449795902118ba695/html5/thumbnails/7.jpg)
Beispiel Entitätserkennung
= Goethe
= Orte = Daten
= Personen
Im April 1770 setzte Goethe sein Studium in Straßburg fort. Diesmal widmete er sich zielstrebiger den juristischen Studien, fand aber auch Zeit, eine ganze Reihe persönlicher Bekanntschaften anzuknüpfen. Die wichtigste davon war die mit dem Theologen, Kunst- und Literaturtheoretiker Johann Gottfried Herder. Der Ältere öffnete ihm die Augen für die ursprüngliche Sprachgewalt von Autoren wie Homer, Shakespeare und Ossion sowie der Volkspoesie und gab so entscheidende Impulse für Goethes dichterische Entwicklung. Später sollte er auf Goethes Fürsprache hin in weimarische Dienste berufen werden.Auf einem Ausritt in die Umgebung lernte Goethe in Sesenheim die Pfarrerstochter Friederike Brion kennen und lieben. Bei seiner Abreise aus Straßburg beendete der bindungsscheue junge Goethe die Beziehung; die an Friederike gerichteten Gedichte, waren in ihrer Ausdruckskraft „der revolutionäre Beginn einer neuen lyrischen Epoche“.
![Page 8: Wissenstechnologien am Beispiel Goethe-Tour Dr.-Ing. Katja Hose Steffen Metzger PD Dr.-Ing. Ralf Schenkel Max-Planck-Institut für Informatik](https://reader035.vdocuments.mx/reader035/viewer/2022062512/55204d6449795902118ba695/html5/thumbnails/8.jpg)
Redundanz und Heterogenität
Anschließend reiste Goethe nach Dresden
…am 25. war Goethe wieder in Dresden…
Goethe besuchte Dresden mehrmals…
Bei einem Besuch in Dresden…
Goethe verließ Dresden…
![Page 9: Wissenstechnologien am Beispiel Goethe-Tour Dr.-Ing. Katja Hose Steffen Metzger PD Dr.-Ing. Ralf Schenkel Max-Planck-Institut für Informatik](https://reader035.vdocuments.mx/reader035/viewer/2022062512/55204d6449795902118ba695/html5/thumbnails/9.jpg)
Faktensuche
Suche nach abstrakten Fakten
Anschließend reiste Goethe nach Dresden
…am 25. war Goethe wieder in Dresden…
Goethe besuchte Dresden mehrmals…
Bei einem Besuch in Dresden…Goethe verließ Dresden…
„Goethe war_in Dresden“Abstrakter Fakt:
![Page 10: Wissenstechnologien am Beispiel Goethe-Tour Dr.-Ing. Katja Hose Steffen Metzger PD Dr.-Ing. Ralf Schenkel Max-Planck-Institut für Informatik](https://reader035.vdocuments.mx/reader035/viewer/2022062512/55204d6449795902118ba695/html5/thumbnails/10.jpg)
Suche auf Fakten
Anfrage: „Goethe war_in X“
Ergebnisliste:
„Goethe war_in Frankfurt“
„Goethe war_in Dresden“
„Goethe war_in Straßburg“
50 Dokumente
46 Dokumente
42 Dokumente
…
„Goethe war_in Sesenheim“22 Dokumente
…
„Goethe war_in Dresden“
Quelldokumente
![Page 11: Wissenstechnologien am Beispiel Goethe-Tour Dr.-Ing. Katja Hose Steffen Metzger PD Dr.-Ing. Ralf Schenkel Max-Planck-Institut für Informatik](https://reader035.vdocuments.mx/reader035/viewer/2022062512/55204d6449795902118ba695/html5/thumbnails/11.jpg)
Wissensextraktion
Im April 1770 verließ Goethe Frankfurt, um dem Wunsch seines Vaters entsprechend
sein Studium zu beenden.
„Goethe war_in Frankfurt“
Wissensverwaltung(Ontologie)
Hinzulernen
Fakt extrahieren
Textmustererkennung
verließ X Y „X war_in Y“Musterbedeutung
erkennen
Bekannte Muster
![Page 12: Wissenstechnologien am Beispiel Goethe-Tour Dr.-Ing. Katja Hose Steffen Metzger PD Dr.-Ing. Ralf Schenkel Max-Planck-Institut für Informatik](https://reader035.vdocuments.mx/reader035/viewer/2022062512/55204d6449795902118ba695/html5/thumbnails/12.jpg)
Wissensextraktion
1771 kehrte Goethe nach Frankfurt zurück, um dort eine kleine Anwaltskanzlei zu eröffnen. „Goethe war_in Frankfurt“
Wissensverwaltung(Ontologie)
Bekannter Fakt
kehrte X nach Y zurück
„X war_in Y“
Musterbedeutungableiten
Hinzulernen
![Page 13: Wissenstechnologien am Beispiel Goethe-Tour Dr.-Ing. Katja Hose Steffen Metzger PD Dr.-Ing. Ralf Schenkel Max-Planck-Institut für Informatik](https://reader035.vdocuments.mx/reader035/viewer/2022062512/55204d6449795902118ba695/html5/thumbnails/13.jpg)
Ontologien
Ontologien sind eine Repräsentationsform von Wissen
Unterteilung in Konzepte, Instanzen von Konzepten und Beziehungen zwischen diesen
Modellierung als Tripel der Form
(Goethe,war_in,Dresden)
Person Stadt
Goethe Dresdenwar_in
ist_Instanz_vonist_Instanz_von
![Page 14: Wissenstechnologien am Beispiel Goethe-Tour Dr.-Ing. Katja Hose Steffen Metzger PD Dr.-Ing. Ralf Schenkel Max-Planck-Institut für Informatik](https://reader035.vdocuments.mx/reader035/viewer/2022062512/55204d6449795902118ba695/html5/thumbnails/14.jpg)
Ontologien
Ontologie
Landschafts-ontologie
vonCommunity 1
Historische Reiserouten-
ontologievon
Community 2
Ontologievermittlung
Stellt Mappings zur gemeinsamen Nutzung zur Verfügung
Ontologieverwaltung
Erlaubt Verwaltung und Anpassung von Ontologien
Welche Ontologie? Woher Basiswissen nehmen?
Basis-Ontologie(Musterverwaltung ...)
Ontologiesuche
![Page 15: Wissenstechnologien am Beispiel Goethe-Tour Dr.-Ing. Katja Hose Steffen Metzger PD Dr.-Ing. Ralf Schenkel Max-Planck-Institut für Informatik](https://reader035.vdocuments.mx/reader035/viewer/2022062512/55204d6449795902118ba695/html5/thumbnails/15.jpg)
Schlussfolgerungen
Ontologie
„Goethe war_in Dresden“
„Dresden gehört_zu Sachsen“
Anfrage: „Goethe war_in Sachsen“?
Antwort: nein
Ontologieschlussfolgerung
„Goethe war_in Sachsen“
Antwort: ja
![Page 16: Wissenstechnologien am Beispiel Goethe-Tour Dr.-Ing. Katja Hose Steffen Metzger PD Dr.-Ing. Ralf Schenkel Max-Planck-Institut für Informatik](https://reader035.vdocuments.mx/reader035/viewer/2022062512/55204d6449795902118ba695/html5/thumbnails/16.jpg)
Community-spezifische Lösungen
Sehr heterogene Daten in Communitys
→ Extraktionskomponenten modular und generisch → Anpassbarkeit über Parameter → Austausch einzelner Komponenten möglich → u.U. Vorverarbeitung von Daten sinnvoll
Wiederverwendung von Anpassungen
Ontologiesuche, um existente Ontologien mit Themenwissen einzubinden
Dienstesuche siehe Vortrag zu Diensten
Existierende Dienste suchen/verwalten/koppeln
z.B. zur Vorverarbeitung der Daten
![Page 17: Wissenstechnologien am Beispiel Goethe-Tour Dr.-Ing. Katja Hose Steffen Metzger PD Dr.-Ing. Ralf Schenkel Max-Planck-Institut für Informatik](https://reader035.vdocuments.mx/reader035/viewer/2022062512/55204d6449795902118ba695/html5/thumbnails/17.jpg)
WisNetGrid-Dienste zur Wissenssuche
Föderierte Suche über angebundenen Quellen
Automatische semantische Anpassung bzw. Erweiterung von Suchanfragen
Entitätenerkennung (Named-Entity-Recognition)
Ontologieverwaltung und -suche sowie automatische Ontologieerweiterung
Wissensextraktion, um in Daten enthaltenes Wissen abstrakt zusammengefasst in Ontologien abzulegen
Suche auf den extrahierten Fakten