motivation des semantic web - ki. ?· semantic web frank puppe 1 motivation des semantic web...

Download Motivation des Semantic Web - ki. ?· Semantic Web Frank Puppe 1 Motivation des Semantic Web •Web…

Post on 20-Aug-2019

212 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

  • Semantic Web Frank Puppe 1

    Motivation des Semantic Web

    • Web ist für Nutzung durch Menschen konzipiert – auch automatisch generierter Inhalt wird ohne interne Struktur

    präsentiert – Werkzeugunterstützung: Stichwortbasierte Suchmaschinen

    • Schwächen stichwortbasierter Suchmaschinen – Hoher recall, niedrige precision – niedriger oder kein recall – Ergebnisse abhängig vom Vokabular – Ergebnisse sind einzelne Web-Seiten

    • Idee: Automatische Verarbeitung des Web-Inhaltes ermöglichen – Semantic Web Initiative des W3C – Graduelle Verbesserung des bisherigen Webs

  • Semantic Web Frank Puppe 2

    Beispiele für Semantic Web

    • Wissensmanagement – notwendig besonders für große verteilte Organisationen

    • B2C Electronic Commerce (Business to Customer) – Einkaufsagenten, die zu einem Produkt, Preise, ggf.

    Alternativen und Reputation der Firma erkennen und ggf. verhandeln können

    • B2B Electronic Commerce (Business to Business) – Datenaustausch bisher mit speziellen Format: EDI (Electronic

    Data Interchange). – Verbesserung XML, aber erfordert Apriori-Vereinbarung

    • Persönliche Agenten – Stellvertreter für Informationssuche und ggf. Vereinbarungen

  • Semantic Web Frank Puppe 3

    Technologien des Semantic Web • Explizite Repräsentation von Metadaten • Ontologien: wichtige Wissensrepräsentationssprachen

    – XML: Syntax, aber keine Festlegung von Semantik – XML Schema: Präzisere Dokumentenbeschreibung – RDF: Datenmodel für Objekte und ihre Beziehungen mit

    einer einfachen Semantik – RDF Schema: Beschreibung seines Vokabulars als

    Klassen mit Eigenschaften und Vererbung – OWL: Reichere Vokabularbeschreibungssprache, z.B.

    • Beziehungen zwischen Klassen (z.B. Diskjunktion) • Kardinalität (z.B. genau ein) • Gleichheit • Reichere Typisierung von Eigenschaften (z.B. Symmetrie) • Aufzählungsklassen

    • Logik: Herleiten von Schlussfolgerungen

  • Semantic Web Frank Puppe 4

    Agenten

    Autonome proaktive Software im Web • basiert auf Meta-

    daten, Ontologien und Logik

    • erfordert zusätzlich Agenten-Kommuni- kationssprachen und Modellierung interner Zustände

    • kommuniziert mit Menschen

  • Semantic Web Frank Puppe 5

    Inkrementeller Mehrebenen-Ansatz

    • Konflikt zwischen Standardisierung und Innovation • Mehrebenenansatz erfordert

    – Abwärtskompatibilität (höhere Ebene beinhalten niedrigere) – partielles Verständnis höherer Ebenen (Ein Agent einer Ebene kann auch

    auch Elemente höherer Ebenen verstehen, sofern sie in seine Sprachebene übersetzbar sind)

  • Semantic Web Frank Puppe 6

    XML

    • Ermöglicht im Gegensatz zu HTML die Definition eigener Tags (Elemente) und Attribute

    • Baum-Modell von XML-Dokumenten: Übersichtliche Darstellung als Baum

    • Definition der Tags mit DTD (Document Type Definition) oder mit XML-Schema (ausdrucksstärkere Sprache)

    • Namensräume erlauben Kombination verschiedener DTD's bzw. Schemas

    • XML-Abfragesprachen basieren auf Pfad-Ausdrücken (XPATH) • XML-Verarbeitung (z.B. Anzeige als HTML oder Umwandlung

    in anderes XML-Dokument) in deklarativer Form mit Style- sheets (XSLT; extensible stylesheet language transformations)

  • Semantic Web Frank Puppe 7

    XML - Baumdarstellung

    Where is your draft

    Grigoris, where is the draft of the

    paper you promised me last week

  • Semantic Web Frank Puppe 8

    Definition einer DTD Formulierung der Terminale: Elemente:

    Name: nur Buchstaben, Ziffern und "." "-" "_" sind erlaubt; Groß- / Kleinschreibung relevant; darf nicht mit "xml" beginnen

    Wert: (#PCDATA) | ANY | EMPTY | Elemente | (#PCDATA | Elemente)*> Formulierung der Regeln für Elemente (a, b, c, … = Elemente):

    - Gruppierung: (a b) oder (a b c) - Alternative: a | b oder a | b | c - Sequenz: a, b oder a, b ,c - Wiederholung 0 .. n: a * - Wiederholung 1 .. n: a + - Wiederholung 0 .. 1: a ?

    Attribute: Elementname: Name eines definierten Elementes Attributliste: Name Typ Bedeutung Typ: CDATA | ID | IDREF | IDREFS | Entity | … | ( (Name | Name | … )* ) Bedeutung: #IMPLIED | #REQUIRED | Name | #FIXED Name

    Entitäten: |

  • Semantic Web Frank Puppe 9

    (nachname, vorname)

  • Semantic Web Frank Puppe 10

    Mächtigere Alternative: XML-Schema

    • Syntax in XML (Einfachere technische Handhabung) • Erweiterbarkeit: Ein XML-Schema kann ein anderes erweitern • Differenzierte Datentypen

    – Numerisch (int, Float, …); String; Zeit (Date, …); Zusammengesetzte Typen (sequence, all, choice); Typerweiterung; Typeinschränkung

    • Definition von Tags (Elementen): Neu: Typen + Kardinalitäten

  • Semantic Web Frank Puppe 11

    XML-Anfragesprachen

    • Beispiele: XQL, XML-QL, XQuery, … • Basieren auf Pfad-Ausdrücken, d.h. XPATH

    – absolute Pfade: Start mit Wurzel-Knoten – relative Pfade zu einem Kontext-Knoten

  • Semantic Web Frank Puppe 12

    Beispiel-Dokument für Anfragen

  • Semantic Web Frank Puppe 13

    Beispiele für XML-Anfragen in XPATH

    • /library/author: liefert alle author-Elemente • //author: liefert alle author-Elemente, die irgendwo im

    Dokument vorkommen (ggf. mehr als obige Anfrage) • /library/@location: liefert alle entsprechenden Attribut-Knoten • //book/@title="Artificial Intelligence": liefert alle Attribut-Knoten,

    bei denen der Titel den angegeben Wert hat. • //book[@title="Artificial Intelligence"]: liefert alle Buch-Knoten,

    die die Bedingung in eckigen Klammern erfüllen • //author[1]: liefert den ersten author-Knoten • //author[1]/book[last()]: liefert den letzten Buch-Knoten vom

    ersten Autor • //book[not @title]: liefert alle Buchknoten ohne Titel-Attribut

  • Semantic Web Frank Puppe 14

    Allgemeine Struktur von Pfad-Ausdrücken

    • Pfad-Ausdruck besteht aus einer Folge von Schritten. • Schritt besteht aus

    – Pfadelement (axis): Vom Kontext-Knoten zum aktuellen Knoten, z.B. //, / = child, parent, sibling, attribute

    – Knotentest (node test), z.B. Element-Namen; * = alle Knoten; – optionalem Filter-Ausdruck (predicate or filter expression)

    • Beispiel: /library/author[1]: 2 Schritte: / = child (Pfad); library = Knotentest; / = child (Pfad); author = Knotentest; [1] = Filterausdruck

  • Semantic Web Frank Puppe 15

    Verarbeitung

    • Kernideen – Umwandlung eines XML-Ausdruck in einen anderen

    (XHTML oder anderes XML) mittels Stylesheets • Anwendung von Ersetzungsregeln für bestimmte Knoten

    – Zugriff aus Programmiersprache mittels sprachspezifischem Parser (z.B. Xerces für Java)

    • Umwandlung in Baum • Zugriff auf Knoten in Baumstruktur mittels API (z.B. XPATH-API) • Spezielle Funktionen für Knotenbearbeitung (z.B. Inhaltsextraktion)

  • Semantic Web Frank Puppe 16

    Beispiel für XSLT

  • Semantic Web Frank Puppe 17

    Probleme mit XML (1)

    • Mit XML kann man Tags definieren, aber keine Semantik • Beispiel:

    – Inhalt: David Billington is a lecturer of Discrete Mathematics – Repräsentation in XML

    • David Billington

    • Discrete Mathematics

    • David Billington Discrete Mathematics

    – Beispiele enthalten teilweise genau umgekehrte Einrückung – Es gibt keine Standardmethode, um aus

    Elementeinrückung Bedeutung zu extrahieren • Verbesserung: RDF und RDFS

  • Semantic Web Frank Puppe 18

    Probleme mit XML (2)

    • XML-Beispiel: Grigoris Antoniou Michael Maher David Billington

    • Anfrage (XPATH): //academicStaffMember – Ergebnis: nur "Grigoris Antoniou" – unbefriedigend, da für Menschen klar ist, dass auch Michael Maher und

    David Billington zum Ergebnis gehören.

    • Notwendige Regeln: – Professoren sind academicStaffMember (subclass) – Kurse werden nur von academicStaffMember gelehrt

    (range-Beschränkung der property )

  • Semantic Web Frank Puppe 19

    RDF und RDF Schema

    • unglückliche Namenswahl, da es an XML und XML Schema erinnert

    • Unterschied: – während XML Schema die Struktur (z.B. die erlaubte

    Schachtelungstiefe) von XML-Dokumenten vorgibt, – gibt RDF Schema das Vokabular von RDF-Dokumenten vor

    (deren Struktur ist dagegen in RDF festgelegt)

  • Semantic Web Frank Puppe 20

    Grundlagen von RDF • Das Kernkonzept von RDF ist das Statement:

    – Objekt-Attribut-Wert Tripel – in RDF: Resource-property-Value – Bsp.:

    • resource: David Billington • property: site-owner • value: http://www.cit.gu.edu.au/~db

    – 3 Sichten auf ein Statement • Tripel: (x P y) oder P(x,y) • Graph-basiert (semantisches Netz; s. rechts oben & nächste Folie) • XML-Repräsentation (s. übernächste Folie)

    • Resource: Gegenstand der Betrachtung; hat URI bzw. URL • Property: Spezielle Resource, die Relationen zwischen

    Resourcen beschreibt: hat auch URI bzw. URL • Value: entweder eine Resource oder ein String

    www.cit.gu.edu.au/~db

    David Billington

    site-owner