institut für medizinische informatik, statistik und epidemiologie vernetzte forschung in der...

of 86/86
nstitut für Medizinische Informatik, Statistik und Epidemiologie Vernetzte Forschung in der Medizin Ein Metadata Repository für Items in klinischen, epidemiologischen und Register-Studien Matthias Löbe 26.05.2009

Post on 05-Apr-2015

104 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

  • Folie 1
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Vernetzte Forschung in der Medizin Ein Metadata Repository fr Items in klinischen, epidemiologischen und Register-Studien Matthias Lbe 26.05.2009
  • Folie 2
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Inhaltsbersicht 1.Folksonomy Tagging Kollaboration 2.Content Syndizierung Microformats Lizenzen 3.Applications Ajax Mashups Web-APIs Architekturen Einleitung
  • Folie 3
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Was ist das Web2.0? Einleitung
  • Folie 4
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Einleitung GebietWeb1.0Web2.0 Persnliche SeiteHomepageBlog Websitemanagemen t CMSWiki StrukturHTMLMicroformats InhaltsverbreitungNewsletterRSS DynamikAppletsAjax MehrwertPortaleMashups NutzerorganisationHierarchieCommunity KlassifizierungTaxonomieTagging Web1.0 >> Web2.0
  • Folie 5
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Soziale Software Folksonomy ist zusammengesetzt aus folk und taxonomy Idee: Kontexterschlieung durch gemeinschaftliches Indizieren (collaborative tagging) Informationselemente werden mit Tags (Labels, Attribute,...) versehen Im Gegensatz zu traditioneller Verschlagwortung: Kein fester Schlagwortsatz Keine Hierarchie Keine Fachexperten oder Qualittssicherung Zurzeit nur ein Trend, Vorteile sind wissenschaftlich nicht nachgewiesen Folksonomy - 1
  • Folie 6
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Bookmarkverwaltung: del.icio.us Folksonomy 2
  • Folie 7
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Verzeichnisse: Open Directory Project Folksonomy 3
  • Folie 8
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Homepages: Weblogs (Blogs) Folksonomy 4
  • Folie 9
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Suchmaschinen: Technorati Folksonomy - 5
  • Folie 10
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Wikis: Wikipedia Folksonomy - 6
  • Folie 11
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Typen von Wikis Folksonomy - 7
  • Folie 12
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Fotos: FlickR Folksonomy - 8
  • Folie 13
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Webseiten: Co-Op Folksonomy - 9
  • Folie 14
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Publikationen: CiteULike Folksonomy - 10
  • Folie 15
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Weitere Beispiele Videos (YouTube.com) Community (MySpace.com) Nachrichten (digg.com) Bcher (Amazon.de) Artikel (eBay.de) Folksonomy - 11
  • Folie 16
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Really Simple Syndication (RSS) Wirklich einfache Verbreitung Erzeugt Kurzzusammenfassungen des Inhalts einer Website, die sich abonnieren lassen Verschiedene Standards, leicht inkompatibel (RSS0.92, RSS1.0, RSS2.0, ATOM) Untersttzung durch moderne Webbrowser und Mailclients Nahezu alle Folksonomy-Anwendungen exportieren / verwerten RSS-Feeds Syndizierung - 1
  • Folie 17
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie RSS-Aufbau Syndizierung - 2
  • Folie 18
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie RSS-Anwendung Syndizierung - 3
  • Folie 19
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Was sind Mikroformate? Microformats - 1
  • Folie 20
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Designprinzipien Entwickelt primr fr Menschen, sekundr fr Maschinen Ntzlich fr den menschlichen Anwender Ntzlich fr Suchmaschinen Dont Repeat Yourself Metadaten werden nicht vom Inhalt getrennt Beispiel ohne semantisches Markup: Am 11. September 2006 von 13:00 Uhr-17:00 Uhr findet das Tutorium "Im WWW nichts Neues? - Web2.0" im Haus 3, Raum 03 statt, gehalten von Matthias L be vom IMISE Leipzig. Microformats - 2
  • Folie 21
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Beispiel mit semantischem Markup (I) Benutzung der Mikroformate hCal und hCard: Am 11. September 2006 von 13:00 Uhr-17:00 Uhr findet das Tutorium Im WWW nichts Neues? - Web2.0 im Haus 3, Raum 03 statt, gehalten von Matthias L be vom IMISE Leipzig. Microformats - 3
  • Folie 22
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Beispiel mit semantischem Markup (II) 11. September 2006 13:00 Uhr - 17:00 Uhr Im WWW nichts Neues? - Web2.0 Haus 3, Raum 03 Ein Tutorium ber neue Trends im WWW gehalten von Matthias L be IMISE ( Leipzig ) +49 341 9716 113 Microformats - 4
  • Folie 23
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Beispiel mit semantischem Markup (III) Microformats - 5
  • Folie 24
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Creative Commons (CC) Lizenzen fr: Texte Bilder Musik Videos Hintergrund: Unsicherheit ber dem Umfang des Verzichts bei Freigabe eines Werks Weitere Verbreitung durch Freigabe Wichtige Rechte knnen eingeschrnkt werden Lizenzen - 1
  • Folie 25
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie 4 Sulen der CC 1.Namensnennung 2.Keine Kommerzielle Nutzung 3.Keine Bearbeitung 4.Weitergabe unter gleichen Bedingungen Lizenzen - 2
  • Folie 26
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie 6 Lizenzmodelle (Version 2.5) Lizenzen - 3 byNamensnennung by-saNamensnennung Weitergabe unter gleichen Bedingungen by-ndNamensnennung Keine Bearbeitung by-ncNamensnennung Nicht-Kommerziell by-nc- sa Namensnennung Nicht-Kommerziell Weitergabe unter gleichen Bedingungen by-nc- nd Namensnennung Nicht-Kommerziell Keine-Bearbeitung
  • Folie 27
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Science Commons Schutzmechanismen fr Rohdaten Lizenzen fr Zweitverwertungen, Vorabdrucke oder Nachdrucke Mechanismen fr die persnlichen Archive der Wissenschaftler Rechtliche Implikationen von Open-Access-Modellen Verwendung maschinenlesbarer Lizenzen Lizenzen - 4
  • Folie 28
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Open Access Wissenschaftliche Literatur und Materialien sollen Kostenlos Ohne Lizenzbeschrnkungen abrufbar sein ffentliche finanzierte Autoren und Gutachter sollen freie Ergebnisse liefern Budapest Open Access Initiative (2001) bzw. Berliner Erklrung (2003) Grundsatzerklrung Einbeziehung des kulturellen Erbes Lizenzen - 5
  • Folie 29
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Archivierungspflicht Gesetz ber die deutsche Nationalbibliothek (22.06.2006) Langzeitarchivierungspflicht fr alle Webinhalte Texte, Bilder, Tne Ablieferungspflicht innerhalb 1 Woche Ablieferungspflichtiger Sitz in Deutschland Auf eigene Kosten Infrastruktur unklar Anmeldekennung fr jede Lieferung Lizenzen - 6
  • Folie 30
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Gadgets, Widgets, whatever Look&Feel - 1
  • Folie 31
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Ajax Asynchronous Javascript and XML Funktionsweise Vorteile Nachteile Look&Feel - 2
  • Folie 32
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Ajax-APIs Look&Feel - 3 Bibliotheken (javascriptbasiert, nur Client) Prototype Dojo Script.aculo.us Frameworks (alle Programmiersprachen, Client und Server) Google Web Toolkit DWR
  • Folie 33
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Textverarbeitung Look&Feel - 4
  • Folie 34
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Tabellenkalkulation Look&Feel - 5
  • Folie 35
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Betriebssysteme Look&Feel - 6
  • Folie 36
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Mashup Mashup - 1 Verknpfung unterschiedlicher externer Datenquellen Veredlung, d.h. es entsteht ein Mehrwert fr den Nutzer durch deren Kombination Bauen auf offenen Programmierschnittstellen auf
  • Folie 37
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Wichtige APIs Mashup - 2 Google Maps FlickR Amazon A3 Yahoo Maps del.icio.us eBay YouTube Google Search
  • Folie 38
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Beispiel: diggdot.us Mashup - 3
  • Folie 39
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Beispiel KML-Studienzentren Mashup - 4
  • Folie 40
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Protokolle, Architekturen und Serialisierungen Untersttzung beliebiger Programmiersprachen Untersttzung beliebiger Betriebssysteme Kommunikation nur ber Port 80 Keine Binrformate Protokolle - 1
  • Folie 41
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Protokolle: SOAP SOAP ist das Basisprotokoll fr Web Services XML als Reprsentationssprache tut-06 Protokolle - 2
  • Folie 42
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Protokolle: XML-RPC XML Remote Procedure Call gmds.getTutorialName 06 Protokolle - 3
  • Folie 43
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Architektur: REST Respresentational State Transfer = bertragung der Darstellung eines Zustands REST verwendet in der Modellierung Substantive, SOAP/RPC dagegen Verben GET http://gmds2006.de/tutorial/06 HTTP/1.1 Protokolle - 4
  • Folie 44
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Serialisierungen: JSON JSON: JavaScript Object Notation Kompakte Kodierung von Datenstrukturen, geringer Overhead Gutes Unmarshalling in Javascript { "Person": { "Name": "L be", "Vorname": "Matthias", "Titel": null "Alter": 31, "Interessen": [ "Ajax", "Mashup", "Tagging" ], } Protokolle - 5
  • Folie 45
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Serialisierungen: YAML YAML: Ain't Markup Language Kompakte Kodierung von Datenstrukturen, geringer Overhead Keine Datentypen --- Person: Name: L be Vorname: Matthias Titel: null Alter: 31 Interessen: - Ajax - Mashup - Tagging Protokolle - 6
  • Folie 46
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Web2.0 Das Web2.0 macht wenig neu, aber vieles anders: 1.Content wird von der Community produziert Als Qualittsmerkmal gilt seine Reichweite Sein Kontext erschliet sich durch Tags Seine Struktur wird semantisch angereichert Er steht unter freien Lizenzen zur Verfgung 2.Web-Applikationen werden benutzerfreundlich Komfortabel wie Desktopprogramme Verzgerungsfreies Arbeiten Angereichert durch Zusatzdienste Zusammenfassung
  • Folie 47
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Inhalt Die Vision des Semantic Web Grundlegende Technologien Praktische Anwendungen Einsatzszenarien in der Medizin
  • Folie 48
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Inhalt Die Vision des Semantic Web Grundlegende Technologien Praktische Anwendungen Einsatzszenarien in der Medizin
  • Folie 49
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Das World Wide Web bisher Was wir haben Eine Vielzahl von Dokumenten, Inhalten und Daten Sprachen zur Darstellung von Inhalten (HTML, CSS...) Werkzeuge fr die Nutzung (Webbrowser, Suchmaschinen...) Anwendungsflle (Information, Bildung, Unterhaltung, E- Commerce, Organisation, Kommunikation...) Was wir nicht haben Ein echtes Zusammenspiel der informationsverarbeitenden Systeme Was wir brauchen Semantik
  • Folie 50
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Semantik? Bezeichnet die exakte Bedeutung von Sprachen unter Zuhilfenahme formaler, logisch-mathematischer Methoden. In Abgrenzung zur Semantik in Philosophie und Linguistik als formale Semantik bezeichnet. Ziel ist es, dass Computersysteme Inhalte nicht nur bereitstellen (Webserver), transportieren (Internet) und prsentieren (Webbrowser), sondern auch verstehen. Zumindest soweit verstehen, dass die bereitgestellten Daten in nutzbringender Weise miteinander in Verbindung gebracht werden knnen.
  • Folie 51
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Ein visionres Beispiel At the doctor's office, Lucy instructed her Semantic Web agent through her handheld Web browser. The agent promptly retrieved information about Mom's prescribed treatment from the doctor's agent, looked up several lists of providers, and checked for the ones in-plan for Mom's insurance within a 20-mile radius of her home and with a rating of excellent or very good on trusted rating services. It then began trying to find a match between available appointment times and Pete's and Lucy's busy schedules. In a few minutes the agent presented them with a plan. Pete didn't like itUniversity Hospital was all the way across town from Mom's place, and he'd be driving back in the middle of rush hour. He set his own agent to redo the search with stricter preferences about location and time. Lucy's agent, having complete trust in Pete's agent in the context of the present task, automatically assisted by supplying access certificates and shortcuts to the data it had already sorted through. Quelle: Tim Berners-Lee, James Hendler und Ora Lassila: The Semantic Web - A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities, Scientific American, May 17, 2001
  • Folie 52
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Ein paar praktische Beispiele Zusammenstellen von Nachrichten-Schlagzeilen aus verschiedenen Quellen und Filterung nach vorgegebenen Kategorien Prsentation persnlicher Kontaktinformationen auf verschiedenen Websites und zugleich im Adressbuch des E-Mail-Clients, der Terminverwaltung und im PDA Import von Terminen aus verschiedenen Quellen per Drag&Drop aus dem Webbrowser in die persnliche Terminverwaltung
  • Folie 53
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Beispiel: Termine aus mehreren Quellen Website Informationsfluss SW-Baustein
  • Folie 54
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Das Web in Semantic Web Anbieter von semantisch ausgezeichneten Daten und die Nutzer dieser Daten sind nur lose miteinander gekoppelt. Genauso wie Webserver und Webbrowser nur lose ber HTTP und HTML miteinander in Verbindung stehen. Es gibt keine zentrale Instanz, die die Kommunikation steuert. Website Client Zugriff
  • Folie 55
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie It's all about the Data Das Semantic Web wird kein Nachfolger des World Wide Web sein. Es ist vielmehr eine Ergnzung desselben. Da die Hauptnutzer Softwaresysteme sind, wird das Semantic Web fr uns Menschen weitgehend im Verborgenen bleiben. Der Fokus liegt auf den Daten, die ausgetauscht und miteinander kombiniert werden. Die (visuelle) Darstellung spielt hierbei eine nachgeordnete Rolle.
  • Folie 56
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Zwei grundlegende Philosophien Zugang zu strukturierten Informationen in Datenbanken Diese Daten sind sonst gar nicht oder nur indirekt ber Webanwendungen erreichbar. Semantisches Markup von Webdokumenten Dokumente, die fr den Menschen als Nutzer gedacht sind, werden zustzlich mit Markup versehen, der die Inhalte fr Computersysteme verstndlich macht. Beide Philosophien stehen nicht im Widerspruch zueinander und so werden fr beide eine Vielzahl von Technologien entwickelt
  • Folie 57
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Inhalt Die Vision des Semantic Web Grundlegende Technologien Praktische Anwendungen Einsatzszenarien in der Medizin
  • Folie 58
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Ein Stapel von Spezifikationen Das Semantic Web wird vom W3C auf dem Fundament des WWW entwickelt URIs fr Identifikation Unicode fr universelle Zeichencodierung XML als universelle Reprsentationsform Sprachen des Semantic Web: RDF, OWL (Ontology), SPARQL (Query), SWRL (Rules) Logic, Proof und Trusted SW folgen spter
  • Folie 59
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Resource Description Framework Mit RDF werden Aussagen ber Dinge (Statements) ausgedrckt. Dinge (Ressourcen) knnen Dokumente im Web sein oder Personen oder Termine oder oder oder... Also alles, worber man etwas ausdrcken mchte. Die Aussagen haben die Form von Tripeln (Subjekt, Prdikat, Objekt) oder (Subject, Property, Value) Subject Property Value
  • Folie 60
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie RDF-Beispiele Aus RDF-Statements werden Graphen gebildet. Die Statements knnen aus beliebigen Quellen stammen. Die Verbindung erfolgt ber die URIs. Im WWW nichts Neues? http://www.imise.de/Mitarbeiter/RolandMuecke Roland Mcke
  • Folie 61
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Web Ontology Language (OWL) Die explizite Festlegung von Struktur erfolgt durch Vokabulare (einfach), Schemata oder Ontologien (komplex). OWL definiert Konzepte und Beziehungen. Klassen und ihre Eigenschaften Hierarchien von Klassen und Eigenschaften Vergleichbar mit Datenbank-Schemata. Kann aber komplexere Beziehungen ausdrcken Wird in RDF ausgedrckt. Unterscheidung in z. B. OWL Lite, OWL DL und OWL Full. Grundlage fr die Ableitung impliziter Statements.
  • Folie 62
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie OWL-Beispiel Definition der Klasse Person und einer ihrer Eigenschaften firstName aus dem FOAF-Schema
  • Folie 63
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Implizites Wissen Mit den in OWL ausgedrckten Beziehungen von Konzepten und ihren Eigenschaften kann aus vorhandenem Wissen neues Wissen abgeleitet werden. Beispiel Im WWW nichts Neues? ist ein GMDS-Tutorium. Ein GMDS-Tutorium ist eine GMDS-Veranstaltung. Im WWW nichts Neues? ist eine GMDS-Veranstaltung und gehrt deswegen in jeden Tagungs-Kalender. Die Ableitung dieses impliziten Wissens (Inferenz, Entailment) wird von einem Reasoner durchgefhrt, der meist direkt an einem RDF-Store angeschlossen sind.
  • Folie 64
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie SPARQL Protocol and RDF Query Language Abfragesprache fr RDF-Graphen Grundlage jeder anspruchsvollen SW-Anwendung Liefert einzelne Werte, Datenstze oder Teilgraphen Vergleichbar mit SQL fr Datenbanken Allerdings nur mit lesendem Zugriff Die Spezifikation definiert zustzlich ein Protokoll fr die Kommunikation zwischen SPARQL-Clients und - Servern. Implementationen knnen auf HTTP oder SOAP aufsetzen
  • Folie 65
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie SPARQL-Beispiele SELECT ?title WHERE { dc:title ?title } SELECT ?title ?price WHERE { ?x ns:price ?price. FILTER (?price < 30). ?x dc:title ?title. } SELECT ?name ?mbox ?hpage WHERE { ?x foaf:name ?name. OPTIONAL { ?x foaf:mbox ?mbox }. OPTIONAL { ?x foaf:homepage ?hpage } }
  • Folie 66
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Inhalt Die Vision des Semantic Web Grundlegende Technologien Praktische Anwendungen Einsatzszenarien in der Medizin
  • Folie 67
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Das Semantic Web in der freien Wildbahn Seit der Einfhrung des Semantic Web im Scientific American im Jahre 2001 hat es nicht nur Entwicklungen im wissenschaftlichen Umfeld gegeben. Einige Anwendungen sind dabei, die Labore zu verlassen und sich im praktischen Alltag zu bewhren. Besonders empfnglich: die Blogger-Szene Der Geek-Faktor ist jedoch noch immer sehr hoch. Die einzige Ausnahme ist RSS und das ist nicht mal echtes Semantic Web.
  • Folie 68
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Nachrichten-Aggregation: RSS Bereitstellung von Nachrichten-Schlagzeilen mittels Rich Site Summary Clientseitige Nutzung in Newsreadern oder Live- Bookmarks Serverseitige Nutzung auf Nachrichten-Portalen, die Schlagzeilen aus vielen Quellen zusammenfhren (Syndizierung) Kategorien von News (Channels) Kein allgemeiner Standard zur Kategorisierung Es existieren mehrere Versionen von RSS und nur eine (die 1.0) verwendet RDF
  • Folie 69
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Netzwerk von Bekanntschaften: FOAF FOAF steht fr Friend of a Friend Persnliche Beschreibung von sich und seinen Freunden Name, Mailbox, Homepages, Bild Diverse Instant-Messenger-IDs und Online-Accounts Bekanntschaften, Interessen, Publikationen, Projekte Derzeit die Visitenkarte im Semantic Web und bei Bloggern. Dan Brickley 241021fb0e6289f92815fc210f9e9137262c252e
  • Folie 70
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Semantisches Markup in XHTML Die Grundidee ist, dass vorhandene Web-Dokumente mit Auszeichnungen versehen werden, die ihren Inhalt semantisch greifbar machen. Die Anstze reichen bezglich der Auswirkungen auf den XHTML-Code von unauffllig (GRDDL) bis brachial (RDF/A). Das Ziel ist, eine Dopplung von Informationen in XHTML- und RDF-Dateien zu vermeiden. Minimiert Arbeit und Fehler Ideal, wenn die Inhalte nicht anderweitig strukturiert sind, z.B. in Datenbanken
  • Folie 71
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie GRDDL, Microformats, RDF/A GRDDL: Gleaning Resource Descriptions from Dialects of Languages extrahiert Daten mittels XSL- Transformation aus XML-Dokumenten. XSL muss die Struktur der XML-Dialekte (z. B. XHTML) kennen, in denen die gewnschten Inhalte stecken. Microformats: Vorgegebene Konstrukte aus - und -Tags zusammen mit CSS-Klassen Vordefinierte Formate, die die Verarbeitung stark vereinfachen. Beispiele sind hCard oder hCalendar RDF/A: Einbettung von RDF direkt in XHTML-Code Dieser Teil des Tutoriums ist von Roland Mcke.
  • Folie 72
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie SPARQL-Endpunkt fr SQL-Datenbanken Zugriff auf SQL-Datenbanken ber einen Wrapper, der SPARQL-Querys in SQL-Querys umwandelt. Beispiel: D2RQ Anbindung an lokale SQL-Datenbanken Zugriff auf Datenbankinhalt als RDF-Graph mglich Beziehung zwischen Datenbankschema und RDF-Graph ber Mapping, das semi-automatisch hergestellt wird. DB Endpunkt Semantic Web SPARQLSQL
  • Folie 73
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Zum Rumprogrammieren: APIs Fr die Entwicklung von Semantic-Web- Anwendungen stehen einige APIs als OpenSource zur Verfgung. Teilweise Referenzimplementationen, also kein Bastelkram! Jena, Sesame Java-APIs fr RDF und SPARQL, RDF-Store Redland Gleicher Leistungsumfang, in C geschrieben Bindings u. a. fr Perl, Python, Ruby und PHP Keine APIs, aber sehr leistungsfhige Browser/Editoren: Protege und Swoop
  • Folie 74
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Wann kommt die Killer-App? Vermutlich wird es nie eine Killer-Applikation geben, die dem Semantic Web zum Durchbruch verhelfen wird. Gab es eine Killer-Website, die dem WWW zum Durchbruch verhalf? Stattdessen wird es viele kleine Semantic Webs geben, die sich in bestimmten Nutzerkreisen oder bei bestimmten Anwendungsfllen durchsetzen, z. B. RSS oder FOAF. Der Wandel hin zum Semantic Web wird sich hinter den Kulissen vollziehen, so dass Otto-Normalsurfer nichts davon mitbekommt. Groe E-Commerce-Websites knnten die Entwicklung drastisch beschleunigen.
  • Folie 75
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Inhalt Die Vision des Semantic Web Grundlegende Technologien Praktische Anwendungen Einsatzszenarien in der Medizin
  • Folie 76
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Medizinische Informationsportale RSS fr Neuigkeiten und Termine FOAF als Visitenkarte Entweder aus Verzeichnisdienst generieren oder FOAF-a-Matic Microformats fr Termine und Kontaktinformationen Sptestens bei der nchsten berarbeitung mit einplanen, wenn man sich sowieso strker mit CSS beschftigen will Generell gilt: Catch the low hanging fruit! Mit geringem Aufwand den Nutzern einen zustzlichen Service bieten.
  • Folie 77
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Verteilte Studienregister Anstelle eines zentralen Dienstes wird die bestehende Web-Infrastruktur von Studien- gruppen und Forschungsprojekten genutzt. Beschreibung von Studien mit RDF Entweder aus der lokalen Studiendatenbank Oder mittels GRDDL oder RDF/A Ein zentrales Schema fr die Beschreibung ist nicht zwingend notwendig Mapping individueller Schemata aufeinander Vereinfacht die Organisation
  • Folie 78
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Planung und Durchfhrung von Studien Beschreibung von Studien-Items mit RDF Nutzung dieser Beschreibungen zur Erzeugung der Studiendatenbanken Generierung von Studiendokumenten (CRFs) Annotation der Studienprotokolle Kommunikation mit Studienregistern
  • Folie 79
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Semantisch annotierte SOPs SOPs besitzen meist eine Grundstruktur, klar definierte Zielgruppen und Anwendungsflle. ber Annotationen kann die Erreichbarkeit und Bekanntmachung von SOPs verbessert werden. Zielgruppengerichtete Information ber Neuerungen Anwendungsfallbezogene Suche in SOP-Systemen Integration direkt in die Arbeitsumgebung
  • Folie 80
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Semantische Wrterbcher Wrterbcher dienen dazu, die vielschichtigen Begrifflichkeiten in der Medizin klarer zu fassen und Missverstndnisse zu vermeiden. Eine semantische Beschreibung von Wrterbucheintrgen hilft, Begriffe und ihre Bedeutungen im richtigen Kontext zu gebrauchen. In Verbindung mit annotierten SOPs liefern sie die korrekten Begriffe beim Nachschlagen. Bei Studienregistern sorgen sie fr eine przise Interpretation von Studieneigenschaften (z. B. beim Begriff der Remission)
  • Folie 81
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Medizinische Ontologien Eine Grundlage fr die Beschreibung medizinischer Sachverhalte sind Vokabulare, Terminologien und Klassifikationen. ICD-10, SNOMED, MeSH, UMLS, GALEN Das National Cancer Institute (NCI) stellt mit ihren Enterprise Vocabulary Services ein umfangreiches Vokabular fr die Onkologie bereit. Wem das alles zu schwergewichtig ist, der kann sich natrlich auch seine eigene Ontologie erstellen. Die Interoperabilitt wird durch Mappings gewhrleistet.
  • Folie 82
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Ausblick Das Semantic Web steckt noch in seinen Kinderschuhen Noch stehen nicht alle bentigten Bausteine zur Verfgung Die Praxistauglichkeit mancher Ideen muss sich erst zeigen Medizinische Anwendungsgebiete stehen explizit im Fokus der Forschung rund um das Semantic Web Eine ergiebige Domne mit breitem Anwendungsspektrum und einer Vielzahl von Profiteuren (rzte, Patienten, Wissenschaftler, Controller) Das Semantic Web wird allmhlich seinen Nutzen zeigen Mitmachen ist gefragt, sonst droht das Henne-Ei-Problem
  • Folie 83
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Zusammenfassung Das Semantic Web macht Wissen im World Wide Web fr Maschinen verstndlich und nutzbar. Es ist eine Ergnzung des bestehenden Web, die weitgehend unsichtbar fr den Menschen mit Daten operiert. Die Daten stammen entweder aus Datenbanken oder aus semantisch ausgezeichneten Webdokumenten. Die Infrastruktur und Grundbausteine des WWW werden genutzt: URI, Unicode, XML Auf ihnen setzen die Sprachen des Semantic Web auf
  • Folie 84
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Zusammenfassung RDF zur Beschreibung von Dingen im Semantic Web Statements (Subject, Property, Value) bilden RDF-Graphen OWL zur Beschreibung von Vokabularen oder Ontologien Definition von Klassen, ihren Eigenschaften und Beziehungen Unerlsslich fr das Schlussfolgern impliziten Wissens SPARQL zur Abfrage von RDF-Stores Das SQL fr das Semantic Web Regeln, Logik, Beweisen, Signatur und Verschlsselung werden in der Zukunft ein vertrauensrdiges SW erlauben
  • Folie 85
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Zusammenfassung Aktuelle Anwendungsgebiete des Semantic Web RSS fr Nachrichten-Schlagzeilen FOAF als Visitenkarte GRDDL, Microformats und RDF/A fr semantisches Markup von Webdokumenten Im medizinischen Umfeld ist die Nutzung des Semantic Webs fr Studienregister, SOPs oder Wrterbcher vorstellbar Neue Anwendungsflle bentigen nur ein wenig Phantasie und der sind keine Grenzen gesetzt!
  • Folie 86
  • Institut fr Medizinische Informatik, Statistik und Epidemiologie Kontakt Roland Mcke Institut fr Medizinische Informatik, Statistik und Epidemiologie (IMISE) Universitt Leipzig Hrtelstrae 16-18 04107 Leipzig Tel.: +49 341 97 16165 E-Mail: [email protected]