"warum metadaten? ein plädoyer und mehr …" - webtechcon 2011 präsentation

57
Sasaki – Webtechcon 2011 Warum Metadaten? Ein Plädoyer und mehr … Felix Sasaki DFKI / FH Potsdam [email protected] 1

Upload: felix-sasaki

Post on 11-Jul-2015

848 views

Category:

Technology


1 download

TRANSCRIPT

Page 1: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Warum  Metadaten?  Ein  Plädoyer  und  mehr  …  

Felix  Sasaki  DFKI  /  FH  Potsdam  [email protected]  

1  

Page 2: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Überblick  

•  Metadaten:  Warum?  •  Geschichte  •  Metadaten  im  Web  •  Metadaten  und  Websearch  •  Metadaten  und  Sprachtechnologie  •  Fazit  

2  

Page 3: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Warum  Metadaten?  

3  

Page 4: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Warum  Metadaten?  (1)  

4  

Nicht  überall  hineinschauen  

müssen  

Page 5: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Warum  Metadaten?  (2)  

5  

Nicht  überall  hineinschauen  

können  

...  

Page 6: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Warum  Metadaten?  (3)  

6  

Prozesse  steuern  

Wo  soll  ich  hin?  

Page 7: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Überblick  

•  Metadaten:  Warum?  •  Geschichte  •  Metadaten  im  Web  •  Metadaten  und  Websearch  •  Metadaten  und  Sprachtechnologie  •  Fazit  

7  

Page 8: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Bibliotheken:  Ursprung  von  Metadaten  

8  

Page 9: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Bibliotheken:  Ursprung  von  Metadaten  

9  

Page 10: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Bibliotheken:  Ursprung  von  Metadaten  

10  

Page 11: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Metadaten:  nicht  überall  hereinschauen  können  

11  

?  

Page 12: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Metadaten:  Standardisierung  hil_  

12  

Bibliotheks-­‐klassifikabon  

Page 13: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Standardisierung  hil_?  

13  

Dewey  Decimal  Classificabon  

Library  of  Congress  Classificabon  Nippon  Decimal  Classificabon  

Chinese  Library  Classificabon  

Universal  Decimal  Classificabon  

Regensburger  Verbundklassifikabon  Basisklassifikabon  

…  

Page 14: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Man  muss  wissen  wo(für)  

14  

Dewey  Decimal  Classificabon  

Library  of  Congress  Classificabon  Nippon  Decimal  Classificabon  

Chinese  Library  Classificabon  

Universal  Decimal  Classificabon  

Regensburger  Verbundklassifikabon  Basisklassifikabon  

…  Geeignet  je  nach  Region,  Sprache,  wissenscha_lich  vs.  allgemein,  Fachgebiet,  ...  

Page 15: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Überblick  

•  Metadaten:  Warum?  •  Geschichte  •  Metadaten  im  Web  •  Metadaten  und  Websearch  •  Metadaten  und  Sprachtechnologie  •  Fazit  

15  

Page 16: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Metadaten  im  Web  –  überall!  

16  

Page 17: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011   17  

Von  hkp://www.w3.org/TR/webarch/    

Page 18: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011   18  

Idenbfikatoren  

Von  hkp://www.w3.org/TR/webarch/    

Page 19: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011   19  

Idenbfikatoren  

HTTP  Header  

Von  hkp://www.w3.org/TR/webarch/    

Page 20: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011   20  

Idenbfikatoren  

HTTP  Header  

Doctype  

Von  hkp://www.w3.org/TR/webarch/    

Page 21: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011   21  

Idenbfikatoren  

HTTP  Header  

Doctype  

Im  Inhalt  

Von  hkp://www.w3.org/TR/webarch/    

Page 22: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Metadaten  im  Inhalt  –  für  ausgewählte  Zielgruppen  

22  

<span  xml:lang="zh-­‐CN">[雪 zh-­‐CN]</span>  <span  xml:lang="ja">[  雪 ja]</span>  <span  xml:lang="ko">[  雪 ko]</span>  

Sprachtags  zur  Glyphauswahl  

Page 23: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Metadaten  im  Inhalt  –  für  ausgewählte  Zielgruppen  

23  

WAI-­‐ARIA  für  Accessibility  

Page 24: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Metadaten  im  Inhalt  –  für  jeden  das  Passende  

•  Metadaten  und  CSS  –  was  ist  der  Unterschied?  •  Keiner  –  nur  (potenbell)  unterschiedliche  Zielgruppen  

•  Metadaten  =  „Styling  für  besondere  Zwecke“  

24  

Page 25: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Metadaten  für  Webdeveloper  –  Warum:  Bringt  Nutzen  

•  Idenbfikatoren:  Verlinke  mich!  •  HTTP  Header:  Finde  mich!  •  Doctype:  Wähle  die  richbge  Engine!  •  Sprachtags:  Wähle  passendes  Layout!  •  WAI-­‐ARIA:  Mache  mich  zugänglich!  

25  

Page 26: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Zwischenfazit:  Metadaten  setzen  sich  durch  

•  Wenn  es  die  richbge  Mischung  gibt  – Metadatenproduzenten  – Metadatenkonsumenten  – Tools  die  beide  unterstützen  – Tolle  (=  besser  als  bisher)  Anwendungen  

26  

Page 27: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Zwischenfazit:  Metadaten  setzen  sich  durch  

•  Wenn  es  die  richbge  Mischung  gibt  – Metadatenproduzenten  – Metadatenkonsumenten  – Tools  die  beide  unterstützen  – Tolle  (=  besser  als  bisher)  Anwendungen  

27  

Triw  zu  für  Dosenproduzenten,  Bibliotheken  und  das  Web  ...  

Page 28: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Überblick  

•  Metadaten:  Warum?  •  Geschichte  •  Metadaten  im  Web  •  Metadaten  und  Websearch  •  Metadaten  und  Sprachtechnologie  •  Fazit  

28  

Page 29: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Metadaten  und  Web  Search:  zunächst  ein  trauriges  Kapitel  ...  

29  

Metadaten  rausschmeißen    

Volltext-­‐index  

Suchanfrage  

Page 30: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Was  wird  rausgeschmissen  

•  Sprachinformabon  ("xml:lang")  •  "meta"  tags  – keywords  – subject  –  language,  – copyright,  – date,  ...  

30  

Page 31: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Eine  (Miss?)erfolgsstory:  Webverzeichnisse  

•  =  (Bibliotheks)katalog  des  Web  – Beispiel  „Open  Directory  Project“  

•  Kribk  – Hierarchische  Struktur  –  das  (soziale)  Netz  ist  ein  Graph!  

– Wem  gehört  das?  – Wer  trägt  bei?  

•  Dieses  Jahr  geschlossen:  „Google  Directory“  

31  

Page 32: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Metadaten  unverzichtbar:  Mulbmedia  

32  

Page 33: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Mulbmedia:  Ein  Wald  von  Metadaten-­‐Formaten  

33  

XMP  

Dublin  Core  

ID3  

EXIF  

YouTube  

CableLabs  Flash  

MP4  

...  

Page 34: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

W3C  „Ontology  for  Media  Resources“:  Mapping  macht  das  Leben  leichter  

34  

Page 35: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

W3C  „Ontology  for  Media  Resources“:  Mapping  macht  das  Leben  leichter  

35  

Mapping  Definibon:  hkp://www.w3.org/TR/mediaont-­‐10/    API  zur  übergreifenden  Abfrage:  hkp://www.w3.org/TR/mediaont-­‐api-­‐1.0/        

Page 36: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Web  Search  ohne  Metadaten:  Suche  nach  „Bank“  

36  

Page 37: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Zwischenfazit  (Wdh.):  Metadaten  setzen  sich  durch  

•  Wenn  es  die  richbge  Mischung  gibt  – Metadatenproduzenten  – Metadatenkonsumenten  – Tools  die  beide  unterstützen  – Tolle  (=  besser  als  bisher)  Anwendungen  

37  

Page 38: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Zwischenfazit  (Wdh.):  Metadaten  setzen  sich  durch  

•  Wenn  es  die  richbge  Mischung  gibt  – Metadatenproduzenten:  Webdeveloper,  CMS  (z.B.  Drupal)  

– Metadatenkonsumenten:  Suchmaschinen  – Tools  die  beide  unterstützen:  Rich  Snippets  Tesbng  Tool    

– Tolle  (=  besser  als  bisher)  Anwendungen:  Die  „richbge“  Bank  finden    

38  

Page 39: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

schema.org  

•  Vokabular  von  Metadaten  •  Von  Bing,  Google,  Yahoo!  „verstanden“  •  Kann  das  „Bank“  Problem  lösen  

39  

Page 40: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

schema.org  

40  

Page 41: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

schema.org:  häufige  Typen  •  Creabve  works:  CreabveWork,  Book,  Movie,  MusicRecording,  Recipe,  TVSeries  ...  

•  Embedded  non-­‐text  objects:  AudioObject,  ImageObject,  VideoObject  

•  Event  •  Organizabon  •  Person  •  Place,  LocalBusiness,  Restaurant  ...  •  Product,  Offer,  AggregateOffer  •  Review,  AggregateRabng  

41  

Page 42: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

schema.org  

42  

Ein  Vokabular  

Schreibweise  RDFa  

Schreibweise  Microdata  

Page 43: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

schema.org  

43  

Ein  Vokabular  

Schreibweise  RDFa  

Schreibweise  Microdata  

Brücke  zum  Semanbc  Web  

Page 44: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

schema.org  

44  

Ein  Vokabular  

Schreibweise  RDFa  

Schreibweise  Microdata  

Brücke  zum  Semanbc  Web  

Auf  schema.org  verwendet  

Page 45: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

schema.org  

45  

Ein  Vokabular  

Schreibweise  RDFa  

Schreibweise  Microdata  

Brücke  zum  Semanbc  Web  

Auf  schema.org  verwendet  

entscheidend  

Page 46: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

schema.org:  Vokabulare  

46  

Bike  mit  entscheiden!  

Page 47: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Überblick  

•  Metadaten:  Warum?  •  Geschichte  •  Metadaten  im  Web  •  Metadaten  und  Websearch  •  Metadaten  und  Sprachtechnologie  •  Fazit  

47  

Page 48: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Metadatenlücke  in  der  maschinellen  Übersetzung  (vgl.  wtc  2010)  

•  Eingabe  aus  www.postbank.de  „Ob  Postbank  direkt,  Online-­‐Banking,  Online-­‐Brokerage  oder  myBHW.  Die  häufigsten  Fragen  zu  unseren  Transakbonssystemen  finden  Sie  an  dieser  Stelle.“    

•  Ausgabe  via  online  MT  system  “Whether  Postbank  direct,  online  banking,  online  brokerage  or  myBHW.  Frequently  asked  quesbons  about  our  transacbon  systems  can  be  found  at  this  locabon.”  

48  

Page 49: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Metadatenlücke  in  der  maschinellen  Übersetzung  (vgl.  wtc  2010)  

•  Eingabe  aus  www.postbank.de  „Ob  Postbank  direkt,  Online-­‐Banking,  Online-­‐Brokerage  oder  myBHW.  Die  häufigsten  Fragen  zu  unseren  Transakbonssystemen  finden  Sie  an  dieser  Stelle.“    

•  Ausgabe  via  online  MT  system  “Whether  Postbank  direct,  online  banking,  online  brokerage  or  myBHW.  Frequently  asked  quesbons  about  our  transacbon  systems  can  be  found  at  this  locabon.”  

Terminologie    wurde  fälschlicherweise  übersetzt  –  warum?  

49  

Page 50: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Prozess:  vom  „Deep  Web“  zum  „Surface  Web“  

•  Eingabe  aus  dem  „Deep  Web“:  „Ob  <term>Postbank  direkt</term>,  <term>Online-­‐Banking</term>,  <term>Online-­‐Brokerage</term>  …“    

•  Ausgabe  im  Web:  „Ob  <em>Postbank  direkt</em>,  <em>Online-­‐Banking</em>,  <em>Online-­‐Brokerage</em>  …“    

Terminology  (=  metadata)  …  

 …  ist  verloren  im  Web  L  

Publikabons-­‐  prozess  

50  

Page 51: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Zukün_ige  W3C  Arbeitsgruppe  „MLW-­‐LT“:  Metadatenlücken  schließen  •  DFKI  •  Trinity    College  Dublin  •  Dublin  City  University  •  Moravia  •  Univ.  of  Econ.  Prague  •  Microso_  •  Enlaso  

•  Insbtut  Jozef  Stefan  •  University  of  Limerick  •  Cocomore  •  Linguaserve  •  VistaTEC  •  Lucy  So_ware  •  Alchemy  So_ware  

51  

W3C  als  Ort  der  Standardisierung  

Page 52: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Zukün_ige  W3C  Arbeitsgruppe  „MLW-­‐LT“:  Metadatenlücken  schließen  •  DFKI  •  Trinity    College  Dublin  •  Dublin  City  University  •  Moravia  •  Univ.  of  Econ.  Prague  •  Microso_  •  Enlaso  

•  Insbtut  Jozef  Stefan  •  University  of  Limerick  •  Cocomore  •  Linguaserve  •  VistaTEC  •  Lucy  So_ware  •  Alchemy  So_ware  

52  

W3C  als  Ort  der  Standardisierung  

Page 53: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Zwischenfazit  (Wdh.):  Metadaten  setzen  sich  durch  

•  Wenn  es  die  richbge  Mischung  gibt  – Metadatenproduzenten  – Metadatenkonsumenten  – Tools  die  beide  unterstützen  – Tolle  (=  besser  als  bisher)  Anwendungen  

53  

Page 54: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Zwischenfazit  (Wdh.):  Metadaten  setzen  sich  durch  

•  Wenn  es  die  richbge  Mischung  gibt  – Metadatenproduzenten:  Lokalisierungsfirmen,  Webdeveloper,  CMS  Provider,  ...  

– Metadatenkonsumenten:  MT  Tools,  Lokalisierungsfirmen  

– Tools  die  beide  unterstützen:  Online  MT  Tools  – Tolle  (=  besser  als  bisher)  Anwendungen:  Bessere  Sprachtechnologie  

54  

Page 55: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Überblick  

•  Metadaten:  Warum?  •  Geschichte  •  Metadaten  im  Web  •  Metadaten  und  Websearch  •  Metadaten  und  Sprachtechnologie  •  Fazit  

55  

Page 56: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Fazit  =  Zwischenfazit:  Metadaten  setzen  sich  durch  

•  Wenn  es  die  richbge  Mischung  gibt  – Metadatenproduzenten  – Metadatenkonsumenten  – Tools  die  beide  unterstützen  – Tolle  (=  besser  als  bisher)  Anwendungen  

56  

Page 57: "Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

Sasaki  –  Webtechcon  2011  

Warum  Metadaten?  Ein  Plädoyer  und  mehr  …  

Felix  Sasaki  DFKI  /  FH  Potsdam  [email protected]  

57