dezvoltarea aplicațiilor web (7/12): arhitectura aplicaţilor rdf. linked open data
DESCRIPTION
Dezvoltarea aplicațiilor Web (7/12) — detalii la http://profs.info.uaic.ro/~busaco/teach/courses/wade/web-film.htmlTRANSCRIPT
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
Linked Open Data
Dezvoltarea aplicațiilor Web
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
“E mai ușor să negi lucrurile,decât să te informezi despre ele.”
Mariano José de Larra
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
Web attitude (Tim Berners-Lee)
anyone can say anything about anything
no one knows everything about anything
my system is most valuablebecause of its interconnection to its peers
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
Centrate pe documentepagini statice, situri de companii
Interactiveexpoziţii virtuale, ştiri, e-travel
Tranzacționalee-banking, soluţii B2B, workflow-uri
Colaborativechat, e-learning, servicii peer-to-peer, wiki,…
Orientate spre portaluricomunități, pentru afaceri, Web cetățenesc etc.
De tip ubicuuservicii bazate pe locație, multi-platformă, în timp-realcloud computing
Web socialspații virtuale, activități colaborative, tagging de resurse,volum mare de date (big data)
Web semantic (Web of data)date structurate, recomandare & mediatizare,servicii contextuale, aplicații smartmanagement de cunoștințe + raționament automat
evolu
țiaîn
timp
a com
plexității
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
disponibilitatea datelor la nivel de Web
A fi stocat pe Web(“on the Web”)
ca document “opac”– disponibil într-un format proprietar sau nu –
fără a referi, pe baza standardelor Web,alte resurse de interes
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
disponibilitatea datelor la nivel de Web
A fi descoperibil pe baza standardelor Web(“in the Web”)
folosind modele/formate de date deschise(e.g., HTML, XML, JSON, RDF etc.)
aliniate principiilor hipertextului/hipermedia,procesabile independent de platformă
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
Necesitatea modelării cunoștințelor
knowledge modeling
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
Necesitatea modelării cunoștințelor
knowledge modeling
“instrumente” cognitive umane:formal logic, rules, concepts, analogies,
images, neural connections
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
Apare necesitatea managementului acestora
knowledge management
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
Aspecte privind managementul cunoștințelorShadbolt & O’Hara, 2004
achiziția (acquiring)modelarea (modelling)obținerea (retrieving)reutilizarea (reusing)
publicarea (publishing)mentenanța (maintaining)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
managementul cunoștințelor
Achiziția (acquiring)aplicațiile Web trebuie să preia
informații și/sau cunoștințe,nu date brute – lipsite de semnificație
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
managementul cunoștințelor
Achiziția (acquiring)aplicațiile Web trebuie să preia
informații și/sau cunoștințe,nu date brute – lipsite de semnificație
e.g., texte (formatate) preluate din formulare
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
managementul cunoștințelor
Achiziția (acquiring)aplicațiile Web trebuie să preia
informații și/sau cunoștințe,nu date brute – lipsite de semnificație
utilizatorii obișnuiți nu vor marca dateleîn formate precum HTML sau JSON, XML, RDF etc.
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
de la limbaj natural la modele conceptuale modelate via RDF – proiectul FRED (F. Draicchio et al., 2012)
http://wit.istc.cnr.it/stlab-tools/fred
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
framework-ul Semarglextragerea datelormodelate cu RDFa
(Lev Khomich, 2013)http://semarglproject.org/
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
managementul cunoștințelor
Modelarea (modelling)
conceptele trebuie stocate ca date structurate
ideal, fiecare fragment de informație trebuie modelatriguros la nivel semantic
conform expresivității dorite
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
managementul cunoștințelor
Modelarea (modelling)
conceptele trebuie stocate ca date structurate
ideal, fiecare fragment de informație trebuie modelatriguros la nivel semantic
în practică, acest aspect este aproape imposibil(vezi dificultățile de dezambiguizare a limbajului natural)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
existența modelelor și formatelor eterogene
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
managementul cunoștințelor
Modelarea (modelling)
pași de urmat:identificarea categoriilor (claselor) de resurse,
definirea proprietăților + restricțiilor,completarea – (semi)automată a – datelor despre indivizi:
input explicit, data mining, tagging, microdate HTML5, RDFa etc.
detalii în cursurile viitoare
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
managementul cunoștințelor
Obținerea (retrieving)
mecanisme de interogare și filtrare a cunoștințelor
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
managementul cunoștințelor
Obținerea (retrieving)
oferirea de suport pentru efectuarea de agregări,procesări și extrageri de date/informații/cunoștințe,
în manieră (semi)automată,pe baza meta-datelor și relațiilor dintre entități
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
managementul cunoștințelor
Reutilizarea (reusing)
fiecare entitate trebuie definită doar o singură dată
identificată printr-un URI
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
De ce este mai „bun” un URL precum http://business.data.gov.uk/id/company/04285910
decât înregistrarea
Phil Archer (2013) – www.w3.org/2013/Talks/1016_phila_ldpoint/
SHA PCT PRACTICE BNF CODE BNF NAME ITEMS NIC ACT COST
Q30 5D7 A86003 0101010G0AAABAB Co-Magaldrox_Susp 195mg/220mg/5ml S/F
managementul cunoștințelor
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
De ce este mai „bun” un URL precum http://business.data.gov.uk/id/company/04285910
decât înregistrarea
“because you can look it up; because you can refer to a URI in any context, unlike 'Q30' which only means something
in a specific context”
Phil Archer (2013) – www.w3.org/2013/Talks/1016_phila_ldpoint/
SHA PCT PRACTICE BNF CODE BNF NAME ITEMS NIC ACT COST
Q30 5D7 A86003 0101010G0AAABAB Co-Magaldrox_Susp 195mg/220mg/5ml S/F
managementul cunoștințelor
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
managementul cunoștințelor
Reutilizarea (reusing)
datele trebuie să poată fi accesate la nivel global
oferirea seturilor de date (data sets) deschise
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
managementul cunoștințelor
Reutilizarea (reusing)
datele trebuie să poată fi accesate la nivel global
oferirea seturilor de date (data sets) deschise
aspecte importante:disponibilitate în formate standardizate
politici de acces – copyright, proveniență, licențiereconfidențialitate (privacy)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
managementul cunoștințelor
Reutilizarea (reusing)
depinde și de utilizabilitatea sistemului
formate alternative oferind o sintaxă simplă, standardizatăquery by example
interacțiune naturalăflexibilitate – e.g., oferirea de sugestii
etc.
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
managementul cunoștințelor
Publicarea (publishing)
datele/informațiile/cunoștintele trebuie să poată fipublicate în formate standardizate deschise,care să încurajeze refolosirea în alte contexte
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
managementul cunoștințelor
Publicarea (publishing)
datele/informațiile/cunoștintele trebuie să poată fipublicate în formate standardizate deschise,care să încurajeze refolosirea în alte contexte
de considerat atât utilizatorii umani, cât și aplicațiile
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
managementul cunoștințelor
Mentenanță (maintaining)
necesitatea existenței unor servicii care să asigureconsistența datelor/cunoștințelor
serviciile automate se pot baza pe instrumentede efectuare a raționamentelor (reasoners)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
realitate
Existența unei/unor suite de formalisme, specificații, limbaje, instrumente, servicii specifice
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
realitate
Existența unei/unor suite de formalisme, specificații, limbaje, instrumente, servicii specifice
cu grade de maturitate & adoptie diferite
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
realitate
Benjamin Nowack, 2009
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
Care este arhitectura aplicațiiloraliniate problematicilor Web-ului semantic?
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
Arhitectura aplicațiilor bazate pe RDF(Allemang & Hendler, 2011)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
Lassila & Hendler (2007)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
exemplificare:arhitectura
framework-uluiApache Jena
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
aplicații rdf: SWAML
Extragerea datelor din mesaje de e-mail, în vedereainterogării, reutilizării & publicării ulterioare
(Sergio Fernández et al., 2009)
procesează datele în format mailbox (RFC 4155) șioferă descrieri RDF ale mesajelor, listelor de distribuție
și persoanelor, bazându-se pe SIOC
interogări via SPARQL, publicare folosind RDFa
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
aplicații rdf: SWAML
export în format KML pentru realizarea de mash-up-uripe baza Google Maps (Fernández et al., 2009)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
aplicații rdf: semantic mediawiki
Management colaborativ al conținutuluimodelat semantic (semantic wikis)
Semantic MediaWiki
extensie a sistemului MediaWiki:permite adnotarea semantică a conținutului unui wiki
http://semantic-mediawiki.org/
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
aplicații rdf: semantic mediawiki
Idee: asocierea de perechi proprietate—valoare
fiecărui fragment de informație dintr-un wiki
The title of this book is '''[[Has Title::Cloud Atlas]]'''
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
aplicații rdf: semantic mediawiki
Utilizări în special în e-science(arheologie, biologie, biomedicină,…)
și în domeniul guvernamental, inclusiv în e-learning
http://semantic-mediawiki.org/wiki/Semantic_MediaWiki_publications
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
aplicații rdf: dbpedia
De la conținut colaborativ la adnotare semantică(Christian Bizer et al.)
constituie o bază de cunoștințe
versiunea în limba engleză: descrieri a peste 4 milioane de „lucruri” (things) via RDF
conținut disponibil în 119 limbi – 25 milioane de „things”
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
aplicații rdf: dbpedia
De la conținut colaborativ la adnotare semantică(Christian Bizer et al.)
recurge la diverse modele conceptuale vizând mai multe domenii
acces via SPARQL: http://wiki.dbpedia.org/OnlineAccess?v=d8c
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
aplicatii rdf: exemplificari
surse de date care referă alte entități DBpediaconform Bizer et al., 2009
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
aplicații rdf: dbpedia
Extractori pentru procesarea tipurilor de conținuturioferite de Wikipedia
labelsrdfs:label, interlanguage links, redirects,imagesfoaf:depiction, geo-coordinates,disambiguationdbpedia:disambiguates,
external linksdbpedia:reference, pagelinksdbpedia:wikilink etc.
DBpedia Information Extraction Frameworkimplementat inițial în PHP, actualmente în Scala
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
aplicatii rdf: exemplificari
OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
DBpedia Liveresponsabil cu sincronizarea datelor Wikipedia↔DBpedia
(implementare Java)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
aplicații rdf: freebase
Freebase (preluat de Google în 2011)
model de date specificat semantic, în mod colaborativ
expune seturi de triple RDF
oferă un API deschis + limbaj de interogare propriu: MQL
utilizatorii finali nu trebuie să aibă cunoștințeprivitoare la Web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: aplicatii reale
detalii pentru dezvoltatorii de aplicații la https://developers.google.com/freebase/
restaurantele din preajma Bucureștiului
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
studii de caz: www.w3.org/2001/sw/sweo/public/UseCases/
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
Cum publicăm datele pe Webastfel încât să fie asigurate
reutilizarea și interoperabilitatea?
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data
Paradigmă de publicare a datelor pe Webcare recurge la tehnologiile Web existente
Tom Heath & Christian Bizer, Linked Data: Evolving the Web into a Global Data Space, Morgan & Claypool, 2011
http://linkeddatabook.com/book
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data
Paradigmă de publicare a datelor pe Webcare recurge la tehnologiile Web existente
reducerea redundanțeifacilitarea reutilizării
permiterea descopeririimaximizarea inter-conectivității între “lucruri” înrudite
adoptarea unei viziuni pragmatice
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data
Viziune:
Use the Web of Data as a Content Management System
Use the community at large as content editors
Ivan Herman (2013) – http://www.w3.org/2013/Talks/0902-Lisbon-IH/
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data
Ingrediente de bază:
identificare – URIacces – HTTP
modelare – RDFstructurare – schema.org, RDFa, RDF Schema, OWL
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data
un „nor” al datelor interconectate extrase din DBpediaexemplu furnizat de R. Meymandpour & J. Davis (2013)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: principii (Berners-Lee)
Utilizarea URI-urilor pentru numirea “lucrurilor”
specificarea via URI a oricăror resurse– informaționale sau non-informaționale –,
nu doar a documentelor
identitate unică la nivel global
http://www.w3.org/DesignIssues/LinkedData.html
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: principii (Berners-Lee)
Folosirea de URI-uri ce pot fi vehiculate via HTTP
orice URI are un proprietar:persoană, organizație, specificație,…
utilizatorii/aplicațiile pot localiza resursele(oricine posedă un browser/client Web)
http://www.w3.org/DesignIssues/LinkedData.html
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: principii (Berners-Lee)
Oferirea de informații utile în format RDF
atunci când o agent (entitate) accesează un URI,poate “afla” (meta-)date de interes
http://www.w3.org/DesignIssues/LinkedData.html
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: principii (Berners-Lee)
Includerea în reprezentarea RDFa unor legături spre alte URI-uri
facilitarea descoperirii de informații înrudite(network effect)
http://www.w3.org/DesignIssues/LinkedData.html
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
S. Buraga, „De câte stele sunt datele d-voastră?” (2012)www.slideshare.net/busaco/de-cte-stele-sunt-datele-dvoastra
date de 5 stele (5 ★ Open Data)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
date de 1 stea
conținutul e disponibil pe Web – indiferent de format – conform unei licențe deschise
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
utilizatorii pot vizualiza, lista,stoca local și, eventual, modifica documentul
documentul în sine poate fi partajat via Internet
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
documentul poate fi publicat rapid & facil pe Web
pentru a refolosi datele incluse în documentsunt necesare uneori procesări suplimentare
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
date de 2 stele
suplimentar, conținutul este disponibil pe Webîntr-un format structurat
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
utilizatorii pot procesa documentul– folosind, uzual, software proprietar
documentul poate fi exportat în alt format(structurat sau nu)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
documentul poate fi încă publicat facil pe Web
datele sunt în continuare “încuiate” în document,procesarea depinzând de un anumit program
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
date deschise de 3 stele
recurgerea la un format deschispentru a pune la dispoziție pe Web date
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
datele pot fi gestionate (vizualizate, filtrate, procesate, convertite, refolosite etc.) în orice manieră
asigurarea independenței de platforma software
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
în continuare, documentul poate fi publicat facil pe Web
exportarea datelor într-un format proprietarar putea fi problematică
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
date deschise de 4 stele
adoptarea identificatorilor de resurse (URI-uri) pentru a desemna “lucruri” de interes
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
datele, informațiile și cunoștințele se identifică via URI-uripentru a putea fi ulterior referite și (re)utilizate
uzual, se recurge la modelul RDF
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
publicarea poate fi relativ mai dificilă,necesitând de obicei adoptarea de instrumente și
metodologii specifice tehnologiilor Web-ului semantic
“data in the Web”implicații pe termen lung
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
date deschise de 5 stele
în plus, datele sunt inter-relaționateconform principiilor inițiativei linked data
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
posibilitatea descoperirii altor date de interes (înrudite)direct la momentul procesării
se oferă premisele efectuării de raționamente automate direct la nivel de Web pe baza modelelor conceptuale
exprimate standardizat via SKOS, OWL,…
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
dificultăți:consistența & reconcilierea datelor și cunoștințelor
probleme legate de adopția lentă de către industrie
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
Publicarea pe Web a datelor interconectatereferitoare la whisky – conform (Tom Heath, 2009)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
Publicarea pe Web a datelor interconectatereferitoare la whisky – conform (Tom Heath, 2009)
existența unui magazin virtual destinat connoisseur-uluiafacere online – wiskii.com – fondată de Jeff
informații furnizate de experți ai domeniuluicontribuții realizate și de către utilizatori obișnuițiimplementare bazată pe un server de aplicații Web
date stocate relaționalacces simultan la date în HTML și RDF
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
1. înțelegerea principiilor linked data2. înțelegerea (conceptualizarea) datelor3. alegerea URI-urilor pentru “lucrurile” de interes4. stabilirea infrastructurii5. relaționarea cu alte seturi de date existente6. descrierea & publicarea datelor
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
Care sunt aspectele principale care trebuiesurprinse privind datele aplicației Web?
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
Care sunt aspectele principale care trebuiesurprinse privind datele aplicației Web?
persoane? locații geografice?
artefacte culturale?comentarii? evaluări?
etc.
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
Aspecte – concepte – de interes privindbaza de cunoștințe utilizată de aplicația wiskii.com
distilerii, regiuni & locații geografice, fondatori, proprietari, brand-uri, produse, fotografii,
evaluări (review-uri), comentarii, prețuri & oferte
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
Descrierea datelor pe baza vocabularelor
principii:
reutilizarea, nu inventarea unui alt vocabular
combinarea vocabularelor existente
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
Descrierea datelor pe baza vocabularelor
în contextul studiului de caz,potențiale modele conceptuale ce pot fi folosite:
Geonames – http://www.geonames.org/ontology
GoodRelationsFOAF (Friend Of A Friend)
Review – http://vocab.org/review/
SIOC (Semantically-Interconnected Online Communities)Whisky – http://vocab.org/whisky/
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
Term URI Description
Comment http://purl.org/stuff/rev#Comment A comment on a review.
Feedback http://purl.org/stuff/rev#Feedback Feedback on the review.
Review http://purl.org/stuff/rev#Review A review of an work.
commenter http://purl.org/stuff/rev#commenter The commenter on the review.
hasReview http://purl.org/stuff/rev#hasReview Associates a work with a a review.
hasComment http://purl.org/stuff/rev#hasCommentUsed to associate a review with a comment on the review.
hasFeedback http://purl.org/stuff/rev#hasFeedbackAssociates a review with a feedback on the review.
maxRating http://purl.org/stuff/rev#maxRating A numeric value.
minRating http://purl.org/stuff/rev#minRating A numeric value.
positiveVotes http://purl.org/stuff/rev#positiveVotesNumber of positive usefulness votes (integer).
rating http://purl.org/stuff/rev#rating A numeric value.
reviewer http://purl.org/stuff/rev#reviewer The person that has written the review.
text http://purl.org/stuff/rev#text The text of the review.
title http://purl.org/stuff/rev#title The title of the review.
totalVotes http://purl.org/stuff/rev#totalVotes Number of usefulness votes (integer).
type http://purl.org/stuff/rev#type The type of media of a work under review.
concepte & proprietăți definite de vocabularul Review
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
Descrierea datelor pe baza vocabularelor
vocabularele (tipurile de date) definite pot avea ulterioratașate specificații formale
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
Alegerea URI-urilor corespunzătoare
principii:recurgerea la schema HTTP pentru facilitarea accesului
http://vocab.org/whisky/terms/Brand
versusurn:whisky-vocab:brand
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
Alegerea URI-urilor corespunzătoare
principii:evitarea imixtiunii în alte spații de nume
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
Alegerea URI-urilor corespunzătoare
principii:abstractizare – evitarea detaliilor de implementare
http://dbpedia.org/resource/Romania
versushttp://www4.wiwiss.fu-berlin.de:2020/demos/dbpedia/cgi-bin/
resources.php?id=Romania
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
Alegerea URI-urilor corespunzătoare
principii:folosirii unei singure convenții de referire
# (hash) sau / (slash)
http://undeva.info/foaf.rdf#me
versushttp://undeva.info/id/me
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
șabloane de stabilire a URI-urilor
http://dbpedia.org/resource/Science Thing (concept)
http://dbpedia.org/data/Science Date RDF
http://dbpedia.org/page/Science Pagină HTML
http://revyu.com/people/tom Thing (concept)
http://revyu.com/people/tom/about/rdf Date RDF
http://revyu.com/people/tom/about/html Pagină HTML
http://undeva.info/concept Thing (concept)
http://undeva.info/concept.rdf Date RDF
http://undeva.info/concept.html Pagină HTML
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
Exemplificări (clasă + instanță):
regiuni http://wiskii.com/regions/speyside
distilerii http://wiskii.com/distilleries/talisker
brand-uri http://wiskii.com/brands/talisker
produse http://wiskii.com/products/talisker-10-yo
persoane http://wiskii.com/people/william-matheson
fotografii http://wiskii.com/photos/58
review-uri http://wiskii.com/reviews/271
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
Accesul la o anumită reprezentare – exemple:
concept http://wiskii.com/brands/talisker
date RDF http://wiskii.com/brands/talisker/rdf
pagină HTML http://wiskii.com/brands/talisker/html
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
Stabilirea infrastructurii
HTML RDF
aplicațieWeb
date
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
HTML RDF
aplicațieWeb
date
http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
HTML RDF
aplicațieWeb
date
http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf
http://wiskii.com/brands/talisker
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
HTML RDF
aplicațieWeb
date
http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf
http://wiskii.com/brands/talisker
HTTP GET
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
HTML RDF
aplicațieWeb
date
http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf
http://wiskii.com/brands/talisker
HTTP GET
HTTP 303 See Other HTTP 303 See Other
content negotiation
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
Instrumente utile la http://linkeddata.org/tools
a se parcurge și http://www.w3.org/wiki/LinkedData
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
Relaționarea cu alte seturi de datede revăzut “norul” linked data – http://lod-cloud.net/
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
Relaționarea cu alte seturi de date
informațiile privitoare la fiecare set de date RDFpot fi explorate via CKAN
(Comprehensive Knowledge Archive Network)
http://ckan.org/
http://thedatahub.org/
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
Relaționarea cu alte seturi de date
aspecte de interes privind vocabularele publice:gradul de utilizare
mentenanțaaplicabilitateaexpresivitatea
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
Relaționarea cu alte seturi de date
predicate generice folosite uzual:owl:sameAs
foaf:homepage, foaf:topic, foaf:based_near, foaf:maker,foaf:depiction, foaf:primaryTopic,…
rdfs:seeAlso
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
Relaționarea cu alte seturi de date – exemplificare:
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
Relații între diverse resurse din seturi de date diferite:
<http://dbpedia.org/resource/Kolkata>
owl:sameAs freebase:Kolkata ;
owl:sameAs <http://sws.geonames.org/1275004> ;
owl:sameAs <http://ru.dbpedia.org/resources/Калькутта> ;
...
<http://sws.geonames.org/1275004>
rdfs:seeAlso <http://dbpedia.org/resource/Kolkata>
wgs84_pos:lat "22.56263" ;
wgs84_pos:long "88.36304" ;
gn:parentCountry <http://sws.geonames.org/1269750> ;
...
după Ivan Herman (2013)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data
Descrierea & publicarea datelor interconectate
voiD (Vocabulary of Interlinked Datasets)
K. Alexander, R. Cyganiak, M. Hausenblas & J. Zhao, 2010
http://www.w3.org/2001/sw/interest/void/
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: cerințe (Health & Bizer)
Calitatea datelor
Disponibilitatea și stabilitatea setului de date
Publicarea direct pe situl public
Claritate privind termenii de utilizare (licențiere)
Existența aplicațiilor
don’t repeat yourself
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
statistici vizând “norul” linked open data (9 ianuarie 2013)http://stats.lod2.eu/
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: studiu de caz
statistici vizând linked open data (12 noiembrie 2013)http://stats.lod2.eu/
639 vs. 2289 seturi de date1,7 miliarde vs. 62 miliarde de triple RDF
49,8% vs. 61,9% date având erori
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data
Aspecte privind cele mai bune practici:
identificarea resurselor – identifier patternsmodelare – modelling patterns
publicare a datelor – publishing patternsmanagement al datelor – data management patterns
dezvoltare de aplicații – application patterns
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data
Mai multe detalii:
Leigh Dodds & Ian Davis, Linked Data Patterns. A pattern catalogue for modelling, publishing, and consuming
Linked Data, 2012:http://patterns.dataincubator.org/
a se studia și http://schoolofdata.org/handbook/
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: testare & depanare
Verificarea corectitudinii sintaxei RDF
W3C RDF Validator – www.w3.org/RDF/Validator/
Eyeball (instrument bazat pe Apache Jena)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: testare & depanare
Verificarea infrastructurii(e.g., dereferențierea URL-urilor)
RDF:Alerts – http://swse.deri.org/RDFAlerts/
Sindice Inspector – http://inspector.sindice.com/
Vapour Linked Data Validator – idi.fundacionctic.org/vapour
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: testare & depanare
Depanarea (inspectarea triplelor) RDF
manuală
eventual, preluând datele – în stilul REST –via cURL sau un instrument similar
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: testare & depanare
Depanarea (inspectarea triplelor) RDF
recurgerea la un hyperdata (semantic) browser
e.g., instrumentul OpenLink Data Explorer ca extensiea unui navigator Web actual – http://ode.openlinksw.com/
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: testare & depanare
Vizualizarea datelor interconectate
exemplificări:
platforma Callimachus – http://callimachusproject.org/
aplicația Web LodLive – http://en.lodlive.it/
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
instrumentul LodLive
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
Există aplicații Web realealiniate “curentului” linked data?
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
aplicația #1
linked dataserver #1
linked dataserver #2
HTTP
aplicația #2
Ivan
Her
man
(20
13
)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
SPARQL / RDF API
arhitectura tratificată a aplicațiilor bazate pe linked data(Tom Heath & Christian Bizer, 2011)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: aplicații
Revyu.comSemantic Web reviewing and rating site
(T. Health & E. Motta, 2008)
permite integrarea datelor evaluate de utilizatori
review-urile sunt stocate + publicate transparent în RDF(utilizatorii finali introduc datele în mod tradițional)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: aplicații
Revyu.com
recurge la vocabulare ca Review, FOAF (Friend Of AFriend), SKOS (Simple Knowledge Organizational System)
interogări pe baza unui punct terminal SPARQL
interconectare cu alte seturi de date:DBpedia, OpenGuides, RDF Book Mashup etc.
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: aplicații
Proiectul Europeana
inițiativă de prezervare a conținutul cultural reprezentativ din statele europene
acces deschis la date interconectatevia data.europeana.eu
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
definește EDM (Europeana Data Model) bazat pe standardeRDF și OWL + vocabulare ca DCMI, FOAF, Open Archive
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: aplicații
myExperiment (David De Roure et al.)
aplicație Web colaborativă – bazată pe Ruby on Rails –pentru managementul workflow-urilor științifice
și a altor obiecte vizând cercetarea
modelarea datelor se bazează pe RDF:http://rdf.myexperiment.org/
acces la date publice via SPARQL
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: aplicații
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: aplicații
Inițiativele semantic (open) e-government
linked data în contextul informațiilor publice ale UK:http://data.gov.uk/linked-data
un proiect similar:USA – http://www.data.gov/developers/page/semantic-web
de studiat și prezentările lui Richard Wallis:www.slideshare.net/rjw
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: aplicații
acces la date publice oficiale după gradul de deschidere (openness score)
http://data.gov.uk/data/search?openness_score=5
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: aplicații
SIGMA (SemantIc Government Mashup Application)Claudia Gheorghiu, Radu Nicolescu, Andrei Vasile Bogdan,
Cristian Ochișor, Sabin Buraga, Lenuța Alboaie (2011)
platformă Web extensibilă capabilă să creeze mashup-urioferind acces la date guvernamentale deschise
includerea unei soluții proprii de acces via un end-pointSPARQL la date guvernamentale preluate de la gov.ro
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: aplicații
Alte utilizări – conform Stefan Decker et al., 2012:
mass-mediaBBC, Guardian, New York Times
publicații academiceCrossRef, Nature
biblioteci (digitale)Library of Congress, SUDOC (Franța), Vatican,…
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
linked data: aplicații
Pentru diverse exemplificări, a se consulta și lucrările atelierelor de lucru LDOW (Linked Data on the Web)
http://events.linkeddata.org/ldow2013/
http://events.linkeddata.org/ldow2012/
http://events.linkeddata.org/ldow2011/
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
“concluzii”
“Software – as a service or not – is just a container.What makes software valuable has always been what
it does to data. Now, in the same spirit of SOA and SaaS,a new concept is emerging, Data-as-a-Service – DaaS.”
Pete Soderling, august 2010http://goo.gl/S4dYy
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
rezumat
aplicații bazate pe Web of dataarhitectură, linked data, studii de caz
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
episodul viitor: evaluarea proiectului (D)joi, 21 noiembrie, 10:00 – C308