wade 2014—2015 (07/12): semantic web—arhitectura aplicaţiilor rdf. iniţiativa lod (linked open...

127
Dr. Sabin Buragawww.purl.org/net/busaco Dezvoltarea aplicațiilor Web Linked Open Data

Upload: sabin-buraga

Post on 15-Jul-2015

102 views

Category:

Technology


1 download

TRANSCRIPT

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Dezvoltarea aplicațiilor Web

♻Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

“E mai ușor să negi lucrurile,decât să te informezi despre ele.”

Mariano José de Larra

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Web attitude (Tim Berners-Lee)

anyone can say anything about anything

no one knows everything about anything

my system is most valuablebecause of its interconnection to its peers

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

disponibilitatea datelor la nivel de Web

A fi stocat pe Web(“on the Web”)

ca document „opac”– disponibil într-un format proprietar sau nu –

fără a referi, pe baza standardelor Web,alte resurse de interes

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

disponibilitatea datelor la nivel de Web

A fi descoperibil pe baza standardelor Web(“in the Web”)

folosind modele/formate de date deschise(e.g., HTML, XML, JSON, RDF etc.)

aliniate principiilor hipertextului/hipermedia,procesabile independent de platformă

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Necesitatea modelării cunoștințelor

knowledge modeling

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Necesitatea modelării cunoștințelor

knowledge modeling

„instrumente” cognitive umane:formal logic, rules, concepts, analogies,

images, neural connections

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Apare necesitatea managementului acestora

knowledge management

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Aspecte privind managementul cunoștințelorShadbolt & O’Hara, 2004

achiziția (acquiring)modelarea (modelling)obținerea (retrieving)reutilizarea (reusing)

publicarea (publishing)mentenanța (maintaining)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

managementul cunoștințelor

Achiziția (acquiring)aplicațiile Web trebuie să preia

informații și/sau cunoștințe,nu date brute – lipsite de semnificație

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

managementul cunoștințelor

Achiziția (acquiring)aplicațiile Web trebuie să preia

informații și/sau cunoștințe,nu date brute – lipsite de semnificație

e.g., texte (formatate) preluate din formulare

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

managementul cunoștințelor

Achiziția (acquiring)aplicațiile Web trebuie să preia

informații și/sau cunoștințe,nu date brute – lipsite de semnificație

utilizatorii obișnuiți nu vor marca dateleîn formate precum HTML sau JSON, XML, RDF etc.

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

FRED: de la limbaj natural la modele conceptuale modelate via RDF (F. Draicchioet al., 2012) http://wit.istc.cnr.it/stlab-tools/fred

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

framework-ul Semarglextragerea datelormodelate cu RDFa

(Lev Khomich, 2013)http://semarglproject.org/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

managementul cunoștințelor

Modelarea (modelling)

conceptele trebuie stocate ca date structurate

ideal, fiecare fragment de informație trebuie modelatriguros la nivel semantic

conform expresivității dorite

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

managementul cunoștințelor

Modelarea (modelling)

conceptele trebuie stocate ca date structurate

ideal, fiecare fragment de informație trebuie modelatriguros la nivel semantic

în practică, acest aspect este aproape imposibil(vezi dificultățile de dezambiguizare a limbajului natural)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

existența modelelor și formatelor eterogene

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

managementul cunoștințelor

Modelarea (modelling)

pași de urmat:identificarea categoriilor (claselor) de resurse,

definirea proprietăților + restricțiilor,completarea – (semi)automată a – datelor despre indivizi:

input explicit, data mining, tagging, microdate HTML5, RDFa etc.

detalii în cursurile viitoare

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

managementul cunoștințelor

Obținerea (retrieving)

mecanisme de interogare și filtrare a cunoștințelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

managementul cunoștințelor

Obținerea (retrieving)

oferirea de suport pentru efectuarea de agregări,procesări și extrageri de date/informații/cunoștințe,

în manieră (semi)automată,pe baza meta-datelor și relațiilor dintre entități

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

managementul cunoștințelor

Reutilizarea (reusing)

fiecare entitate trebuie definită doar o singură dată

identificată printr-un URI

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

De ce este mai „bun” un URL precum http://business.data.gov.uk/id/company/04285910

decât înregistrarea

Phil Archer (2013) – www.w3.org/2013/Talks/1016_phila_ldpoint/

SHA PCT PRACTICE BNF CODE BNF NAME ITEMS NIC ACT COST

Q30 5D7 A86003 0101010G0AAABAB Co-Magaldrox_Susp 195mg/220mg/5ml S/F

managementul cunoștințelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

De ce este mai „bun” un URL precum http://business.data.gov.uk/id/company/04285910

decât înregistrarea

“because you can look it up; because you can refer to a URI in any context, unlike 'Q30' which only means something

in a specific context”

Phil Archer (2013) – www.w3.org/2013/Talks/1016_phila_ldpoint/

SHA PCT PRACTICE BNF CODE BNF NAME ITEMS NIC ACT COST

Q30 5D7 A86003 0101010G0AAABAB Co-Magaldrox_Susp 195mg/220mg/5ml S/F

managementul cunoștințelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

managementul cunoștințelor

Reutilizarea (reusing)

datele trebuie să poată fi accesate la nivel global

oferirea seturilor de date (data sets) deschise

http://ideasource.blankdots.com/2012/08/open-data-sources/

http://datahub.io/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

managementul cunoștințelor

CERN Open Data Portalhttp://opendata.cern.ch/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

managementul cunoștințelor

Reutilizarea (reusing)

aspecte importante:disponibilitate în formate standardizate

politici de acces – copyright, proveniență, licențiereconfidențialitate (privacy)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

managementul cunoștințelor

Reutilizarea (reusing)

depinde și de utilizabilitatea sistemului

formate alternative cu o sintaxă simplă, standardizatăinterogări bazate pe exemple (query by example)

interacțiune naturalăflexibilitate – e.g., oferirea de sugestii sau exemplificări

etc.

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

managementul cunoștințelor

Publicarea (publishing)

datele/informațiile/cunoștintele trebuie să poată fipublicate în formate standardizate deschise,care să încurajeze refolosirea în alte contexte

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

managementul cunoștințelor

Publicarea (publishing)

datele/informațiile/cunoștintele trebuie să poată fipublicate în formate standardizate deschise,care să încurajeze refolosirea în alte contexte

de considerat atât utilizatorii umani, cât și aplicațiile

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

managementul cunoștințelor

Mentenanță (maintaining)

necesitatea existenței unor servicii care să asigureconsistența datelor/cunoștințelor

serviciile automate se pot baza pe instrumentede efectuare a raționamentelor (reasoners)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

realitate

Existența unei/unor suite de formalisme, specificații, limbaje, instrumente, servicii specifice

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

realitate

Existența unei/unor suite de formalisme, specificații, limbaje, instrumente, servicii specifice

cu grade de maturitate și adopție diferite

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

realitate

Benjamin Nowack, 2009

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Care este arhitectura aplicațiiloraliniate problematicilor Web-ului semantic?

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Arhitectura aplicațiilor bazate pe RDF(Allemang & Hendler, 2011)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Ora Lassila & James Hendler (2007)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

aplicații rdf: SWAML

Extragerea datelor din mesaje de e-mail, în vedereainterogării, reutilizării & publicării ulterioare

(Sergio Fernández et al., 2009)

procesează datele în format mailbox (RFC 4155) șioferă descrieri RDF ale mesajelor, listelor de distribuție

și persoanelor, bazându-se pe SIOC

interogări via SPARQL, publicare folosind RDFa

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

aplicații rdf: SWAML

export în format KML pentru realizarea de mash-up-uripe baza Google Maps (Fernández et al., 2009)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

aplicații rdf: semantic mediawiki

Management colaborativ al conținutuluimodelat semantic (semantic wikis)

Semantic MediaWiki

extensie a sistemului MediaWiki:permite adnotarea semantică a conținutului unui wiki

http://semantic-mediawiki.org/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

aplicații rdf: semantic mediawiki

Idee: asocierea de perechi proprietate—valoare

fiecărui fragment de informație dintr-un wiki

The title of this book is '''[[Has Title::Cloud Atlas]]'''

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

aplicații rdf: semantic mediawiki

Utilizări în special în e-science(arheologie, biologie, biomedicină,…)

și în domeniul guvernamental, inclusiv în e-learning

http://semantic-mediawiki.org/wiki/Semantic_MediaWiki_publications

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

aplicații rdf: dbpedia

De la conținut colaborativ la adnotare semantică(Christian Bizer et al.)

constituie o bază de cunoștințe:seturi de date (datasets) + model conceptual

versiunea în limba engleză: descrieri RDF a peste 4.5 milioane de „lucruri” (things)

conținut disponibil în 125 limbi – 38 milioane de „things”

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

aplicații rdf: dbpedia

De la conținut colaborativ la adnotare semantică(Christian Bizer et al.)

recurge la diverse modele conceptuale (ontologii) vizând mai multe domenii

acces via SPARQL: http://wiki.dbpedia.org/OnlineAccess

versiune curentă: septembrie 2014asocieri multilingve de concepte pentru 28 de limbi

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

aplicatii rdf: exemplificari

surse de date care referă alte entități DBpediaconform Bizer et al., 2009

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

aplicații rdf: dbpedia

Extractori pentru procesarea tipurilor de conținuturioferite de Wikipedia

labelsrdfs:label, interlanguage links, redirects,imagesfoaf:depiction, geo-coordinates,disambiguationdbpedia:disambiguates,

external linksdbpedia:reference, pagelinksdbpedia:wikilink etc.

DBpedia Information Extraction Frameworkimplementat inițial în PHP, actualmente în Scala

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

aplicatii rdf: exemplificari

OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

DBpedia Liveresponsabil cu sincronizarea datelor Wikipedia↔DBpedia

(implementare Java)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

aplicații rdf: freebase

Freebase (preluat de Google în 2011)

model de date specificat semantic, în mod colaborativ

expune seturi de triple RDF

oferă un API deschis + limbaj de interogare propriu: MQL

utilizatorii finali nu trebuie să aibă cunoștințeprivitoare la Web-ul semantic

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: aplicatii reale

detalii pentru dezvoltatorii de aplicații la https://developers.google.com/freebase/

compozițiile muzicale ale lui Vangelis cu durată mai mare de 10 minute

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

studii de caz: www.w3.org/2001/sw/sweo/public/UseCases/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Cum publicăm datele pe Webastfel încât să fie asigurate

reutilizarea și interoperabilitatea?

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data

Paradigmă de publicare a datelor pe Webcare recurge la tehnologiile Web existente

Tom Heath & Christian Bizer, Linked Data: Evolving the Web into a Global Data Space, Morgan & Claypool, 2011

http://linkeddatabook.com/book

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data

Paradigmă de publicare a datelor pe Webcare recurge la tehnologiile Web existente

reducerea redundanțeifacilitarea reutilizării

permiterea descopeririimaximizarea inter-conectivității între „lucruri” înrudite

adoptarea unei viziuni pragmatice

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data

Viziune:

Use the Web of Data as a Content Management System

Use the community at large as content editors

Ivan Herman (2013) – http://www.w3.org/2013/Talks/0902-Lisbon-IH/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data

Ingrediente de bază:

identificare – URIacces – HTTP

modelare – RDFstructurare – schema.org, RDFa, RDF Schema, OWL

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data

un „nor” al datelor interconectate extrase din DBpediaexemplu furnizat de R. Meymandpour & J. Davis (2013)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: principii (Berners-Lee)

Utilizarea URI-urilor pentru numirea „lucrurilor”

specificarea via URI a oricăror resurse– informaționale sau non-informaționale –,

nu doar a documentelor

identitate unică la nivel global

http://www.w3.org/DesignIssues/LinkedData.html

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: principii (Berners-Lee)

Folosirea de URI-uri ce pot fi vehiculate via HTTP

orice URI are un proprietar:persoană, organizație, specificație,…

utilizatorii/aplicațiile pot localiza resursele(oricine posedă un browser/client Web)

http://www.w3.org/DesignIssues/LinkedData.html

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: principii (Berners-Lee)

Oferirea de informații utile în format RDF

atunci când o agent (entitate) accesează un URI,poate „afla” (meta-)date de interes

http://www.w3.org/DesignIssues/LinkedData.html

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: principii (Berners-Lee)

Includerea în reprezentarea RDFa unor legături spre alte URI-uri

facilitarea descoperirii de informații înrudite(network effect)

http://www.w3.org/DesignIssues/LinkedData.html

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

S. Buraga, “Towards 5-star Data in the E-university” (2014)http://www.slideshare.net/busaco/towards-5star-data

date de 5 stele (5 ★ Open Data)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Publicarea pe Web a datelor interconectatereferitoare la whisky – conform (Tom Heath, 2009)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Publicarea pe Web a datelor interconectatereferitoare la whisky – conform (Tom Heath, 2009)

existența unui magazin virtual destinat connoisseur-uluiafacere online – wiskii.com – fondată de Jeff

informații furnizate de experți ai domeniuluicontribuții realizate și de către utilizatori obișnuițiimplementare bazată pe un server de aplicații Web

date stocate relaționalacces simultan la date în HTML și RDF

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

1. înțelegerea principiilor linked data2. înțelegerea (conceptualizarea) datelor3. stabilirea de URI-uri pentru entități (things)4. stabilirea infrastructurii5. relaționarea cu alte seturi de date existente6. descrierea și publicarea datelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Care sunt aspectele principale care trebuiesurprinse privind datele aplicației Web?

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Care sunt aspectele principale care trebuiesurprinse privind datele aplicației Web?

persoane? locații geografice?

artefacte culturale?comentarii? evaluări?

etc.

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Aspecte – concepte – de interes privindbaza de cunoștințe utilizată de aplicația wiskii.com

distilerii, regiuni & locații geografice, fondatori, proprietari, brand-uri, produse, fotografii,

evaluări (review-uri), comentarii, prețuri + oferte

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Descrierea datelor pe baza vocabularelor

principii:

reutilizarea, nu inventarea unui alt vocabular

combinarea vocabularelor existente

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Descrierea datelor pe baza vocabularelor

în contextul studiului de caz,potențiale modele conceptuale ce pot fi folosite:

Geonames – http://www.geonames.org/ontology

GoodRelationsFOAF (Friend Of A Friend)

Review – http://vocab.org/review/

SIOC (Semantically-Interconnected Online Communities)Whisky – http://vocab.org/whisky/

diverse altele furnizate de schema.org

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Term URI Description

Comment http://purl.org/stuff/rev#Comment A comment on a review.

Feedback http://purl.org/stuff/rev#Feedback Feedback on the review.

Review http://purl.org/stuff/rev#Review A review of an work.

commenter http://purl.org/stuff/rev#commenter The commenter on the review.

hasReview http://purl.org/stuff/rev#hasReview Associates a work with a a review.

hasComment http://purl.org/stuff/rev#hasCommentUsed to associate a review with a comment on the review.

hasFeedback http://purl.org/stuff/rev#hasFeedbackAssociates a review with a feedback on the review.

maxRating http://purl.org/stuff/rev#maxRating A numeric value.

minRating http://purl.org/stuff/rev#minRating A numeric value.

positiveVotes http://purl.org/stuff/rev#positiveVotesNumber of positive usefulness votes (integer).

rating http://purl.org/stuff/rev#rating A numeric value.

reviewer http://purl.org/stuff/rev#reviewer The person that has written the review.

text http://purl.org/stuff/rev#text The text of the review.

title http://purl.org/stuff/rev#title The title of the review.

totalVotes http://purl.org/stuff/rev#totalVotes Number of usefulness votes (integer).

type http://purl.org/stuff/rev#type The type of media of a work under review.

concepte și proprietăți definite de vocabularul Review

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Descrierea datelor pe baza vocabularelor

vocabularele (tipurile de date) definite pot avea ulterioratașate specificații formale

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Alegerea URI-urilor corespunzătoare

principii:recurgerea la schema HTTP pentru facilitarea accesului

http://vocab.org/whisky/terms/Brand

versusurn:whisky-vocab:brand

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Alegerea URI-urilor corespunzătoare

principii:evitarea imixtiunii în alte spații de nume

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Alegerea URI-urilor corespunzătoare

principii:abstractizare – evitarea detaliilor de implementare

http://dbpedia.org/resource/Romania

versushttp://www4.wiwiss.fu-berlin.de:2020/demos/dbpedia/cgi-bin/

resources.php?id=Romania

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Alegerea URI-urilor corespunzătoare

principii:folosirii unei singure convenții de referire

# (hash) sau / (slash)

http://undeva.info/foaf.rdf#me

versushttp://undeva.info/id/me

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

șabloane de stabilire a URI-urilor

http://dbpedia.org/resource/Science Thing (concept)

http://dbpedia.org/data/Science Date RDF

http://dbpedia.org/page/Science Pagină HTML

http://revyu.com/people/tom Thing (concept)

http://revyu.com/people/tom/about/rdf Date RDF

http://revyu.com/people/tom/about/html Pagină HTML

http://undeva.info/concept Thing (concept)

http://undeva.info/concept.rdf Date RDF

http://undeva.info/concept.html Pagină HTML

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Exemplificări (clasă + instanță):

regiuni http://wiskii.com/regions/speyside

distilerii http://wiskii.com/distilleries/talisker

brand-uri http://wiskii.com/brands/talisker

produse http://wiskii.com/products/talisker-10-yo

persoane http://wiskii.com/people/william-matheson

fotografii http://wiskii.com/photos/58

review-uri http://wiskii.com/reviews/271

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Accesul la o anumită reprezentare – exemple:

concept http://wiskii.com/brands/talisker

date RDF http://wiskii.com/brands/talisker/rdf

pagină HTML http://wiskii.com/brands/talisker/html

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Stabilirea infrastructurii

HTML RDF

aplicațieWeb

date

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

HTML RDF

aplicațieWeb

date

http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

HTML RDF

aplicațieWeb

date

http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf

http://wiskii.com/brands/talisker

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

HTML RDF

aplicațieWeb

date

http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf

http://wiskii.com/brands/talisker

HTTP GET

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

HTML RDF

aplicațieWeb

date

http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf

http://wiskii.com/brands/talisker

HTTP GET

HTTP 303 See Other HTTP 303 See Other

content negotiation

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Resurse utile sunt oferite de siturile de la adresele Webhttp://www.w3.org/standards/semanticweb/data

http://www.w3.org/wiki/LinkedData

a se studia și http://linkeddata.org/tools

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Relaționarea cu alte seturi de date

de (re)considerat „norul” linked datahttp://lod-cloud.net/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de cazTopic Datasets %

Government 183 18.05%

Publications 96 9.47%

Life sciences 83 8.19%

User-generated content 48 4.73%

Cross-domain 41 4.04%

Media 22 2.17%

Geographic 21 2.07%

Social Web 520 51.28%

Total 1014

cea mai recentă actualizare: august 2014http://linkeddatacatalog.dws.informatik.uni-mannheim.de/state/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Relaționarea cu alte seturi de date

informațiile privitoare la fiecare set de date RDFpot fi explorate via CKAN

(Comprehensive Knowledge Archive Network)

http://ckan.org/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Relaționarea cu alte seturi de date

aspecte de interes privind vocabularele publice:gradul de utilizare

mentenanțaaplicabilitateaexpresivitatea

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Relaționarea cu alte seturi de date

predicate generice folosite uzual:owl:sameAs

foaf:homepage, foaf:topic, foaf:based_near, foaf:maker,foaf:depiction, foaf:primaryTopic,…

rdfs:seeAlso

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

Relaționarea cu alte seturi de date – exemplificare:

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Relații între diverse resurse din seturi de date diferite:

<http://dbpedia.org/resource/Kolkata>

owl:sameAs freebase:Kolkata ;

owl:sameAs <http://sws.geonames.org/1275004> ;

owl:sameAs <http://ru.dbpedia.org/resources/Калькутта> ;

...

<http://sws.geonames.org/1275004>

rdfs:seeAlso <http://dbpedia.org/resource/Kolkata>

wgs84_pos:lat "22.56263" ;

wgs84_pos:long "88.36304" ;

gn:parentCountry <http://sws.geonames.org/1269750> ;

...

după Ivan Herman (2013)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data

Descrierea și publicarea datelor interconectate

voiD (Vocabulary of Interlinked Datasets)

K. Alexander, R. Cyganiak, M. Hausenblas & J. Zhao, 2010

http://www.w3.org/TR/void/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: inginerie – necesități

Calitatea datelor

Disponibilitatea și stabilitatea setului de date

Publicarea direct pe situl public

Claritate privind termenii de utilizare (licențiere)

Existența aplicațiilor

don’t repeat yourself

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: studiu de caz

statistici vizând „norul” datelor interconectatelinked open data (9 ianuarie 2013 vs. 20 noiembrie 2014)

http://stats.lod2.eu/

639 vs. 1048 seturi de date1,7 miliarde vs. 5,7 miliarde de triple RDF

49,8% vs. 64,9% date cu probleme

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: inginerie

Aspecte privind cele mai bune practici:

identificarea resurselor – identifier patternsmodelare – modelling patterns

publicare a datelor – publishing patternsmanagement al datelor – data management patterns

dezvoltare de aplicații – application patterns

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: inginerie

Considerații metodologice și pragmatice

oferite de specificația W3CLinked Data Platform 1.0 (în lucru, septembrie 2014)

http://www.w3.org/TR/ldp/

o soluție open source de implementare: Apache Marmottahttp://marmotta.apache.org/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: inginerie

Considerații metodologice și pragmatice

rezolvarea interogărilor SPARQL la nivel de clientLinked Data Fragments (2014)

http://linkeddatafragments.org/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: inginerieacces la fragmente de triple RDF

(triple pattern fragments)aici, un client Web asincron

soluții software (Java & JavaScript):http://linkeddatafragments.org/software/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: testare & depanare

Verificarea corectitudinii sintaxei RDF

W3C RDF Validator – www.w3.org/RDF/Validator/

Eyeball (instrument inclus în Apache Jena)

de experimentat: LOD Laundromat (Beek et al., 2014)http://lodlaundromat.org/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: testare & depanare

Verificarea infrastructurii(e.g., dereferențierea URL-urilor)

RDF:Alerts – http://swse.deri.org/RDFAlerts/

Sindice Inspector – http://inspector.sindice.com/

Vapour Linked Data Validator – idi.fundacionctic.org/vapour

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: testare & depanare

Depanarea (inspectarea triplelor) RDF

manuală

eventual, preluând datele – în stilul REST –via cURL sau un instrument similar

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: testare & depanare

Depanarea (inspectarea triplelor) RDF

recurgerea la un hyperdata (semantic) browser

e.g., instrumentul OpenLink Data Explorer ca extensiea unui navigator Web actual – http://ode.openlinksw.com/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: vizualizare

Vizualizarea datelor interconectate

exemplificări:

platforma Callimachus – http://callimachusproject.org/

proiectul Web LodLive – http://en.lodlive.it/

aplicația Web LOD for all – http://lod4all.net/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

instrumentul LodLive

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

vizualizarea seturilor de date interconectate: LOD for all

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: vizualizare

Descoperirea relațiilor dintre diverse dateoferite de sursele linked data

framework-ul Silkhttp://wifo5-03.informatik.uni-mannheim.de/bizer/silk/

proiectul RelFinderhttp://www.visualdataweb.org/relfinder.php

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: vizualizare

Silk Workbench – un asistent Web oferind suport pentru interconectarea diverselor surse de date

https://www.assembla.com/spaces/silk/wiki/Silk_Workbench

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Există aplicații Web realealiniate „curentului” linked data?

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

aplicația #1

linked dataserver #1

linked dataserver #2

HTTP(S)

aplicația #2

Ivan

Her

man

(20

13

)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

SPARQL / RDF API

arhitectura stratificată a aplicațiilor bazate pe linked data(Tom Heath & Christian Bizer, 2011)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: aplicații

RevyuSemantic Web reviewing and rating site

(T. Health & E. Motta, 2008)

permite integrarea datelor evaluate de utilizatori

review-urile sunt stocate + publicate transparent în RDF(utilizatorii finali introduc datele în mod tradițional)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: aplicații

Revyu

recurge la vocabulare ca Review, FOAF (Friend Of AFriend), SKOS (Simple Knowledge Organizational System)

interogări pe baza unui punct terminal SPARQL

interconectare cu date de la DBpedia, OpenGuides etc.

implementare bazată pe RAP (RDF API for PHP)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: aplicații

Proiectul Europeana

inițiativă de prezervare a conținutul cultural reprezentativ din statele europene

acces deschis la date interconectatevia data.europeana.eu

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

definește EDM (Europeana Data Model) bazat pe standardeRDF și OWL + vocabulare ca DCMI, FOAF, Open Archive

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: aplicații

myExperiment (David De Roure et al.)

aplicație Web colaborativă – bazată pe Ruby on Rails –pentru managementul workflow-urilor științifice

și a altor obiecte vizând cercetarea

modelarea datelor se bazează pe RDF:http://rdf.myexperiment.org/

acces la date publice via SPARQL

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: aplicații

Inițiativele semantic (open) e-government

linked data în contextul informațiilor publice ale UK:http://data.gov.uk/linked-data

de studiat și prezentările lui Richard Wallis: www.slideshare.net/rjw

câteva proiecte similare:USA – www.data.gov/developers/

Franța – www.data.gouv.fr/fr/dashboard/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: aplicații

SIGMA (SemantIc Government Mashup Application)Claudia Gheorghiu, Radu Nicolescu, Andrei Vasile Bogdan,

Cristian Ochișor, Sabin Buraga, Lenuța Alboaie (2011)

platformă Web extensibilă capabilă să creeze mashup-urioferind acces la date guvernamentale deschise

includerea unei soluții proprii de acces via un end-pointSPARQL la date guvernamentale preluate de la gov.ro

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: aplicații

Alte utilizări(Stefan Decker et al., 2012; H. Quoc et al., 2014)

e-geografie (e.g., date spațiale interconectate)http://www.semantic-web-journal.net/system/files/swj877.pdf

mass-media: BBC, Guardian, New York Times

publicații academice: CrossRef, Nature

biblioteci (digitale): Library of Congress, Franța, Vatican,…

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: aplicații

D. Le-Phuoc et al., “Enabling Live Exploration on The Graph of Things”http://challenge.semanticweb.org/2014/submissions/swc2014_submission_8.pdf

http://graphofthings.org/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data: aplicații

Pentru diverse exemplificări, a se consulta și lucrările atelierelor de lucru LDOW (Linked Data on the Web)

http://events.linkeddata.org/ldow2014/

http://events.linkeddata.org/ldow2013/

http://events.linkeddata.org/ldow2012/

http://events.linkeddata.org/ldow2011/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

linked data

Pentru mai multe detalii, a se parcurgeLeigh Dodds & Ian Davis, Linked Data Patterns. A pattern

catalogue for modelling, publishing, and consuming Linked Data, 2012:

http://patterns.dataincubator.org/

a se studia și School of Data Handbook (2013)http://schoolofdata.org/handbook/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

„concluzii”

“Software – as a service or not – is just a container.What makes software valuable has always been what

it does to data. Now, in the same spirit of SOA and SaaS,a new concept is emerging, Data-as-a-Service – DaaS.”

Pete Soderling, august 2010http://goo.gl/S4dYy

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

rezumat

♻aplicații bazate pe Web of data

arhitectură, linked data, studii de cazmulțumiri Claudiei Gheorghiu și lui Ștefan Negru – @blankdots

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

episodul viitor: modelarea cunoștințelor via RDF Schema