de câte stele sunt datele d-voastră?
DESCRIPTION
A presentation – available in Romanian language – regarding the open data and 5-star access & publishing approaches. Also, several details about the linked data initiative are provided.TRANSCRIPT
Procesare de la algoritmi optimi la software comercial
1945—1970
adaptare după Daconta et al. (2003)
Procesare de la algoritmi optimi la software comercial
1945—1970
“datele sunt mai puțin importante decât codul”
adaptare după Daconta et al. (2003)
Date proprietare baze de date & suite de birou proprietare
1970—1994
adaptare după Daconta et al. (2003)
Date proprietare baze de date & suite de birou proprietare
1970—1994
“datele sunt la fel de importante ca și programele”
adaptare după Daconta et al. (2003)
Publicarea datelor pe Web Web-ul clasic – standarde: HTML & CSS
1994—2004
adaptare după Daconta et al. (2003)
Publicarea datelor pe Web Web-ul clasic – standarde: HTML & CSS
1994—2004
“datele sunt la fel de importante ca și programele”
adaptare după Daconta et al. (2003)
Partajarea & reutilizarea documentelor Web-ul social – modele de date: XML, JSON,…
2004—prezent
adaptare după Daconta et al. (2003)
Partajarea & reutilizarea documentelor Web-ul social – modele de date: XML, JSON,…
2004—prezent
“datele sunt mai importante decât codul”
adaptare după Daconta et al. (2003)
Accesarea resurselor disponibile pe Web
Unicode DNS TCP/IP
URI HTTP
bine-cunoscute standarde Internet & Web
Accesarea resurselor disponibile pe Web
“dacă nu ai asociat un URL, nu exiști”
Accesarea resurselor disponibile pe Web
“dacă nu ai asociat un URL, nu exiști”
Uniform Resource Locator
Accesarea resurselor disponibile pe Web
identificarea oricărei (reprezentări de) resurse
via localizatori uniformi de resurse – URL-uri
Tom Heath & Christian Bizer (2011)
Accesarea resurselor disponibile pe Web
autoritatea care stabilește URL-ul (domeniul) deține
reprezentarea resursei desemnate de acel URL
Accesarea resurselor disponibile pe Web
procesarea marcajelor HTML – Web scrapping
versus interfețe de programare
(API – Application Programming Interface)
Reutilizarea datelor disponibile pe Web
preluarea datelor via servicii Web
eventual, pe baza API-urilor
lista API-urilor publice (aici, privind domeniul educațional)
www.programmableweb.com
Reutilizarea datelor disponibile pe Web
preluarea datelor via servicii Web
aplicații Web hibride (mash-up-uri)
instrumentul Web Zemanta – sistem de recomandare
mash-up “inteligent” folosind resurse disponibile liber pe Web
(exemplu: îmbogățirea conținutului unui articol de blog WordPress)
Reutilizarea datelor disponibile pe Web
necesitatea adoptării unei licențe de (re)utilizare
Reutilizarea datelor disponibile pe Web
utilizare onestă (fair use)
folosire limitată, dar gratuită, a unei lucrări
protejate de drepturi de autor – e.g., pentru uz educațional
Reutilizarea datelor disponibile pe Web
domeniul public (public domain)
a expirat copyright-ul, proprietarul deliberat plasează
resursa în domeniul public sau legile nu pot proteja
resursa respectivă
Reutilizarea datelor disponibile pe Web
copyleft
autorul oferă resursa să fie utilizată
cu anumite restricții
uzual: some rights reserved
Reutilizarea datelor disponibile pe Web
Creative Commons
oferă licențe de tip copyleft pentru creații disponibile pe Web
reasonable, flexible copyright
valori de bază: deschidere, transparență, respect
https://creativecommons.org/
Reutilizarea datelor disponibile pe Web
Creative Commons
vizează maniera de atribuire, caracterul non-comercial,
politica derivării conținutului și modul de partajare
creativecommons.org/about/licenses/
stabilirea unei licențe de (re)utilizare
a însemnărilor publicate pe Twitter – www.tweetcc.com
căutarea de resurse respectând licențele Creative Commons
http://search.creativecommons.org/
acces la resurse multimedia prin inițiativa Wikimedia Commons
https://commons.wikimedia.org/
Disponibilitatea datelor disponibile pe Web
a fi stocat pe Web
(“on the Web”)
ca document “opac”
– disponibil într-un format proprietar sau nu –
fără a referi, pe baza standardelor Web,
alte resurse de interes
Tom Health (2007)
Disponibilitatea datelor disponibile pe Web
a fi descoperibil pe baza standardelor Web
(“in the Web”)
folosind modele/formate de date deschise
(e.g., HTML, XML, JSON, RDF etc.)
aliniate principiilor hipertextului/hipermedia,
procesabile independent de platformă
Tom Health (2007)
“A piece of content or data is open if anyone is free to use, reuse, and redistribute it.”
http://opendefinition.org/
Caracterul deschis al datelor e dat de…
disponibilitate & acces
reutilizare & redistribuire
participare universală
opendatahandbook.org
Caracterul deschis al datelor e dat de…
disponibilitate & acces
reutilizare & redistribuire
participare universală
opendatahandbook.org
inter-operabilitate
deși pretind a avea (uneori) un caracter deschis,
“castelele” aplicațiilor Web actuale țin “ostatice” datele
deși pretind a avea (uneori) un caracter deschis,
“castelele” aplicațiilor Web actuale țin “ostatice” datele
acces (limitat, eventual pe baza
unei subscripții – e.g., taxe) via API
Cum putem evalua caracterul deschis
al resurselor Web?
Date de 5 stele (5 ★ Open Data)
Tim Berners-Lee (2009)
★
date de 1 stea
date de 1 stea
conținutul e disponibil pe Web – indiferent de
format – conform unei licențe deschise
utilizatorii pot vizualiza, lista,
stoca local și, eventual, modifica documentul
documentul în sine poate fi partajat via Internet
documentul poate fi publicat rapid & facil pe Web
pentru a refolosi datele incluse în document
sunt necesare uneori procesări suplimentare
★ ★
date de 2 stele
date de 2 stele
suplimentar, conținutul este disponibil pe Web
într-un format structurat
utilizatorii pot procesa documentul
– folosind, uzual, software proprietar
documentul poate fi exportat în alt format
(structurat sau nu)
documentul poate fi încă publicat facil pe Web
datele sunt în continuare “încuiate” în document,
procesarea depinzând de un anumit program
★ ★ ★
date deschise de 3 stele
date deschise de 3 stele
recurgerea la un format deschis
pentru a pune la dispoziție pe Web date
datele pot fi gestionate (vizualizate, filtrate, procesate,
convertite, refolosite etc.) în orice manieră
asigurarea independenței de platforma software
în continuare, documentul poate fi publicat facil pe Web
exportarea datelor într-un format proprietar
ar putea fi problematică
★ ★ ★ ★
date deschise de 4 stele
date deschise de 4 stele
adoptarea identificatorilor de resurse (URI-uri)
pentru a desemna “lucruri” de interes
datele, informațiile și cunoștințele se identifică via URI-uri
pentru a putea fi ulterior referite și (re)utilizate
uzual, se recurge la modelul RDF
(Resource Description Framework)
publicarea poate fi relativ mai dificilă,
necesitând de obicei adoptarea de instrumente și
metodologii specifice tehnologiilor Web-ului semantic
“data in the Web”implicații pe termen lung
★ ★ ★ ★ ★
date deschise de 5 stele
date deschise de 5 stele
în plus, datele sunt inter-relaționate
conform principiilor inițiativei linked data
posibilitatea descoperirii altor date de interes (înrudite)
direct la momentul procesării
se oferă premisele efectuării de raționamente automate
direct la nivel de Web pe baza modelelor conceptuale
exprimate standardizat via SKOS, OWL,…
dificultăți:
consistența & reconcilierea datelor și cunoștințelor
probleme legate de adopția lentă de către industrie
5stardata.info
Michael Hausenblas (2012)
interogări vizuale asupra datelor deschise (conform modelului RDF)
oferite de DBpedia – varianta procesabilă a Wikipedia
“Norul” datelor interconectate
reducerea redundanței
facilitarea reutilizării
permiterea descoperirii
maximizarea inter-conectivității dintre “lucruri” înrudite
adoptarea unei viziuni pragmatice
Tom Heath & Christian Bizer (2011)
martie 2009
http://lod-cloud.net/
sept. 2011
http://lod-cloud.net/
http://thedatahub.org/
http://ckan.org/
http://opengovernmentdata.org/
S. Buraga, Prezentările aferente cursului
“Dezvoltarea aplicațiilor Web”, UAIC, 2012
http://profs.info.uaic.ro/~busaco/teach/courses/wade/web-film.html
D. Dietrich et al., The Open Data Handbook, Open Knowledge Foundation, 2012
http://opendatahandbook.org/
T. Heath & C. Bizer, Linked Data: Evolving the Web into a Global Data Space, Morgan & Claypool, 2011
http://linkeddatabook.com/book
D. Allemang & J. Hendler, Semantic Web for the Working Ontologist (2nd Ed.), Morgan Kaufmann, 2011
de studiat
fotografii realizate de 3brian, bjaglin, ecatoncheires, Hervé Boulben, Ralph Hockens, jjjj56cp,
micmol, mynameisharsha, Daniel Petzold, scot2342, striatic, ToSaveOnPostage
Dr. Sabin Buraga www.purl.org/net/busaco
Facultatea de Informatică, Universitatea “A. I. Cuza” Iași