seminar k datasetom
DESCRIPTION
TRANSCRIPT
Seminár k datasetom a štandardom
Bratislava, 1.10.2012
1www.opendata.sk
Bratislava, 1.10.2012Gabriel Lachmann
Obsah
� Štandardy pre sprístupňovanie dátových zdrojov� Formáty� Linked data� Kvalita a hodnotenie dátApplication Programming Interfaces (APIs)
2www.opendata.sk
� Application Programming Interfaces (APIs)� Príklady
Štandardy pre sprístupňovanie dátových zdrojov
� Materiál UV� data.gov.sk
Základná požiadavka:
3www.opendata.sk
Základná požiadavka:Aby boli dáta dostupné a strojovo
spracovateľné.
Liked data – LOD2
4www.opendata.sk
What is Linked Data?
5www.opendata.sk
6www.opendata.sk
7www.opendata.sk
8www.opendata.sk
9www.opendata.sk
10www.opendata.sk
11www.opendata.sk
12www.opendata.sk
13www.opendata.sk
14www.opendata.sk
Registre a kontrolované slovníky
15www.opendata.sk
Formáty
� minimálne požiadavky na formáty: � CSV, alebo � XML so schémou
16www.opendata.sk
� odporúčané formáty Linked data vo formátoch : � Resource Description Framework – RDF,� Web Ontology Language - OWL, � Simple Knowledge Organization System - SKOS.
Kvalita a hodnotenie dát – 5 Stars
Metodika hodnotenia kvality datasetov by mohla vychádzať z metodiky 5 Stars (5 hviezdičiek). Metodika bola definovanova zo strany w3c.
17www.opendata.sk
Kvalita a hodnotenie dát
� ★ make your stuff available on the web (whatever format)
� ★★ make it available as structured data (e.g. excel instead of image scan of a table)
� ★★★ non-proprietary format (e.g. csv instead of excel)
use URLs to identify things, so that people can point at
18www.opendata.sk
� ★★★★ use URLs to identify things, so that people can point at your stuff
� ★★★★★ link your data to other people’s data to provide context
Štruktúra údajov o dátovom zdroji – metadáta
� dátum, ku ktorému sú údaje platné� odporúčané: dátum najbližšej aktualizácie� sprístupnenie doplňujúcich informácií:
� schémy údajov - pokiaľ schéma údajov (t.j. členenie dátového zdroja na typy údajov, konkrétne záznamy a
19www.opendata.sk
dátového zdroja na typy údajov, konkrétne záznamy a vzťahy medzi týmito entitami) nie je triviálna
� popis typov položiek - najmä v prípade, ak sú používané netypické dátové typy, číselníkové typy, skratky, zložené dátové typy a pod.
� popis formátov v ktorých je dátový zdroj sprístupňovaný -napr. formáty súborov
� popis možných nepravidelností v štruktúre
Application Programming Interfaces (APIs)
� Príamy prístup ku aplikácii spravujúcej dáta� minimálne požiadavky:
� RESTful vo formáte XML alebo JSON
odporúčané formáty: ako vyššie ale navyše aj vo
20www.opendata.sk
� odporúčané formáty: ako vyššie ale navyše aj vo formáte RDF (Turtle, RDF/XML, ...) cez SPARQL endpoint
� Mnohé projekty
21www.opendata.sk
22www.opendata.sk
23www.opendata.sk
24www.opendata.sk
• datasety publikované MV, vizualizované vo forme Heatmap, choropleth map, grafov...
25www.opendata.sk
• cyklické harvestovanie dát a metadát do datasetov
• získané datasety vizuálne publikovať vo forme máp a grafov:•heat mapy,•choropleth mapy,
26www.opendata.sk
•choropleth mapy,•grafy.
Heat mapy
27www.opendata.sk
Choropleth mapy
28www.opendata.sk
Grafy
29www.opendata.sk
www.opendata.sk
30www.opendata.sk
www.opendata.sk