open data inps

38
OPEN DATA

Upload: datigovit

Post on 24-Apr-2015

1.405 views

Category:

Technology


1 download

DESCRIPTION

Slide che Filippo d'angelo dell'inps ha utilizzato per tenere il seminario online sui dati perti dell'INPS per Dati.gov.it qui maggiori info: http://www.dati.gov.it/content/terzo-ciclo-di-seminari-online-sui-dati-aperti

TRANSCRIPT

Page 1: Open data INPS

OPEN DATA

Page 2: Open data INPS

“STATO DELL’ARTE”

Marzo 2012- ePSI platform ConferenceTaking re-use to the next level

...L’Europa corre veloceDicembre 2011 - Nuova OpenData StrategyNeelie Kroes, Vice-Presidente Commissione europea per l’Agenda digitale.

“The best way to get value from data is to give it away..[..]..Lets join

together and share our data”

“Practical example of OpenData reuse and grass roots support and experience play an important role here..

[..]..Go out and make the case for OpenData more

strongly!”

Page 3: Open data INPS

Le direttive dalla Digital Agenda di Dicembre 2011

Aggiornamento direttive 2003 sul riuso del PSI

Rendere accessibili e riutilizzabili i contenuti documentali della PA.Rendere i dati in formato machine readable (RDF, JSON, XML).Creazione di un data portal della commissione europea.

Aggiornamento delle direttive dalla ePSI conference 2012

Tutti i dati resi disponibili dal PSI devono poter essere riutilizzabili per uso commerciale e non commerciale.

Gli stati membri devono introdurre un sistema di supervisione e regolamentazione al fine di rispettare le direttive UE sul riuso nei tempi stabiliti.

Lo scopo delle direttive sarà esteso alle informazioni contenute nelle digital libraries, musei e archivi.

Page 4: Open data INPS

IL RIUSO COME CRITERIO

OBIETTIVO:

“VALUTARE LA QUALITÀ DEI PROCESSI DI GOVERNANCE”

“VALUTARE LA QUALITÀ DEI DATASET

PUBBLICATI”

Open (Government Data)Tutti le tipologie di dati di

interesse pubblico

(Open Government) Data

Tutti le tipologie di dati che contribuiscono alla trasparenza delle amministrazioni

Page 5: Open data INPS

COME VALUTA L’UNIONE EUROPEA ?

Il riuso negli indicatori di punteggio:

Implementazione delle direttive EU

Pratiche di riusoSviluppo dei formati

Dati delle amministrazioni Locali

Eventi ed attività correlate

Page 6: Open data INPS

QUALE VALUTAZIONE

PER ITALIA?

Page 7: Open data INPS

L’ITALIA NON VA MALE !

8° POSIZIONE

Page 8: Open data INPS

Qualche dettaglio sulla valutazione degli OpenData in Italia

Dal punto di vista del punteggio non siamo lontani dai paesi già avviati in materia di open government (UK).

Cosa migliorare?

Implementazione delle direttive EU

Pratiche di riuso

Sviluppo dei formati

Rilascio dei dati delle amministrazioni Locali

Eventi ed attività correlate

Per migliorare il riuso implementare i formati non basta !

Page 9: Open data INPS

Qualche idea?

Page 10: Open data INPS

La correlazione tra pratiche di riuso e rilascio dei dataset degli enti locali suggerisce di implementare un piano di rilascio OpenData a

partire dal modello degli Enti pubblici più importanti.

Page 11: Open data INPS

“Interestingly the INPS data website explicitly refers to the EU PSI Directive as the reason for publishing data for re-use.”

“..continuous dialogue between data holders and re-users is needed, as we are learning how to do this by doing. The INPS data release is a good step forward, and creates appetite for more.”

Page 12: Open data INPS

Liberare i dati

Page 13: Open data INPS

Il lavoro sugli OpenData è collaborativo. E’ necessario individuare le tappe del processo. E’ necessario che la metodologia sia condivisa.

Perchè le linee guida sono importanti?

Page 14: Open data INPS

Come mettere insieme i pezzi?

Da dove partire? Quali dati vanno aperti?

MA...

Come produrre un dataset di qualità?

E i metadati?

Page 15: Open data INPS

STOP !!

Page 16: Open data INPS

Il modello INPS

Page 17: Open data INPS

1- Analisi di dominio e individuazione dei dati

2 - Analisi tipologica dei dati

3 - Preparazione dei dati

4 - Definizione dei formati

5 - Definizione dei metadati

6 - Attribuzione della licenza

Page 18: Open data INPS

ANALISI DI DOMINIOINDIVIDUAZIONE DEI DATI

Obiettivo? identificare i contenuti già esposti dall’istituto all’interno delle aree

di pubblicazione al fine di identificare i dati.

INPS.IT

Page 19: Open data INPS

Individuare subito i dati che possono essere aperti ...

1.Relazioni annuali2.Bilanci sociali3.Osservatorio statistico4.Statistiche della previdenza5.Rapporto sulla coesione sociale

Sottosezioni

Page 20: Open data INPS

La definizione del formato è un processo graduale e in itinere.

Ma XLS non è un pò poco

Abbiamo sempre bisogno di dati grezzi da cui partire

Possiamo sempre implementare il formato una volta pubblicati i dati.

Si, ma..

Page 21: Open data INPS

ANALISI TIPOLOGICADEI DATI

Di che tipo sono i dati (XLS) che abbiamo trovato?

Obiettivo? Distinguere in maniera efficace dati grezzi dai dati già manipolati:

Page 22: Open data INPS

Dati Grezzi

Dati Statistici(già manipolati)

Page 23: Open data INPS

PREPARAZIONE DEI DATIObiettivo?

Poichè molte delle fonti dei dati presentano le informazioni in maniera non strutturataè opportuno effettuare un’operazione di pulizia riguardante la struttura

delle tabelle e il contenuto delle stesse.

Page 24: Open data INPS

DEFINIZIONE DEI FORMATI

★ : testo ( PDF, TXT )

★ ★ : struttura proprietaria ( XLS )

★ ★ ★: struttura aperta ( CSV,XML )

★ ★ ★ ★: struttura con URL e URI

★ ★ ★ ★ ★: Linked Data ( RDF + Link )

Obiettivo? Se in prima battuta cerchiamo dati raw dobbiamo anche pensare di implementare

successivamente formati non proprietari come:

Livello di apertura

Page 25: Open data INPS

DEFINIZIONE DEI METADATIObiettivo?

Lo step successivo nella creazione degli Open Data è la definizione e la creazione di metadati, cioè informazioni che descrivono uno o un insieme di dati.

Tali informazioni rappresentano delle proprietà più significative fissate e consentono la ricerca e il recupero dei dati stessi con lo scopo di migliorarne la visibilità e facilitarne l’accesso.

Alcuni importanti standard per i metadati

• ISO/IEC 11179

• ISO 15836 Dublin Core

•W3C SKOS, W3C RDF/OWL

Page 26: Open data INPS

La creazione e l’implementazione dei metadati richiede attenzione alle risorse informative che tali metadati devono riflettere. Molta attenzione deve essere data alla qualità, perchè un pessimo metadato è peggio dell’assenza di metadati.

Per tale ragioni sono stati creati opportuni metadati per descrivere al meglio i dati INPS.

• Titolo: titolo dei dati

• Data di pubblicazione: Questa informazione riguarda la data di pubblicazione del dato all’interno del portale/minisito OpenData Inps.

• Formato: l’estensione del file (.pdf; .xls; .rdf; .doc)

• Licenza : il tipo di licenza a cui è legato il dato

• Dimensione in byte: la dimensione fisica del dato

• Identificativo : numero progressivo univoco del dato

• Link: (URL-permanent link-, link annidati, short URL)

• Fonte: opzionale, chi ha prodotto il dato (Direzione, altro soggetto)

Metadati SintatticiDescr ivono i l dato attraver so le sue caratteristiche strutturali, in cui sono comprese le informazioni sul processo di creazione, organizzazione e pubblicazione. Tali metadati non aggiungono informazioni sul contenuto del dataset.

Page 27: Open data INPS

Metadati Semantici

Descrivono il dato attraverso le sue caratteristiche semantiche, ovvero le informazioni sul contenuto. Tali aspetti consentono di individuare univocamente la risorse.

• Copertura spaziale: rappresenta il riferimento geografico del dato (coverage=area geografica: Internazionale, Europeo, Nazionale, Regionale, Provinciale, Comunale)

• Copertura temporale: rappresenta l’estensione temporale del dato (es. ante 2000, 2001-2005, 2006-2011, 2012-)

• Livello di lavorazione del dato: grezzo, statistica, bilancio.

• Tags: parole chiave dell’argomento principale

• Area di pubblicazione: a sezione in cui viene pubblicato all’interno del portale Inps.it.

• Descrizione: un breve abstract del dato

• Data di aggiornamento: mostra ogni quanto il dato viene tenuto aggiornato.

• Argomento trattato: il soggetto semantico del dato

Page 28: Open data INPS

Dal dato al metadato...

Definiamo così nel complesso la modalità

di fruizione dei dati attraverso le

informazioni che li descrivono.

Page 29: Open data INPS

ATTRIBUZIONE DELLALICENZA

Obiettivo? Scegliere una licenza che consenta all’utente un riuso più facile e libero

possibile

La IODL 2.0 prevede che l’utente possa liberamente:

1-Consultare, estrarre,copiare e pubblicare i dati2-Creare un lavoro derivato integrando diversi dataset.

..rispetto alla IODL 1.0?

Non prevede l’obbligo dell’utente di pubblicare o condividere i lavori con la

stessa licenza. E’ chiesto solo di indicare la fonte!

Page 30: Open data INPS

....Perchè la semantica?

Aiutare gli utenti

Mettere in relazione i dati

Page 31: Open data INPS

Lavoriamo sui metadati semantici!

Cosa possiamo farci?

Una volta definiti i metadati semantici, questi sono utilizzati per la creazione delle faccette per il motore di ricerca. Le faccette rappresentano i diversi aspetti o dimensioni attraverso i quali si può descrivere una stessa risorsa.

Page 32: Open data INPS

Selezionando una faccetta, si riducono i dataset trovati; selezionandone più di una si opererà una intersezione tra i dati, riducendo ancora di più fino a trovare esattamente quanto cercato.

Motore a faccette

Page 33: Open data INPS

La modalità di ricerca Query expansion consente di interrogare il sistema utilizzando il linguaggio

naturale, piuttosto che inserire parole chiave che l’utente potrebbe non conoscere.

In questo modo il raggiungimento delle risorse sarà notevolmente facilitato per tutte le categorie

di utenti (dai più esperti ai meno esperti)

Query expansion

Ad esempio: supponiamo che l’utente digiti la query “centri per le cure termali”.

Utilizzando la query expansion, nonostante la stringa inserita non sia presente nelle descrizioni dei dati, l’utente sarà indirizzato al dato “Cure forme vie respiratorie - elenco alberghi convenzionati per la stagione termale”.

Page 34: Open data INPS

Arricchire semanticamente i dati significa stabilire uno standard di qualità

dei dataset in vista dei Linked Open Data.

Fare linked open data consente di abbattere le barriere fisiche tra i dati.

connettere e condividere dataset attraverso standard

già implementati

Page 35: Open data INPS

La qualità dei dataset pubblicati costituisce una buona pratica OpenData!

Più i dati sono ricchi di informazioni ed esposti

in modo preciso maggiore sarà il riuso che se ne potrà fare.

Page 36: Open data INPS

Dati sugli attraversamenti stradali

Dati sugli incidenti stradali

Buona praticaUn esempio applicativo

Dal dato all’informazione

(integrazione)

Page 37: Open data INPS

Gli Open Data Linked possono essere facilmente accessibili da persone e applicazioni (via mashup) per i più diversi scopi

ma soprattutto...- consentono di passare dal dato all’informazione -

IL RIUSO COME CRITERIO DI VALUTAZIONE

Riuso nella PA: maggior controllo del territorio con più semplicità

Riuso privato: informazioni ai cittadini, maggiore trasparenza

Riuso commerciale: sviluppo di applicazioni più intelligenti e integrate

Page 38: Open data INPS

OPEN DATA

Un modello di qualità per lo sviluppo OpenData in Italia

Un modello per le PA locali

Il modello

Grazie a tutti ! Filippo D’Angelo

[email protected]