visual exploration of open data
DESCRIPTION
The project proposes a Web interface based on Data Visualization for Open Data portals, to improve the user experience in the data exploration process. Thesis project by Emanuela Giovannoni e Laura Pippinato, Graphic Design Virtual - Polytechnic of Turin, 2012TRANSCRIPT
Visual explorationof Open Data
Una proposta di applicazione dei princìpi di Data Visualization
ai dati aperti
STUDENTI
Emanuela GiovannoniLaura Pippinato
RELATORE
Christian Racca
CO-RELATORE
Lorenzo Benussi
Vis
ual
Exp
lora
tio
n o
f O
pe
n D
ata
| UNIVERSITÀ
1° Facoltà di ArchitetturaA.A. 2011 / 2012
| OGGETTO
Tesi di Laurea in Progetto Grafico e Virtuale
| RELATORE
Christian Racca
| CO-RELATORE
Lorenzo Benussi
| STUDENTE
Emanuela GiovannoniLaura Pippinato
| CONTENUTI, IMPAGINAZIONE E
PROGETTO GRAFICO
Emanuela [email protected]
Laura [email protected]
| STAMPA E RILEGATURA A CURA DI
Legatoria MontiVia Gen. Perotti 40Grugliasco (TO)
| LICENZA
Visual Exploration of Open Data di Emanuela Giovannoni e Laura Pippinato è distribuito con licenza Creative Commons Attribuzione 3.0
3
4
Lo spunto iniziale per la stesura di questa trattazione nasce a seguito di una lezione universitaria durante il corso Materiali e Modelli III al Politecnico di Torino.La tematica Open Data, materia inesplorata fino a quel momento, ha suscitato da subito un forte e spontaneo interesse verso l’argomento: è stato infatti immediatamente chiaro il ruolo che essa potrebbe adempiere nel contesto contemporaneo, nonché le conseguenze che potrebbero derivare dalla sua diffu-sione, oggi ancora non così estesa.
Le conoscenze accumulate in campo grafico hanno inoltre portato a porre in relazione a questo un altro rilevante ambito di approfondimento, associabile, non solo per assonanza, al tema Open Data: la Data Visua-lization. Anche in questo caso ci si trova davanti a un soggetto che presenta potenzialità tanto grandi, quanto al mo-mento sottovalutate, nonostante essa viva oggigiorno il momento di massima popolarità.
Entrambi i campi hanno come oggetto d’interesse i dati, l’uno in senso di apertura, di condivisione, di riuso e di estrazione di valore grazie al libero accesso delle informazioni; l’altro invece, in senso più prettamen-te funzionale, utilizza i dati come base per ottenere rappresentazioni che, al di là dell’aspetto estetico, ne permettono una comprensione più immediata.
Se gli Open Data oggi non risultano così conosciuti e diffusi come meriterebbero, a causa soprattutto della lentezza di aziende e istituzioni ad aderire a questo modello, la Data Visualization sta prendendo invece sempre più piede, senza che però se ne apprezzi in modo profondo le caratteristiche e gli obiettivi. Entrambi i campi risultano quindi bisognosi di un’o-perazione di rivalutazione che possa proporre nuove soluzioni e risolvere i loro punti più deboli.
L’intento focale di questa pubblicazione uno scam-bievole arricchimento delle due tematiche tramite l’applicazione dell’una all’altra.
Introduzione
5
Nello specifico si propone di utilizzare le possibili-tà funzionali della Data visualization applicandole al contesto Open Data, in modo tale da elevare, da un lato, la Datavis a un vero e proprio strumento di analisi, mostrandone le capacità in un contesto sensibile, e dall’altro rendere più intuitiva la navigazione degli Open Data, al fine di facilitare l’accesso alle informa-zioni contenute.
E’ ovvio quindi che per perseguire questo obiettivo si sia scelto nel concreto di sviluppare il progetto sulla modalità principale attraverso cui i dati aperti vengono maggiormente fruiti: i portali Open Data. Tra quelli esistenti, si è scelto quindi di prendere in esa-me il portale dati.piemonte.it che, per le sue caratteri-stiche di maturità nel panorama italiano, rappresenta, la solida base per lo sviluppo della visualizzazione.
IL PROGETTO
8
Lo scopo che si prefigge questa trattazione è sfruttare le potenzialità
della Data Visualization, applicandola nello specifico al contesto Open Data.
Questo permetterà da un lato di ottenere quelle funzionalità specificate dal
mantra di Shneidermann, raggiungibili solo considerando la visualizzazione
dei dati un vero e proprio strumento di analisi; dall’altro lato si potrebbe
migliorare la consultazione degli Open data, rendendoli più facilmente
navigabili e analizzabili, incentivandone l’interesse e il dialogo. Per compiere
questo passaggio, in concreto, si è scelto di utilizzare come base per le
considerazione e lo sviluppo progettuale il mezzo con cui i dati aperti
vengono resi pubblici: i portali Open Data.
Sfruttare
le funzioni
potenzial i del la
Data Visual izat ion
appl icandola agl i
Open Data
Arr icchire le
due tematiche:
1 E levare la Datavis
a strumento di
anal is i grazie a i dat i
apert i ;
2 Faci l i tare accesso
e navigazione degl i
Open Data;
Ut i l izzare forme
di Datavis per
la r icerca e
l ’esplorazione
del le informazioni
sui portal i Open
cosa perchè come
9
Di seguito si riporta un’analisi approfondita del sito
dati.piemonte.it ( www.dati.piemonte.it ), scelto come
base per sviluppare una una proposta di applicazione
di elementi Datavis a un portale di ricerca Open
Data. La scelta di esaminare il sito piemontese è
stata dettata dalla rilevanza che esso ha assunto,
essendo il primo in ordine temporale nel panorama
italiano e quindi considerato un consolidato punto di
riferimento.
L’analisi della piattaforma è suddivisa in 2 sezioni.
La sezione A contiene e esamina gli aspetti che
ne costituiscono la filosofia e la base concreta,
relavamente all’archivio dei dati e agli utilizzatori,
aspetti sui quali non si sono effettuate modifiche
in fase progettuale, essendo sostanzialmente le
premesse su cui costruire la proposta.
La sezione B contiene invece le specifiche riguardo
struttura organizzativa dei dati e funzionalità del
portale dati.piemonte.it, che sono le aree principali in
cui applicare la Data Visualization e quindi operare le
modifiche.
Il caso
dati.piemonte
10
Sez. A
COS’È DATI.PIEMONTE.IT
PARTE 1 / 4
Dati.piemonte.it è il portale promosso dalla Regione Piemonte, a disposizione di tutti gli enti della PA piemontese, per la condivisione dei dati e delle informazioni pubbliche. Rappresenta il primo esempio italiano sul tema della disponibilità dei dati pubblici, che ha dato concreta risposta alla Direttiva europea 2003/98/CE e che si pone oggi come punto di riferimento sia per la consultazione dei dati riusabili delle PA piemontesi, sia come punto di incontro della comunità degli utenti.Il portale è on-line dal 28 maggio 2010 e solo nel primo mese di vita ha ottenuto 7.000 visite.
A CHE COSA SERVE
PARTE 2 / 4
Il progetto nasce per dare attuazione a quanto previsto a livello comunitario in materia di riutilizzo delle informazioni pubbliche. L’Unione Europea infatti attribuisce al riutilizzo delle informazioni del settore pubblico un ruolo fondamentale, sia per lo sviluppo economico e sociale del territorio, sia per la diffusione delle nuove tecnologie digitali fra enti pubblici, imprese e cittadini. Il portale rappresenta un punto preferenziale di accesso per il mondo privato ai dati dell’amministrazione pubblica: la modalità Open con cui sono resi disponibili questi dati permette di sfruttarne il pieno potenziale, costituendo così un’immensa occasione di sviluppo. A livello della PA piemontese i benefici potenziali sono notevoli, in relazione alla dimensione, in termini numerici, del patrimonio informativo raccolto.
11
Sez. A
ASPETTO ECONOMICO
Sviluppo economico e sociale del territorio
| PROPOSITI PREFISSATI
ASPETTOTECNOLOGICO
Diffusione tecnologie digitali tra enti pubblici
ASPETTOCULTURALE
Promozione della filosofia Open
| INTEFACCIA PORTALE
12
A CHI È RIVOLTO
PARTE 3 / 4
Il portale si rivolge a tutti gli operatori pubblici, privati o commerciali alla ricerca di dataset specifici per esplorarli e/o riutilizzarli a scopo commerciale o non commerciale. L’obiettivo è quello di stimolare un nuovo rapporto fra pubblico e privato e di favorire lo sviluppo di iniziative imprenditoriali.
I DATI
PARTE 4 / 4
I dati sono affidabili, imparziali, completi e raccolti nel lungo periodo.Attualmente sono 327 quelli disponibili su dati.piemonte.it; in aggiunta si contano i 27 raccolti dai portali federati e i 243 del portale Ckan.Il caricamento di nuove informazioni è comunque costantemente in corso.I dati sono stati rilasciati da 16 enti, per un totale di 34 unità organizzative. Il patrimonio è strutturato in formati diversi: dai dati non strutturati, come le raccolte legislative, o semistrutturati, come i dati catalografici delle raccolte culturali, ai dati strutturati derivanti da basi dati gestionali e decisionali, ai dati geografici.La maggior parte dei dati si trova nel formato originale con cui è stato realizzato o archiviato per la Regione Piemonte.Inoltre, nella sezione RDF Data, è possibile accedere alla pagina nella quale si trovano i dati in formato RDF, che rappresentano l’inizio di un percorso di pubblicazione di una quantità via via crescente di informazioni secondo lo standard Linked Data.
Sez. A
13
RICERCA
| USER CASES
SVILUPPO
RICERCATORI
Sviluppo di
analisi o
pubblicazioni;
cultori del tema
Open
***assiduo
STUDENTI
Stesura di
ricerche
in ambito
accademico
*sporadico
GIORNALISTA
Verifica delle
affermazioni
tramite i dati
**frequente
SVILUPPATORI
Creazione di
nuovi servizi
utilizzando
mashup di
dati
***assiduo
DESIGNERS
Realizzazioni
di infografiche
e/o datavis
**frequente
* frequenza di consultazione
FORMATO: CC0 CCBY
| DATI PER ENTE
Regione Piemonte Unioncamera
Fossanese
Settimo
Borgomanero GalliateVerbania Cuorgnè
Forno Canavese
Altri
327dataset
Sez. A
14
POLITICA
INFO SCIENTIFICA
E RICERCA
COME SONO ORGANIZZATI I DATASET
PARTE 1 / 2
I dati sono organizzati in 13 categorie stilate autonomamente dallo staff di dati.piemonte.it. Lo stesso dato può essere inserito dall’ente proprietario anche in due o più categorie differenti. Al momento del caricamento del dato è possibile specificare eventuali sottocategorie, visualizzabili solo all’apertura della scheda tecnica dello stesso e non considerati nei filtri di ricerca.
AMBIENTE
E METEO
AGRICOLTURA,
TERRITORIO E PESCA
CULTURA
ECONOMIA
INFO GEOGRAFICHE
LEGALI
RISORSE NATURALI
SOCIALE
TRAFFICO E
TRASPORTI
TURISMO E
TEMPO LIBERO
FORMAZIONE
Sez. B
15
| NUMERO DATI E SOTTOCATEGORIE
37 dataset
/ .../ dati imprese agr. / uso del suolo/ edilizia
72 dataset
/ .../ bandi e gare / documenti/ istituzioni/ verbali assemblee
60 dataset
/ .../ artigianato / dati imprese/ industria e comm./ info finanziarie
45 dataset
/ .../ alberghi / eventi e intr./ sport
34 dataset
/ .../ reti viarie e di trasp.
29 dataset
/ .../ info biologiche/ info geologiche
26 dataset
/ .../ atti di conferenze / scuole
20 dataset
/ .../ dati idrografici
20 dataset
/ .../ catasto / confini politici/ dati spaziali/ topografia
17 dataset
/ .../ dati demografici / indagini settoriali/ statistiche lavoro
12 dataset
/ .../ monumenti e siti / musei e mostre/ risorse bibliotecarie/ altri archivi pubblici
1 dataset
/ .../ iniziative finan.
0 dataset = 72
numero dataset
Sez. B
16
FLUSSO DEL DATO
PARTE 2 / 2
Il portale permette di scaricare dati (o documenti contenenti dati pubblici) prodotti dalle Pubbliche Amministrazioni nell’ambito delle proprie attività istituzionali. Si tratta di dati o documenti che, dopo una serie di verifiche (fra cui quella in materia di privacy) possono essere diffuse dalla PA in un’ottica di riuso. Il portale si fonda sui cataloghi di metadati in cui sono censite le basi dati e gli applicativi degli enti.
/ Gli enti proprietari dei dati possono effettuare l’upload dei loro dati tramite un semplice form, a cui possono accedere previa registrazione. I campi da compilare sono liberi e rappresentano le informazioni che andranno a formare la scheda tecnica del dato. Nel dettaglio questi campi sono: nome dataset, descrizione, formato, licenza, argomento (categorizzazione), parole chiave, data di creazione. L’ente ha in seguito la possibilità di aggiornare il dato, se esso lo necessita, o di caricare revisioni o altre versioni.
/ Le principali funzionalità disponibili per gli utenti sono sostanzialmente quelle di download dei dati e di social networking: ricerca dei dati, accesso ai set di dati, possibilità di lasciare feedback sulla qualità dell’informazione fornita, forum/RSS, news su filosofia e iniziative Open, servizio “l’esperto risponde”.
/ La ricerca dei dati può essere effettuata tramite ricerca semplice, ricerca avanzata, che permette di utilizzare dei filtri, oppure ricerca estesa nei portali federati con dati.piemonte.it. I risultati della ricerca si presentano sotto forma di elenco, con i nomi del dataset in evidenza e con la possibilità di osservare con un click una preview con alcune delle caratteristiche principali del dataset. Una volta trovato il risultato di interesse, è possibile visualizzare la relativa scheda di dettaglio con tutte le informazioni, scheda tecnica e il link per effettuare il download. Per ogni scheda tecnica è possibile votare la qualità del dato e lasciare un commento, oppure fare click sui dati correlati proposti.
/ Nella versione precedente del sito era presente una visualizzazione base, esplora, che permetteva di muoversi all’interno della classificazione scelta per i dati. Si effettuavano una serie di click che permettevano di entrare in profondità, di categoria in sottocategorie (in certi casi le sottocategorie erano anche di due livelli gerarchici), fino a scoprire i dati in esse contenuti. Tale visualizzazione risultavano comunque piuttosto rigida e poco intuitiva; al momento non è stata riproposta nella nuova versione della piattaforma.
Sez. B
17
Sez. B
Login
Form
Carica un dataset Carica un altro dataset
Carica una nuova versione
Ricerca per parola
Ricerca per filtri
Estendi ricerca
Dati in evidenza
Digita parola
Elenco
Apri preview
Scheda dato
Scegli filtri
Digita parola Portale
Ckan
Download
Vota
Commenta
Dati correlati
| POSSIBILI AZIONI ALL’INTERNO DEL PORTALE
ENTE
Requisito iniziale: REGISTRAZIONE
Digita parola
UTENTE
Requisito iniziale: NESSUNO RICHIESTO
18
1 2 3
4 5 6 7
8 9 10
Soluzione
progettuale
L’analisi della soluzione progettuale è
suddivisa in due sezioni: la sezione C espone
i cambiamenti strutturali che si propongono
per ottenere gli obiettivi definiti, ovvero la
riorganizzazione della classificazione dei dati
e le nuove funzioni implementate; la sezione
D infine riporta tutte le caratteristiche grafiche
che permettono di ottenere tali migliorie.
19
20
COME SONO ORGANIZZATI I DATASET
PARTE 1 / 2
Da un punto di vista organizzativo/strutturale la proposta in oggetto comporta l’adozione del thesaurus Eurovoc, come modello standard internazionale per l’organizzazione interna di categorie e sottocategorie.
Eurovoc è un thesaurus multilingue e multidisciplinare specificamente concepito per il trattamento dell’informazione documentaria delle istituzioni dell’Unione europea.
E’ sostanzialmente un vocabolario controllato che comprende settori sufficientemente ampi per inglobare ottiche comunitarie e nazionali: permette quindi la normalizzazione terminologica dei vocabolari di indicizzazione, consentendo un’efficace gestione dei documenti e nel contempo una maggiore precisione nella ricerca degli stessi.
La funzione del thesaurus è di eliminare le ambiguità, garantendo che ogni concetto sia situato in un contesto tale che il suo significato risulti univoco. Ogni concetto infatti viene circoscritto ad un solo significato, all’interno del settore e del microthesaurus cui appartiene, dalle sue relazioni semantiche, dalle informazioni aggiuntive (note operative, di definizione o storiche), nonchè dai suoi equivalenti nelle altre lingue di Eurovoc; il multilinguismo di questo thesaurus comporta infatti la definizione di equivalenze linguistiche tra concetti identici espressi in lingue diverse, permettendo l’indicizzazione dei documenti nella lingua del documentarista e la ricerca nella lingua dell’utente.
Sez. C
21
Sez. C
Thesaurus multidisciplinare dell’Unione Europea
VANTAGGI
/ Normalizzazione terminologica
/ Multilinguismo, equivalenze linguistiche
Precisione nella categorizzazione e nella ricerca documentaria
Indicizzazione nella lingua di documentalista e utente
| L’EUROVOC
EUROVOC PROGETTO
Settori
Microthesauri
Termini
Relazioni tra termini
Nomi dei paesi
Categorie
Sottocategorie
Tag, parole chiave
Relazioni tra dataset;
Lingua
Organizzazione internazionali / Comunità europee / Produzione e ricerca / Scienze / Diritto / Agricoltura e pesca / Geografia / Industria / Finanze / Impresa e concorrenza / Agroalimentare / Energia / Scambi commerciali / Vita economia / Relazioni intern. / Vita politica / Educazione Questioni sociali / Occupazione e lavoro / Trasporto
STRUTTURA
NUOVE CATEGORIE
diventano
22
FLUSSO DEL DATO
PARTE 2 / 2
Anche se le finalità e gli obiettivi descritti per il portale dati.piemonte.it rimangono i medesimi anche nella proposta progettuale, il sistema strutturale proposto permette di ottenere funzionalità aggiunte, in particolare la capacità di muoversi in maniera libera e dinamica all’interno della classificazione in cui sono distribuiti i link ai dataset.
/ L’elemento chiave per ottenere una classificazione coerente si esprime concretamente con un form destinato agli enti proprietari. I campi da compilare nello specifico sono: titolo dato; titolo abbreviato; scelta categoria di classificazione; scelta sottocategoria; descrizione/abstract; parole chiave; formato; licenza; usabili; aggiornamento.
/ Le principali funzionalità disponibili per gli utenti sono sostanzialmente quelle di download dei dati e di social networking: ricerca dei dati, accesso ai set di dati, possibilità di lasciare feedback sulla qualità dell’informazione fornita, forum/RSS, news su filosofia e iniziative Open, servizio “l’esperto risponde”.
/ La ricerca dei dati può essere effettuata tramite ricerca semplice, ricerca avanzata, che permette di utilizzare dei filtri, oppure ricerca estesa nei portali federati con dati.piemonte. I risultati della ricerca si presentano sotto forma di elenco, con i nomi del dataset in evidenza e con la possibilità di osservare con un click una preview con alcune delle caratteristiche principali del dataset. Una volta trovato il risultato di interesse, è possibile visualizzare la relativa scheda di dettaglio con tutte le informazioni, scheda tecnica e il link per effettuare il download. Per ogni scheda tecnica è possibile votare la qualità del dato e lasciare un commento, oppure fare click sui dati correlati proposti.
/ Nella versione precedente del sito era presente una visualizzazione base, “esplora”, che permetteva di muoversi all’interno della classificazione scelta per i dati. Si effettuavano una serie di click che permettevano di entrare in profondità, di categoria in sottocategorie (in certi casi le sottocategorie erano anche di due livelli gerarchici), fino a scoprire i dati in esse contenuti. Tale visualizzazione risultavano comunque piuttosto rigida e poco intuitiva; al momento non è stata riproposta nella nuova versione della piattaforma.
Sez. C
23
Sez. C
Visualizzazione
Scheda dato
Filtra categ,
Scegli filtri
Download
Filtra per parola
Visualizza categ.
Visualizza sottocat.
Visualizza per categoria
Tutti i dati della stessa sotttocat.
| POSSIBILI AZIONI ALL’INTERNO DEL PORTALE
UTENTE
Requisito iniziale: NESSUNO RICHIESTO
Ricerca per parola
Ricerca per filtri
Esplora
Digita parola
Visualizza per enti
sottocategoria
Suggerimenti
ente
Login
Form
Carica un dataset Carica un altro dataset
Carica una nuova versione
ENTE
Requisito iniziale: REGISTRAZIONE
24
1 2 3
4 5 6 7
8 9 10
Interfaccia
25
Sez. D
26
1 2 3
4 5 6 7
8 9 10
Soluzione
progettuale
Questa è la proposta grafica di interfaccia per
supportare la ricerca di dataset all’interno di
portali Open Data.
I dati, come già precedentemente descritto,
sono organizzati secondo l’Eurovoc, il
modello di thesaurus riconosciuto a livello
internazionale.
L’interfaccia si apre con una videata suddivisa in
tre macro aree:
/ ricerca avanzata (Avanzate, a sinistra)
/ ricerca per parola (Cerca posto al centro)
/ esplorazione libera (Esplora, a destra)
27
Sez. D
28
1 2 3
4 5 6 7
8 9 10
Cliccando all’interno della sezione “Ricerca per
parola”, ossia nell’area delimitata dal cerchio
posto al centro dell’interfaccia, è possibile
digitale la parola che si ritiene più opportuna
per iniziare la ricerca di specifiche informazioni.
Una funzionalità dell’interfaccia prevede la
comparsa di alcuni suggerimenti mentre si sta
componendo la parola da ricercare: vengono
così mostrate le parole chiave che sono già
presenti nell’Eurovoc.
Soluzione
progettuale
29
La presenza di suggerimentipermette all’utente di essere maggiormente indirizzato verso l’argomento ricercato,suggerendo parole chiave catalogate al’interno della struttura.
Sez. D
30
1 2 3
4 5 6 7
8 9 10
L’utente può decidere se usufruire dei
suggerimenti, cliccando su una delle parole
chiave mostrate nell’elenco, oppure se
ricercare dati inserendo una specifica parola.
In tale caso, dopo aver digitato il nome, è
necessario premere il tasto Invio, per avviare
così la ricerca.
Il caricamento della pagina successiva è
preceduto, come mostra l’immagine sotto,
da una piccola animazione di download che
permette, tramite l’utilizzo di un espediente
grafico, di visualizzare le quantità di dataset
relative alla parola ricercata presenti nelle
differenti categorie.
Soluzione
progettuale
31
Sez. D
32
1 2 3
4 5 6 7
8 9 10
L’animazione di interconnessione tra le due
pagine dura appena il tempo per mostrare
la corrispondenza tra colore/categoria e la
quantità di dataset: la lunghezza dell’arco
indica la quantità di dati relativi alla parola
ricercata contenuti in quella sottocategoria. Il
numero dei dataset e il nome della categoria
sono esplicitati per esteso nel testo al di sotto
della linea all’interno della circonferenza di
ricerca.
Soluzione
progettuale
33
Sono mostrate tutte le categorie in cui la parola ricercata compare; la lunghezza dell’elemento grafico fa intuire immediatamente la suddivisione strutturale.
In questo caso, la categoria corrispondente a verde chiaro rappresenta quella che contiene al suo interno più dataset inerenti alla parola “acqua”.
Sez. D
34
1 2 3
4 5 6 7
8 9 10
La visualizzazione a lato rappresenta la
schermata dei risultati di ricerca.
I dataset sono rappresentati come piccoli
cerchi colorati a seconda della categoria e
compaiono all’interno di 2 anelli.
A seconda della loro collocazione all’interno
di essi, si indica l’affinità del singolo dataset
con la parola ricercata: i dataset disposti
all’interno del primo anello, quello più vicino
all’anello centrale delle categorie, sono quelli
maggiormente inerenti alla parola ricercata.
Soluzione
progettuale
35
Sez. D
36
1 2 3
4 5 6 7
8 9 10
I dataset sono rappresentati quindi
tramite piccoli cerchi colorati in maniera
differente a seconda della categoria a cui
corrispondono. Altre due caratteristiche sono
rappresentate graficamente: la qualità, data
dalla combinazione tra il tipo di formato e di
licenza, che viene rappresentato attraverso
un anello esterno; l’aggiornamento,
rappresentato con un punto bianco al centro
del cerchio che definisce il il dataset.
È possibile interagire con la visualizzazione
modificandone alcuni aspetti grafici come
dimensione del carattere oppure grandezza
dell’immagine.
Soluzione
progettuale
37
Sono mostrate tutte le categorie in cui la parola ricercata compare; la lunghezza dell’elemento grafico fa intuire immediatamente la suddivisione strutturale.
In questo caso la categoria corrispondente a verde chiaro rappresenta quella che contiene al suo interno più dataset inerenti alla parola “acqua”.
Sez. D
38
1 2 3
4 5 6 7
8 9 10
È possibile visualizzare il titolo del dataset
semplicemente posizionando il cursore sopra
il cerchio che lo rappresenta.
In questa posizione inoltre è possibile
attingere a ulteriori informazioni: sul lato
sinistro compaiono infatti, evidenziate da
un filetto grigio, le indicazioni relative alla
categoria e alla sottocategoria a cui il dataset
appartiene. La rappresentazione di categorie
e sottocategorie sulla sinistra permette di
esplorarle cliccando semplicemente sopra
una di esse.
Soluzione
progettuale
39
Sez. D
40
1 2 3
4 5 6 7
8 9 10
In basso a destra della schermata, invece, è
possibile attivare o disattivare i tag relativi a
tutti i dataset visualizzati, a seconda dei quali
si attiveranno o disattiveranno i dataset che li
contengono.
In alto a destra compare inoltre il filtro
per categoria. Cliccando sui cerchi del
colore relativo alla categoria è possibile
disabilitare la visualizzazione della categoria
corrispondente.
Soluzione
progettuale
41
Cliccando su uno degli archi che compongono il cerchio centrale, è possibile visualizzare i titoletti di tutti i dataset appartenenti ad una categoria.
Sez. D
42
1 2 3
4 5 6 7
8 9 10
Cliccando su un dataset si aprirà una
scheda tecnica, simile ad un pop-up, con le
caratteristiche specifiche del dataset (breve
descrizione, formato, licenza, categoria e
sottocategoria) e il link relativo al download.
Inoltre la scheda tecnica è composta di altri
due elementi:
/ suggerimenti, ossia dataset che hanno in
comune tre o più parole chiave e quindi per
questo facilmente associabili;
/ visualizza tutti i dataset della stessa
categoria a cui appartiene quello selezionato.
Per uscire dalla visualizzazione è necessario
cliccare in un qualsiasi punto esterno non
appartenente al pop-up.
Soluzione
progettuale
43
Sez. D
44
1 2 3
4 5 6 7
8 9 10
Tornando alla schermata iniziale, tramite click
sul logo posto in alto a sinistra avente link
diretto con la home, è possibile accedere,
previo click sul pulsante Esplora posizionato
sulla destra della schermata, ad un’altra
sezione: quella dell’esplorazione libera dei
dataset.
Soluzione
progettuale
45
Sez. D
46
1 2 3
4 5 6 7
8 9 10
Qui a lato viene riportata la prima schermata
della sezione. I cerchi colorati, in questo caso,
rappresentano le singole categorie e la loro
dimensione indica il numero di dataset in
esse contenuti. Questo tipo di visualizzazione
permette di avere un’idea generale della
disposizione dei dataset nelle differenti
categorie.
Cliccando in corrispondenza di uno dei cerchi
colorati, si passerà alla finestra successiva. A
lato, il menù “Visualizza per”, dà la possibilità
di cambiare tipo di visualizzazione.
Soluzione
progettuale
47
Sez. D
48
1 2 3
4 5 6 7
8 9 10
Questa visualizzazione pone al centro la
categoria, rappresentata da una circonferenza
del colore corrispondente: attorno ad essa
sono riportati tutti dataset appartenenti a
quella data categoria.
Tali dataset sono raggruppati per
sottocategoria: quest’ulteriore suddivisione
facilita l’utente alla scoperta dei dataset,
rendendo la ricerca più mirata e accurata.
Soluzione
progettuale
49
Cliccando non sul dataset ma direttamente sulla sottocategoria, nella schermata apparirà al centro, al posto della scritta “Ambiente” il nome della sottocategoria e, in automatico, i dataset inerenti a tale sottocategoria, ridistribuiti attorno all’anello centrale.
Sez. D
50
1 2 3
4 5 6 7
8 9 10
In alternativa alla visualizzazione per
categoria, è possibile selezionare dal menù
di destra “Visualizza per: Ente”, che viene
mostrata qui a lato.
In questa schermata i dataset vengono
riportati suddivisi per ente di produzione.
Come nella precendente interfaccia, la
dimensione dei cerchi corrisponde al numero
di dataset in essi contenuti.
Soluzione
progettuale
51
Sez. D
52
1 2 3
4 5 6 7
8 9 10
Cliccando sul cerchio relativo all’ente di
produzione dei dati, si rimanda alla finestra di
interfaccia qui a lato. Al centro viene mostrato
il nome dell’ente e, intorno all’anello centrale,
vengono disposti tutti i dataset prodotti
da tale amministrazione. Come mostra
l’immagine, i dataset sono raggruppati per
colore, ossia per categoria.
Soluzione
progettuale
53
Cliccando su un dataset, l’utente viene portato alla visualizzazione della scheda tecnica relativa.
Sez. D
54
1 2 3
4 5 6 7
8 9 10
L’ultima sezione è dedicata alla “Ricerca
Avanzata”. In questa schermata è possibile,
oltre a ricercare i dataset per parola,
selezionare uno o più filtri di ricerca che
permettono all’utente di “raggiungere” i
dataset necessari più facilmente.
I filtri presenti sono: categoria, ente, formato,
licenza e data di produzione.
Soluzione
progettuale
55
Sez. D
56
Il percorso intrapreso, che ha avuto origine dai dati aperti, passando attraverso la Data Visualization, si è concretizzato nello sviluppo del progetto esposto, scaturito come naturale conseguenza dall’analisi delle due tematiche a confronto.
La particolarità di tale percorso è che l’obiettivo che si è scelto di perseguire non è stato stabilito a priori, ma solo dopo aver analizzato in maniera attenta i campi proposti, partendo in prima battuta, come si è visto, dall’ambito Open.Questo ha portato ad una completa imparzialità nell’approccio a tali argomenti, facilitando l’individua-zione delle reali problematiche e la proposizione di possibili soluzioni. E’ stato quindi necessario ottenere un’adeguata conoscenza e familiarità degli argomenti per poter capire in modo profondo l’ambìto di azione e trarne la successiva proposta progettuale.
Il progetto, che potrebbe sembrare in prima istanza, una soluzione poco concreta, deve essere valutato in realtà soprattutto per lo spirito e la finalità con il quale è stato costruito.La proposta creata è attualmente disponibile solo in forma grafica e non è sviluppata sottoforma di codice sorgente: in questa fase, infatti, non è l’aspetto tecnico quello che risulta rilevante e neanche la definizione di una precisa collocazione futura. L’ottica in sostanza è quella di suggerire un modello di interfaccia per gli Open Data che possa facilitarne l’accesso e la consultazione, incrementando l’interes-se attorno all’argomento e che permette contempora-neamente di far emergere la Data Visualization come strumento da utilizzare per l’analisi delle informazioni e non solo come puro espediente estetico.
Si tenga ben presente che, per quanto riguarda la riva-lutazione del ruolo della Datavis, si è ottenuta grazie al fatto di applicarla non a dati stettamente numerici. In-fatti, l’applicazione è stata fatta non tanto al contenuto dei dataset open, ma ai dataset in quanto elementi classificati secondo una certa struttura e categorizza-
Conclusioni
57
zione. Si è così dimostrato che i dati possono avere tipologie differenti, non solo relegate alle semplici quantità.
Per quanto riguarda la collocazione del progetto in rapporto al portale piemontese e all’ambiente Open, si è deciso di non escludere alcun tipo di sviluppo successivo.Questo non per mancanza di progettualità, ma perchè effettivamente la soluzione si presta a essere trattata in diversi modi; in linea di massima la proposta non pre-vede una sostituzione del portale esistente, ma piutto-sto un’integrazione, un supporto nella fase di ricerca ed esplorazione. Si tratta quindi di un arricchimento che, in quanto tale, non comporta la scomparsa o la sostituzione dei modelli precedenti.È tuttavia vero che parte del progetto prevede una componente aggiuntiva dettata dalla riorganizzazione delle categorie esistenti. Questa prescrizione in effetti risulterebbe necessaria non solo a livello regionale o nazionale, ma soprattutto a livello europeo: in effetti il vantaggio di un vocabolario semantico, come quello dell’Eurovoc, sta proprio nella sua internazionalità. Un adeguamento di questo genere comportereb-be una riorganizzazione della struttura di portali già esistenti, cosa però piuttosto dispendiosa in termini di tempo e manodopera. La proposta quindi rimane valida per i portali di nuova generazione, nello specifi-co in ambito europeo. Si tenga comunque conto che, in generale, qualsiasi operazione di standardizzazione prevede in ogni ambìto un dispiego di energie affinchè i modelli già esistenti si adeguino alle nuove soluzioni. In questi casi si presuppone che tali energie siano am-piamente ripagate dai vantaggi ottenuti grazie a queste modifiche.
Durante lo sviluppo del progetto la fattibilità della soluzione è stata verificata interpellando al riguardo diversi esperti con competenze diverse, che potessero esprimere le loro conoscenze riguardo i codici di pro-grammazione e la situazione italiana degli Open Data, o che avessero conoscenza specifica del portale dati.piemonte.it, essendo parte del progetto stesso: questo ovviamente per verificare sia la possibilità concreta di realizzarlo che l’effettiva utilità.
Il futuro rimane sostanzialmente aperto a molte solu-zioni e non si esclude che la piattaforma possa subire migliorie, adeguamenti o sviluppi più concreti.
58
59
Si ringraziano per il supporto tecnico,
in ordine alfabetico
GIUSEPPE FUTIA
Communication Manager
presso Nexa Center
DANIELE GALIFFA
CTO & co-founder
presso GoalShouter e VISup
MAURIZIO NAPOLITANO
Technologist
presso Fondazione B. Kessler
SAVERINO REALE
Project Manager
presso CSI Piemonte
MASSIMO ZAGLIO
R&D Project Manager
presso TOP-IX Consortium
61
62
Visual explorationof Open Data
Una proposta di applicazione dei princìpi di Data Visualization
ai dati aperti
STUDENTI
Emanuela GiovannoniLaura Pippinato
RELATORE
Christian Racca
CO-RELATORE
Lorenzo Benussi
Vis
ual
Exp
lora
tio
n o
f O
pe
n D
ata