stars factory: lod in rdf data cube vocabulary · • knowledge management • tecnologie...

11
info su www.evodevo.it Stars Factory: LOD in RDF Data Cube Vocabulary Open Data Ground plug-in Claudia Corcione, Paola De Caro, Stefano De Luca LOD 2014, 20-21/02/2014

Upload: others

Post on 27-Jun-2020

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Stars Factory: LOD in RDF Data Cube Vocabulary · • Knowledge Management • Tecnologie Semantiche • Open Data 2. info su Open Data Ground 3 ... utilizza tecnologie semantiche

info su www.evodevo.it

Stars Factory: LOD in RDF Data Cube Vocabulary Open Data Ground plug-in

Claudia Corcione, Paola De Caro, Stefano De LucaLOD 2014, 20-21/02/2014

Page 2: Stars Factory: LOD in RDF Data Cube Vocabulary · • Knowledge Management • Tecnologie Semantiche • Open Data 2. info su Open Data Ground 3 ... utilizza tecnologie semantiche

info su www.evodevo.it

Evodevo

Evodevo è una società che offre servizi, sviluppa strumenti software e fa ricerca nei settori:

• Business Intelligence• GIS• Knowledge Management• Tecnologie Semantiche• Open Data

2

Page 3: Stars Factory: LOD in RDF Data Cube Vocabulary · • Knowledge Management • Tecnologie Semantiche • Open Data 2. info su Open Data Ground 3 ... utilizza tecnologie semantiche

info su www.evodevo.it

Open Data Ground

3

Open Data Ground è una

piattaforma per la gestione di

open data, che permette di:

• Caricare i dati in qualsiasi

formato o attraverso il

collegamento diretto con DB

• Convertire in formati open

• Catalogare attraverso

metadati standard

• Ricercare i dati attraverso

vari strumenti.

• Esportare i dati nei formati

XLS, CSV, XML, JSON,

RDF, OWL

• Esporre i dati tramite API

• Visualizzare le statistiche di

utilizzo

Page 4: Stars Factory: LOD in RDF Data Cube Vocabulary · • Knowledge Management • Tecnologie Semantiche • Open Data 2. info su Open Data Ground 3 ... utilizza tecnologie semantiche

info su www.evodevo.it

OpenDataGround utilizza tecnologie semantiche per la ricerca e l’organizzazione delle risorse:

• Motore a faccette

• Tag Net

• Tag Cloud

• Ricerca a testo libero, anche su metadati

OpenDataGround: semantic technologies

4

Page 5: Stars Factory: LOD in RDF Data Cube Vocabulary · • Knowledge Management • Tecnologie Semantiche • Open Data 2. info su Open Data Ground 3 ... utilizza tecnologie semantiche

info su www.evodevo.it

OpenDataGround è stato necessario per progetti Open Data e LOD:

• Comune di Albano

• Open Sanità

• Open Data INPS

OpenDataGround: progetti Open Data e LOD

5

http://dati.opendataground.it/comunealbanolaziale

http://dati.opendataground.it/opensanita

http://www.inps.it/portale/default.aspx?iIDLi

nk=43&bi=08&link=Open+Data

Page 6: Stars Factory: LOD in RDF Data Cube Vocabulary · • Knowledge Management • Tecnologie Semantiche • Open Data 2. info su Open Data Ground 3 ... utilizza tecnologie semantiche

info su www.evodevo.it

Stars Factory: ODG plug-in

6

• ODG permette la conversione automatica di dataset in formato XML, RDF e

OWL

• La conversione nel formato RDF/OWL avviene attraverso lo standard W3C

RDB2RDF.

• Per tabelle multidimensionali (non tabelle RDB) ODG è dotato di un plug-in,

Stars Factory, che consente la generazione di file OWL .

Tabella RDB >> Modello

Tabellare

Crosstab >> Modello

Multidimensionale

Page 7: Stars Factory: LOD in RDF Data Cube Vocabulary · • Knowledge Management • Tecnologie Semantiche • Open Data 2. info su Open Data Ground 3 ... utilizza tecnologie semantiche

info su www.evodevo.it

RDF Data Cube Vocabulary

7

RDF Data Cube Vocabulary: un modello dati per convertire semi-automaticamente

tabelle in LOD.

• Vocabolario raccomandato dal W3C

• Traduce in RDF il modello multidimensionale tipico dei dati aggregati

• Compatibile con SDMX

Stars Factory converte

Crosstab in grafi OWL

secondo una versione

semplificata del modello RDF

Data Cube Vocabulary.

Page 8: Stars Factory: LOD in RDF Data Cube Vocabulary · • Knowledge Management • Tecnologie Semantiche • Open Data 2. info su Open Data Ground 3 ... utilizza tecnologie semantiche

info su www.evodevo.it

Modello ontologico di conversione in LOD

8

• Il modello semplificato che usa

Stars Factory si traduce nella T-

Box di un’ontologia, che descrive

le dimensioni, le misure e gli

attributi (Component Property)

del Crosstab

• L’Observation è il fenomeno da

descrivere, espresso dal valore

della cella e definito attraverso le

relazioni con dimensioni, misure

e attributi

Page 9: Stars Factory: LOD in RDF Data Cube Vocabulary · • Knowledge Management • Tecnologie Semantiche • Open Data 2. info su Open Data Ground 3 ... utilizza tecnologie semantiche

info su www.evodevo.it

Stars Factory: come funziona

9

• Dai CSV vengono estratti i dati

• Dall’ XML vengono estratti i metadati del dataset

• Dal modello OWL viene estratta la struttura della tabella da convertire

• Il modello OWL fornisce le istruzioni per associare ad ogni cella le corrispettive

Component Property, seguendo una logica posizionale

Stars Factory popola il modello ontologico (T-Box) fornito in input, con tutte le

observation relative alle celle del dataset di partenza, che costituiscono la A-Box.

Page 10: Stars Factory: LOD in RDF Data Cube Vocabulary · • Knowledge Management • Tecnologie Semantiche • Open Data 2. info su Open Data Ground 3 ... utilizza tecnologie semantiche

info su www.evodevo.it

L’Output di Stars Factory è un grafo ontologico con:

• T-box definita manualmente

• Medadati del dataset estratti dal file XML

• Tante istanze della classe Observations quante sono le celle del dataset

Output di Stars Factory: LOD

10

Observation 102

Observation

dimensio

n

dimension

dimension

measuremeasureValue

2009

beneficiari di Mobilità

mezzogiorno

dataset 52

numero di beneficiari

“4654”

Anno

Lavoratori

Area

Geografica

Measure

Property

Dimension

Property

Component

Property

Is-a

Is-a

Is-a Is-a

Is-a

Is-a

Is-a

Is-a

subject

mobilità

lavoro dipendente

subject

Concept

Is-a

Is-a

rapporti annuali

Source

Is-a

“Inps”

“Generazione di beneficiari

di Mobilità dal 2006 al

2009-”

“17/01/2012”

Dataset

Page 11: Stars Factory: LOD in RDF Data Cube Vocabulary · • Knowledge Management • Tecnologie Semantiche • Open Data 2. info su Open Data Ground 3 ... utilizza tecnologie semantiche

info su www.evodevo.it

Per informazioni:

Evodevo srl

Via dei Castelli Romani 12a

00040 Pomezia (Roma)

Tel. 06 9108509

[email protected]

www.evodevo.it

@OpenDataGround

11

“Sometimes perceiving this

world differently is the key

to making discoveries”

Grazie per l’attenzione!