gis sis vichi

18
1 Maurizio Vichi Presidente Società Italiana di Statistica e Dpt. Statistica Probabilità e Statistiche Applicate Università “La Sapienza” di Roma em: [email protected] Informazione Statistica Informazione Geografica e Banche Dati Online: Sviluppi Metodologici ed Applicativi

Upload: coman-alina

Post on 30-Jan-2016

219 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Gis Sis Vichi

1

Maurizio VichiPresidente Società Italiana di Statistica e Dpt. Statistica Probabilità e Statistiche ApplicateUniversità “La Sapienza” di Roma

em: [email protected]

Informazione Statistica Informazione Geografica e Banche Dati Online: Sviluppi Metodologici ed Applicativi

Page 2: Gis Sis Vichi

La Statistica: tra Diffusione e Comunicazione

La Statistica tra cattiva immagine e grande successo in Italia (ma anche all’estero) • La funzione delle Statistica è in generale di acquisire informazione “soggettiva” (ovvero dati

su singoli individui) e restituire informazione “oggettiva”, (conoscenza) legata alla collettività; • Con la Società dell’Informazione (basata su radio, televisione, telefonia e internet),

l’informazione soggettiva è enormemente aumentata; • La percezione pubblica della statistica è in parte negativa. Da che dipende? • I media spesso usano informazione soggettiva e la pubblicano come oggettiva;• La gente ha una percezione di dipendenza della Statistica ufficiale dal Governo. Necessità

di favorire l’indipendenza e l’autorevolezza (credibilità);

Che cosa si può fare per migliorare l’immagine pubblica della Statistica. Due punti in discussione nel workshop: la condivisione e la diffusione dell’informazione statistica

• Organizzare l’informazione statistica online per renderla universalmente accessibile, integrabile e facile da leggere ed interpretare;

• Completare la modernizzazione della Statistica. Il Datawarehouse non è un problema informatico ma è statistico;

La comunicazione dell’informazione statistica. La Statistica non si deve fermare alle tabelle e grafici ma deve comunicare l’informazione rilevante dandone l’interpretazione oggettiva, ovvero la descrizione ed l’inferenza su ciò che è stato osservato.

• Analizziamo gli sviluppi metodologici ed applicativi che sono necessari per migliorare la condivisione e la diffusione dell’informazione statistica

2

Page 3: Gis Sis Vichi

3

SIS Sistema Informativo Statistico online Costruzione di un Sistema Informativo Statistico online Quali sono le caratteristiche generali di un SIS online Per gli aspetti di Organizzazione

Accessibilità dei dati e dei metadati online; Organizzazione dei dati per l’analisi statistica; Integrazione tra dati (modularità) mediante internet Per gli aspetti di Comunicazione Ridurre i tempi di pubblicazione dei dati; Trasparenza e certificazione (qualità dei dati); Predisposizione di strumenti statistici di elaborazione; Interpretazione oggettiva delle elaborazioni (information mining).

Page 4: Gis Sis Vichi

• UN data (http://data.un.org/) • La Divisione Statistica delle Nazioni Unite (UNSD) del DESA ha lanciato un nuovo

servizio internet che permette di trovare e scaricare una varietà di dati statistici delle agenzie delle Nazioni Unite.

• Databases• Education UNESCO UIS Data• Employment ILO Data• Energy UNSD Energy Statistics• Environment UNFCCC Greenhouse Gas Inventory• Food and Agriculture FAO Data , FAO Fertilizer Data• Health WHO Data , HIV/AIDS UNAIDS Data• Human Development UNDP Human Development Report• Indicator databases UNSD Key Global Indicators, UNSD Gender Info 2007 , UNSD Indicators on Women and Men ,UNSD Millennium

Development Goals , UNICEF The State of the World’s Children 2009• Industry UNSD Industrial Commodity Statistics• Information and Communication Technology TU Data• National Accounts UNSD Official Country Data , UNSD Estimates of Main Aggregates• Population UNSD Demographic Statistics , UNPD World Population Prospects• Refugees UNHCR Statistical Yearbook• Trade UNSD Commodity Trade Statistics• Tourism UNWTO Data

4

Basi Dati OnlineAnalizziamo tre rilevanti DB Online per esaminare le loro caratteristiche

Page 5: Gis Sis Vichi

• Eurostat (http://epp.eurostat.ec.europa.eu)• Disponibile sul sito ed esplorata con un albero

• Euroindicators database• Economy and finance Main economic indicators, National accounts (incl.GDP), Government

statistics, Financial accounts, Exchange rates, Interest rates, Monetary and other financial ,statistics, Prices , Balance of payments

• Population and social conditions Population, Health , Education and training , Labour market ,Living conditions and welfare , Crime and criminal justice ,

• Industry, trade and services Short-term business statistics , Structural business statistics ,Information society statistics , Tourism , Statistics on the production of manufactured goods ,

• General and regional statistics Regions , Urban audit , Non EU countries ,• Agriculture and fisheries Agriculture Forestry, Fisheries ,Food• External trade External trade• Transport• Environment and energy Environment ,Energy• Science and technology Science and technology

5

Basi Dati Online 2

Page 6: Gis Sis Vichi

Basi Dati Online 3• Statistics Portal OECD.Stat Extracts• General Statistics • Agriculture and Fisheries • Demography and Population • Development • Economic Projections, Education and Training • Environment • Finance • Globalisation • Health • Industry and Services • International Trade and Balance of Payments • Labour • Monthly Economic Indicators • National Accounts • Prices and Purchasing Power Parities • Productivity • Public Sector, Taxation and Market Regulation • Regional Statistics • Science, Technology and Patents • Social and Welfare Statistics • Non-member Economies • Others 6

Page 7: Gis Sis Vichi

Vista Univariata o tabellare dei DB

• In UNDATA sono riportate le serie storiche degli indicatori ed ha un motore di mappe tematiche;

• In EUROSTAT c’è una applet Java che permette di costruire tabelle;

• In OECD Portal c’è eXplorer che è uno strumento per costruire tabelle e grafici e fare confronti territoriali;

• In un SIS i dati sono logicamente strutturati in uno o più“CUBI” di informazioni:

• unità territoriali x indicatori x tempi, che sono le dimensioni tipiche di ogni fenomeno statistico con struttura complessa.

7

Page 8: Gis Sis Vichi

8

Struttura Multiway dei Dati organizzati in uno o più data-set a tre vie (Three-way Data Set) X un insieme X di I × J × K attributi relativi a: J Indicatori (variabili) misurati, (osservati, stimati) su I Unità Territoriali (oggetti geografici, aggregazioni

amministrative) osservati, K Occasioni (tempi, diverse fonti di dati)

Si ha un Cubo X o 3-Way Array

tempo k

Unità territoriale

i

x11h x12h ... x1kh

x11r x12r ... x1kK

xn11 xn21... x1JK

x111 x121 … x1k1

Indicatore j

xijk

Un insieme di indicatori economici, demegrafici, sociali

Comuni, provincie, regioni, comucap

anno, semestre, trimestre, mensile

Page 9: Gis Sis Vichi

9

Analisi statistica dei dati di un SISI dati presentano tre diverse tipologie di relazione di cui si deve tener conto

RELAZIONE TERRITORIALI, tra le unità territoriali rispetto agli indicatori in un istante di tempo (correlazione spaziale, (dis)similarità fra oggetti spaziali, vincoli di contiguità, ecc.);

TIPO DI ANALISI: Statistica per il territorio (Spaziale) Statistica per il territorio (Spaziale) ed uso dei ed uso dei GISGIS; Indici di associazione spaziale, regressione eregressione e segmentazione segmentazione vincolata al territoriovincolata al territorio.

RELAZIONE MULTIVARIATE,ovvero tra gli indicatori sulla base di unità territoriali osservate in un istante di tempo (associazione e correlazione fra variabili);

TIPO DI ANALISI : Statistica MultivariataStatistica Multivariata.. Costruzione di indicatori indicatori complessicomplessi, segmentazione del mercatosegmentazione del mercato. RegressioneRegressione tra indicatori

RELAZIONI TEMPORALI, ovvero in ciascun indicatore che si riferiscono a indicatori e/o unità territoriali (auto-correlazione temporale);

TIPO DI ANALISI: Analisi delle Serie Storiche Analisi delle Serie Storiche ed uso della modellistica per le PrevisioniPrevisioni.

Page 10: Gis Sis Vichi

10

Prima vista del SIS CONFRONTI TERRITORIALI

(sezionando verticalmente X)

Units

Variables

xn11 xn21 ...xnk1

x11r x12r ...x1kr

xi11 x121 ... xik1

x112 x122 ...x1k2occasion 1

occasion 2

occasion r

x111 x121 ...x1k1

xnk2

xik2xnkr

xikr

Unità territoriali multivariate Confronti territoriali tra indicatori in uno stesso istante di tempo(Analisi cross-section); Analisi delle posizioni relative tra le unità territoriali su indicatori ospazi fattoriali (indicatori compositi); Segmentazione del territorio in aree omogenee.

Indicatori

Tempo 1

Tempo 2

Tempo r

Unità Territoriali

Page 11: Gis Sis Vichi

11

Seconda Vista PREVISIONI STATISTICHE

(sezionando orizzontalmente X) n Serie Storiche Multiple

Occasions

Unit 1x221

x11r

x111

x211

xn11 xn21

x121 x1k1

x12r x1kr

x2k1

x21r

Unit n

Variables

xnk1

xn1r

Un insieme di dati Panel Confronti tra n Serie Storiche multivariate (Panel di dati) Analisi delle “storie” tra più unità territoriali sulla base di unset di indicatori; Previsioni su un territorio sulla base di un set di indicatori; Analisi di convergenza e divergenza territoriale;

Unità I

Unità 1

Indicatori

tempi

Page 12: Gis Sis Vichi

12

Terza vista CONVERGENZA di INDICATORI

(sezionando lateralmente X) un insieme di K Serie Storiche Multiple

Un insieme di dati Panel Confronti “storici” tra indicatori per le unità territoriali; Previsioni di indicatori in un territorio; Analisi di convergenza e divergenza degli indicatori sulterritorio;

Occasions

Units

variable 1

variable k

x112

x11r

x111

x211

x212

x21r

xn11

xn12

xn1r

Indicatore 1

Indicatore K Tempi

Unità

Page 13: Gis Sis Vichi

13

GIS- Geographical Information System

• Un GIS è un sistema orientato alla Geografia, che permette, la gestione, l’analisi e la visualizzazione di informazioni legate al territorio

Diversi modi di vedere un GIS

La vista del Database: dati geografici

Collezioni ordinate di caratteristiche vettoriali (insiemi di punti, linee e poligoni)

modelli digitali di elevazione del territorio

Collegamenti tra oggetti geografici

Terreni e altre superficie

Insiemi di dati di ricerche geografiche

altre informazioni geografiche

Altra modalità “geografica” di vedere i dati

Page 14: Gis Sis Vichi

14

Secondo e Terzo modo di vedere un GIS Dati di relazione tra gli oggetti spaziali e i dati di flusso.

Relazioni spaziali come topologie e reti sono parti cruciali di un GIS. La topologia è impiegata per gestire confini comuni tra oggetti geografici

Organizzazione tematica dei dati (livelli tematici)

Page 15: Gis Sis Vichi

15

Integrazione tra GIS e SIS

Tre tipologie di vista dei dati

Visualizzazione cartografica (tipica GIS)Gli indicatori che definiscono una serie territoriale originano un cartogramma.

Visualizzazione tabellare (tipica SIS)Tabelle unità territoriali x indicatori;Tabelle unità terrritoriali x tempi;Tabelle indicatori x tempi

Visualizza grafica (tipica SIS e GIS + cartografia)Per variabili qualitative 1 indicatore: grafico a colonne 1 indicatore x anni: grafico a colonne contrapposte

Per variabili quantitativeIstogramma 1 indicatore x anni: grafico cartesianom indicatori x anni: grafici cartesiani a confronto

Page 16: Gis Sis Vichi

16

MetadataCatalogo Dati

Basi Dati ufficiali, gestione, validazione

•GESTIONE DATI•BASE DATI RELAZIONALE•INTEGRAZIONI DI FONTI* Strumenti per il DBMS* Gestione della sicurezza * Raccolta di dati mediante

questionari interattivi * Controllo e correzione dati* Geo-processing dei dati

•PRESENTAZIONERISULTATI

* Strumenti grafici per la presentazione dei dati

* Gestione della tabelle * Geo-processing dei dati

• ANALISI DEI DATI

* Strumenti statistici per l’analisi dei dati

* Classificazione dei territori * Costruzione di indicatori

complessi* Modelli per le relazioni

tra indicatori* Geo-processing dei dati

90 89 88 87 86 85 84 83 82 81 80

86 4

20 -2 -4 -6 -8

CAFRGBGEJAPITASPAUSA

90 868380

9086 8380

908683

80

9086

8380

9086

8380

90 8683

80

90868380

90868380

Factor 1 (60%)

210-2-3

Fact

or 2

(24%

)

3

2

1

-1

-2

-4

ITASPA

GRB

FRACAN

JAP

USA

GER

0

20

40

60

80

100

1° Trim. 2° Trim. 3° Trim. 4° Trim.

y111 ... y1n1

yi11 ... yin1

yn11 ...ynn1

Warehouse cubi di dati

F RA

U SA

G RB

C AN

G ER

J AP

I TA

S PA

0

5-9

15-2

4

45-6

4

LiguriaPiemonteVenetoFriuli-Venezia GiuliaLombardia

0

500.000

1.000.000

1.500.000

2.000.000

2.500.000

3.000.000

Integrazione tra GIS e SIS: Geo Web StarterGeo Web Starter

Gestione profili utenti

Basi Datiutente

Servizio WEB -multimediale

Cartografia & Tabelle e Grafici

Confronti avanzatiDBMS archivi

Segmentazioneterritorio in areeomogenee

Modelli per serie temporali e serie spaziali

Diffusione, confronti

Page 17: Gis Sis Vichi

17

DESC FREQ PROB ANOVA1 ANOVA+ EXPER SLR MLR LOG LOGIT PROBIT GLM ANCOVA NONPAR LOGLIN TIME SURV PCA FACT CCA CA DISCR CLUST

ADE 4 • • • • • • • • •

DATAPLOT • • • • • • • • • • • • •

EASYREG • • • • • • • • • • •

GRETL • • • • • • • • • • • •

INSTAT + • • • • • • • • • • •

MACANOVA • • • • • • • • • • • • • • •

MATRIXER • • • • • • • • •

MICROSIRIS • • • • • • • • • • • •

OPENSTAT • • • • • • • • • • • • • • • •

R • • • • • • • • • • • • • • • • • • • • • • •

TANAGRA • • • • • • • • • • •

VISTA • • • • • • • • • •

WINIDAMS • • • • • • • • • •

Software Statistico (Open Source)

Page 18: Gis Sis Vichi

Software Online

• SOCR (Statistics Online Computational Resource)

• (http://www.socr.ucla.edu/) Database di risorse computazionali online

• include: • Distributions (interactive graphs and calculators), • Experiments (virtual computer-generated analogs of popular games and processes), • Analyses (collection of common web-accessible tools for statistical data analysis), • Games (interfaces and simulations to real-life processes), • Modeler (tools for distribution, polynomial and spectral model-fitting and simulation), • Graphs, Plots and Charts (comprehensive web-based tools for exploratory data analysis), • Additional Tools (other statistical tools and resources), • SOCR Wiki (collaborative Wiki resource), • Educational Materials and Hands-on Activities (varieties of SOCR educational materials), • SOCR Statistical Consulting• Statistical Computing Libraries

18