ciro cattuto - data science: dati, modelli, decisioni - digital for business

22
DATA SCIENCE: DATI, MODELLI, DECISIONI Ciro Cattuto ISI Foundation, Torino @ciro Digital Festival, 7 maggio 2013 BIG DATA – SCENARIO E TECNOLOGIA ABILITANTE

Upload: cultura-digitale

Post on 05-Jul-2015

94 views

Category:

Business


0 download

TRANSCRIPT

Page 1: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

DATA SCIENCE:DATI, MODELLI, DECISIONI

Ciro CattutoISI Foundation, Torino

@ciro

Digital Festival, 7 maggio 2013BIG DATA – SCENARIO E TECNOLOGIA ABILITANTE

Page 2: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

dealing with dataSciencespecial issue11 feb 2011

Page 3: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

il quarto paradigma

“The new model is for the data to be captured by instruments or generated by simulations before being processed by software and for the resulting information or knowledge to be stored in computers. Scientists only get to look at their data fairly late in this pipeline. The techniques and technologies for such data-intensive science are so different that it is worth distinguishing data-intensive science from computational science as a new, fourth paradigm for scientific exploration.”

- Jim Gray, 2007

1. empirico2. teorico3. computazionale

Page 4: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

nuovi paradigmi decisionali

“Data-intensive science, if done right, will mean more paradigm shifts of scientific theory, happening faster, because we can rapidly assess our worldview against the ‘objective reality’ we can so powerfully measure.”

- John Wilbanks (Creative Commons), 2007

Page 5: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

reti socialiin vivo

sociopatterns.org

Page 6: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

dottori

infermieri

ausiliari

pazienti

genitori

Page 7: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

GLEaMviz - Global Epidemic and Mobility Model

gleamviz.org

Page 8: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

INFLUENZANETsorveglianza Web pan-europea dell’influenza stagionale

influweb.it

Page 9: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

INFLUENZANETsorveglianza Web pan-europea dell’influenza stagionale

influweb.it

Page 10: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

✓ grande numero di componenti✓ interazioni fra componenti✓ strutture gerarchiche multi-scala✓ interazione fra scale diverse✓ auto-organizzazione (no blueprint)✓ proprietà emergenti✓ “complesso” è più che “complicato”

infrastructural + social

A. Koblin

P. Butler

Page 11: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

✓ grande numero di componenti✓ interazioni fra componenti✓ strutture gerarchiche multi-scala✓ interazione fra scale diverse✓ auto-organizzazione (no blueprint)✓ proprietà emergenti✓ “complesso” è più che “complicato”

infrastructural + social

A. Koblin

P. Butler

★ la fine del pensiero lineare★ interdipendenza e rischio sistemico★ il problema dell’inferenza causale

Page 12: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

tracce digitali di comportamenti umani

P. Butler

Page 13: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

tracce digitali

Page 14: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

tracce digitali

prospettiva storicaorizzonte temporale limitatoriproducibilità limitatacontesto limitatoprivacy e protezione dati

Page 15: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

tracce digitali

prospettiva storicaorizzonte temporale limitatoriproducibilità limitatacontesto limitatoprivacy e protezione dati

disponibili come effetto collaterale di attività ordinariealto livello di copertura, accesso alle grandi scalepossibilità di elaborazione automatica

Page 16: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

tracce digitali

prospettiva storicaorizzonte temporale limitatoriproducibilità limitatacontesto limitatoprivacy e protezione dati

disponibili come effetto collaterale di attività ordinariealto livello di copertura, accesso alle grandi scalepossibilità di elaborazione automatica

natura fondazionaledell’accesso alle tracce digitali di comportamenti umani

Page 17: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

il nuovo ruolo dei dati

http://www.weforum.org/issues/rethinking-personal-data

Page 18: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

il nuovo ruolo dei dati

http://www.weforum.org/issues/rethinking-personal-data

Page 19: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

metodologiatracce digitali di comportamentocome evidenza di primo ordine

per decisioni globali

data-drivenmodeling

machine learningdata mining

natural language processing

scalable computational infrastructures ICT

data-driven decision & policy making

Page 20: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

metodologiatracce digitali di comportamentocome evidenza di primo ordine

per decisioni globali

data-drivenmodeling

machine learningdata mining

natural language processing

scalable computational infrastructures ICT

data-driven decision & policy making

valore?

Page 21: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business
Page 22: Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

If we are going to really capitalize on big data,we need to get human insight at machine scale.