ciência de dados espaciais - aonde...

29
Ciˆ encia de Dados Espaciais Aonde Vamos? Joana Sim˜ oes Eurecat, Centro Tecnol´ ogico da Catalunha

Upload: others

Post on 07-Jul-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

Ciencia de Dados EspaciaisAonde Vamos?

Joana SimoesEurecat, Centro Tecnologico da Catalunha

Page 2: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

Cientistas & Unicornios“Data Scientist” is a Data Analyst who lives in California.A data scientist is someone who is better at statistics than any software engineer and better at softwareengineering than any statistician. (Wills, Cloudera)

2 / 29

Page 3: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

Dados, Informacao e Conhecimento

3 / 29

Page 4: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

Algo espacial...Lei de Tobler:Everything is related to everything else, but near things are morerelated to each other.

Heatmap de Tweets perto de um Cruzeiro (Eurecat, unpublished).

4 / 29

Page 5: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

Algo espacial...Lei de Tobler:Everything is related to everything else, but near things are morerelated to each other.

Buffers de acidentes a volta das escolas (Eurecat, unpublished).

5 / 29

Page 6: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

Onde Vamos?

6 / 29

Page 7: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

(Algumas) Tendencias

7 / 29

Page 8: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

Importancia Crescente

Runkeeper: fitness track app https://runkeeper.com/

Whitings: balanca “inteligente” http://www2.withings.com/eu/en

8 / 29

Page 9: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

Mais Dados

Infografia baseada en dados da Cisco http://www.i-scoop.eu/internet-of-things/

9 / 29

Page 10: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

E Ainda Mais Dados

Clusters de Tweets enviados por locais e estrangeiros (Eurecat, unpublished).

10 / 29

Page 11: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

E Ainda Mais Dados

Distribuicao de densidades de Tweets enviados por estrangeiros (Eurecat, unpublished).

11 / 29

Page 12: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

“Arqueologia” de Dados

Mapa de casos de colera em Londres, produzido por John Snow (1864).

12 / 29

Page 13: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

“Arqueologia” de Dados

Mapa de casos de colera em Londres, produzido por John Snow (1864).

Descodificacao de metadados atraves da estrutura de directorios (Institute of Marine Research, unpublished).

13 / 29

Page 14: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

Tecnologias de Big Data

Os 3 Vs de Big Data (Cuesta, H., 2013).

14 / 29

Page 15: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

Tecnologias de Big Data

Benchmarking de bases de dados espaciais na cloud (Simoes, 2015).

15 / 29

Page 16: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

Uso Cada vez Mais Generalizado de ML

Arquitectura de uma red de Deep Learning para reconhecimento facialhttps://gigaom.com/2015/03/06/how-paypal-uses-deep-learning-and-detective-work-to-fight-fraud/.

Tempos de viagem na cidade de Barcelona: ajuste entre as previsoes SVM (verde) e os valores observados(vermelho) (Eurecat, unpublished). 16 / 29

Page 17: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

Jornalismo de Dados & Story Telling

How riot rumours spread on Twitter (Guardian Interactive team, 2011).

17 / 29

Page 18: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

Jornalismo de Dados & Story Telling

Dashboard sobre acidentes graves e mortais na cidade de Barcelona (Eurecat, unpublished).

18 / 29

Page 19: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

Mais (e Melhores) Dados Abertos

Sismografo da Catalunya, @OpenGovCat (OpenGov, 2015)

19 / 29

Page 20: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

Etica

Ofuscacao espacial (Genovese, A., 2012):

Annonimity setMSV

20 / 29

Page 21: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

Etica

Ofuscacao espacial (Genovese, A., 2012):Annonimity set

MSV

21 / 29

Page 22: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

Etica

Ofuscacao espacial (Genovese, A., 2012):Annonimity setMSV

22 / 29

Page 23: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

EticaOfuscacao espacial (Genovese, A., 2012):

Annonimity setMSV

Pontos originais (Eurecat, unpublished).

23 / 29

Page 24: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

EticaOfuscacao espacial (Genovese, A., 2012):

Annonimity setMSV

Pontos ofuscados (Eurecat, unpublished).

24 / 29

Page 25: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

SIG Open-Source?

25 / 29

Page 26: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

Importancia destas Tendencias para o FOSS4G

Mais aplicacoes + maior quantidades de dados = maiorcomunidade

Infra estruturas colaborativas de dados.Bibliotecas de ML com capacidades espaciais.Visualizacao (interactiva) de dados espaciais (3D).Infra estrutura e processamento de Big Spatial Data.Etica e privacidade.

26 / 29

Page 27: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

Importancia destas Tendencias para o FOSS4G

Mais aplicacoes + maior quantidades de dados = maiorcomunidade

Infra estruturas colaborativas de dados.Bibliotecas de ML com capacidades espaciais.Visualizacao (interactiva) de dados espaciais (3D).Infra estrutura e processamento de Big Spatial Data.Etica e privacidade.

27 / 29

Page 28: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

Obrigada pela vossa AtencaoEsta apresentacao encontra-se disponıvel em:

http://tinyurl.com/nfbrhvl

28 / 29

Page 29: Ciência de Dados Espaciais - Aonde Vamos?osgeopt.pt/sasig2015/files/keynotes/joana_simoes_sasig.pdfMais aplicac¸˜oes + maior quantidades de dados = maior comunidade Infra estruturas

IntroducaoTendencias

Consideracoes Finais

Referencias

Simoes, J., 2015. Visualizing Geolocated Tweets: A Spatial Data Mining Approach. Presentation at the4th Data beers BCN, in Barcelona. Available at:https://github.com/doublebyte1/data_beers/blob/master/data_beers.pdf

Johnson, S., 2006. The Ghost Map: The Story of London’s Most Terrifying Epidemic —and How itChanged Science, Cities and the Modern World. Riverhead Books. ISBN 1-59448-925-4Cuesta, H., 2013. Practical Data Analysis. PACKT Publishing.Simoes, J., Gimenez, R., Planaguma, M., 2015. Big Data y Bases de Datos Espaciales: una analisiscomparativo. Presentacion en las 9as Jornadas SIG Libre, Girona.Guardian Interactive team, 2011. Behind the rumours: how we built our Twitter riots interactive. Availableat: http://www.theguardian.com/news/datablog/2011/dec/08/twitter-riots-interactive

OpenGov, 2015.The seismograph’s oddyssey and transparency for show. Available at:http://opengov.cat/en/2015/08/the-seismographs-oddyssey-and-transparency-for-show/

Genovese, A. 2012. Obfuscation-based techniques for privacy protection in location-based systems: acomparison of recent methods. Dissertation presented for the degree of Doctor in Computer Science, in theUniversita Degli Studio di Milano.

29 / 29