meloda una métrica de la reutilización -...

33
YOUR LOGO ¿Por que publicamos la información? MELODA una métrica de la reutilización Alberto Abella @aabella

Upload: ngokhuong

Post on 11-Feb-2018

215 views

Category:

Documents


2 download

TRANSCRIPT

YOUR LOGO

¿Por que publicamos la información?MELODA una métrica de la reutilización

Alberto Abella@aabella

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓNXVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Madrid. Datos.madrid.es

198 descargas desde 15-4-2014

1.07 al día

http://bit.ly/volunariosmadrid

198 descargas desde 15-4-2014

1.07 al día

http://bit.ly/volunariosmadrid

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓNXVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Madrid. Datos.madrid.es

14 apps oficiales utilizando los datos de datos.madrid.es

14 apps oficiales utilizando los datos de datos.madrid.es

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓNXVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

España. Datos.gob.es

2 descargas

desde 15-4-2011 (posiblemente)

http://datos.gob.es/catalogo/anejo-fotografico-de-tarazona-moncayo-c12album

2 descargas

desde 15-4-2011 (posiblemente)

http://datos.gob.es/catalogo/anejo-fotografico-de-tarazona-moncayo-c12album

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓNXVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Hay 1 (encontrada)

Es oficial

1000 descargas

Hay 1 (encontrada)

Es oficial

1000 descargas

BNE. Apps

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓNXVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Copyright BNE 2015Copyright BNE 2015

BNE. Licencia catalogo datos

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Barcelona: ● 100.000 to 500.000 downloads● Basada en scraping de la web ● Multiplicó por 5 durante tiempo a su competidor oficial

Barcelona: ● 100.000 to 500.000 downloads● Basada en scraping de la web ● Multiplicó por 5 durante tiempo a su competidor oficial

Barcelona. Eduard Ereza

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓNXVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Helsinki. Apps usando open data

Helsinki

621.000 habitantes

136 apps

Helsinki

621.000 habitantes

136 apps

9XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

¿Realmente queremos que se usen?

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

1 OGOV Active Passive

2 Goals Service’s improvementHaving lots of people in well designed sites

3 ParticipantsRepresentative citizens’ sample

Those willing to participate

4 Info. Release Actual demand and useAuthorities’ interests and availability

5 Timeliness ASAP Once reviewed

6 Applications Ecosystem of developers Own development

7 Participation Commitment to answer Just open

8 Training In place No (just principles)

Ogov pasivo vs activo

Source: Abella, Ortiz-de-Urbina and De Pablos (2015)

SI NO

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

De centralizado a colaborativo

Todos los desarrollos

son propios No hay alternativas

para grupos de usuarios

Conexión limitada en caso existir

Centralizado

● Los recursos se comparten con los usuarios

● Propiedad central cesión derechos uso

Ecosistema reutilizadores

Promoción Feedback

Compartido

● Red de nodos conectados por plataformas / protocolos comunes

Comparten datos u otros recursos digitales

Propiedad datos distribuida

Colaborativo

Control Ecosistema Impacto

MODELOS COLABORACIÓN

Eficiencia recursos propios

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Ecosistemas digitales

Smart City Ecosystem Society

External digital assets

SC Digital assets

SC Data demandFixed data

Services delivered

Services demand

Added value processes

Source: Abella, Ortiz-de-Urbina and De Pablos (2015)

Data source

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Citizen Experience

SERVICE experience

Innovation

SaveTime

Trust

Stage impact on attribute

Channel impact on attribute

TOUCHPOINTS

Office Call Center … ATM

Discover Brand

Use of services

Discover Brand

…. … … … …

Finishing

LIFECYCLE PHASE

Driver 1 (x %)

Driver 3 (z %)

Driver 2 (y %)

Driver 4 (t %)

Driver 5 (a %)

Driver 6 (b %)

Attribute

Driver For every attribute of experience

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Source http://www.ncbi.nlm.nih.gov/pubmed/15794461

Impacto de la publicación datos

Los Angeles county

Publicación calificación sanitaria restaurantes

13.1 descenso ingresos hospitalarios

Los Angeles county

Publicación calificación sanitaria restaurantes

13.1 descenso ingresos hospitalarios

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Tiene solución

….

Pero no sabemos cual es

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

No sabemos cual es

….

Pero tenemos algunas pistas

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Impacto de la publicación datos

Reusabilitydegree

Reusevalue

Economic and socialvalue

Open dataProducts/services

Distribution and/or commercialization

Products / servicesdevelopment

Open dataSmart cities datasets

Inbound open innovation

Apps development

Outbound open innovation

Apps Social and market value

Stage 1 Stage 2 Stage 3

Source: Abella, Ortiz-de-Urbina and De Pablos (2015)

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Factores afectan a la reutilización

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Factores reutilización datos. Legal

Legal

- Licencia de reutilización

- Uso comercial

- Compatibilidad entre licencias

Con la condición

- No desnaturalización

- Actualización

Legal

- Licencia de reutilización

- Uso comercial

- Compatibilidad entre licencias

Con la condición

- No desnaturalización

- Actualización

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Cambios en licencias de datos

Copyright and restrictive licensing Commercial & only attribution0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

84%

16%12%

88%

2011

2013

Fuente: Abella (2013)

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Factores reutilización datos. Acceso

Acceso

• Registro oficial

• Acceso a todos los datos

• API

• Query / SPARQL

Acceso

• Registro oficial

• Acceso a todos los datos

• API

• Query / SPARQL

«Vandalproof» de Originally first uploaded by Bottesini of the English Wikipedia, converted to PNG by 98E of the English Wikipedia, and then edited to look better by Rappingwonders2. - Originally converted to PNG from Image:Vandalprooflock.jpg, edited to look better by User:Rappingwonders2.. Disponible bajo la licencia CC BY-SA 3.0 vía Wikimedia Commons - http://commons.wikimedia.org/wiki/File:Vandalproof.png#/media/File:Vandalproof.png

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Factores reutilización datos. Acceso

-15% -10% -5% 0% 5% 10% 15% 20%2

2.2

2.4

2.6

2.8

3

3.2

3.4

3.6

3.8

4LOCAL

Linear (LOCAL)

NATIONAL

Linear (NATIONAL)

REGIONAL

Linear (REGIONAL)

Increment use 12-11

Acc

ess

dim

en

s io

n

Legal

Legal

Legal

Transport

Transport

Transport (L)

Meteo

Meteo

Meteo (R)

Geograhic

Geograhic

Geograhic

Social

Social

Social

Other

Other

Other

Business

Business

Business

Muestra (2013)

• 204 fuentes (España)

• 7 categorías datos

•Ambito nacional, regional y local

•MELODA 2.5

Muestra (2013)

• 204 fuentes (España)

• 7 categorías datos

•Ambito nacional, regional y local

•MELODA 2.5

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Factores reutilización. Estándares técnicos

Estándares técnicos

• No influyen tanto

• Pueden incluir los metadatos

• Pueden condicionar la herramienta uso

•Estándares geográficos (INSPIRE)

Estándares técnicos

• No influyen tanto

• Pueden incluir los metadatos

• Pueden condicionar la herramienta uso

•Estándares geográficos (INSPIRE)

"Master lock" by Dhscommtech at English Wikipedia. Licensed under CC BY-SA 3.0 via Wikimedia Commons - https://commons.wikimedia.org/wiki/File:Master_lock.JPG#/media/File:Master_lock.JPG

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Factores reutilización. Modelo de datos

Modelo de datos

- Documentado

- Publicado

- Compartido

- Normalizado

- Utilizado

Posiblemente el de mayor impacto

No nos valen las 5 estrellas

Modelo de datos

- Documentado

- Publicado

- Compartido

- Normalizado

- Utilizado

Posiblemente el de mayor impacto

No nos valen las 5 estrellas

CC Attribution IvanWalsh.com

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Factores reutilización. Geolocalización

Geolocalización

- Añade valor

- En los datasets más utilizados

Geolocalización

- Añade valor

- En los datasets más utilizados

"World Heat Engine" by NASA / Goddard - Image n.0300805 "The World Revs its Heat Engine"http://mix.msfc.nasa.gov/abstracts.php?p=2622http://nasaimages.org/luna/servlet/detail/nasaNAS~9~9~58656~162500http://www.flickr.com/photos/nasacommons/5053572594/. Licensed under Public Domain via Wikimedia Commons - https://commons.wikimedia.org/wiki/File:World_Heat_Engine.jpg#/media/File:World_Heat_Engine.jpg

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Factores reutilización. Tiempo real

Tiempo real

De acuerdo al proceso que los genera

Conexión en directo a los datos

Mayoritariamente presente en los datos más reutilizados

Tiempo real

De acuerdo al proceso que los genera

Conexión en directo a los datos

Mayoritariamente presente en los datos más reutilizados

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

¿Como medimos la reusabilidad?

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Metrica reutilización

MELODA

4 Dimensiones de análisis

Varios niveles en cada dimensión

Cada nivel está ponderado

MELODA

4 Dimensiones de análisis

Varios niveles en cada dimensión

Cada nivel está ponderado

MELODA: Tabla de dimensiones y nivelesDimensiones

Niveles

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Metrica reutilización

MELODA

4 Dimensiones análisis

Varios niveles en cada dimensión

Cada nivel está ponderado

MELODA

4 Dimensiones análisis

Varios niveles en cada dimensión

Cada nivel está ponderado

MELODA: Ponderación de niveles

Dimensiones

Niveles

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Metrica reutilización

MELODA

MEtric for reLeasing Open DAta

- Cuantificar la reusabilidad de fuentes de información

- Relacionarla con su reutilización

- Relacionarla con el valor creado

- Accesible en meloda.org

MELODA

MEtric for reLeasing Open DAta

- Cuantificar la reusabilidad de fuentes de información

- Relacionarla con su reutilización

- Relacionarla con el valor creado

- Accesible en meloda.org

Proceso evaluación

Estándar técnico

Legal

Acceso

Juego datos

Meloda 3.10

M3.10

Ponderación

Ponderación

Pondera

Criterios

Nivel

Nivel

Nivel

Paso 1.Evaluación

Paso 2.Ponderación

Paso 3.Obtenciónvalor

ValorMétrica MELODA

Modelo de datos

Nivel

Ponderación

Ponderación

Cualificación Reusabilidad

Paso 4.Calificaciónreusabilidad

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Metrica reutilización. Ejemplo

MELODA

La Biblioteca A publica un conjunto de datos como linked data pero con un modelo de datos propio, con licencia de uso comercial, y con un mecanismo por el cual se puede utilizar un recurso SPARQL para interrogar el conjunto de datos. Los niveles que tiene en cada dimensión son los siguientes:

Dimensión estándares técnicos: Nivel 3 (RDF con metadatos) → 100%

Dimensión acceso: Nivel 5 (Interrogable vía SPARQL) → 100%

Dimensión legal: Nivel 4 (comercial) → 90%

Dimensión Modelo de datos: Nivel 2 (modelo de datos ad hoc) → 30%

MELODA

La Biblioteca A publica un conjunto de datos como linked data pero con un modelo de datos propio, con licencia de uso comercial, y con un mecanismo por el cual se puede utilizar un recurso SPARQL para interrogar el conjunto de datos. Los niveles que tiene en cada dimensión son los siguientes:

Dimensión estándares técnicos: Nivel 3 (RDF con metadatos) → 100%

Dimensión acceso: Nivel 5 (Interrogable vía SPARQL) → 100%

Dimensión legal: Nivel 4 (comercial) → 90%

Dimensión Modelo de datos: Nivel 2 (modelo de datos ad hoc) → 30%

√√100 ·100 ·90 ·30 =72.08

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓNXVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Informe reusabilidad

XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN

Alberto Abella

Activismo: Open Knowledge Foundation Spain

Academia: Universidad Rey Juan Carlos

Sociedad información : AMETIC

Sector Privado: Brain Trust

Activismo: Open Knowledge Foundation Spain

Academia: Universidad Rey Juan Carlos

Sociedad información : AMETIC

Sector Privado: Brain Trust

Contacto: @aabella [email protected]

[email protected]