experiencia de acceso a datos del estudio niños del milenio en el perú: desafíos en la gestión e...

29
Experiencia de acceso a datos del estudio Niños del Milenio en el Perú: desafíos en la gestión e implementación de metadatos Alan Sánchez Niños del Milenio/ GRADE

Upload: ninos-del-milenio-grade

Post on 05-Aug-2015

228 views

Category:

Data & Analytics


1 download

TRANSCRIPT

Experiencia de acceso a datos del estudio Niños del Milenio en el Perú:

desafíos en la gestión e implementación de metadatos

Alan Sánchez Niños del Milenio/ GRADE

Esquema de la presentación

1. Características del estudio Niños del Milenio.

2. Tipo de metadatos generados.

3. Estrategias de divulgación de metadatos.

4. Estadísticas (según portal de Niños del Milenio).

5. Experiencia y desafíos.

1. Características del estudio

1. Características del estudio

1. Características del estudio

• Estudio longitudinal, observacional: 12 000 niños y niñas en Perú, Etiopía, India y Vietnam.

• Cinco rondas de visitas (2002, 2006, 2009, 2013 y 2016).• En el Perú:

– Encuesta a niños y madres.– Encuesta comunitaria, Encuesta escolar (2010)

• Estudio administrado por la Universidad de Oxford a nivel global y GRADE y el IIN en Perú.

• Estudio financiado por el Gobierno de Reino Unido (DFID) y la Cooperación Internacional de Irlanda.– Datos cuantitativos (anonimizados) son bienes públicos.– Número de investigaciones publicadas es una de las muestras de

éxito del estudio.

Datos longitudinales recolectados

R1 R3 R46-18 meses

4-5 años

7-8 años

11-12 años

R1 R3 R47-8 años

11-12 años

14-15 años

18-19 años

Cohorte menor (Encuesta Hogar, Encuesta Niño)

R514-15 años

R521-22 años

2002 2006 2009 2013 2016

R2

R2

Cohorte menor (Encuesta Hogar, Encuesta Niño)

Datos longitudinales recolectados

R1 R3 R46-18 meses

4-5 años

7-8 años

11-12 años

R1 R3 R47-8 años

11-12 años

14-15 años

18-19 años

Cohorte menor (Encuesta Hogar, Encuesta Niño)

R514-15 años

R521-22 años

2002 2006 2009 2013 2016

Desde 2006: Encuesta de Comunidad

R2

R2

Cohorte menor (Encuesta Hogar, Encuesta Niño)

Datos longitudinales recolectados

R1 R3 R46-18 meses

4-5 años

7-8 años

11-12 años

R1 R3 R47-8 años

11-12 años

14-15 años

18-19 años

Cohorte menor (Encuesta Hogar, Encuesta Niño)

R514-15 años

R521-22 años

2002 2006 2009 2013 2016

Desde 2006: Encuesta de Comunidad

R2

R2

Cohorte menor (Encuesta Hogar, Encuesta Niño)

En 2010:Encuesta Escolar

2010

1. Características del estudio

2. Tipo de metadatos generados

2. Tipo de metadatos generados

• Bases de datos de:– Encuesta al hogar.– Encuesta al niño.– Encuesta a nivel

comunidad.– Encuesta de escuelas

(2010).

• Diccionarios y cuestionarios asociados a las bases de datos.

• Reportes técnicos.

3. Proceso de generación y divulgación de datos y metadatos (Ejemplo con Ronda 3)

3. Proceso de generación y divulgación de datos y metadatos (Ejemplo con Ronda 3)

Levanta-miento de datos de Ronda 3

Limpieza general de

base de datos

Confección de diccionarios de

variables

Limpieza específica de base de datos

20092010

Digitación

Publicación de bases de datos de Ronda 3 en

UK DATA ARCHIVE

2012

Publicación de cuestionarios y diccionarios en

página web

Presentación de reportes técnicos

2011

Confección de diccionarios de

variables

Publicación de trabajos…

(…)

3. Proceso de generación y divulgación de datos y metadatos (Ejemplo con Ronda 3)

Levanta-miento de datos de Ronda 3

Limpieza general de

base de datos

Confección de diccionarios de

variables

Limpieza específica de base de datos

20092010

Digitación

Publicación de bases de datos de Ronda 3 en

UK DATA ARCHIVE

2012

Publicación de cuestionarios y diccionarios en

página web

Presentación de reportes técnicos

2011

Confección de diccionarios de

variables

Publicación de trabajos…

(…)

Datos son de acceso público con dos condiciones:(i)Registro en UK data archivo.(ii)Justificación de solicitud de datos

Datos son de acceso público con dos condiciones:(i)Registro en UK data archivo.(ii)Justificación de solicitud de datos

Se cuenta con un administrador de bases de datos (full-time) en

cada país y un administrador general en Oxford

Levanta-miento de datos de Ronda 3

Limpieza general de

base de datos

Confección de diccionarios de

variables

Limpieza específica de base de datos

20092010

Digitación

Publicación de bases de datos de Ronda 3 en

UK DATA ARCHIVE

2012

Publicación de cuestionarios y diccionarios en

página web

Presentación de reportes técnicos

2011

Confección de diccionarios de

variables

Publicación de trabajos…

(…)

3. Proceso de generación y divulgación de datos y metadatos (Ejemplo con Ronda 3)

3. Proceso de generación y divulgación de datos y metadatos (Ejemplo con Ronda 3)

3. Mecanismos de divulgación:(i) página web local

3. Mecanismos de divulgación:(ii) página web internacional

3. Mecanismos de divulgación:(iii) RePEC

3. Mecanismos de divulgación:(iv) Repositorio de Reino Unido

4. Estadísticas de página web local

2012 2013 2014Reporte país 1 353 1 140 1 457

Notas técnicas 1 468 1 103 1 447Papers 10 898 12 229 15 276

Cuestionarios 2 900 3 075 3 920

Descargas

Número de personas que ingresaron a la página web Niños del Milenio

4. Estadísticas de página web local

2010 2011 2012 2013 2014

18 468 18 188 17 063 39 985 41 782

Número de visitas a la página web Niños del Milenio

2010 2011 2012 2013 201430 861 28 295 26 814 65 141 79 423

Número de visitas por página (URL)

4. Estadísticas de página web local

2013 20141316 1803

Página de Acceso a base de datos

Número de visitas por página (URL)

4. Estadísticas de página web local

2013 2014937 1188

Página de Cuestionarios

Número de visitas por página (URL)

4. Estadísticas de página web local

2013 2014413 489

Página de Metadatos

Número de visitas por página (URL)

4. Estadísticas de página web local

2013 2014518 912

Página de Encuesta escolar de Niños del Milenio en el Perú

5. Experiencias y desafíos en la gestión y divulgación de datos y metadatos

5. Experiencias y desafíos en la gestión y divulgación de datos y metadatos1. Complejidad de la base de datos.

a) Necesidad de construir versión amigable de la base de datos para usuarios externos (comparable en el tiempo y entre países). En Español e Inglés.

b) Atención de consultas.c) Realización de talleres de uso de las bases de datos (gratuitos).d) Generación de reportes técnicos y documentación adicional.

2. Comunicación de revisiones de la base de datos.– Vía página web y redes sociales.

3. Elaboración de cuestionarios físicos para divulgación.– Desde 2013 se dejó de usar cuestionarios físicos. Toda la

información se registra en tablets.

5. Experiencias y desafíos en la gestión y divulgación de datos y metadatos

4. Escaneado de encuestas de rondas 1 a 3 y programa informático para revisión.

5. Solicitudes de acceso a información confidencial (p.e., UBIGEO).

– Se ha sido respetuoso al anonimizar los datos. – Para el caso particular del UBIGEO: generación de mecanismo

de solicitud de datos (elaboración de propuesta de investigación revisada por comités en GRADE y U. de Oxford). Acceso según mérito académico, y no cruce con investigación interna.

5. Reconocimiento del donante en las publicaciones.– No siempre ocurre y es difícil de controlar.

Portal de Niños del Milenio, un estudio longitudinal

En el portal del estudio Niños del Milenio encontrará todas las publicaciones, los

cuestionarios y las indicaciones para acceder a las bases de datos de las tres

rondas de encuestas disponibles; y podrá suscribirse al boletín de novedades:

www.ninosdelmilenio.org

Redes sociales de Niños del Milenio

Síguenos en Facebook y Twitter:

/NinosDelMilenio.org@NinosdelMilenio