sesión 8 procesando la encuesta de demografía y salud...
TRANSCRIPT
La r
ep
rod
ucció
n t
ota
l o
parc
ial d
e e
ste
mate
rial está
pro
hib
ida.
Mate
rial p
rov
isio
nal y s
uje
to a
cam
bio
s
Sesión 8
Procesando la Encuesta de Demografía
y Salud (ENDS) Colombia 2010
Juan D. Baró[email protected]
Métodos Cuantitativos de Economía Regional y Urbana
Universidad Autónoma de Occidente
03 de junio de 2011
Versión : 1.1
Copyright © 2011: La reproducción total o parcial de este material está prohibida
Material provisional y sujeto a cambios
La r
ep
rod
ucció
n t
ota
l o
parc
ial d
e e
ste
mate
rial está
pro
hib
ida.
Mate
rial p
rov
isio
nal y s
uje
to a
cam
bio
s
1. Acceso a la base de datos
La r
ep
rod
ucció
n t
ota
l o
parc
ial d
e e
ste
mate
rial está
pro
hib
ida.
Mate
rial p
rov
isio
nal y s
uje
to a
cam
bio
s
3
• La ENDS se realiza desde 1990 cada 5 años. La última es la de 2010
• Primordialmente mujeres en edad fértil (13 a 49 años). Información de
hogares y viviendas, compañero e hijos menores de 5 años de ellas,
conocimientos sobre citología y mamografía (entre 18 y 69 años),
peso y talla de todos los miembros del hogar hasta los 64 años, y
medida de la cintura para todos aquellos entre 18 y 64
• Características de la población y los hogares, fecundidad, uso de
anticonceptivos, riesgo de embarazo, mortalidad infantil, lactancia y
nutrición (de todos), violencia intrafamiliar, afiliación a seguridad
social, salud sexual y reproductiva, etc
• Solicitud de acceso a los datos http://www.measuredhs.com/
Acceso gratis a los datos de ENDS para muchos países en desarrollo
• Los archivos están disponibles en varios formatos (STATA)
• Varios archivos: importante entender la estructura de la encuesta
(bajar también reportes y diccionarios de variables)
La r
ep
rod
ucció
n t
ota
l o
parc
ial d
e e
ste
mate
rial está
pro
hib
ida.
Mate
rial p
rov
isio
nal y s
uje
to a
cam
bio
s
4
La r
ep
rod
ucció
n t
ota
l o
parc
ial d
e e
ste
mate
rial está
pro
hib
ida.
Mate
rial p
rov
isio
nal y s
uje
to a
cam
bio
s
5
La r
ep
rod
ucció
n t
ota
l o
parc
ial d
e e
ste
mate
rial está
pro
hib
ida.
Mate
rial p
rov
isio
nal y s
uje
to a
cam
bio
s
6
La r
ep
rod
ucció
n t
ota
l o
parc
ial d
e e
ste
mate
rial está
pro
hib
ida.
Mate
rial p
rov
isio
nal y s
uje
to a
cam
bio
s
7
La r
ep
rod
ucció
n t
ota
l o
parc
ial d
e e
ste
mate
rial está
pro
hib
ida.
Mate
rial p
rov
isio
nal y s
uje
to a
cam
bio
s
8
La r
ep
rod
ucció
n t
ota
l o
parc
ial d
e e
ste
mate
rial está
pro
hib
ida.
Mate
rial p
rov
isio
nal y s
uje
to a
cam
bio
s
9
• La información en esta y la siguiente dispositivas la encuentran en la
sección de la página llamada “Working with Datasets”
• Los nombres de los archivos anteriores tienen la siguiente forma:
[CC][DD][VV][FF].ZIP
• [CC]: Código del país (CO para Colombia)
• [DD]: Tipo de base de datos (hogar, persona, entrevistada, etc.)
• [VV]: Versión de la base de datos
• [FF]: Formato del archivo (dt para Stata)
La r
ep
rod
ucció
n t
ota
l o
parc
ial d
e e
ste
mate
rial está
pro
hib
ida.
Mate
rial p
rov
isio
nal y s
uje
to a
cam
bio
s
10
¿Pero por qué hay tantos archivos? Cada archivo tiene un tipo diferente
de base de datos ([DD] en la diapositiva anterior
• BR: Birth Recode---Información de todos los nacimientos para las mujeres
elegibles (info de vacunación y salud para los nacidos en los últimos 5
años). La información de la mamá de cada niño también se incluye. Cada
observación es un niño nacido de las mujeres elegibles
• HR: Household Recode---Incluye información de los hogares, no incluye
información individual de las mujeres (pero si el roster).
Cada observación es un hogar
• IR: Individual Recode---Contienen toda la información de los cuestionarios
de cada mujer elegible y algunas variables del hogar. Incluye hasta 20
nacimientos (vacunación y salud) en la historia de cada mujer. Cada
observación es un mujer
• KR: Children’s Recode---Información de salud, embarazo para los
menores de 5 años. Incluye la información de la madre. Cada observación
es un niño (de mujer elegible) en los últimos 5 años
• PR: Household Member Recode---Incluye edad, sexo, educación, peso
talla, etc. Incluye las características del hogar donde vive la persona.
Cada observación es un miembro del hogar (TODOS)
La r
ep
rod
ucció
n t
ota
l o
parc
ial d
e e
ste
mate
rial está
pro
hib
ida.
Mate
rial p
rov
isio
nal y s
uje
to a
cam
bio
s
11
Archivos
• Además de los archivos de Stata (*.dta) también encontrará archivos
con las siguientes extensiones:
• *.FQR: Este archivo de texto tiene tablas de frecuencias de las
variables en el archivo “.dta” con el mismo nombre
• *.FQW: Este archivo de texto tiene tablas de frecuencias ponderadas
de las variables en el archivo “.dta” con el mismo nombre
• *.MAP: Este archivo de texto tiene descripciones de las variables en el
archivo “.dta” con el mismo nombre
• *.doc: Un solo archivo. Tiene una lista con las variables que aunque
aparecen en las bases de datos no se usaron en la encuesta (están
vacías). También tiene una lista de variables que se añadieron al
cuestionario en Colombia. En este archivo, hacia el final, hay unas
notas que es importante leer
La r
ep
rod
ucció
n t
ota
l o
parc
ial d
e e
ste
mate
rial está
pro
hib
ida.
Mate
rial p
rov
isio
nal y s
uje
to a
cam
bio
s
2. Llevar los datos a Stata
La r
ep
rod
ucció
n t
ota
l o
parc
ial d
e e
ste
mate
rial está
pro
hib
ida.
Mate
rial p
rov
isio
nal y s
uje
to a
cam
bio
s
13
• Dado que los datos están en Stata simplemente el comando use y el
archivo que contiene la información que quiere utilizar
• Todos los archivos tienen identificadores de personas y/o hogares
que les permiten hacer merge en caso de necesitarlo
• En estos cuatro archivos de STATA se encuentra toda la base de datos
• Lea los cuestionarios cuidadosamente. La encuesta cambia un poco
de país a país
La r
ep
rod
ucció
n t
ota
l o
parc
ial d
e e
ste
mate
rial está
pro
hib
ida.
Mate
rial p
rov
isio
nal y s
uje
to a
cam
bio
s
3. Discriminación a las futuras madres:
el caso de la prueba de embarazo
La r
ep
rod
ucció
n t
ota
l o
parc
ial d
e e
ste
mate
rial está
pro
hib
ida.
Mate
rial p
rov
isio
nal y s
uje
to a
cam
bio
s
15
• Ejemplo: uso de la base de datos para hacer cosas interesantes y
diferentes
• La pregunta 818 del cuestionario dice “Alguna vez le exigieron la
prueba de embarazo cuando solicitó trabajo?”
(si/no/nunca solicitó trabajo)
• Usando el comando “lookforit” en Stata (hay que descargarlo), puedo
identificar la variable en Stata (recuerde que las etiquetas de las
variables en los archivos de Stata están en inglés)
• Quiero estimar el siguiente modelo usando información de respuestas
individuales:
5
1
43210 2|1i
iregruraleducedadedadxyP
La r
ep
rod
ucció
n t
ota
l o
parc
ial d
e e
ste
mate
rial está
pro
hib
ida.
Mate
rial p
rov
isio
nal y s
uje
to a
cam
bio
s
16
La r
ep
rod
ucció
n t
ota
l o
parc
ial d
e e
ste
mate
rial está
pro
hib
ida.
Mate
rial p
rov
isio
nal y s
uje
to a
cam
bio
s
17
La r
ep
rod
ucció
n t
ota
l o
parc
ial d
e e
ste
mate
rial está
pro
hib
ida.
Mate
rial p
rov
isio
nal y s
uje
to a
cam
bio
s
18
• Pedir una prueba de embarazo a una mujer en un proceso de
selección de empleo es ilegal
• Existen incentivos perversos en la ley para que las empresas se
comporten de esta manera:
• Las empresas deben pagar la licencia de maternidad si la persona,
o la empresa, no estuvo cotizando a salud por TODO el tiempo de
gestación. En caso contrario, la EPS paga la licencia de
maternidad
• La probabilidad de ser sancionado por la ley es baja, las empresas
exigen ese requisito ilegal porque pueden
• Licencia de maternidad en Colombia: 3 meses de salario
• Las empresas piden la prueba de embarazo para prevenir que sea a
ellos los que les toque pagar la licencia de maternidad
• Si esto es así, deberíamos observar que las mujeres más educadas y
por ende “caras”, deberían tener una mayor probabilidad de que se
les pida una prueba de embarazo
La r
ep
rod
ucció
n t
ota
l o
parc
ial d
e e
ste
mate
rial está
pro
hib
ida.
Mate
rial p
rov
isio
nal y s
uje
to a
cam
bio
s
19
Resultados del modelo (no el mas apropiado, pero buena aproximación):
• pregt (var. dependiente) toma el valor 1 si la persona dice que le han pedido la
prueba de emabarazo, y 0 si no
. regress pregt edad edad2 educ i.regiones i.tipo if edad >= 15
Source | SS df MS Number of obs = 38749
-------------+------------------------------ F( 9, 38739) = 563.92
Model | 836.811394 9 92.9790438 Prob > F = 0.0000
Residual | 6387.32652 38739 .164881038 R-squared = 0.1158
-------------+------------------------------ Adj R-squared = 0.1156
Total | 7224.13791 38748 .186438988 Root MSE = .40606
------------------------------------------------------------------------------
pregt | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
edad | .0413345 .0016292 25.37 0.000 .0381413 .0445278
edad2 | -.0005475 .0000249 -21.96 0.000 -.0005964 -.0004987
educ | .0215109 .0005304 40.56 0.000 .0204714 .0225505
|
regiones |
2 | .0714753 .0068784 10.39 0.000 .0579934 .0849572
3 | .0518806 .0061962 8.37 0.000 .039736 .0640253
4 | .0428838 .0070744 6.06 0.000 .0290177 .0567499
5 | .2438672 .0087763 27.79 0.000 .2266654 .261069
6 | -.0304121 .0069384 -4.38 0.000 -.0440115 -.0168127
|
2.tipo | -.0608521 .0051649 -11.78 0.000 -.0709755 -.0507287
_cons | -.6909939 .0258213 -26.76 0.000 -.7416042 -.6403835
------------------------------------------------------------------------------
La r
ep
rod
ucció
n t
ota
l o
parc
ial d
e e
ste
mate
rial está
pro
hib
ida.
Mate
rial p
rov
isio
nal y s
uje
to a
cam
bio
s
Resumen
• Es este sesión se mostró como acceder y procesar la Encuesta de
Demografía y Salud 2010 para estimar un modelo sencillo de variable
binaria
• También se introdujo el uso del operador “i.” en los modelos, lo que
nos ahorra la creación de la variables dummy (en algunos casos)
• Se introducce el comando “lookforit” que permite hacer una búsqueda
de texto en las etiquetas de las variables
• También se introdujo el uso de ponderadores en los comando de Stata
(o factores de expansión) para aproximarnos a los parámetros
poblacionales
20