modelos de regresión de respuesta cualitativa

25
MODELOS DE REGRESIÓN DE RESPUESTA CUALITATIVA Capítulo 15 Gujarati

Upload: john-alexander-campuzano-vasquez

Post on 08-Nov-2015

27 views

Category:

Documents


2 download

DESCRIPTION

Toma del libro de Gujarati información para clases introductorias de modelos de respuesta cualitativa

TRANSCRIPT

MODELOS DE REGRESIN DE RESPUESTA CUALITATIVA

MODELOS DE REGRESIN DE RESPUESTA CUALITATIVACaptulo 15 GujaratiMODELOS DE REGRESIN DE RESPUESTA CUALITATIVALa regresada, la variable dependiente o la variable de respuesta Y no es cuantitativa.Regresada es una variable binaria, o dictoma, polictoma (o de categora mltiple).En el modelo de regresin donde Y es cualitativa, el objetivo es encontrar la probabilidad de que un acontecimiento suceda, por ejemplo: poseer una casa, votar por un candidato, hacer deporte, etc.Los modelos de respuesta cualitativa se conocen a menudo como modelos de probabilidad.MODELOS DE REGRESIN DE RESPUESTA CUALITATIVA. Preguntas a considerar.MTODOS PARA CREAR UN MODELO DE PROBABILIDADModelo lineal de probabilidad (MLP)Modelo logitModelo probitModelo tobitMODELO LINEAL DE PROBABILIDAD (MLP)Es de simplicidad relativa y de estimacin mediante mnimos cuadrados ordinarios.Donde X = el ingreso familiar, y Y = 1 si la familia tiene casa propia y 0 si la familia no tiene casa propiaMODELO LINEAL DE PROBABILIDAD (MLP)Restriccin MODELO LINEAL DE PROBABILIDAD (MLP)Caractersticas:8DISTRIBUCIN DE BERNOULLIExperimento de Bernoulli: solo son posibles dos resultados: xito o fracaso.

Podemos definir una variable aleatoria discreta X tal que: xito 1fracaso 0Si la probabilidad de xito es p y la de fracaso 1 - p, podemos construir una funcin de probabilidad:

Un tpico experimento de Bernoulli es el lanzamiento de una moneda con probabilidad p para cara y (1-p) para cruz.

8X10.....MLP (no restringido)X10....MLP (restringido o truncado)X10...ABMLPNo sale de la banda lgica de 0 y 1EJEMPLO DE MLP.Propiedad de vivienda Y (1 = tiene casa propia, 0 = no tiene casa propia) e ingreso familiar X (miles de dlares) de 40 familias Source | SS df MS Number of obs = 40-------------+------------------------------ F( 1, 38) = 156.63 Model | 8.0274948 1 8.0274948 Prob > F = 0.0000 Residual | 1.9475052 38 .051250137 R-squared = 0.8048-------------+------------------------------ Adj R-squared = 0.7996 Total | 9.975 39 .255769231 Root MSE = .22638

------------------------------------------------------------------------------ Y | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+---------------------------------------------------------------- X | .102131 .0081605 12.52 0.000 .085611 .118651 _cons | -.9456861 .1228415 -7.70 0.000 -1.194366 -.6970066------------------------------------------------------------------------------

EJEMPLO DE MLP.Propiedad de vivienda Y (1 = tiene casa propia, 0 = no tiene casa propia) e ingreso familiar X (miles de dlares) de 40 familiasEl intercepto da la probabilidad de que una familia con ingreso 0 tenga una casa propia. Como es negativo se acepta que es 0, probabilidad casi nula.El valor de la pendiente 0,1021 un cambio en X de 10%.Con ingreso determinado se puede tener la probabilidad real de tener casa propia a partir de la ecuacin.

X = 12.000 USDINTRODUCCINA diferencia de la regresin lineal que suele hacer uso de los mtodos de estimacin por Mnimos Cuadrados), en la regresin logstica se emplean los mtodos de Mxima Verosimilitud (MV) para llevar a cabo la estimacin de los parmetros del modelo. En economa, estos modelos de regresin con variable endgena categrica suelen emplearse para explicar la decisin Y que toma un individuo -de entre un nmero limitado de posibles opciones- a partir de un conjunto de variables explicativas X1, X2, ..., Xk. EL MODELO LOGITFuncin de distribucin logsticaNO SE PUEDE APLICAR MCO POR SER NO LINEAL EN PRIMERA INSTANCIA , AUNQUE SE PUEDE LINEALIZARRazn de probabilidadEL MODELO LOGITEn funcin de datosDatos de nivel individualSi una familia es duea de una casaSi una familia no es duea de una casa

Existe software que puede ayudar a su clculo utilizando MVEL MODELO LOGITEn funcin de datos agrupadosglogit n N x

Weighted LS logistic regression for grouped data

Source | SS df MS Number of obs = 10-------------+------------------------------ F( 1, 8) = 210.64 Model | 4.87904376 1 4.87904376 Prob > F = 0.0000 Residual | .185305477 8 .023163185 R-squared = 0.9634-------------+------------------------------ Adj R-squared = 0.9588 Total | 5.06434924 9 .562705471 Root MSE = .15219

------------------------------------------------------------------------------ | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+---------------------------------------------------------------- x | .0792593 .0054611 14.51 0.000 .0666659 .0918527 _cons | -1.607727 .1110547 -14.48 0.000 -1.86382 -1.351634------------------------------------------------------------------------------

Mnimos cuadrados ponderados

Calificacin Y = 1 si la calificacin final fue A, 0 si fue B o C TUCE = calificacin en un examen presentado al comienzo del curso para evaluar los conocimientos previos de macroeconoma.PSI = 1 con el nuevo mtodo de enseanza, 0 en otro casoGPA = promedio de puntos de calificacin inicial.Fuente: L. Spector y M. Mazzerologit Calificacion GPA TUCE PSI

Iteration 0: log likelihood = -20.59173 Iteration 1: log likelihood = -13.259768 Iteration 2: log likelihood = -12.894606 Iteration 3: log likelihood = -12.889639 Iteration 4: log likelihood = -12.889633 Iteration 5: log likelihood = -12.889633

Logistic regression Number of obs = 32 LR chi2(3) = 15.40 Prob > chi2 = 0.0015Log likelihood = -12.889633 Pseudo R2 = 0.3740

------------------------------------------------------------------------------Calificacion | Coef. Std. Err. z P>|z| [95% Conf. Interval]-------------+---------------------------------------------------------------- GPA | 2.826113 1.262941 2.24 0.025 .3507938 5.301432 TUCE | .0951577 .1415542 0.67 0.501 -.1822835 .3725988 PSI | 2.378688 1.064564 2.23 0.025 .29218 4.465195 _cons | -13.02135 4.931325 -2.64 0.008 -22.68657 -3.35613------------------------------------------------------------------------------CLCULO UTILIZANDO EVIEWS

CLCULO UTILIZANDO EVIEWS

LECTURA DE COEFICIENTESAdems, en este tipo de modelos no resulta posible interpretar directamente las estimaciones de los parmetros , ya que son modelos no lineales. Lo que haremos en la prctica es fijarnos en el signo de los estimadores. Si el estimador es positivo, significar que incrementos en la variable asociada causan incrementos en P(Y = 1) (aunque desconocemos la magnitud de los mismos). Por el contrario, si el estimador muestra un signo negativo, ello supondr que incrementos en la variable asociada causarn disminuciones en P(Y = 1).

Mtodos alternativos que permiten que los residuales se distribuyan de otra forma distinta a la normal.GRFICAS DE PROBABILIDAD EN MODELOS DE RESPUESTA CUALITATIVAMODELO PROBITMODELO PROBITProbabilidad que un suceso ocurra dado valores de X

logit calificacion gpa tuce psi

Iteration 0: log likelihood = -20.59173 Iteration 1: log likelihood = -13.259768 Iteration 2: log likelihood = -12.894606 Iteration 3: log likelihood = -12.889639 Iteration 4: log likelihood = -12.889633 Iteration 5: log likelihood = -12.889633

Logistic regression Number of obs = 32 LR chi2(3) = 15.40 Prob > chi2 = 0.0015Log likelihood = -12.889633 Pseudo R2 = 0.3740

------------------------------------------------------------------------------calificacion | Coef. Std. Err. z P>|z| [95% Conf. Interval]-------------+---------------------------------------------------------------- gpa | 2.826113 1.262941 2.24 0.025 .3507938 5.301432 tuce | .0951577 .1415542 0.67 0.501 -.1822835 .3725988 psi | 2.378688 1.064564 2.23 0.025 .29218 4.465195 _cons | -13.02135 4.931325 -2.64 0.008 -22.68657 -3.35613------------------------------------------------------------------------------ probit calificacion gpa tuce psi

Iteration 0: log likelihood = -20.59173 Iteration 1: log likelihood = -12.908126 Iteration 2: log likelihood = -12.818963 Iteration 3: log likelihood = -12.818803 Iteration 4: log likelihood = -12.818803

Probit regression Number of obs = 32 LR chi2(3) = 15.55 Prob > chi2 = 0.0014Log likelihood = -12.818803 Pseudo R2 = 0.3775

------------------------------------------------------------------------------calificacion | Coef. Std. Err. z P>|z| [95% Conf. Interval]-------------+---------------------------------------------------------------- gpa | 1.62581 .6938825 2.34 0.019 .2658255 2.985795 tuce | .0517289 .0838903 0.62 0.537 -.1126929 .2161508 psi | 1.426332 .5950379 2.40 0.017 .2600795 2.592585 _cons | -7.45232 2.542472 -2.93 0.003 -12.43547 -2.469166------------------------------------------------------------------------------coeficientesDISTRIBUCIONES ACUMULATIVAS LOGIT Y PROBIT

Ejercicio resumen de modelosHoja1xNn6408850121060181380281510045207036256539305033354030402520

Hoja2

Hoja3

Hoja1GPATUCEPSICalificacion2.6620002.8922003.2824002.921200421012.8617002.7617002.8721003.0325003.9229012.6320003.3223003.5723003.2625013.5326002.7419002.7525002.8319003.1223103.1625112.0622103.6228112.8914103.5126103.5424112.8327113.3917112.6724103.652111423113.121102.391911

Hoja2

Hoja3