métodos multivariados clase 5 mmv22013

20
MÉTODOS MULTIVARIADOS CLASE 5

Upload: karen-perez-caro

Post on 22-Oct-2015

5 views

Category:

Documents


0 download

TRANSCRIPT

MÉTODOS MULTIVARIADOS

CLASE 5

CONTENIDO DE LA PRESENTACIÓN

• Naturaleza de variables dicotómicas

• Modelos ANOVA

• Modelos ANCOVA

• Modelos LOGIT

CONTENIDO DE LA PRESENTACIÓN

• Naturaleza de variables dicotómicas

• Modelos ANOVA

• Modelos ANCOVA

• Modelos LOGIT

NATURALEZA DE VARIABLES DICOTÓMICAS

En el análisis de regresión, la variable dependiente o regresada, está influida por variables que son esencialmente cualitativas por naturaleza (por ejemplo: sexo, raza, olor, religión, nacionalidad).

Puesto que tales variables usualmente indican la presencia o ausencia de una “cualidad” o atributo, mediante la elaboración de variables artificiales que tomarán los valores 0 y 1.

• 1 indicará la presencia • 0 la ausencia.

CONTENIDO DE LA PRESENTACIÓN

• Naturaleza de variables dicotómicas

• Modelos ANOVA

• Modelos ANCOVA

• Modelos LOGIT

MODELOS ANOVA (1/3)

Para ilustrar los modelos ANOVA, considérese el siguiente ejemplo.

Al analizar salarios de los maestros de escuelas públicas por región geográfica, según la tabla donde se proporciona los datos sobre salarios de los maestros de escuelas públicas de los estados 50 de EEUU, clasificadas en tres zonas geográficas: Norte, sur y este.

Suponga que se desea analizar si el salario de los maestros difieren entre cada región. Una de las técnicas para conocer si son estadísticamente distintos entre sí, se conoce como análisis de varianza. Pero se puede lograr el mismo objetivo dentro del ámbito del análisis de regresión.

Microsoft Excel Worksheet

MODELOS ANOVA (2/3)

Considere el siguiente modelo:

Donde

MODELOS ANOVA (3/3)

Por lo tanto, el salario medio de los profesores del Este es de casi 26.158, el de los del Norte es menor por casi 1.734, y respecto del Sur es de menor por casi 3.265.

Como el coeficiente de pendiente estimado del norte no estadísticamente significativo y el del sur sí, se concluye que entre el este y el norte los salarios son casi iguales, pero el salario medio de los maestros del Sur estadísticamente más bajo por casi 3.265.

CONTENIDO DE LA PRESENTACIÓN

• Naturaleza de variables dicotómicas

• Modelos ANOVA

• Modelos ANCOVA

• Modelos LOGIT

MODELOS ANCOVA (1/3)

Los modelos de regresión que muestran una mezcla de variables cuantitativas y cualitativas se llaman modelos de análisis de covarianza (ANCOVA).

MODELOS ANCOVA (2/3)

Considerando el ejemplo anterior, utilice la variable gastos en escuelas públicas otorgado por las autoridades locales. Con el cual se desarrolla el siguiente modelo:

Donde

MODELOS ANCOVA (3/3)

Conforme el gasto público aumenta, el salario de los maestros se incrementa aproximadamente 3,29.

CONTENIDO DE LA PRESENTACIÓN

• Naturaleza de variables dicotómicas

• Modelos ANOVA

• Modelos ANCOVA

• Modelos LOGIT

MODELOS LOGIT(1/7)

Este modelo se denomina modelo logit ya que la variable regresada es dicotómica o binaria. Por ejemplo: Un modelo que trata de explicar los factores determinantes de que una familia sea propietaria de una casa.

MODELOS LOGIT(2/7)

Para establecer las ideas, considérese el siguiente modelo simple:

Donde

MODELOS LOGIT(3/7)

Se puede encontrar el valor de los coeficientes por el método de los mínimos cuadrados ordinarios pero existen ciertas problemáticas como por ejemplo:

Las predicciones del modelo no necesariamente estarán entre cero y uno.

Considere el término de error. Para un valor dado de Xi el término de error sólo puede tomar uno de los siguientes dos valores:

ei = 1 – – cuando = 1

ei = – – cuando = 0

MODELOS LOGIT(4/7)

En consecuencia los errores no se distribuyen como una normal (de hecho lo hacen como una binomial)

Por ejemplo la constancia del efecto marginal de un cambio en el ingreso sobre la probabilidad de ser propietario. Esperaríamos un efecto bajo para ingresos muy bajos y muy altos. Y un efecto mayor para ingresos promedio.

MODELOS LOGIT(5/7)

Esto implicaría una relación de este tipo entre probabilidad de ser propietario e ingreso, de esta manera:

0

0.2

0.4

0.6

0.8

1

X

p

MODELOS LOGIT(6/7)

Una relación que genera un gráfico como el anterior es:

Donde se define la razón de probabilidades (odds ratio) como:

En el caso de la propiedad de casas representa la razón de la probabilidad de que una familia posea una casa respecto de la probabilidad de que no la posea.

Por ejemplo, si Pi = 0.8 significa que las probabilidades son 4 a 1 a favor de que la familia posea una casa (0.8/0.2)

MODELOS LOGIT(7/7)

Si tomamos el logaritmo natural de la razón de probabilidades obtenemos

Entonces, el Li resulta lineal en X y también en los parámetros. L es llamado modelo Logit.

La interpretación del modelo es la siguiente: B1 es la pendiente y mide el cambio en L ocasionado por un cambio unitario en X, es decir, dice cómo el logaritmo de las probabilidades a favor de tener una casa cambian a mediada que el ingreso cambia en una unidad. B0 es el valor de L si el ingreso es cero.