econometria i (profesora: sonia sotoca lÓpez)

1

Material de

ECONOMETRIA I

CURSO 2009/2010

PROFESORA: SONIA SOTOCA LPEZ

e-mail: sotoca@ccee.ucm.es

Tfno. 91 394 23 03/ 23 04

Despacho: Pabelln Central (Decanato, Primera Planta, Despacho 3)

Horario de tutoras: Martes y Jueves de 12.30 a 14 horas

Material disponible en: www.ucm.es/info/ecocuan/ectr1

2

INTRODUCCION

- Econometra: este vocablo procede del griego y significa medida de la economa

- Esta definicin no caracteriza completamente el contenido de la materia, pero pone de manifiesto su carcter necesariamente

cuantitativo.

- A lo largo del tiempo, la Econometra ha ido ampliando su contenido debido fundamentalmente a 4 aspectos:

o El desarrollo de la Teora Econmica o Los avances en la Teora Estadstica o El desarrollo de la Informtica y la creciente disponibilidad y

fcil acceso a grandes bases de datos (tanto a nivel macro

como micro).

- Por tanto, el continuo avance de esta disciplina hace que no haya una definicin generalmente aceptada.

- Intriligator (1978) define Econometra como aquella rama de la Economa que se ocupa de medir desde el punto de vista emprico

cualquier relacin entre variables econmicas.

- De acuerdo con esta definicin, los dos ingredientes bsicos de la Econometra son: 1) La Teora Econmica y 2) Los datos.

- La caracterstica fundamental de esta disciplina es que debe saber conjugar perfectamente ambos ingredientes. En otras palabras, un

econmetra no puede defender la medicin sin teora, pero

tampoco la teora sin datos.

- Saber conjugar perfectamente teora, datos y tcnicas estadsticas es lo ms difcil, pero tambin lo ms atractivo de la Econometra.

Alguien dijo que la Econometra sera ms fcil sin datos. - En definitiva, la Econometra debe complementar a la Teora

Econmica, para validar determinadas relaciones que postula

usando datos. En este sentido, el econmetra no puede prescindir

de la Teora, ni el terico de lo que dicen los datos.

Relaciones entre la Teora Econmica y la Econometra

(1) La Econometra necesita primero de la Teora Econmica para que le proporcione un marco conceptual concreto. Por ejemplo, la

teora de Keynes proporciona un marco en el que se relacionan

dos variables econmicas: Consumo ( C ) y Renta (Y ), en donde,

adems se postula que el C es una funcin de la Y : ( )C f Y y no

a la inversa. En ocasiones, el econmetra puede partir no de una

teora, sino del sentido comn o de la intuicin de que exista una

relacin entre un conjunto de variables. Por ejemplo, puede

3

preguntarse si un tipo de inters a corto plazo depende de su

propia historia pasada o no.

(2) La teora econmica tambin necesita de la econometra para poder validar, contrastar, determinadas hiptesis postuladas por el

terico. En el ejemplo de la funcin de consumo Keynesiana, se

postula una funcin lineal entre C e Y : C a bY , donde a es el

consumo autnomo y b la propensin marginal a consumir.

Adems, se supone que 0 1b . Usando datos, el econmetra

puede contrastar si esta restriccin se cumple o no.

(3) La teora econmica necesita de la econometra para poder seguir desarrollndose. Es decir, la evidencia emprica obtenida con los

datos puede ayudar a reformular teoras ya existentes o incluso,

sugerir nuevas. En el ejemplo anterior, se puede contrastar si la

relacin entre C e Y es lineal o no. Adems, se puede contrastar

si la relacin entre C e Y es esttica. Es decir, el C en un instante

puede depender de la Y en ese momento, pero tambin del C e Y

pasados.

Pasos en un Estudio Economtrico:

(1) Para que la teora econmica pueda utilizarse en un estudio economtrico necesita de una elaboracin matemtica que de lugar

a un modelo y en concreto, a un modelo economtrico. Un modelo

economtrico no es un modelo geomtrico ni un modelo

matemtico. En un modelo geomtrico se representan mediante

grficos o diagramas relaciones entre variables econmicas

(IS/LM, Oferta/Demanda). En un modelo matemtico se

representan mediante ecuaciones matemticas relaciones entre

variables. Por ejemplo, ( )C f Y

Las principales diferencias entre un modelo matemtico y uno

economtrico son:

a) La forma funcional ha de estar perfectamente definida. Por

ejemplo, C a bY , es una funcin lineal caracterizada por a y b ,

que son los parmetros de la misma. La idea es medir o estimar

numricamente a y b , dada una muestra de C e Y .

b) El carcter estocstico. Un modelo economtrico es estocstico

porque aparecen en el mismo variables aleatorias. La excepcin son

relaciones puramente deterministas como las identidades contables.

En nuestro ejemplo, C a bY , donde es la perturbacin

aleatoria, ya que no nos creemos que haya una relacin exacta entre

4

C e Y . La interpretacin de es la influencia combinada sobre el

C de variables distintas a la Y . En concreto, en la funcin de

consumo, puede recoger factores como las expectativas de los

agentes, factores estacionales, tipos de inters. En esta funcin

asumimos que el factor determinante del C es la Y , pero esto es

slo una aproximacin. En general, recoger todos los fallos del modelo. Las hiptesis que hagamos sobre estas variables aleatorias son fundamentales para decidir qu tcnica economtrica usar.

c) El tamao. El modelo debe ser pequeo, escueto. Esto quiere

decir que tiene que tener pocos parmetros que le caracterizen.

Muchas veces, el tamao est condicionado por la informacin

estadstica disponible. En nuestro ejemplo, hay dos parmetros que

caracterizan la funcin de consumo Keynesiana ( a yb ).

(2) Una vez que se ha especificado el modelo economtrico, se trata de buscar los datos apropiados. Es decir, se necesitan datos de cada

una de las variables que entran en el modelo. En nuestro ejemplo,

podramos usar distintos tipos de datos.

Datos de series temporales: miden una variable en perodos de

tiempo sucesivos. La frecuencia puede ser el ao, el mes, el

trimestre, la semana, el da e incluso podemos trabajar con datos

intrahorarios (Bolsa). Disponer de datos temporales hace que

podamos poner un subndice t (tiempo) a las variables:

t t tC a bY

Fuentes fundamentales de datos temporales son la Contabilidad

Nacional, la EPA (Encuesta de Poblacin Activa), el INE (Instituto

Nacional de Estadstica), Eurostat, Datos de Bolsa o el Banco de

Espaa. Normalmente, son gratuitos.

Datos de seccin cruzada: miden una variable en un momento

determinado del tiempo para distintas entidades. Estas entidades

pueden ser individuos, familias, pases, empresas, Comunidades

Autnomas, sectores empresariales, etc. Por ejemplo, podemos

tener una funcin de consumo familiar: i i iC a bY , donde el

subndice i hace referencia a la familia.

Estos datos fundamentalmente se obtienen a partir de entrevistas o

encuestas hechas a las entidades correspondientes. Las dos fuentes

5

ms importantes de este tipo de datos son: la EPF (Encuesta de

Presupuestos Familiares) y la CB (Central de Balances).

Datos de panel: surgen al cruzar una seccin cruzada con una serie

temporal. En nuestro ejemplo, tendramos el dato de consumo de

una familia a lo largo de una serie de aos. Un panel supone

disponer de mucha ms informacin que en una seccin cruzada, ya

que tenemos distintas observaciones de una misma variable

(consumo) para una misma unidad (familia). Esto es difcil

conseguir en una ciencia no experimental como es la Economa.

En un panel se pueden analizar o contrastar hiptesis que no es

posible con una seccin cruzada. Por ejemplo, contrastar si ha

habido diferencias en el comportamiento del consumo de las

familias despus de un cambio de poltica econmica (impuestos)

en un momento determinado del tiempo.

Tanto las secciones cruzadas como los paneles no suele ser

informacin gratuita.

(3) Una vez que se ha especificado el modelo y que se dispone de los datos adecuados de todas las variables, se pasa a la etapa de

estimacin del mismo. Consiste en medir empricamente los

parmetros que caracterizan el modelo y aqu entra la estadstica,

sobre todo la inferencia estadstica (que usa la informacin

muestral disponible para inferir caractersticas de toda una

poblacin).

(4) Una vez que el modelo ha sido estimado usando las tcnicas economtricas adecuadas, llegamos al paso de la verificacin o

validacin del modelo. Se establecen criterios (grficos y

estadsticos) para rechazar o aceptar el modelo. Aqu comienza un

proceso iterativo en la modelizacin, ya que si no aceptamos un

modelo, no lo usamos, sino que reformulamos el modelo terico, o

bien, tratamos de una forma ms adecuada los datos. A veces, es

fcil teorizar sobre relaciones entre variables que estn definidas de

forma precisa, pero otra cosa es obtener datos seguros de estas

variables. Por ejemplo, es difcil siempre obtener datos razonables

de los beneficios de una empresa, de un tipo de inters o del stock

de capital de una economa. En algunos casos, no existe

contrapartida observable para una variable terica.

6

Usos de un modelo economtrico estimado: Pueden ser varios:

(1) Anlisis estructural. Se usa el modelo estimado para medir la relacin entre variables econmicas. Algunos ejemplos, son la

medicin de la propensin marginal a consumir de un pas, de la

elasticidad demanda-precio de un bien, de la elasticidad de la

produccin-input de una empresa, de la curva de Phillips (inflacin

y paro), de la relacin entre ventas y publicidad de un producto en

una empresa, de la relacin entre el rendimiento y riesgo de un

activo financiero, de la relacin entre el salario y el nivel de

educacin de un individuo, etc.

(2) Prediccin. Es el uso ms frecuente de un modelo economtrico. Se usa para predecir el valor futuro de una variable de inters. Las

predicciones se usan para tomar decisiones. Por ejemplo, todo el

mundo predice Inflacin, PIB o Consumo. Fuera de la economa,

todos los das se hacen previsiones meteorolgicas.

(3) Evaluacin de polticas econmicas. Se usa para simular el valor futuro de una variable bajo distintos supuestos de evolucin de otras.

En nuestro ejemplo, sera predecir el patrn de evolucin de

consumo bajo distintos escenarios de evolucin de la renta. Si una

autoridad controla algunas variables, como la cantidad de dinero,

puede evaluar el efecto sobre la tasa de inflacin ante distintos

escenarios de crecimiento monetario.

Clasificacin de variables en un modelo economtrico

La principal clasificacin es la de:

Variable Endgena: es aquella explicada por otras variables. Es denotada

por y .

Variables Exgenas: explican a la endgena pero no pueden estar influidas

por ella. Puede haber k variables explicativas y son denotadas por

1 2, ,..., kx x x .

Hay que tener en cuenta que esta distincin vara dependiendo del modelo

economtrico en particular y su objetivo. As, una exgena en un modelo

puede pasar a ser la endgena de otro. Ej. ( )C f Y y ( )Y f M ,

donde M es cantidad de dinero.

Variables continuas: pueden tomar valores en todos los puntos de la recta

real ( C e Y ).

Variables discretas: slo toman valores en algunos puntos de la recta real.

7

Un ejemplo son las variables ficticias o dummies que toman valor uno o

cero. La idea es que hay caractersticas que no se pueden medir (en euros,

en kilos, etc), pero que pueden ser factores relevantes a la hora de explicar

a otra variable. Por ejemplo, en la funcin de consumo familiar, adems de

la renta, el hecho de que la familia viva en el campo o en la ciudad puede

ser relevante para explicar diferencias en el consumo. Para ello, se

construye una variable ficticia que toma uno para las familias que viven en

la ciudad y cero para las que viven en el campo ( iD ) y se introduce como

una exgena ms en el modelo.

8

TEMA 1. EL MODELO DE REGRESIN LINEAL SIMPLE Y

GENERAL

El objetivo es especificar, estimar y contrastar relaciones entre variables

econmicas usando datos.

Para ello, es necesario hacer una serie de hiptesis simplificatorias

(1) Hiptesis de linealidad en los parmetros. Establece la linealidad en los parmetros en la relacin entre la variable endgena y las

exgenas. Es decir, en la funcin de consumo tendremos.

1 2t t tC Y

donde 1 y 2 son los parmetros de esta relacin. No hay que confundir

esta hiptesis de linealidad con la linealidad entre las variables. Por

ejemplo, en las relaciones entre y y x que se dan a continuacin, slo la

primera es formalmente lineal. Sin embargo, cumplen la hiptesis de

linealidad en los parmetros las tres:

1 2y x

1 2

xy e

1 2 lny x

En determinadas relaciones econmicas no se cumple la hiptesis de

linealidad en los coeficientes. Un ejemplo sencillo es la funcin de

produccin de tipo Cobb-Douglas, donde Y representa el output de la

empresa, L es trabajo y K es el stock de capital:

Y AK L

Los parmetros desconocidos de esta funcin son A (parmetro de

eficiencia), (elasticidad del output con respecto al capital) y

(elasticidad del output con respecto al trabajo). Una simple transformacin

logartmica en los datos, hace que esta relacin cumpla la linealidad en los

parmetros. Es decir:

ln ln ln lnY A K L

9

Ejemplos de relaciones entre variables econmicas no lineales en los

parmetros hay muchos, por ejemplo, en una funcin de Consumo no lineal

como:

cC a bY

donde a, b y c son los parmetros que caracterizan esta relacin. En este

caso, habra que estimar estos tres parmetros dada una muestra de C y Y.

Contrastar una relacin lineal entre C y Y, equivale a contrastar si el

parmetro c es unitario o no.

(2) Hiptesis de especificacin correcta. Esta hiptesis supone que las k variables explicativas del modelo son aquellas variables

relevantes que explican el comportamiento de la endgena. Y que

estn todas. No existe ninguna variable ix que no explique nada de

la y . Es decir, el modelo est bien planteado o especificado.

Esta hiptesis supone aceptar en la prctica dos cosas no siempre

ciertas:

(a) Aceptar que siempre hay una teora detrs que me permite saber cales son las variables relevantes en cada modelo.

(b) Aceptar que sobre estas variables dispongo siempre de informacin muestral adecuada.

El incumplimiento de esta hiptesis se da en muchos casos. Ejemplo: Si

uno quiere estimar con datos de seccin cruzada una funcin de consumo

keynesiana, adems de la renta familiar, existen otras muchas variables que

explican el comportamiento del consumo de una familia. Por ejemplo, el

nmero de hijos, la edad del cabeza de familia, si la mujer trabaja o no, si

se vive en el campo o en la ciudad, etc. Sin embargo, nunca ser posible

incluir todas y cada una de las variables que determinan el consumo de una

familia.

(3) Hiptesis de grados de libertad positivos. Los grados de libertad de un modelo se definen como la diferencia entre el nmero de datos

( n ) y el nmero de variables explicativas ( k ). Es decir, 0gl n k .

Esta hiptesis supone que, como mnimo, es necesario disponer de

tantos datos como parmetros a estimar. No obstante, es preferible

siempre disponer de ms datos que parmetros a estimar. En el ejemplo

de la funcin de consumo keynesiana hay que estimar dos parmetros (a

y b). Con un nico dato, no sera posible estimar de forma nica ambos

10

parmetros. Con dos datos, sera posible obtener una nica estimacin

de a y b, pero para que la estimacin sea estable, es mejor tener una

nube de datos y pocos parmetros a estimar.

(4) Hiptesis de parmetros constantes. Esta hiptesis supone que los parmetros

1 2, ,..., k son constantes en el tiempo.

Si trabajamos con n datos en la funcin de consumo keynesiana,

suponer que la propensin marginal a consumir es constante en el

tiempo, implica que se obtiene una estimacin que ha de interpretarse

como la propensin marginal a consumir media en ese perodo de

tamao n. Si el perodo muestral con el que se trabaja es muy amplio y

heterogneo (por ejemplo, incluye perodos de crisis y de auge), es ms

difcil mantener esta hiptesis que si la muestra es homognea.

(5) Hiptesis de independencia lineal entre las variables explicativas. Esta hiptesis implica que cada variable explicativa

contiene informacin adicional sobre la endgena que no est

contenida en otras. Si hubiera informacin repetida, habra variables

explicativas dependientes linealmente de otras. Formalmente, se

puede resumir la informacin muestral sobre las k variables

explicativas (regresores) en una matriz, denotada por X , de tamao

n k con la siguiente estructura:

11 1

1

k

n nk

x x

x x

donde cada columna recoge los datos asociados a cada variable x . El

hecho de que cada columna sea linealmente independiente de las otras

implica que el rango de la matriz X es completo, es decir, igual a k . Si

alguna variable x es linealmente dependiente de otra, decimos que

existe un problema de multicolinealidad exacta.

(6) Hiptesis de regresores no estocsticos. Esta hiptesis implica que los datos de las variables explicativas son fijos en muestras

repetidas. Es decir, el valor de las variables explicativas es constante

en la funcin de distribucin de la endgena.

Existen tres situaciones en Econometra donde no es posible

mantener esta hiptesis:

11

(6.1) Modelos de ecuaciones simultneas. Por ejemplo, un modelo de

demanda y de oferta de un bien que se intercambia en un mercado

competitivo en equilibrio, se puede escribir:

1

d

t t tq a bp

2

o

t t tp c dq

, 1,2, ,d ot tq q t n

donde se observa una relacin bidireccional entre el precio (tp ) y la

cantidad intercambiada ( dtq o

o

tq ), de forma que el precio es una

exgena en la ecuacin de demanda y pasa a ser la endgena en la

ecuacin de oferta y por tanto, esto hace que sea un regresor estocstico.

(6.2) Modelos dinmicos en los que aparecen como regresores sucesivos

retardos de la variable endgena. Por ejemplo, si en la relacin entre

consumo y renta se supone un modelo dinmico como:

1 2 1 3t t t tC C Y

donde el propio modelo indica que el consumo retardado es un regresor

estocstico al depender un error aleatorio, 1t . Es decir:

1 1 2 2 3 1 1t t t tC C Y

(6.3) Modelos con errores de medida en las variables explicativas. Bajo

la hiptesis de renta permanente de Friedman, el consumo slo depende

del componente permanente de la renta ( PtY ):

P

t t tC bY P T

t t tY Y Y

donde el componente transitorio ( TtY ) o las desviaciones aleatorias

alrededor de la renta media de un agente no es observable. Por tanto, la

renta permanente ( PtY ) es un regresor estocstico, ya que P T

t t tY Y Y .

De hecho, estos 3 incumplimientos dan lugar a 3 temas de econometra .

(7) Hiptesis referentes a las perturbaciones aleatorias del modelo. El trmino de error t satisface las siguientes hiptesis:

12

(7.1) Esperanza nula en todo instante de tiempo: ( ) 0, 1,2,tE t n . Ya

que t es tratado como la suma de muchos efectos individuales sobre la

endgena, donde el signo de cada uno es desconocido, no existe ninguna

razn para esperar cualquier valor distinto de cero. Supongamos que

( )tE , entonces el modelo 1 2 t tx es el mismo que

1 2( ) ( )t tx , donde el nuevo trmino de error:*

t t , es tal

que la *( ) 0tE .

Una situacin en la que se incumple esta hiptesis, es cuando a su vez,

se incumple otra, como es omitir en el modelo una variable relevante. Si

la verdadera funcin de consumo es

t t t tC a bY ci

donde ti es un tipo de inters y se trabaja con un modelo que omite esta

variable:

t t tC a bY

donde t es el trmino de error de esta ecuacin y adems, se sabe que

t t tci . Es fcil comprobar que ( ) 0t tE ci , aunque t tenga

esperanza nula. Se usan las hiptesis de parmetros constantes y

regresores no estocsticos.

(7.2) Varianza constante (Homocedasticidad). Supone que al cumplirse

(7.1), la 2 2var( ) ( ) , 1,2, ,t tE t n . Si la variabilidad (o dispersin

alrededor de la media) de las perturbaciones cambia con el tiempo

hablamos de heterocedasticidad.

Es muy frecuente la heterocedasticidad en modelos donde se usan datos

de seccin cruzada. Si tenemos la funcin de consumo familiar utilizada

hasta ahora, es fcil comprender que aquellas familias con mayor nivel

de renta tengan mayor variabilidad en su consumo (adems de satisfacer

necesidades bsicas, pueden consumir otras cosas). Puesto que el error

del modelo est relacionado con el consumo, lo que ocurrir es que a

mayor renta, mayor varianza en el consumo y por tanto, mayor varianza

en el error.

(7.3) Ausencia de autocorrelacin en todo instante de tiempo. Implica

que la cov( ) ( ) 0, , 1,2, ,t s t sE t s n t s . Si hay autocorrelacin, el

error en un momento del tiempo ayudara a predecir el error en un

13

momento posterior y los errores tendran inercia. Si no hay

autocorrelacin, la historia pasada no ayuda a predecir el

comportamiento futuro y los errores son completamente aleatorios e

imprevisibles.

Es muy frecuente el incumplimiento de esta hiptesis en modelos

donde se usan datos de series temporales.

Estas restricciones se imponen para exigir un buen comportamiento a las variables t , aunque tambin hay razones

tcnicas que nos obligan a hacer estas hiptesis. Puesto que tenemos n

variables aleatorias 1, 2( , )n , su caracterizacin exige hablar, al

menos, de sus dos primeros momentos (media y varianza):

Media: Sera un vector de n medias, ( )E .

E1

.

n

=1

.

n

Matriz de varianzas y covarianzas: Sera una matriz que recoge las

varianzas de cada variable en la diagonal principal y las covarianzas

entre una perturbacin y otra diferente fuera de la diagonal. Es

simtrica, definida positiva y de tamao n n .

2

1 1 2 1 1 1 2 1

22 1 2 2 2 1 2 2

21 2 1 2

var( ) cov( ) . cov( ) ( ) ( ) . ( )

cov( ) var( ) . cov( ) ( ) ( ) . ( )var( )

. . . . . . . .

cov( ) cov( ) . var( ) ( ) ( ) . ( )

n n

n n

n n n n n n

E E E

E E E

E E E

Los elementos diferentes de dicha matriz son ( 1)

2

n n . No obstante, si la

muestra disponible es de tamao n , ya no tenemos grados de libertad

para caracterizar el trmino de error, ya que habra que estimar n

medias y ( 1)

2

n n varianzas y covarianzas distintas. Las hiptesis (7)

hacen que el vector de medias sea nulo y la matriz de var-cov una

matriz diagonal, en donde slo habra que estimar la varianza constante 2 , ya que por ausencia de autocorrelacin todas las covarianzas son

cero.

14

NOTACIN MATRICIAL DEL MODELO LINEAL GENERAL

La informacin asociada a la variable endgena se almacena en un

vector columna Y de tamao 1n :

Y = 1

.

n

y

y

La informacin asociada a las variables explicativas se recoge en una

matriz llamada X de tamao n k :

X = 11 1

1

.

. . .

.

k

n nk

x x

x x

Las perturbaciones en un vector de tamao 1n y los parmetros en

un vector de tamao 1k :

= 1

.

n

; = 1

.

k

El modelo lineal general (MLG) escrito en forma matricial o compacta

es:

1

.

n

y

y

=11 1

1

.

. . .

.

k

n nk

x x

x x

1

.

k

+1

.

n

o bien, Y =X + . Este es un sistema de n ecuaciones que se

corresponde con la forma compacta de escribir el MLG.

Las hiptesis sobre las pertubaciones en notacin matricial son:

E( ) = 0 ; var ( ) = E( T ) = 2 I, donde I es la matriz identidad

15

METODOS DE ESTIMACIN DEL MODELO LINEAL SIMPLE

Y GENERAL

Estimacin del modelo lineal simple:

Supongamos que queremos estimar los parmetros de la funcin de

consumo keynesiana (modelo de regresin lineal simple):

t t tC a bY

donde a es el consumo autnomo y b la propensin marginal a

consumir. Para ello, se dispone de una muestra de n datos de consumo y

renta que se puede representar en el plano tC e tY . Cada punto

representa el par de valores de Consumo y Renta observados en ese

perodo (ao) concreto. Esto se denomina NUBE DE PUNTOS real,

donde habr tantos puntos como datos utilizados.

Grfico: Nube de puntos real y recta de ajuste

500

1000

1500

2000

2500

500 1000 1500 2000 2500 3000

RENTA

CO

NS

UM

O

Si suponemos un modelo lineal entre ambas variables, dada la nube de

puntos, una estimacin del modelo viene dada por una recta llamada

RECTA DE AJUSTE definida por:

ta bY

donde a representa una estimacin del consumo autnomo y b una

estimacin de la propensin marginal a consumir. Para cada valor de tY ,

la recta de ajuste genera un valor de consumo que denotamos por tC ,

que no tiene por qu coincidir con el consumo real tC . Si dado un valor

de la tY , el modelo predice un valor de consumo tal que

t tC C , en ese

instante de tiempo el modelo ajusta perfectamente. Si dado un valor de

16

la tY , el modelo genera un valor del consumo tal que

t tC C , el modelo

infraestima el verdadero valor del consumo en ese ao y comete un

error. Este error es medible y se denomina RESIDUO, es decir

t t tC C . El residuo puede ser nulo, positivo o negativo, si el modelo

acierta, infraestima o sobrestima el verdadero valor de consumo. En

general, en todos los puntos de la nube real por encima de la recta de

ajuste, el verdadero valor de consumo est por encima de lo que predice

la recta; en los puntos sobre la recta de ajuste el modelo no se equivoca

y en los puntos de la nube real por debajo de la recta, el verdadero valor

de consumo est por debajo de lo que ajusta el modelo (la recta).

El objetivo ahora es conseguir una estimacin de a y b de manera que se

cumpla algn criterio de optimalidad. Por ejemplo, un criterio sera

minimizar la suma de los residuos cometidos en toda la muestra:

1 1

min minn n

t t t

t t

C a bY

Este no es un buen criterio, ya que los errores individuales que comete

el modelo pueden ser muy grandes, pero al tener signo los errores

grandes y positivos se pueden compensar con los grandes y negativos.

La solucin obvia es eliminar en este criterio el signo de los residuos,

tomando por ejemplo el valor absoluto:

1

minn

t

t

En este caso, el problema es la dificultad analtica de obtener una

solucin para a y b . No obstante, otra forma de eliminar el signo de

una variable es elevarla al cuadrado. El criterio de optimalidad sera

obterner una expresin de a y b que minimize la suma de los cuadrados

de los residuos:

2 2

1 1

min min ( )n n

t t t

t t

C a bY

que tiene las ventajas de (1) eliminar la compensacin de errores por el

signo, (2) penalizar ms los errores grandes que los pequeos y (3)

llevar a una solucin analtica sencilla. Este criterio de estimacin es el

ms conocido en Econometra y se denomina MCO (Mnimos

Cuadrados Ordinarios).

17

Ejemplo: Obtener la expresin MCO para a y b en la funcin de

Consumo Keynesiana:

2 2

1 1

min min ( )n n

t t t

t t

C a bY

Solucin: Condiciones de primer orden:

2

1

1

2 ( ) 0

n

t nt

t t

t

C a bYa

2

1

1

2 ( ) 0

n

t nt

t t t

t

C a bY Yb

Este es un sistema de dos ecuaciones con dos incgnitas. De la primera

condicin, se obtiene que:

1 1

0n n

t t

t t

C na b Y a C bY

donde C e Y representan las medias muestrales de Consumo y Renta,

respectivamente. Usando la segunda condicin de primer orden y la

solucin para a , se obtiene:

2 2

1 1 1 1 1 1

0 ( ) 0n n n n n n

t t t t t t t t

t t t t t t

C Y a Y b Y C Y C bY Y b Y

y operando:

2

1 1 1 1

( )n n n n

t t t t t

t t t t

b Y Y Y C Y C Y

1 1

2 2 2

1 1

( )( )

( )

n n

t t t t

t t

n n

t t

t t

C Y nCY C C Y Y

b

Y nY Y Y

Las dos frmulas en los recuadros son los estimadores MCO para los

parmetros a y b. Para una muestra concreta de Consumo y Renta, el

18

estimador proporciona una estimacin concreta del consumo autnomo

y de la propensin marginal a consumir.

Ejercicio para el estudiante: Comprobar que la solucin obtenida es un

mnimo. Es decir, mostrar que el hessiano es definido positivo:

2 2 2 2

2

2 2 2 2

2

( )

( )

t t

t t

a a bH

b a b

Estimacin del modelo lineal general (MLG):

Dada la formulacin matricial del MLG, Y =X + , el objetivo es,

de nuevo, obtener la expresin analtica del estimador MCO de . Para

ello, se define el vector de residuos de tamao 1n que una vez

conseguida una estimacin del vector , se calcular como:

Y X

La funcin objetivo sigue siendo minimizar la suma de cuadrados de los

residuos con respecto a los k parmetros del modelo que puede

escribirse como:

2

1

min min min( ) ( )n

T T

t

t

Y X Y X

Operando:

min( )( ) min( 2 )T T T T T T T T TY X Y X Y Y X Y X X

Condiciones de primer orden:

2 2 0

TT TX Y X X

donde se han tenido en cuenta los siguientes resultados sobre derivadas

matriciales:

Tz w

wz

; 2

Tz AzAz

z

19

siendo z y w dos vectores de tamao compatible y A una matriz

cuadrada. La solucin analtica a las condiciones de primer orden es:

T TX X X Y

Este es un sistema de k ecuaciones con k incgnitas (1 2

, ,..., k ),

llamado sistema de ecuaciones normales. El estimador que satisface

este sistema se llama estimador por MCO. La forma ms sencilla de

resolver este sistema es premultiplicar el mismo por la inversa de la

matriz TX X de tamao ( k k ), teniendo que:

1 ( )T TX X X Y

Ejercicio para el estudiante: Comprobar que la solucin obtenida es un

mnimo.

Propiedades estadsticas del estimador MCO de :

Linealidad: El estimador MCO de es lineal. La linealidad consiste en

poder escribir el estimador como una combinacin lineal fija de los

valores de la variable endgena.

Prueba: Denotando por 1( )T TW X X X , el estimador MCO de se

puede escribir como WY , donde por la hiptesis de regresores fijos

sabemos que cada estimador se puede escribir como una combinacin

lineal fija de los valores de la variable endgena Y .

Insesgadez: El estimador MCO de es insesgado. Es decir, la media

de la distribucin muestral de coincide con el verdadero . Si la ( )E , las estimaciones que conseguimos con el estimador no son

iguales al verdadero vector de parmetros ni siquiera en media. A la

diferencia ( )E se le denomina sesgo. La insesgadez es una

propiedad deseable, pero no a toda costa. Por ejemplo, podemos tener

dos estimadores alternativos de , uno insesgado y otro sesgado. Si los

valores que toma el estimador sesgado oscilan menos alrededor de

que el insesgado, el primero tendra menos varianza que el segundo. Es

decir, a veces un pequeo sesgo compensa por la menor varianza.

20

Prueba: La expresin del estimador MCO de , 1 ( )T TX X X Y , se

puede escribir como 1 ( )T TX X X , sin ms que sustituir el valor

de Y por el modelo Y X . Por tanto:

1 1 1( ) [ ( ) ] ( ) [( ) ] ( ) ( )T T T T T TE E X X X E E X X X X X X E

donde se han usado las hiptesis de (1) parmetros constantes, (2)

regresores fijos e independientes linealmente y (3) esperanza nula del

trmino de error .

Eficiencia: El estimador MCO de es eficiente. Es decir, tiene

varianza mnima dentro de la familia de estimadores lineales e

insesgados de . Esto es lo que demuestra el Teorema de Gauss-

Markov. Pero antes, hay que derivar la expresin de la matriz de

varianzas-covarianzas del estimador MCO de .

1 1 var( ) [( )( ) ] [( ) ( ) ]T T T T TE E X X X X X X

Sabiendo que por hiptesis los regresores son fijos:

1 1var( ) ( ) ( ) ( )T T T TX X X E X X X

y, finalmente, aplicando las hiptesis de que las pertubaciones tienen

esperanza nula, varianza constante y ausencia de autocorrelacin:

2 1var( ) ( )TX X

Esta es la expresin de la mnima varianza de un estimador lineal e

insesgado de (ver Apndice 1).

Estimador MCO de la varianza residual 2

Dada una muestra de Y y X , con la expresin del estimador MCO,

es posible calcular una estimacin puntual de los parmetros, pero no es

posible calcular una medida de la incertidumbre asociada a dicha

estimacin (varianza), porque 2 es constante pero desconocido.

Un estimador intuitivo de la varianza de las perturbaciones consiste

en dividir la suma de cuadrados de los residuos MCO por n. No

obstante, para que dicho estimador sea insesgado, hay que ponderar la

suma de cuadrados de los residuos por los grados de libertad. Es decir:

21

2

2 1

n

Tt

t

n k n k

Este estimador es insesgado, es decir, la 2 2( )E , ya que la 2 ( ) ( )TE n k .

Prueba: El vector de residuos MCO se puede escribir como:

1 1 ( ) [ ( ) ]T T T TY Y Y X Y X X X X Y I X X X X Y MY

donde la matriz M de tamao ( )n n es la llamada matriz de proyeccin

que tiene propiedades importantes: (1) es simtrica, (2) idempotente ,(3)

no tiene inversa y (4) es ortogonal a la matriz X , es decir, 0MX .

Ejercicio para el estudiante: Probar estas cuatro propiedades de la matriz

M .

A partir de la relacin anterior y de las propiedades de la matriz M , se

obtiene: ( )MY M X M . Por tanto, siempre que se desee la

suma de cuadrados de los residuos se puede escribir como una forma

cuadrtica:

T T M

Finalmente, la esperanza de esa suma es igual a:

2 2

( ) ( ) [ ( )] [ ( )]

[ ( )] [ ( )] [ ] [ ]

T T T T

T T

E E M E tr M E tr M

tr E M tr ME tr M tr M

y la traza de la matriz M :

1 1 1( ) [ ( ) ] [ ( ) ] [( ) ]T T T T T Ttr M tr I X X X X n tr X X X X n tr X X X X n k

ya que la matriz M es cuadrada y de dimensin n y 1( )TX X de tamao

( )k k . De hecho, la prueba de que esta matriz no tiene inversa es

inmediata, ya que el rango de una matriz idempotente coincide con su

traza.

Una vez obtenido un estimador insesgado de la varianza residual, dada

cualquier muestra de Y y X en el MLG, los pasos en la estimacin

MCO son:

22

(1) 1 ( )T TX X X Y

(2) 2

T

n k

(3) 2 1 var( ) ( )TX X

Ejercicio para el estudiante: Probar que el estimador de la varianza del

MCO es insesgado. Es decir, la [var( )] var( )E .

Ejercicio numrico 1: Dada la siguiente muestra temporal de las

variables ty y tx :

ty 8.04 6.95 7.58 8.81 8.33 9.96 7.24 4.26 10.84 4.82 5.68

tx 10 8 13 9 11 14 6 4 12 7 5

Obtener la estimacin MCO de los parmetros del modelo

1 2t t ty x , as como una estimacin insesgada de la varianza

residual y de la matriz de varianzas-covarianzas del estimador de 1 y

2 .

Solucin: El clculo de la expresin 1 ( )T TX X X Y para esta muestra

es:

2

11 99

99 1001

tT

t t

n xX X

x x

82.51

797.60

tT

t t

yX Y

y x

1

1

2

11 99 82.51 1001 99 82.51 31 99 1001 797.60 99 11 797.60 0.51210

El modelo estimado se escribe 3 0.5t ty x . La estimacin de la varianza

residual por MCO exige calcular la suma de cuadrados de residuos:

1 1 1 11 11 11 8.04 8 0.04;...; 5.68 5.5 0.18y y y y

112

112 2 1

1

14

14; 1.5511 2

t

tt

t

SRn k

23

Por ltimo, la estimacin de la matriz de varianzas y covarianzas del

estimador MCO de 1 y 2 es:

1 1 22 1

1 2 2

var( ) cov( ) 1001 99 1.27 0.131.55 var( ) ( ) 99 11 0.13 0.0141210cov( ) var( )

TX X

Propiedades algebraicas del criterio de estimacin MCO

Hay que distinguir las propiedades algebraicas del criterio MCO

dependiendo de si el modelo incorpora o no un trmino constante. El

sistema de ecuaciones normales para un modelo con trmino constante

tiene la siguiente estructura:

T TX X X Y

o bien:

112 1 1

12 22 2 22 2 12 22 2 22

1 2 2 1 2

1 1 . 1 1 . 1 1 . 1

. 1 . .

. . . . . . . . . . . . ..

. 1 . .

k

n k n

k k nk n nk k k nk nk

x x y

x x x x x x x x y

x x x x x x x x y

donde la primera columna de la matriz X es determinista y vale siempre

uno (es el llamado trmino constante del modelo). Operando en el

sistema anterior, se obtiene:

12 3

2

2 2 3 2 22

2

.

. . . . ..

. . .

t t tk t

t t t t tk t t

tk tk tk

n x x x y

x x x x x x y

x x y

La primera ecuacin del sistema de ecuaciones normales de un modelo

con trmino constante es:

1 2 2 ...t tk k tn x x y

o bien, en trminos matriciales:

24

T Ti X i Y

donde Ti es un vector fila unitario de tamao n ; 1 1 . 1Ti . A partir

de esta primera ecuacin que cumple el criterio MCO es fcil derivar

algunas propiedades algebraicas:

Propiedad 1. En el MLG con trmino constante estimado por MCO, la

media muestral de los residuos es nula, es decir, 0 .

Prueba: A partir de la primera ecuacin normal de un modelo con

constante:

( ) 0 ( ) 0 0 0T T T T T ti X i Y i Y X i Y Y i


media muestral de la variable endgena coincide con la media muestral

de la variable ajustada por el modelo, es decir: Y Y .

Prueba: A partir de la primera ecuacin normal de un modelo con

constante:

T T T T

t ti X i Y i Y i Y y y

Propiedad 3. En el MLG con o sin trmino constante estimado por

MCO, los residuos son ortogonales a las variables explicativas, es decir:

0TX . En trminos escalares, 1

0, 1,2,...,n

ti t

t

x i k

.

Prueba: A partir del sistema de ecuaciones normales MCO:

( ) 0 0T T T TX X X Y X Y X X


MCO, los residuos son ortogonales a la variable endgena ajustada, es

decir: 0TY . En trminos escalares, 1

0n

t t

t

y

.

Prueba: A partir de la misma condicin de ortogonalidad:

0 ( ) 0 0T T T TY X X

25

teniendo en cuenta la propiedad 3 de ortogonalidad entre los residuos y

los regresores.


MCO, la suma de cuadrados de la variable endgena real es igual a la

suma de cuadrados de la variable ajustada ms la suma de cuadrados de

residuos, es decir: T T TY Y Y Y . O bien, escrita en trminos escalares,

2 2 2

1 1 1

n n n

t t t

t t t

y y

.

Prueba: La suma de cuadrados de residuos MCO se puede escribir

como: ( ) ( ) 2T T T T T T TY X Y X Y Y X Y X X

Sustituyendo en el ltimo sumando la expresin analtica del estimador

MCO de :

1 2 ( )T T T T T T T T T T TY Y X Y X X X X X Y Y Y X Y

Finalmente: T T T T TY Y X X X Y

Ejercicio para el estudiante: Probar de una manera diferente esta

propiedad haciendo uso de la propiedad 4.


propiedad 5 se cumple cuando las variables se expresan en desviaciones

con respecto a sus medias, es decir:

( ) ( ) ( ) ( ) ( ) ( )T T TY iY Y iY Y iY Y iY i i

donde i es una columna unitaria de tamao n.

Prueba: Aplicando las propiedades algebraicas 1 y 2, la expresin

anterior en trminos escalares queda reducida a:

2 2 2( ) ( )t t ty y y y

y operando 2 2 2 2 2t t ty ny y ny , que se corresponde con la propiedad 5.

26

A la suma de cuadrados de los valores de la endgena alrededor de

su media se le llama ST (Suma Total); a la suma de cuadrados de la

variable ajustada en desviaciones SE (Suma Explicada) y a la suma de

cuadrados de residuos se le denomina SR (Suma Residual). Por tanto,

esta ltima propiedad se expresa como ST SE SR . La interpretacin

de esta igualdad es una descomposicin de varianzas. Es decir,

dividiendo por n , indica que de toda la variabilidad que hay que

explicar de la endgena (ST), hay una parte captada por el modelo (SE)

y otra parte que no puede ser explicada (SR). Si el modelo ajusta

perfectamente la SR=0 y la ST=SE. Si el modelo no explica nada, la

0SE y la ST SR .

Ejercicio para el estudiante: Comprobar que se cumplen estas 6

propiedades con los datos del ejercicio numrico 1.

Medidas de bondad de ajuste en la regresin

La SR puede ser una medida de bondad de ajuste. No obstante, no es

buena medida, ya que los residuos tienen escala y esta suma cambia ante

un simple de escala en los datos de la endgena.

Adems, la SR como mnimo es nula, pero su valor mximo no est

acotado. Si queremos una medida adimensional y acotada, se puede

definir un ratio de sumas. La medida de ajuste ms conocida es el

llamado coeficiente de determinacin o 2R del modelo definido como:

2 1SE SR

RST ST

en donde se ha usado la propiedad de que la ST SR SE , por lo que la

expresin dada se corresponde con una medida de bondad slo vlida si

el modelo tiene trmino constante.

El valor del 2R (multiplicado por 100) se interpreta como el porcentaje

de la varianza de la endgena que queda explicada por el modelo.

Adems, est acotado entre cero y uno. Si el 2 0R , el ajuste es nulo, ya

que la 0SE . Si el 2 1R , el ajuste es perfecto, ya que la SE ST , o

bien, la 0SR . Ajustes intermedios daran lugar a un 2 0.5R .

Ejercicio para el estudiante: Probar que en un modelo como t ty ,

el 2 0R .

27

El 2R es muy fcil de calcular y muy usado, pero hay que tener en

cuenta que tiene problemas.

Problemas del 2R . En primer lugar, puede ser engaoso mirar slo el 2R sin mirar los datos. Muchas veces, el 2R es muy alto en relaciones

espreas. El ejemplo ms famoso en la literatura economtrica es la

relacin entre el N de nacimientos en un ao en los EEUU y el N de

cigueas en ese mismo ao y estados. La estimacin del modelo que

explica el N de nacimientos en funcin del N de cigueas proporciona

un 2R muy elevado y esto sabemos que es espreo. La razn es que en

ese ao la correlacin muestral entre ambas variables fue muy alta y

aunque no hay ninguna relacin causal entre ambas, el coeficiente de

determinacin es bueno, pero engaoso.

En relaciones donde tiene sentido relacionar determinadas variables

(Consumo y Renta), el coeficiente de determinacin puede ser

excesivamente alto si en el perodo muestral considerado ambas

variables evolucionan de forma muy parecida o presentan una tendencia

comn.

Otro problema distinto del 2R convencional es que nunca empeora

cuando en el modelo introducimos variables explicativas adicionales. Es

decir, aunque una nueva variable no sea muy relevante, su

incorporacin hace que, en el peor de los casos, el 2R no cambie, o bien,

con un poco de suerte, aumente. Introducir un nuevo regresor en el

modelo tiene dos efectos: (1) disminuyen los grados de libertad y ste es

negativo y (2) disminuye la suma residual y ste es positivo. Si el peso

del efecto negativo es mayor que la mejora en el ajuste, no compensar

introducir esta nueva variable y a la inversa.

La solucin a ste ltimo problema es utilizar el llamado 2R ajustado o

corregido de grados de libertad ( 2R ) que se calcula como:

2 211 (1 )n

R Rn k

En esta formulacin del 2R se tienen en cuenta dos efectos: (1) Si

aumenta el nmero de regresores en el modelo, disminuyen los grados

de libertad y esto se penaliza, es decir: 21n

k n k Rn k

y (2)

Esos nuevos regresores pueden mejorar el modelo en trminos de ajuste,

es decir: 2 2k SR R R . Si el efecto de penalizacin es menor

28

que el efecto de mejora en el ajuste, el 2R aumentar e indicar que

compensa la introduccin de esas nuevas variables y a la inversa.

Como ejemplo, supongamos que se han estimado dos funciones de

consumo alternativas:

2 ; 0.80t t tC a bY R

2 ; 0.87t t t tC a bY ci R

donde ti es un Tipo de inters. Ambos modelos estn anidados ya que se

quiere explicar el Consumo en funcin de la Renta (en el primero) o

bien, introducir un nuevo regresor (Tipo de inters) en el modelo ms

sencillo. El hecho de que el 2R sea mayor en el modelo ms complicado

indica que el Tipo de inters es una variable que compensa introducir

(en trminos de ajuste) a pesar de que los grados de libertad hayan

disminuido.

Derivacin del 2R : Se obtiene a partir del 2R convencional

2 /1 1/

SR SR nR

ST ST n

donde dividiendo por n la Suma Residual y la Suma Total, esta medida

se puede interpretar como un ratio de varianzas. Implantando la

restriccin de que los estimadores de las varianzas residual y de la

variable endgena sean insesgados, se obtiene el 2R corregido de los

grados de libertad:

2 2/ 11 1 (1 )/ 1

SR n k nR R

ST n n k

Ejercicio para el estudiante: Calcular el 2R convencional y el corregido

usando los datos del ejercicio numrico 1. Interpretar este coeficiente.

Prctica con los datos de Anscombe y Eviews.

En un conocido trabajo publicado por F.J. Anscombe en 1973 (Graphs in Statistical Analysis, The American Statistician, 27, pp.17-21), se ilustran algunos aspectos bsicos del anlisis de regresin lineal usando

los datos simulados que figuran en la tabla siguiente (tambin en

www.ucm.es/info/ecocuan/ectr1):

29

t 1ty 2ty 3ty 4ty 1tx 2tx

1 8.04 9.14 7.46 6.58 10.00 8.00

2 6.95 8.14 6.77 5.76 8.00 8.00

3 7.58 8.74 12.74 7.71 13.00 8.00

4 8.81 8.77 7.11 8.84 9.00 8.00

5 8.33 9.26 7.81 8.47 11.00 8.00

6 9.96 8.10 8.84 7.04 14.00 8.00

7 7.24 6.13 6.08 5.25 6.00 8.00

8 4.26 3.10 5.39 12.50 4.00 19.00

9 10.84 9.13 8.15 5.56 12.00 8.00

10 4.82 7.26 6.42 7.91 7.00 8.00

11 5.68 4.74 5.73 6.89 5.00 8.00

Dada esta informacin se pide:

(1) Estimar por MCO las cuatro regresiones con trmino constante que se indican a continuacin:

(a) 1 11 12 1 1t t ty x

(b) 2 21 22 1 2t t ty x

(c) 3 31 32 1 3t t ty x

(d) 4 41 42 2 4t t ty x

Usando Eviews, los resultados son:

Modelo (a)

Dependent Variable: Y1 Method: Least Squares Date: 11/06/03 Time: 17:03 Sample: 1 11 Included observations: 11

Variable Coefficient Std. Error t-Statistic Prob.

C 3.000091 1.124747 2.667348 0.0257 X1 0.500091 0.117906 4.241455 0.0022

R-squared 0.666542 Mean dependent var 7.500909 Adjusted R-squared 0.629492 S.D. dependent var 2.031568 S.E. of regression 1.236603 Akaike info criterion 3.425579 Sum squared resid 13.76269 Schwarz criterion 3.497924 Log likelihood -16.84069 F-statistic 17.98994 Durbin-Watson stat 3.212290 Prob(F-statistic) 0.002170

30

Modelo (b)



C 3.000909 1.125302 2.666758 0.0258 X1 0.500000 0.117964 4.238590 0.0022


Modelo (c)



C 3.002455 1.124481 2.670080 0.0256 X1 0.499727 0.117878 4.239372 0.0022


Modelo (d)



C 3.001727 1.123921 2.670763 0.0256 X2 0.499909 0.117819 4.243028 0.0022


31

Obsrvese que en los cuatro modelos coinciden todos los resultados

MCO: (1) La estimacin puntual de la constante y la pendiente, (2) la

media y la desviacin tpica muestral de la variable dependiente, (3) el

coeficiente de determinacin convencional y corregido, (4) la suma de

cuadrados de residuos (5) la desviacin tpica residual y (6) las

desviaciones tpicas de los parmetros estimados por MCO.

A la vista de estos resultados, los cuatro modelos ajustan igual.

Aproximadamente el 66.7% de las fluctuaciones de la endgena vienen

explicadas por la variabilidad de la exgena. Sin embargo, los datos

utilizados no son los mismos. Muchas veces, la representacin grfica

de los datos nos ayuda a entender los resultados numricos de una

simple estimacin lineal.

(2) Represente grficamente la nube de puntos real junto con la recta ajustada en cada uno de los cuatro modelos

considerados:

4

6

8

10

12

2 4 6 8 10 12 14 16

X1

Y1

2

4

6

8

10

2 4 6 8 10 12 14 16

X1

Y2

4

6

8

10

12

14

2 4 6 8 10 12 14 16

X1

Y3

4

6

8

10

12

14

5 10 15 20

X2

Y4

32

En el modelo (a) la relacin entre las variables es ms o menos

lineal, luego la hiptesis de linealidad en los parmetros hace que el

ajuste sea razonable.

En el modelo (b) la relacin entre las variables es claramente no

lineal y el ajuste podra mejorar claramente especificando el modelo de

otras formas, como por ejemplo:

2

1 2 3t t t ty x x

1 2 lnt t ty x

En el modelo (c) todos los puntos de la nube real, exceptuando uno,

se ajustan casi perfectamente en una recta que no es la estimada porque

ese valor atpico (el tercer par de valores) hace que la recta de ajuste

cambie de pendiente y el ajuste sea peor. En este caso, se aprende que la

presencia de una o ms observaciones atpicas pueden alterar todos los

resultados de la estimacin. Por tanto, el tratamiento de atpicos antes de

estimar una relacin puede ser crucial.

En el modelo (d) tenemos otro problema diferente en los datos. Los

datos de la variable explicativa 2tx son todos igual a 8, exceptuando el

octavo valor, que es igual a 19. De hecho, ste es el dato que hace que la

recta de ajuste est anclada donde est. Si eliminramos el par de

valores de la endgena y de la exgena para el instante t=8, no sera

posible estimar por MCO el modelo, ya que seran perfectamente

colineales la constante y la variable explicativa (la primera vale uno en

toda la muestra y la segunda vale 8).

Ejercicios para el estudiante usando EViews: (1) Con los datos

usados en el modelo (b) reestime usando las especificaciones

alternativas que se proponen. Compare los resultados. (2) Cmo

cambian los resultados de la estimacin del modelo (c) si se elimina el

tercer par de valores observados sobre 3ty y 1tx ?. (3) Qu propiedad

tiene la matriz TX X si se elimina el octavo par de valores de 4ty y 2tx

en la regresin (d)?

ESTIMACIN DEL MLG POR MXIMA VEROSIMILITUD

Es otro mtodo de estimacin del vector de parmetros en el

MLG. Este criterio proporciona un valor de los parmetros que

maximizan la probabilidad (o verosimilitud) de que con ese valor se

generen las mismas observaciones de la variable Y que las observadas.

33

Es decir, maximiza la verosimilitud de que el modelo estimado

proporcione los mismos datos de Y que los observados en la realidad.

Es un criterio de estimacin que tiene propiedades tericas ms

fuertes que el MCO. A cambio, requiere de una hiptesis adicional: la

hiptesis de normalidad de las perturbaciones del modelo. De hecho,

esta hiptesis se puede justificar por diversos motivos:

(a) Sabemos que t representa la influencia combinada de un

gran nmero de variables explicativas que no se incluyen

explcitamente en la matriz X . Adems, se espera que la

influencia de estas variables sea pequea y en el mejor de

los casos, aleatoria. Gracias al Teorema Central del Lmite,

se puede demostrar que si existe un nmero grande de

variables aleatorias independientes e idnticamente

distribuidas, la suma de todas ellas seguir una normal.

(b) Una variante del Teorema Central del Lmite afirma que aunque el nmero de variables no sea muy grande o no

sean estrictamente independientes, su suma puede seguir

teniendo una distribucin normal.

(c) Con el supuesto de normalidad, se pueden obtener fcilmente las distribuciones que siguen los estimadores

MCO, puesto que una funcin lineal de una variable

normal hereda la normalidad. Recordar que ( )MCO f .

Esto es crucial para poder hacer inferencia estadstica

acerca de .

(d) La distribucin normal es una distribucin sencilla, caracterizada slo por dos parmetros (media y varianza).

Sus propiedades tericas han sido ampliamente estudiadas.

Derivacin de la funcin de verosimilitud del modelo:

Si ( , )N , es decir, una normal multivariante con media y matriz

de varianzas , la funcin de densidad es:

1/ 2/ 2 11( ) (2 ) exp ( ) ( )2

n Tf

Dadas las hiptesis habituales sobre , sabemos que 0 y 2I y la

funcin de densidad anterior es ms simple:

34

/ 2 2 / 2

2

1( ) (2 ) exp

2

n n Tf

Puesto que Y es una funcin de , conocemos la funcin de distribucin

de Y , aplicando el resultado de que:

( ) ( )f Y fY

donde el ltimo trmino es el valor absoluto del determinante del

Jacobiano de la transformacin.

Ejercicio para el estudiante: Comprobar que en el modelo Y X , el

determinante del Jacobiano de la transformacin es uno y por tanto,

( ) ( )f Y f .

Por tanto:

/ 2 2 / 2 2

2

1( ) ( ) (2 ) exp ( ) ( ) ( , )

2

n n Tf Y f Y X Y X L

siendo la funcin de verosimilitud cuando depende de los parmetros

y 2 , dada una muestra de Y y X . Esta es la funcin de densidad

conjunta de Y y X , dados los valores de los parmetros y 2 .

Obtener la expresin de los estimadores por mxima verosimilitud de

y 2 , supone maximizar la funcin de verosimilitud, 2( , )L . Para que

sea ms fcil y puesto que no cambia el ptimo se maximiza el

logaritmo neperiano de la funcin de verosimilitud:

2 2

2

1max ln ( , ) ln 2 ln ( ) ( )

2 2 2

Tn nL Y X Y X

Condiciones de primer orden:

2

1

2

ln ( , ) 1 ( 2 2 ) 0 ( )2

T T T T

MV

LX Y X X X X X Y

2

2

2 2 4

ln ( , ) ( ) ( ) 10

2 2

T T

MV

L n Y X Y X

n

Por tanto, el estimador MV de coincide con el MCO, pero no es as

para el estimador de la varianza de las perturbaciones, 2 . En concreto,

35

sabemos que el estimador MV de la varianza de las perturbaciones no es

insesgado, ya que para que lo sea es necesario ponderar la suma de

cuadrados de residuos por los grados de libertad, n k .

Ejercicio para el estudiante: Encontrar la expresin y el signo del sesgo

del estimador MV de la varianza de las perturbaciones, es decir 2 2 2 ( ) ( )MV MVE sesgo .

Ejercicio para el estudiante: Comprobar que estamos en un mximo. La

matriz hessiana de segundas derivadas particularizada en el punto en el

que se cumplen las condiciones de primer orden es definida negativa y

tiene la expresin:

2

4

0

02

TX X

Hn

Propiedades estadsticas del estimador MV: La cota de Cramer Rao

proporciona la mnima varianza que puede alcanzar cualquier estimador

insesgado de un vector de parmetros. Dicha cota viene dada por la

inversa de la matriz de informacin ( I ), donde sta viene definida por la

esperanza del hessiano cambiada de signo. Es decir:

2

2

ln ( )LI E

, siendo

2

Tomando las derivadas segundas a las condiciones de primer orden, se

tiene que:

2 2

2 2

ln ( , ) TL X X

2 2

2 4

ln ( , ) [ ]

( )( )

TL X X Y

2 2

2 2 4 6

ln ( , ) [ ] [ ]

( )( ) 2

TL n Y X Y X

y formando el hessiano:

36

2 4

4 6

[ ]

[ ] [ ]

2

T T

T

X X X X Y

Hn Y X Y X

La esperanza de los trminos del hessiano es igual a:

2 2

T TX X X XE

4 4

[ ]0

T TX X Y XE E

2

4 6 4 6 4 6 4

[ ] [ ] [ ]

2 2 2 2

T Tn Y X Y X n E n n nE

Puesto que la matriz de informacin es diagonal por bloques, su inversa

tambin y tiene la expresin:

2 1

14

( ) 0

20

TX X

I

n

Esta matriz indica que la cota inferior para la varianza de un estimador

insesgado de es 2 1( )TX X y la cota inferior para la varianza de un

estimador insesgado de 2 es la expresin 42

n

.

En el caso MCO y MV, el estimador de tiene una matriz de varianzas

que alcanza la cota exactamente, luego es eficiente.

En el caso MCO, el estimador de 2 tiene una varianza igual a 42

n k

(ver Apndice 2), que supera a la Cota de Cramer Rao. En este caso, no

podemos hablar de eficiencia.

En el caso MV, el estimador de 2 tiene una varianza igual a 42 ( )n k

n n

(ver Apndice 2), que es inferior a la Cota de Cramer Rao. No obstante,

en este caso el estimador MV es sesgado. Lo que s es cierto es que no

existe un estimador insesgado de 2 que alcance la cota.

37

Apndice 1: Teorema de Gauss-Markov.

Este teorema demuestra que el estimador MCO de es el que tiene

mnima varianza dentro de la familia de estimadores lineales e

insesgados.

La varianza del estimador MCO de tiene la expresin 2 1var( ) ( )TX X . La expresin del estimador MCO de es WY

donde 1( )T TW X X X . Denotando por * CY , donde C W , tendr

todos los estimadores de distintos al MCO y lineales. Para que

adems, * sea insesgado, se tendr que cumplir que *( )E . Por

tanto, la *( ) [ ( )]E E C X CX y habr que imponer que kCX I .

La varianza del estimador de llamado * es:

* * * 2 var( ) [( )( ) ] ( )T T T TE E C C CC

Aunque todava no son comparables ambas matrices de varianzas y

covarianzas, es posible siempre descomponer una matriz fija como la C

en la suma de otras dos: C W D , donde 0D y postmultiplicando por

la matriz X esa identidad, tenemos que CX WX DX . Como kCX I ,

por insesgadez y kWX I , por definicin, es obvio que 0DX . Por

tanto:

* 2 2 2 2 2 2var( ) ( )( )T T T T T TCC W D W D WW DD DW WD

teniendo en cuenta que 1( )T TWW X X y 0T TDW WD , se obtiene :

* 2 1 2 * 2 var( ) ( ) var( ) var( )T T TX X DD DD

y la matriz 2 TDD es definida positiva por construccin.

Apndice 2. Distribuciones de los estimadores MCO y MV de y de 2 .

A partir de la hiptesis de normalidad de las perturbaciones es fcil

obtener las distribuciones de los estimadores MCO y MV.

38

Distribucin del estimador de por MCO y MV: En ambos

criterios la frmula del estimador coincide y al poder escribir el

estimador como una funcin lineal de las perturbaciones, 1 ( )T TX X X , la normalidad se hereda. Por tanto:

2 1 [ , ( ) ]TN X X

Distribucin del estimador de 2 por MCO y MV: Para obtener esta

distribucin es necesario el uso de un resultado estadstico preliminar:

Resultado: La distribucin de la forma cuadrtica 22

T

q

Q

si se

cumplen las siguientes condiciones:

(1) El vector 2(0, )N I

(2) La matriz Q es idempotente y su ( )tra Q q .

A partir de este resultado podemos derivar inmediatamente la

distribucin del estimador de 2 por MCO:

2

2 2 2

2 2

T T

MCO MCO n k

M n k

n k n k

ya que la ( )tra M n k . Es habitual escribir esta distribucin como:

2

2 2MCO n k

n k

Los dos primeros momentos de esta distribucin son:

2 2

2 2 2( ) ( )MCO n kE E n kn k n k

4 4 4

2 2

2 2

2var( ) var( ) 2( )

( ) ( )MCO n k n k

n k n k n k

Ejercicio para el estudiante: Derivar la distribucin y los momentos

(esperanza y varianza) del estimador MV de 2 .

econometria i (profesora: sonia sotoca lÓpez)

Documents

econometria 21mar2012

econometria alfonsonovales

econometria preguntas

econometria ejercicios

natàlia sotoca

econometria puc

análisis technologie hof javier garcía sotoca

econometria ii

econometria financeira

ponencia econometria

cnm9110 – econometria

tarea econometria

econometria - loria

econometria- tarea

econometria a

econometria libro

econometria aplicada

econometria guanabana

facultad de medicina - digitum: repositorio institucional...

econometria - iseg