l'économétrie - institut national de la recherche …2).pdf1.1.2 iden ti cation de termes...

Formation SPdS, Paris, 3 décembre 2004

L'économétrie des panels

Alban THOMAS

[email protected]

1 Introduction

Données de panel : Séquence d'observations sur une population

(ménages, entreprises, pays).

En anglais : cross-sections over time ou pooled cross-section time-

series data.

Fondamental : Deux dimensions (individuelle et temporelle).

1.1 Gains à fusionner des données dans les deux dimen-

sions

1.1.1 Moins de collinéarité entre les variables explicatives

En économie de la production et de la consommation, les prix

sont di�ciles à utiliser :

� Séries temporelles : Les indices de prix agrégés sont très col-

linéaires ;

� Coupe instantanée : Pas su�samment de variation de prix

entre �rmes ou individus.

Avec données de panel, prise en compte des variations entre indi-

vidus et périodes.

� Séries temporelles : pas d'information sur l'impact des carac-

téristiques individuelles (variables socio-économiques,...) ;

� Coupes instantanées : pas d'information sur les dynamiques

d'ajustement.

2

1.1.2 Identi�cation de termes individuels inobservables

Sous certaines conditions (voir plus loin). Si le nombre d'ob-

servations est su�samment grand, on peut estimer des termes

d'hétérogénéité individuelle inobservable.

1.1.3 Réduction du biais (variables manquantes/inobservables)

Avec le panel, facile de contrôler l'hétérogénéité inobservable

entre les individus (d'où la popularité de ces méthodes).

Exemple : Décision de production et e�cacité des entreprises

max� = pQ� C(�;Q) où C(�;Q) = � � c(Q);

p : prix de vente, Q : quantité produite, � : terme d'e�cacité,

C(:) : coût total de production.

, p = �@c(Q)

@Q= A��Q

��1 (coût Cobb-Douglas)

= �(�0 + �1Q) (coût quadratique).

Cas Cobb-Douglas : logQ = 1��1 (log p� log � � A� �).

De la condition d'équilibre à l'équation estimable :

Observations (Qit; pit), hétérogenéité inobservable �i, entre-

prise i, période t.

logQit =1

� � 1(log pit � log �i � A� �)

Problème d'identi�cation : l'équation estimable est

~Qit = a0 + a1~pit + uit; i = 1; 2; : : : ; N; t = 1; 2; : : : ; T;

3

où ~Qit = logQit,

~pit = log pit,

a1 = 1=(� � 1),

a0 = (�A� � � E log �i) =(� � 1), Euit = 0.

Le modèle est identi�é si E log �i = 0, i.e., E�i = 1. Sinon, A est

biasé si �i est négligé et E log �i 6= 0.

Problème empirique : Corrélation possible entre prix de vente

pit et e�cacité �i. �

1.2 Analyse de variance

Considérons le modèle

yit = �i + xit�i + "it; i = 1; 2; : : : ; N; t = 1; 2; : : : ; Ti;

où xit est scalaire, �i et �i sont des paramètres, et Ti : nombre de

périodes disponibles pour l'individu i.

Moments empiriques utiles :

yi =1

T

TiXt=1

yit; xi =1

T

TiXt=1

xit;

Sxxi =

TiXt=1

(xit � xi)2; Sxyi =

TiXt=1

(xit � xi)(yit � yi);

et

Syyi =

TiXt=1

(yit � yi)2; i = 1; 2; : : : ; N:

L'estimateur par Moindres Carrés est calculé par

�i = Sxyi=Sxxi et �i = yi � xi�;

4

et la Somme des Carrés des Résidus (RSS) pour l'individu

i est

RSSi = Syyi � S2xyi=Sxxi; with (Ti � 2) degrés de liberté:

Considérons à présent un modèle restreint avec des ordonnées

et des pentes constantes :

yit = �+ xit� + "it;

que l'on obtient en imposant les conditions suivantes :��1 = �2 = � � � = �N(= �)

�1 = �2 = � � � = �N(= �):

Sous ces restrictions, l'estimateur des Moindres Carrés sera

� =

PNi=1

PTit=1(xit � �x)(yit � �y)PN

i=1

PTit=1(xit � �x)2

et � = �y � �x�, où

�y =1

NP

i Ti

NXi=1

TiXt=1

yit; �x =1

NP

i Ti

NXi=1

TiXt=1

xit:

La Somme des Carrés des Résidus est

RSS =

NXi=1

TiXt=1

(yit � �y)2 �

hPNi=1

PTit=1(yit � �y)(xit � �x)

i2PN

i=1

PTit=1(xit � �x)2

;

avec comme degrés de liberté :PN

i=1 Ti � 2.

5

Pour une majorité d'applications, le premier modèle est trop

général et l'estimation demanderait un nombre important de pé-

riodes. Si l'hétérogénéité est aditive dans le modèle, on peut consi-

dérer la spéci�cation suivante, avec pente constante mais ordon-

nées di�érentes :

yit = �i + xit� + "it:

En minimisantP

i

Pt(yit � �i � xit�)

2 par rapport à �i and �,

on obtient :Xi

Xt

(yit � �i � xit�) = 0;Xi

Xt

xit(yit � �i � xit�) = 0;

de sorte que

�i = �yi � �xi� et � =

Pi

Pt xit(yit � �yi)P

i

Pt xit(xit � �xi)

:

La RSS a maintenantP

i Ti � (N + 1) degrés de liberté (N + 1

paramètres sont estimés).

C'est le modèle le plus utilisé dans les applications empiriques.

1.3 Quelques dé�nitions

� Panel typique : le nombre d'individu N est grand et celui des

périodes (T ) est petit.

� Panel court (long) : quand T est petit (grand).

� Panel cylindré (balanced panel) : même nombre de périodes

pour chaque individu.

6

� Panel rotatif : un sous-échantillon d'individus est remplacé à

chaque période. Les panels rotatifs peuvent être cylindrés ou non.

� Pseudo panel : obtenu par fusion de coupes instantanées à

di�érentes périodes, avec des individus di�érents.

� Attrition : avec des panels longs, la probabilité que l'indivi-

dual reste dans l'échantillon décroît avec le nombre de périodes

(lassitude, déménagement, décès, faillite, etc.)

2 Le modèle linéaire

2.1 Notation

2.1.1 Notation sous forme scalaire

yit = xit� + uit; i = 1; 2; : : : ; N; t = 1; 2; : : : ; T;

où xit est un vecteur 1 � K de variables explicatives, � est un

vecteur (K � 1) de paramètres, et uit est le résidu.

yit et les composantes de xit varient à la fois entre les individus et

dans le temps.

Composante de la variable dépendante inexpliquée par xit :

uit = �i + �t + "it;

où �i est l'e�et individuel, �t est l' e�et temporel, et "it est

une erreur i.i.d.

7

Modèle à erreurs composées de type I : uit = �i + "it.

Modèle à erreurs composées de type II : uit = �i+ �t+ "it.

Permet di�érentes prédictions de yit sachant Xit :

E(yitjxit) = xit�;

E(yitjxit; i) = xit� + �i pour l'individu i,

E(yitjxit; t) = xit� + �t pour la période t,

E(yitjxit; i; t) = xit� + �i + �t pour l'individu i et la période t.

2.1.2 Notation sous forme matricielle

Y = X� + �+ �+ ";

où Y; �; � et " sont (NT � 1), X est (NT �K).

Convention : l'indice t est le plus rapide, l'indice i est le plus lent :

0BBBBBBBBBBBBBBBBBBBB@

y11...

y1T

y21...

y2T...

yit...

yN1...

yNT

1CCCCCCCCCCCCCCCCCCCCA

=

266666666666666666666664

X(1)11 � � � X

(K)11

... � � � ...

X(1)1T � � � X

(K)1T

X(1)21 � � � X

(K)21

... � � � ...

X(1)

2T � � � X(K)

2T... � � � ...

X(1)it � � � X

(K)it

... � � � ...

X(1)N1 � � � X

(K)N1

... � � � ...

X(1)NT � � � X

(K)NT

377777777777777777777775

0BBBBBBB@

�1

�2...

�k...

�K

1CCCCCCCA

+ �+ �+ "

8

2.1.3 Modèle sous forme vectorielle

yi = Xi� + ��i + �+ "i; i = 1; 2; : : : ; N;

où yi is T � 1, Xi est T �K.

Note : � = (�1; �2; : : : ; �T )0 et ��i = (�i; �i; : : : ; �i)

0 sont (T � 1).

2.1.4 Matrices et opérateurs usuels

� INT : matrice identité avec NT lignes et NT colonnes ;

� eT : vecteur T � 1 de 1 ;

� B = IN (1=T )eTe0T : Opérateur Inter-individus (Bet-

ween Groups) ;

� �B = (1=N)eNe0NIT : Opérateur Inter-périodes (Between

Periods) ;

� Q = INT � IN (1=T )eTe0T = INT �B :

Opérateur Intra-individu (Within Groups) ;

� �Q = INT � (1=N)eNe0N IT = INT � �B :

Opérateur Intra-période (Within Periods) ;

� B �B = (1=NT )eNTe0NT :

Calcule la moyenne dans la population.

Hypothèse importante : Pas de terme constant dans le modèle.

Sinon, utiliser B �B pour décentrer toutes les variables.

9

Les opérateurs B sont utilisés pour calculer, à partir des vecteurs

et matrices à NT lignes, les moyennes spéci�ques aux individus

et aux périodes, qui sont aussi à NT lignes.

Les opérateursQ sont utilisés pour calculer les écarts à ces moyennes.

2.1.5 Propriétés importantes de ces opérateurs

Symétrie, idempotence et orthogonalité

Q0 = Q; B

0 = B; Q2 = Q; B

2 = B; BQ = QB = 0;

Rang d'une matrice idempotente = sa trace

) rank(Q) = N(T � 1) and rank(B) = N:

Décomposition de l'opérateur Q avec N = T = 2 :

Qy =

0BB@2664

1 0 0 0

0 1 0 0

0 0 1 0

0 0 0 1

3775�

�1 0

0 1

� 1

2

�1 1

1 1

�1CCA y

=

0BB@

y11

y12

y21

y22

1CCA� 1

2

2664

1 1 0 0

1 1 0 0

0 0 1 1

0 0 1 1

37750BB@

y11

y12

y21

y22

1CCA

=

0BB@

y11

y12

y21

y22

1CCA� 1

2

0BB@

y11 + y12

y11 + y12

y21 + y22

y21 + y22

1CCA

Nous utiliserons aussi, dans la notation vectorielle

� BT = (1=T )eTe0T : Opérateur Between pour un seul individu ;

10

� QT = IT � (1=T )eTe0T = IT � BT : Opérateur Within pour un

seul individu.

2.2 Le modèle à e�ets �xes de type I

Terminologie : le modèle à e�ets �xes ne signi�e pas que les

e�ets individuels �i ne sont pas aléatoires dans le vrai modèle !

Plutôt, l'estimation est menée conditionnellement à l'hétérogé-

néité inobservée : les �i sont �traités comme� des paramètres à

estimer.

2.2.1 L'estimateur en termes du théorème de Frisch-Waugh-Lovell

L'inférence est conditionnelle aux e�ets individuels : les esti-

mations sont obtenues en régressant Y sur X et des indicatrices

individuelles.

Soit E la matrice NT �N des indicatrices individuelles :

E =

266666666666666666664

1 0 0 � � � 0

1 0 0 � � � 0

1 0 0 � � � 0

0 1 0 � � � 0

0 1 0 � � � 0

0 1 0 � � � 0... � � � � � � � � � ...

0 0 0 � � � 1

0 0 0 � � � 1

0 0 0 � � � 1

" " "(i = 1) (i = 2) � � � � � � (i = N)

377777777777777777775

11

et considérons le modèle

Y = X� + E + " = W� + u

où W = [X;E], � = (� 0; 0)0, u = ".

Théorème de Frish-Waugh-Lovell : Les paramètres estimés � sont

numériquement identiques dans les 2 procédures suivantes :

� � de �MCO = (�0; 0)0 = (W 0

W )�1W 0Y

� � = (X�0

X�)�1X�0

Y�; où

X� = [I �E(E 0

E)�1E 0]X = PEX;

Y� = [I �E(E 0

E)�1E 0]Y = PEY

(résidus de la régression linéaire de X et Y sur E).

Mais E = IN eT , E0E = IN e

0TeT = IN � T

, PE = I � E(E 0E)�1E 0 = I � 1

TE(IN)E

0

= I � 1T(IN eT )(IN eT )

0 = I � IN 1TeTe

0T = Q.

Par conséquent, � = (X�0

X�)�1(X�0

Y�) = (X 0

P0EPEX)�1(X 0

P0EPEY )

= (X 0QX)�1(X 0

QY ).

Idée derrière la procédure d'estimation des e�ets �xes :

Eliminer les e�ets individuels , Eliminer les écarts spéci�ques

aux individus

(des variables)

Transformation du modèle linéaire :

yit � 1=TXt

yit = (xit � 1=TXt

xit)� + uit � 1=TXt

uit

, Y �BY = (X � BX)� + u�Bu , QY = QX� +Qu:

12

Estimateur par Moindres Carrés :

� = [(QX)0(QX)]�1

(QX)0QY = [X 0Q0QX]

�1(X 0

Q0QY )

= (X 0QX)�1X 0

QY et V ar(�) = �2"(X

0QX)�1.

2.2.2 Interprétation comme un estimateur de covariance

Modèle en forme vectorielle :26664y1

y2...

yN

37775 =

26664x1

x2...

xN

37775 � +

26664eT

0T...

0T

37775�1 +

26664

0TeT...

0T

37775�2

+ � � �+

26664

0T0T...

eT

37775�N +

26664"1

"2...

"N

37775 ;

avec les hypothèses :

E("i) = 0; E("i"0i) = �

2"IT ; E("i"

0j) = 0 i 6= j:

Les estimateurs MCO (Moindres Carrés Ordinaires) de � et �is'obtiennent comme

min

NXi=1

"0i"i =

NXi=1

(yi � ��i � xi�)

0(yi � ��i � xi�)

, �i = �yi � �xi�; i = 1; 2; : : : ; N;

et, en substituant la dérivée partielle par rapport à �, nous avons

� =

"N;TXi;t

(xit � �xi)(xit � �xi)0

#�1 "N;TXi;t

(xit � �xi)(yit � �yi)

#:

13

Cet estimateur est appelé L'estimateur de la covariance (cova-

riance estimator), ou l'estimateur LSDV (Least-Square Dummy-

Variable). � est sans biais, convergent lorsque N ou T tend vers

l'in�ni. Sa matrice de variance-covariance s'écrit

V ar

��

�= �

2"

"NXi=1

xiQTx0i

#�1;

où QT = IT � (1=T )eTe0T .

�i est sans biais mais convergent seulement quand T !1.

2.2.3 Commentaires

� Transformation du modèle par �ltrage de la composante indivi-

duelle) les coe�cients associés aux régresseurs invariant dans le

temps ne sont pas identi�és.

� La procédure "E�ets Fixes" utilise les variations within entre

les périodes pour chaque individu, d'où son nom.

� Autre possibilité : la procédure Between, qui utilise les va-

riations entre les individus :

BY = BX� + B� +B";

� = [(BX)0(BX)]�1

(BX)0BY = [X 0BX]

�1X0BY:

Cet estimateur utilise les di�érences entre les moyennes indivi-

duelles des variables du modèle.

Si X1 varie dans le temps seulement, BX1 = f 1T

PTt x1itgi;t =

�x1 8i, et le terme constant (ordonnée à l'origine) n'est pas identi�é.

Une remarque concernant le calcul de l'estimateur de la

variance-covariance. Dans le modèle QY = QX� + Qu, les

14

logiciels statistiques diviseraient RSS par NT � K (e�ets �xes

exclus). Mais dans le modèle Y = X�+E +�+ ", la RSS serait

divisée par N(T � 1)�K.

L'estimateur de la variance dans le modèle à e�ets �xes doit être

multiplié par (NT �K)=[N(T � 1)�K].

Y

X

Between

Within

y

�

Æ

�1

�2

�3

................................................................................

...........

15

2.2.4 Tests de �poolability� et e�ets individuels

�Poolability�

Comme avant :yit = �i + xit�i + "it

versus

yit = �i + xit� + "it;

mais maintenant xit est un vecteur 1�K.

H0 : �1 = �2 = � � � = �N(= �) (K(N � 1) contraintes).

La statistique de test de Fisher est :

(RRSS � URSS)=K(N � 1)

URSS=N(T �K � 1)v F (K(N � 1); N(T �K � 1)) ;

où RRSS : de la régression Within

et URSS : =PN

i=1RSSi où RSSi = Syyi � S2xyi=Sxxi.

Test des e�ets individuels

H0 : �1 = � � � = �N(= �).

yit = � + xit� + "it (MCO)

versus

yit = �i + xit� + "it (Within):

La statistique de test de Fisher est :

(RRSS � URSS)=(N � 1)

URSS=(NT �N �K)v F ((N � 1); NT �N �K)) ;

où RRSS : provient de la régression MCO sur les données fusion-

nées (�pooled data�)

et URSS : provient de la régression Within (LSDV) .

16

2.3 Le modèle à e�ets aléatoires

2.3.1 Notations et hypothèses

Problème avec le modèle E�ets Fixes : perte de (beaucoup de)

degrés de liberté quand N !1. Approche di�érente : traiter les

e�ets individuels comme des e�ets aléatoires, i.e., l'inférence sur

le modèle est marginale (non conditionnelle aux �i) par rapport

à la population de tous les e�ets.

Hypothèses :

�i v IID(0; �2�); "it v IID(0; �2

"); E(�i"it) = E(�ixit) = 0;

avec

E(�i�j) =

��2� si i = j;

0 sinon;

E("it"sj) =

��2" si i = j et t = s;

0 sinon:

Ainsi cov(uit; ujs) = �2� + �

2" si i = j et t = s, et �2

� si i = j et

t 6= s.

Soit

T = E(uiu0i) =

26664�2� + �

2" �

2� � � � �

2�

�2� �

2� + �

2" � � � �

2�

... � � � � � � ...

�2� �

2� � � � �

2� + �

2"

37775 ;

une matrice (T � T ), pour chaque individu i, i = 1; 2; : : : ; N .

On a

E(uu0) = = IN T = IN ��2�(eTe

0T ) + �

2"IT

�= IN

��2�(T � BT ) + �

2"(QT + BT )

�17

puisque QT = IT � BT and BT = (1=T )eTe0T . Par conséquent,

= IN ��2�(T � BT ) + �

2"(QT + BT )

�= T�

2�B + �

2"INT

ou de façon équivalente : = �2"Q+ (T�2

� + �2")B.

2.3.2 Estimation par Moindres Carrés Généralisés du Modèle à

E�ets Aléatoires

Forme générale : Y = X� + U; with E(UU 0) = .

Les Moindres Carrés Généralisés (MCG, GLS en anglais) four-

nissent des estimations e�caces (de variance minimum) de �, �2�

et �2" , basées sur une structure connue de variance-covariance .

�MCG =�X0�1X

��1X0�1Y

et V ar(�MCG) = �2"

�X0�1X

��1.

Calcul de �1 : utilisation de la formule

r = (�2")rQ+ (T�2

� + �2")rB

pour un scalaire arbitraire r. On se base sur les propriétés d'idem-

potence et d'orthogonalité de Q and B.

En particulier, des matrices utiles sont

�1 =1

�2"

Q+1

T�2� + �2

"

B

et

�1=2 =1

�"Q+

1

(T�2� + �2

")1=2

B:

On a �MCG =�X0�1X

��1X0�1Y

=

"X0�

�2"

��1X

#�1 "X0�

�2"

��1Y

#:

18

=hX0 (Q+ �B)

�1X

i�1 hX0 (Q+ �B)

�1Y

i;

où � = (T�2� + �

2")=�

2" = 1 + T�

2�=�

2" .

Les MCG comme des Moindres Carrés Pondérés. Pré-

multiplions le modèle par �"�1=2 et utilisons la formule MCO :

Y� = X

�� + u

�, où

Y� = �"

�1=2Y =

�Q+

�"

(�" + T��)1=2B

�Y

X� = �"

�1=2X =

�Q+

�"

(�" + T��)1=2B

�X;

de sorte que Y� = (Q + �

�1=2B)Y; X� = (Q + �

�1=2B)X; et

sous forme scalaire :

fy�itg = (yit � �yi) + ��1=2�yi = yit � (1� 1p

�)�yi

fx�itg = (xit � �xi) + ��1=2�xi = xit � (1� 1p

�)�xi:

2.3.3 Comparaison entre les MCG, MCO et E�ets Fixes

�MCG =

�X0QX +

1

�X0BX

��1�X0QY +

1

�X0BY

�

�Within = (X 0QX)�1X 0

QY; �Between = (X 0BX)�1X 0

BY;

de sorte que

�MCG = S1�Within + S2�Between;

19

où S1 = [X 0QX + 1

�X0BX]�1X 0

QX et

S2 = [X 0QX + 1

�X0BX]�1X

0BX�

.

� (i) Si �2� = 0, alors 1=� = 1 et �MCG = �MCO.

� (ii) Si T !1, alors 1=�! 0 et �MCG ! �Within.

� (iii) Si 1=�!1, alors �MCG ! �Between.

� (iv) V ar(�Within) � V ar(�MCG) est une matrice semi-dé�nie

positive.

� (v) Si 1=�! 0, alors V ar(�Within)! V ar(�MCG).

2.3.4 E�ets individuels �xes ou aléatoires ?

Problème crucial en économétrie des panels : comment traiter

les e�ets �i ? Comme des paramètres ou comme des e�ets aléa-

toires ?

) Si l'inférence est limitée aux individus spéci�ques dans l'échan-

tillon : inférence conditionnelle, on utilise les E�ets Fixes. Exemple :

Les individus ne sont pas sélectionnés aléatoirement, ou bien toutes

les entreprises dans un secteur donné sont sélectionnées.

) Si l'inférence porte sur la population totale : inférence margi-

nale (non conditionelle), on utilise les E�ets Aléatoires. Exemple :

Les individus sont sélectionnés au hasard à partir d'une (grande)

population (consommateurs).

20

Quelques critères de choix En pratique

� Interprétation des e�ets dans le modèle économique ;

� Processus d'échantillonnage : purement aléatoire ou non ;

� Nombre d'individus (pays, régions, ménages,...) ;

� Interchangeabilité des individus ;� Endogénéité des Xit (voir plus loin).

Terminologie Lorsque l'on considère des e�ets �xes individuels,

procédure d'estimation Fixed-E�ects ou Within. Avec des ef-

fets aléatoires, procédure d'estimationMCG (Moindres Carrés

Généralisés).

L'estimateur MCG est une moyenne pondérée des estimateurs

Within et Between, où le poids est l'inverse de la variance cor-

respondante.

L'estimateur Within néglige les variations entre les individus, l'es-

timateur Between néglige les variations

temporelles pour un individu, et en�n les MCO donnent un poids

égal aux variations Within et Between.

Note. Si le modèle contient une ordonnée à l'origine :

yit = �+ xit� + �i + "it;

on utiliseB�B �B au lieu de B (pour éliminer �) dans les formules.

21

2.3.5 Estimateurs �Best Quadratic Unbiased Estimators� (BQU)

des variances

Si les erreurs sont normales, les estimations BQU de �2� et �2

"

s'obtiennent à partir de

�2" = u

0Qu=tr(Q) =

PNi=1

PTt=1(uit � �ui)

2

N(T � 1)

et \�2" + T�2

� = u0Bu=tr(B) = T

NXi=1

�u2i=N;

car tr(Q) = N(T � 1) and tr(B) = N .

Mais en pratique, les uit sont inconnus et l'on doit estimer les

variances à partir de uit.

1/ Wallace et Hussain (1969) : Utiliser les résidus MCO à la place

des vrais u ;

2/ Amemiya (1971) : Utiliser les résidus estimés LSDV. On a� pNT (�2

" � �2")p

N(�2� � �

2�)

�v N

�0;

�2�4

" 0

0 2�4�

��;

où �2� =

�\�2" + T�2

� � �2"

�=T .

3/ Swamy et Arora (1972) : Utiliser les erreurs quadratiques moyennes

des régressions Within et Between.

Erreur quadratique moyenne de la régression Within :

�2" =

�Y0QY � Y

0QX(X 0

QX)�1X 0QY�=[N(T � 1)�K]

et de la régression Between :

\�2" + T�2

� =�Y0BY � Y

0BX(X 0

BX)�1X 0BY�=[N �K � 1]:

22

Note : Ordonnée à l'origine dans les régresseurs Between (X), pas

dans la régression Within.

4/ Nerlove (1971) : Calculer �2� = 1

N�1

PNi=1(�i� ��i)

2, où �i sont

des �paramètres� estimés associés aux indicatrices individuelles de

la régression LSDV. Et �2" est estimé à partir de la régression Wi-

thin.

La méthode d'estimation MCG ci-dessus avec les composantes des

variances remplacées par des estimateurs convergents : �Feasible

GLS�, MCG Admissibles.

23

2.4 Exemple : Demande d'eau des ménages

Utilisation des logiciels SAS et GAUSS.

Dé�nition des variables :

� LCONSO : log de la consommation d'eau potable par tête ;

� LPRICE : log du prix moyen de l'eau distribué, par mètre cube ;

� LREVENUE : log du revenu par tête.

Nombre d'observations : 696 (N = 116, T = 6).

Equation linéaire en log :

logQit = �i + � log pit + logRit + "it:

Utilité : calculer les élasticités-prix et revenu :

�P =@Q

@p� p

Q=@ logQ

@ log p= �; �R =

@Q

@R�RQ

=@ logQ

@ logR= :

24

Exemple : Le logiciel Gauss c

/* DYNTAB.PRG 16 01 2001 Residential water use */

new ; clear all ;

library tscs,pgraph ;

tscsset ;graphset ;

output �le=d :/dea/panel/dyntab.out reset ;

output on ;

n=116 ; t=6 ;

load x[n*t,6]=d :/dea/panel/dyntab3.dat ;

id=x[.,1] ;

year=x[.,2] ;

conso=ln(x[.,3]) ;

price=ln(x[.,4]) ;

revenue=ln(x[.,5]) ;

precip=ln(x[.,6]) ;

vnames="year","conso","price","revenue","precip","id" ;

call saved(year�conso�price�revenue�precip�id,"wat�le",vnames) ;

y= conso ;

x= price,revenue ;

grp= id ;

__title("Water demand equation") ;

call tscs("wat�le",y,x,grp) ;

25

=====================================================================

TSCS Version 3.1.2 1/17/01 3 :51 pm

=====================================================================

Data Set : watfile

��-

�� OLS DUMMY VARIABLE RESULTS ��-

��

Dependent variable : conso

��

Observations : 696

Number of Groups : 116

Degrees of freedom : 578

Residual SS : 2.578

Std error of est : 0.067

Total SS (corrected) : 2.891

F = 35.033 with 2,578 degrees of freedom

P-value = 0.000

Var Coef. Std. Coef. Std. Error t-Stat P-Value

��- ��- �� -

price -0.134245 -0.347461 0.018447 -7.277506 0.000

revenue 0.024386 0.035045 0.033223 0.734009 0.463

Group Number Dummy Variable Standard Error

1 4.643484 0.365639

2 4.876781 0.370063

3 5.252595 0.369474

... ... ... ... ... ... ...

114 4.839490 0.365496

115 4.858434 0.359065

116 5.099257 0.366957

F-statistic for equality of dummy variables :

F(115, 578) = 58.3964 P-value : 0.0000

26

��

OLS ESTIMATE OF CONSTRAINED MODEL

��

��


��

Observations : 696



R-squared : 0.172

Rbar-squared : 0.170

Residual SS : 32.532




P-value = 0.000


��- ��- ��

CONSTANT 1.164761 �- 0.598014 1.947715 0.052

price -0.249873 -0.406149 0.022153 -11.279345 0.000

revenue 0.376643 0.257121 0.052746 7.140637 0.000

��-

FULL, RESTRICTED, AND PARTIAL R-SQUARED TERMS�DUMMY VARIABLES ARE CONSTRAINED

��-

TABLE OF R-SQUARED TERMS

��-R-squared�full model : 0.934

R-squared�constrained model : 0.172

Partial R-squared : 0.921��-

��

FULL, RESTRICTED, AND PARTIAL R-SQUARED TERMS�X VARIABLES ARE CONSTRAINED

27

��-

TABLE OF R-SQUARED TERMS

��-

R-squared�full model : 0.934

R-squared�constrained model : 0.926

Partial R-squared : 0.108��-

��-

GLS ERROR COMPONENTS RESULTS

��-

��


��

Observations : 696



Residual SS : 3.135




P-value = 0.000

Std. errors of error terms :

Individual constant terms : 0.206

White noise error : 0.067


��- ��- ��

CONSTANT 4.687235 �- 0.355285 13.192903 0.000

price -0.149316 -0.363264 0.017623 -8.472974 0.000

revenue 0.053560 0.071009 0.032338 1.656247 0.098

28

Group Number Random Components

1 -0.346522

2 -0.121608

3 0.250638

4 -0.020350

5 0.128761

... ... ... ...

112 0.512636

113 -0.216224

114 -0.151243

115 -0.125587

116 0.104064

Lagrange Multiplier Test for Error Components Model

Null hypothesis : Individual error components do not exist.

Chi-squared statistic (1) : 1367.1014

P-value : 0.0000

29

3 Extensions

3.1 Le modèle linéaire de panel Type II

La structure d'erreur est de la forme :

uit = �i + �t + "it i = 1; 2; : : : ; N; t = 1; 2; : : : ; T;

ou sous forme matricielle :

U = (IN eT )� + (eN IT )�+ ";

avec � = (�1; : : : ; �N)0 et � = (�1; : : : ; �T )

0.

3.1.1 Le modèle à e�ets �xes

�i et �t sont traités comme des paramètres �xes, l'inférence est

menée conditionnellement aux N individus sur la période 1! T .

3.1.2 Notations

L'estimateur e�ets �xes est obtenu en utilisant le nouvel opé-

rateur :

Q = IN IT � IN (eTe0T=T )� (eNe

0N=N) IT ;

de sorte que Qu = fuit � �ui � �utgit :En prenant la moyenne sur les individus, nous avons

�yt = �xt� + �t + �"t avec la contrainte

NXi=1

��i = 0:

Et en prenant la moyenne sur les périodes :

�yi = �xi� + ��i + �"i avec la contrainte

TXt=1

�t = 0;

30

Les MCO sur les écarts aux moyennes donnent :

� = (X 0QX)�1X 0

QY;

�i = �yi � �xi�;

�t = �yt � �xt�:

Si le modèle contient un terme constant, l'opérateurQ devient :

Q = IN IT � IN (eTe0T=T )� (eNe

0N=N) IT

+(eNe0N=N) (eTe

0T=T )

de sorte que Qu = fuit � �ui � �ut + �ugit, et l'estimateur Within

est� = (X 0

QX)�1X 0QY;

�i = (�yi � �y)� (�xi � �x)�;

�t = (�yt � �y)� (�xt � �x)�:

Test des e�ets 1/ H0 : �1 = � � � = �N = �1 = � � � = �T = 0.

Statistique de test de Fisher :

(RRSS � URSS)=(N + T � 2)

URSS=[(N � 1)(T � 1)�K]v F (k1; k2);

où

k1 = N + T � 2; k2 = (N � 1)(T � 1)�K); et

URSS (RSS Non contrainte) : à partir du modèle Within,

RRSS : (RSS contrainte) : à partir des MCO sur données fusionnées.

2/ H0 : �1 = � � � = �N = 0 étant donné �t 6= 0; t � T � 1.


(RRSS � URSS)=(N � 1)

URSS=[(N � 1)(T � 1)�K]v F (k1; k2);

31

où

k1 = N � 1; k2 = (N � 1)(T � 1)�K); et

URSS : du modèle Within,

RRSS : de la régression avec indicatrices temporelles seulement :

(yit � �yt) = (xit � �xt)� + (uit � �ut):

3/ H0 : �1 = � � � = �T�1 = 0 étant donné �i 6= 0; i � N � 1.


(RRSS � URSS)=(T � 1)

URSS=[(N � 1)(T � 1)�K]v F (k1; k2);

où

k1 = T � 1; k2 = (N � 1)(T � 1)�K); et

URSS : du modèle Within,

RRSS : de la régression Within comme dans le modèle de Type I :

(yit � �yi) = (xit � �xi)� + (uit � �ui):

32

3.1.3 Exemple : Fonction de production agricole (Hoch, 1962)

Echantillon : 63 agriculteurs du Minnesota (US), sur la période

1946-1951.

Estimation d'une fonction de production Cobb-Douglas :

logProduitit = �0 + �1 logTravailit + �2 logFoncierit+�3 logMachinesit + �4 logEngraisit:

Motivation pour incorporer des e�ets spéci�ques (dans uit) :

� Climat, identique a priori entre les exploitations (�t) ;

� Facteurs spéci�ques à l'exploitation (qualité du sol, savoir-faire,

etc.) (�i).

Tab. 1 � Résultats d'estimation - Fonction de production Cobb-

DouglasHypothèse

(I) (II) (III)

Estimation �i = �t = 0 �i = 0 �t = 0

�1 (Travail) 0.256 0.166 0.043

�2 (Foncier) 0.135 0.230 0.199

�3 (Machines) 0.163 0.261 0.194

�4 (Engrais) 0.349 0.311 0.289

Somme des � 0.904 0.967 0.726�R2 0.721 0.813 0.884

33

Exemple : Le logiciel SAS c

* ;

* DYNTAB.SAS ;

* ;

* Uses datafile DYNTAB3.DAT ;

* ;

* Create library and file names ;

* Change directory information below ;

libname water 'd :/dea/panel' ;

filename watfile 'd :/dea/panel/dyntab3.dat' ;

* Create SAS table and read data from Ascii file ;

data wat ;

infile watfile ;

input id year conso price revenue precip ;

* Compute logs ;

lconso=log(conso) ; lprice=log(price) ;

lrevenue=log(revenue) ;

run ;

* Descriptive statistics ;

proc means data=wat ;run ;

* OLS regression ;

proc reg data=wat ;

model lconso = lprice lrevenue ;

run ;

* Model 1 : One-way Fixed effects ;

34

* cs=116 : Set the number of cross-sections ;

* option /fixone : Set one-way Fixed-effect ;

proc tscsreg data=wat cs=116 ;

model lconso= lprice lrevenue /fixone ;

run ;

* Model 2 : Two-way Fixed effects ;

* option /fixtwo : Set two-way Fixed-effect ;


model lconso= lprice lrevenue /fixtwo ;

run ;

* Model 3 : One-way Random effects ;

* option /ranone : Set one-way Random-effect ;


model lconso= lprice lrevenue /ranone ;

run ;

* Model 4 : Two-way Random effects ;

* option /rantwo Set Two-way Random-effect ;


model lconso= lprice lrevenue /rantwo ;

run ;

* Model 5 : One-way Random effects with AR(1) ;

* option /ranone parks rho Set One-way Random-effect ;

* and compute RHO : Ar(1) parameter ;


model lconso= lprice lrevenue /ranone parks rho ;

run ;

* Compute parameter estimates on each cross section ;

proc sort data=wat ;

by year ;

35

proc reg data=wat ;

model lconso= lprice lrevenue ;

by year ;

run ;

* Compute Within and Between estimates ;

* using the MEANS procedure ;

proc sort data=wat ;

by id ;

proc means data=wat noprint ;

var lconso lprice lrevenue ;

by id ;

output out=out1 mean=mconso mprice mrevenue ;

data out1 ;set out1 ;

keep id mconso mprice mrevenue ;

data wat ;

merge wat out1 ;

by id ;

data wat ;set wat ;

qconso=lconso-mconso ; qprice=lprice-mprice ;

qrevenue=lrevenue-mrevenue ;

* Within regression ;

proc reg data=wat ;

model qconso = qprice qrevenue ;

run ;

* Between regression ;

proc reg data=wat ;

model mconso = mprice mrevenue ;

run ;

36

ESTIMATES USING TSCSREG PROCEDURE

MODEL 1. ONE-WAY FIXED EFFECTS

The SAS System 16 :15 Monday, January 22, 2001 3

TSCSREG Procedure

Dependent Variable : LCONSO

Model Description

Estimation Method FIXONE

Number of Cross Sections 116

Time Series Length 6

Model VarianceSSE 2.578099 DFE 578

MSE 0.00446 Root MSE 0.066786

RSQ 0.9344

F Test for No Fixed EffectsNumerator DF : 115 F value : 58.3964

Denominator DF : 578 Prob.>F : 0.0000

Parameter Estimates

Parameter Standard T for H0 : Variable

Variable DF Estimate Error Parameter=0 Prob > |T| Label

CS 1 1 -0.455773 0.039463 -11.549433 0.0001 Cross Sec

CS 2 1 -0.222476 0.039923 -5.572620 0.0001 Cross Sec

CS 3 1 0.153338 0.038900 3.941882 0.0001 Cross Sec

CS 4 1 -0.131488 0.039174 -3.356518 0.0008 Cross Sec

CS 5 1 0.027422 0.038890 0.705132 0.4810 Cross Sec

... ... ... ... ... ... ... ...

CS 112 1 0.420843 0.040309 10.440506 0.0001 Cross Sec

CS 113 1 -0.322888 0.039376 -8.200102 0.0001 Cross Sec

CS 114 1 -0.259767 0.038678 -6.716134 0.0001 Cross Sec

CS 115 1 -0.240823 0.039379 -6.115479 0.0001 Cross Sec

INTERCEP 1 5.099257 0.366957 13.896065 0.0001 Intercept

LPRICE 1 -0.134245 0.018447 -7.277506 0.0001

LREVENUE 1 0.024386 0.033223 0.734009 0.4632

37

MODEL 2. TWO-WAY FIXED EFFECTS


TSCSREG Procedure


Model Description

Estimation Method FIXTWO



Model VarianceSSE 2.205671 DFE 573

MSE 0.003849 Root MSE 0.062043

RSQ 0.9439

F Test for No Fixed EffectsNumerator DF : 120 F value : 65.6530

Denominator DF : 573 Prob.>F : 0.0000

Parameter EstimatesParameter Standard T for H0 : Variable


CS 1 1 -0.535192 0.040793 -13.119702 0.0001 Cross Sec

CS 2 1 -0.302435 0.041809 -7.233670 0.0001 Cross Sec

CS 3 1 0.120803 0.037066 3.259125 0.0012 Cross Sec

... ... ... ... ... ... ... ...

CS 114 1 -0.288486 0.036463 -7.911820 0.0001 Cross Sec

CS 115 1 -0.256215 0.036669 -6.987209 0.0001 Cross Sec

TS 1 1 -0.102087 0.017883 -5.708681 0.0001 Time Seri

TS 2 1 -0.047565 0.016463 -2.889216 0.0040 Time Seri

TS 3 1 -0.030524 0.014486 -2.107135 0.0355 Time Seri

TS 4 1 -0.007359 0.012507 -0.588378 0.5565 Time Seri

TS 5 1 -0.025528 0.009992 -2.554900 0.0109 Time Seri


LPRICE 1 -0.251061 0.034210 -7.338896 0.0001

LREVENUE 1 -0.053316 0.033244 -1.603773 0.1093

MODEL 3. ONE-WAY RANDOM EFFECTS

38


TSCSREG Procedure


Model Description

Estimation Method RANONE



Variance Component Estimates

SSE 3.12498 DFE 693

MSE 0.004509 Root MSE 0.067152

RSQ 0.1087

Variance Component for Cross Sections 0.043243

Variance Component for Error 0.004460

Hausman Test for Random Effects

Degrees of Freedom : 2

m value : 14.4912 Prob. > m : 0.0007




LPRICE 1 -0.149074 0.017611 -8.465039 0.0001

LREVENUE 1 0.053077 0.032306 1.642977 0.1008

39

MODEL 4. TWO-WAY FIXED EFFECTS


TSCSREG Procedure


Model Description

Estimation Method RANTWO



Variance Component Estimates

SSE 2.707154 DFE 693

MSE 0.003906 Root MSE 0.062501

RSQ 0.0907

Variance Component for Cross Sections 0.043638

Variance Component for Time Series 0.000746

Variance Component for Error 0.003849

Hausman Test for Random Effects

Degrees of Freedom : 2

m value : 22.2377 Prob. > m : 0.0000




LPRICE 1 -0.225151 0.027604 -8.156464 0.0001

LREVENUE 1 -0.018251 0.032401 -0.563297 0.5734

40

WITHIN REGRESSION USING PROC REG

Analysis of Variance

Sum of Mean

Source DF Squares Square F Value Prob>F

Model 2 0.31252 0.15626 42.003 0.0001

Error 693 2.57810 0.00372

c Total 695 2.89062

Root MSE 0.06099 R-square 0.1081

Dep Mean -0.00000 Adj R-sq 0.1055

C.V. -1.291786E17



INTERCEP 1 -5.28092E-17 0.00231195 -0.000 1.0000

QPRICE 1 -0.134245 0.01684666 -7.969 0.0001

QREVENUE 1 0.024386 0.03034107 0.804 0.4218

BETWEEN REGRESSION USING PROC REG

Analysis of Variance

Sum of Mean

Source DF Squares Square F Value Prob>F

Model 2 7.13103 3.56551 84.369 0.0001

Error 693 29.28684 0.04226

C Total 695 36.41786

Root MSE 0.20557 R-square 0.1958

Dep Mean 4.99481 Adj R-sq 0.1935

C.V. 4.11576



INTERCEP 1 -0.176444 0.68091356 -0.259 0.7956

MPRICE 1 -0.259461 0.02278084 -11.389 0.0001

MREVENUE 1 0.494483 0.05958703 8.298 0.0001

41

3.2 Panels non cylindrés

3.2.1 Introduction

Dé�nition : Le nombre de périodes est di�érent entre les individus.

Pour l'individu i, nous avons Ti périodes, et le nombre total d'ob-

servations est maintenantPN

i=1 Ti (au lieu de NT auparavant).

Exemples

� Entreprises : peuvent fermer, ou être des nouveaux entrants dans

le secteur ;

� Consommateurs : peuvent démenager, décéder, refuser de ré-

pondre ;

� Salariés : Chômage, changement de statut, etc.

Problème de l'attrition : la probabilité qu'un individu reste dans

l'échantillon diminue au fur et à mesure que le nombre de périodes

augmente.

3.2.2 Modèles à e�ets �xes pour panels non-cylindrés

Le modèle à e�ets �xes de type I pour panel non-cylindré Consi-

dérons le modèle non-cylindré avec T1 = 3 et T2 = 2 :0BBBB@

y11

y12

y13

y21

y22

1CCCCA =

0BBBB@

x11

x12

x13

x21

x22

1CCCCA � +

0BBBB@

�1

�1

�1

�2

�2

1CCCCA+

0BBBB@

"11

"12

"13

"21

"22

1CCCCA :

Pour éliminer �, nous avons besoin d'un nouvel opérateur Within :

Q� =

�I3 � e3e

03=3 0

0 I2 � e2e02=2

�

42

=

266664

2=3 �1=3 �1=3 0 0

�1=3 2=3 �1=3 0 0

�1=3 �1=3 2=3 0 0

0 0 0 1=2 �1=20 0 0 �1=2 1=2

377775 ;

et la même procédure que dans le cas cylindré s'applique :

�Within = (X 0Q�X)

�1X0Q�Y

où Q� = diag(ITi � eTie0Ti=Ti)ji=1;2;:::;N .

43

4 Le modèle de panel �augmenté�

Que sont les modèles de panel �augmentés� ? Implication pour l'es-

timation ? Techniques spéciales d'estimation lorsque les MCG ne

sont plus appropriés.

4.1 Introduction

Considérons le modèle

yit = xit� + zi + �i + "it; i = 1; 2; : : : ; N; t = 1; 2; : : : ; T;

avec xit un vecteur 1�K de régresseurs variant dans le temps et

entre les individus, et zi un vecteur 1 � G de régresseurs spéci-

�ques à l'individu (invariant dans le temps).

Exemple :

logSALAIRE = �1HEURES+ 1EDUC+ 2SEXE+�i+"it:

Méthode d'estimation :

� Within : n'est pas identi�able car

QY = QX� + (I �B)Z +Q�+Q" = QX� +Q";

puisque BZ = Z. Seul � est identi�able. Mais une procédure en

2 étapes est possible :

1/ Régression Within ) � ;

2/ Régression Between sur

�yi � �xi� = �i + Zi + �"i; i = 1; 2; : : : ; N;

44

pour estimer les .

� MCG : A la fois � et sont identi�ables.

4.2 Choix entre Within et MCG

L'un des critères de choix entre Within et MCG : présence de

zi dans le modèle.

Rappel : L'estimateur MCG est convergent et e�cace à la condi-

tion que les régresseurs soient exogènes :

E(�ixit) = 0 et E(�izi) = 0 8i; t:

Considérons le modèle non-augmenté yit = xit� + �i + "it.

Si xit est endogène dans le sens E(�ixit) 6= 0, alors les MCG ne

sont pas convergents :

�MCG = � +�X0�1X

��1 �X0�1U

�= � +

�X0 �Q+ �

�1B�X��1 �

X0 �Q+ �

�1B�U�;

où � = 1 + T�2�=�

2" , de sorte que�

X0 �Q+ �

�1B�U�= [X 0

Q"+X0(B� +B")=�]

= 0 +X0B�=� + 0 = X

0�=� 6= 0;

car E(X 0") = 0 and B� = �.

Même problème avec le modèle augmenté, si E(X 0�) 6= 0 et/ou

E(Z 0�) 6= 0.

45

Conséquence importante en practique : Si les (certains)

régresseurs sont endogènes, les estimateurs MCG ne sont pas

convergents, mais les estimateurs Within le sont car � est éliminé.

Un autre critère de choix entre Within et MCG :

� Si régresseurs endogènes) Choisir l'estimation Within (mais

n'est pas identi�é) ;

� Si tous les régresseurs sont exogènes, utiliser les MCG (les plus

e�caces).

Trois problèmes demeurent :

� toujours pas identi�é, car dans la régression Between

�yi � �xi� = zi + �i + �"i,

zi reste corrélé avec �i.

� Si l'on utiliser les Within, tous les régresseurs sont traités comme

endogènes (pas de distinction entre xit exogènes et endogènes).

� Les estimateurs Within ne sont pas e�caces.

4.3 Un important test de l'endogénéité

Hypothèse nulle : H0 : E(X 0�) = E(Z 0�) = 0 (exogénéité).

Comparaison entre 2 estimateurs :

�MCG �Within

H0 Convergent, Convergent,

e�cace pas e�cace

Alternative Pas convergent Convergent

Hausman (1978) : Même si les xit sont exogènes, les estimateurs

MCG de ne sont pas convergents dans le modèle augmenté. Par

46

conséquent, on peut tester l'exogénéité en utilisant les paramètres

estimés de � seulement.

Statistique de test de Hausman : Sous H0,

HT =��Within � �MCG

�0 hV ar(�Within)� V ar(�MCG)

i�1��Within � �MCG

�v �

2(K):

Remarques

� �MCG et �Within doivent avoir les mêmes dimensions.

� La matrice de pondérationhV ar(�Within)� V ar(�MCG)

iest

positive : les MCG sont plus e�caces que les Within sous l'hypo-

thèse nulle.

Rappel : V ar(�MCG) = �2"(X

0QX + �X

0BX)�1 et V ar(�w) =

�2"(X

0QX)�1.

Interprétation du nombre de degrés de liberté du test :

L'estimateurWithin est basé sur la condition E(X 0QU) = 0, alors

que le MCG est basé sur E(X 0�1U) = 0 ) E(X 0QU) = 0 et

E(X 0BU) = 0.

Pour les MCG, nous ajoutons K conditions supplémentaires (en

termes de B) : rang de X. Le test d'Hausman utilise ces restric-

tions additionnelles.

47

___ ____ ____ ____ ____tm /__ / ____/ / ____/ ___/ / /___/ / /___/ Statistics/Data Analysis ------------------------------------------------------------------------------- log: E:\dea\panel\2004\energy.smcl log type: smcl opened on: 15 Apr 2004, 21:59:56 1 . use energy 2 . desc Contains data from energy.dta obs: 1,003 vars: 16 15 Apr 2004 21:59 size: 68,204 (93.0% of memory free) ------------------------------------------------------------------------------- storage display value variable name type format label variable label ------------------------------------------------------------------------------- pgn float %9.0g Prix gaz naturel eff float %9.0g Effectifs employes pk float %9.0g Prix electricite we float %9.0g Part cout energie : electricite wg float %9.0g Part cout energie : gaz wfl float %9.0g Part cout energie : fuel lourd wfd float %9.0g Part cout energie : fuel domestique wbp float %9.0g Part cout energie : Butane - Propane lnpk float %9.0g Log prix electricite lnpgn float %9.0g Log prix gaz naturel, normalise par prix electricite lnpfl float %9.0g Log prix fuel lourd, normalise par prix electricite lnpfd float %9.0g Log prix fuel domestique, normalise par prix electricite lnpbp float %9.0g Log prix Butane-Propane, normalise par prix electricite annee float %9.0g Annee sire float %9.0g Identifiant entreprise leff float %9.0g Log effectifs employes ------------------------------------------------------------------------------- Sorted by: sire annee 3 . sum Variable | Obs Mean Std. Dev. Min Max -------------+----------------------------------------------------- pgn | 1003 1593.143 575.2697 649.3506 4935.065 eff | 1003 196.7009 165.1831 0 1200 pk | 1003 3591.579 12531.49 76 270000 we | 1003 .6535525 .1700342 .0755102 .989083 wg | 1003 .2682747 .1811665 .0017207 .9244898 wfl | 1003 .0336884 .1027124 0 .7529242 wfd | 1003 .0405599 .0892802 0 .5299442 wbp | 1003 .0039245 .0116155 0 .1561713 lnpk | 1003 7.536383 .2859703 6.365459 8.255204 lnpgn | 1003 -12.74313 1.400228 -18.18878 -9.613284 lnpfl | 1003 -12.56832 1.226006 -17.68294 -9.556078 lnpfd | 1003 -12.48682 1.189972 -17.26859 -9.694551 lnpbp | 1003 -12.45441 1.183546 -17.36138 -9.731269 annee | 1003 1990.54 3.847273 1983 1996 sire | 1003 5.49e+15 2.17e+15 5.48e+13 9.46e+15 leff | 1002 5.044025 .663634 3.332205 7.090077

4 . xtreg wg lnpgn lnpfl lnpfd lnpbp leff, i(sire) fe Fixed-effects (within) regression Number of obs = 1002 Group variable (i) : sire Number of groups = 110 R-sq: within = 0.1410 Obs per group: min = 1 between = 0.0733 avg = 9.1 overall = 0.0366 max = 14 F(5,887) = 29.12 corr(u_i, Xb) = -0.1955 Prob > F = 0.0000 ------------------------------------------------------------------------------ wg | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- lnpgn | -.1537251 .0181908 -8.45 0.000 -.1894272 -.1180229 lnpfl | .1140461 .0207206 5.50 0.000 .073379 .1547132 lnpfd | -.0047182 .0254882 -0.19 0.853 -.0547425 .045306 lnpbp | .1014905 .0164493 6.17 0.000 .0692063 .1337747 leff | -.0160971 .0193974 -0.83 0.407 -.0541674 .0219731 _cons | 1.029037 .1338883 7.69 0.000 .7662621 1.291812 -------------+---------------------------------------------------------------- sigma_u | .14842561 sigma_e | .09943612 rho | .69021761 (fraction of variance due to u_i) ------------------------------------------------------------------------------ F test that all u_i=0: F(109, 887) = 12.30 Prob > F = 0.0000 5 . xtreg wg lnpgn lnpfl lnpfd lnpbp leff, i(sire) re Random-effects GLS regression Number of obs = 1002 Group variable (i) : sire Number of groups = 110 R-sq: within = 0.1239 Obs per group: min = 1 between = 0.4670 avg = 9.1 overall = 0.2909 max = 14 Random effects u_i ~ Gaussian Wald chi2(5) = 187.45 corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000 ------------------------------------------------------------------------------ wg | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- lnpgn | -.2144363 .0167928 -12.77 0.000 -.2473497 -.181523 lnpfl | .1528693 .0200142 7.64 0.000 .1136423 .1920964 lnpfd | .0070502 .0252708 0.28 0.780 -.0424797 .05658 lnpbp | .0799307 .0155383 5.14 0.000 .0494761 .1103852 leff | -.0083034 .0143499 -0.58 0.563 -.0364287 .0198219 _cons | .575301 .0904628 6.36 0.000 .3979972 .7526048 -------------+---------------------------------------------------------------- sigma_u | .09913539 sigma_e | .09943612 rho | .49848553 (fraction of variance due to u_i) ------------------------------------------------------------------------------

6 . xthausman Hausman specification test ---- Coefficients ---- | Fixed Random wg | Effects Effects Difference -------------+----------------------------------------- lnpgn | -.1537251 -.2144363 .0607113 lnpfl | .1140461 .1528693 -.0388232 lnpfd | -.0047182 .0070502 -.0117684 lnpbp | .1014905 .0799307 .0215598 leff | -.0160971 -.0083034 -.0077937 Test: Ho: difference in coefficients not systematic chi2( 5) = (b-B)'[S^(-1)](b-B), S = (S_fe - S_re) = 90.39 Prob>chi2 = 0.0000 7 . xtreg wg lnpgn lnpfl lnpfd lnpbp leff, i(sire) be Between regression (regression on group means) Number of obs = 1002 Group variable (i) : sire Number of groups = 110 R-sq: within = 0.0950 Obs per group: min = 1 between = 0.5116 avg = 9.1 overall = 0.3100 max = 14 F(5,104) = 21.78 sd(u_i + avg(e_i.))= .109751 Prob > F = 0.0000 ------------------------------------------------------------------------------ wg | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- lnpgn | -.4574283 .0462411 -9.89 0.000 -.5491261 -.3657306 lnpfl | .1751386 .0940214 1.86 0.065 -.0113093 .3615866 lnpfd | .2341099 .1059095 2.21 0.029 .0240874 .4441324 lnpbp | .0808667 .0512214 1.58 0.117 -.0207073 .1824407 leff | -.0404652 .0212932 -1.90 0.060 -.0826905 .0017601 _cons | .7752163 .146705 5.28 0.000 .4842948 1.066138 ------------------------------------------------------------------------------ 8 . predict alpha,u 9 . log close log: E:\dea\panel\2004\energy.smcl log type: smcl closed on: 15 Apr 2004, 22:08:27 -------------------------------------------------------------------------------

4.4 Estimation par la Variable Instrumentale : l'estima-

teur MCG de Hausman-Taylor

4.4.1 Estimation par la Variable Instrumentale

Méthode alternative : Estimation IV (� Instrumental Variable�).

Dans un contexte de coupe instantanée avec N observations :

Y = X� + "; E(X 0") 6= 0; E(W 0

") = 0;

où W est une matrice N � L d'instruments.

� Si K = L,

[W 0(Y �X�)] = 0 , (W 0Y ) = (W 0

X)�

� = (W 0X)�1W 0

Y (Estimateur IV):

� Si L > K,

[W 0(Y �X�)] = 0 (L conditions sur K paramètres)

et l'on construit la forme quadratique (Y �X�)0W (W 0W )�1W 0

�(Y �X�) où PW = W (W 0W )�1W 0

) � = (X 0P0WX)�1(X 0

PWY ):

Note : en général, les instrumentsW ne proviennent pas de l'équa-

tion.

4.4.2 IV dans un contexte de panel

� Prise en compte de la structure de variance-covariance () ;

� Trouver des instruments pertinents, non corrélés avec �.

Considérons le modèle augmenté général :

Y = X1�1 +X2�2 + Z1 1 + Z2 2 + � + ";

48

oùX1 : N �K1 exogène, varie selon i et t;

X2 : N �K2 endogène, varie selon i et t;

Z1 : N �G1 exogène, varie selon i;

Z2 : N �G2 endogène, varie selon i:

Posons � = (X 01; X

02; Z

01; Z

02) et � = (� 01; �

02;

01;

02)0.

Forme générale d'un estimateur de la variable instrumentale

pour données de panel : Soit Y � = �1=2Y , X� = �1=2X, et

�� = �1=2�. Nous avons

�IV =h��

0

PW��i�1 h

��0

PWY�i

=h�0�1=2PW�1=2�

i�1 h�0�1=2PW�1=2Y

i:

Calcul de �1=2 : comme dans le cas MCG usuel.

4.4.3 Hypothèses d'exogénéité et une première matrice d'instru-

ments

Hypothèses d'exogénéité : E(X 01�) = E(Z 01�) = 0

) Des instruments évidents sont X1 et Z1, pas su�sant car

K1 +G1 < K1 +K2 +G1 +G2.

Instruments supplémentaires : ne doicent pas être corrélés avec �.

Puisque � est la �source� de l'endogénéity, toute variable non cor-

rélée avec � sera un instrument valide. Les meilleurs instruments

valides sont fortement corrélés avec X2 et Z2.

QX1 etQX2 sont des instruments valides :E[(QX1)0�] = E[X 0

1Q�] =

0 et E[(QX2)0�] = E[X 0

2Q�] = 0.

Pour X1, équivalent d'utiliser BX1 car nous devons avoir

E[X 01

�1U ] = E[X 0

1(Q+ ��1B)U ] = E[X 0

1B(Q+ ��1B)U ]

49

puisque BQ = 0 et BB = B.

Matrice d'instruments de Hausman-Taylor (1981) :

WHT = [QX1; QX2; BX1; Z1] = [QX1; QX2; X1; Z1]:

Condition d'identi�cation : Nous avons K1+K2+G1+G2 para-

mètres à estimer, avec K1+K1+K2+G1 instruments (K1 +K2

instruments dans QX). Par conséquent, la condition d'identi�ca-

tion est K1 � G2.

4.4.4 Des procédures plus e�caces : Amemiya-MaCurdy et Breusch-

Mizon-Schmidt

Amemiya et MaCurdy (1986) Utilisent le fait que si xit est exo-

gène, nous pouvons partir des conditions : E(xit�i) = 0 8i; 8t aulieu de E(x0i�i) = 0.

Amemiya et MaCurdy (1986) suggèrent d'utiliser la matrice

X�1 dans la liste des instruments :

X�1 =

26666666666666664

x11 x12 : : : x1T (i = 1; t = 1)

x11 x12 : : : x1T (i = 1; t = 2)

: : : : : : : : : : : : : : :

x21 x22 : : : x2T (i = 2; t = 1)

x21 x22 : : : x2T (i = 2; t = 2)

: : : : : : : : : : : : : : :

xN1 xN2 : : : xNT (i = N; t = 1)

xN1 xN2 : : : xNT (i = N; t = 2)

: : : : : : : : : : : : : : :

xN1 xN2 : : : xNT (i = N; t = T )

37777777777777775

50

tel que QX�1 = 0 et BX�

1 = X�1 . La matrice d'instruments est

WAM = [QX;X�1 ; Z1], et un estimateur équivalent s'obtient en

utilisant

WAM = [QX; (QX1)�; BX1; Z1];

où (QX1)� est construit comme X�

1 ci-dessus.

Amemiya et MaCurdy : leur matrice d'instruments fournit un

estimateur au moins aussi e�cace que celui d'Hausman-Taylor, si

�i n'est pas corrélé avec les régrésseurs 8t.

Condition d'identi�cation : On ajoute (QX1)� à la liste des ins-

truments de Hausman-Taylor, mais comme [(QX1)�; X1] est de

rang K1, on ajoute seulement (T � 1)K1 instruments. La condi-

tion d'identi�cation est TK1 � G2.

Breusch, Mizon et Schmidt (1989) Estimateur encore plus e�-

cace : basé sur les conditions

E[(QX2it)0�i] = 0 8i; 8t, au lieu de la condition

E[(QTX2i)0�i] = 0.

Pour BMS, l'estimateur est plus e�cace si l'endogénéité dans X2

provient d'une composante invariant dans le temps. Matrice d'ins-

truments de BMS :

WBMS = [QX; (QX1)�; (QX2)

�; BX1; Z1]

où (QX1)� et (QX2)

� sont construites de la même façon que X�1

pour AM.

Condition d'identi�cation : Avec BMS, on ajoute (QX2)� aux ins-

truments de Amemiya-MaCurdy. La condition est alors TK1 +

(T � 1)K2 � G2. Comme précédemment, on ajoute seulement

(T � 1)K2 instruments, puisque (QX2)� n'est pas de rang plein,

mais de rang égal à (T � 1)K2.

51

4.5 Calcul de la matrice de variance-covariance matrix

des estimateurs IV

Problème ici : Les régresseurs endogènes peuvent fournir des esti-

mateurs non convergents des composantes de la variance dans ,

en particulier le paramètre �.

La méthode suggérée par Hausman-Taylor (1981) procure des es-

timateurs convergents.

Soit M1 le vecteur des moyennes individuelles du résidu Within :

M1 = BY �BX�W =�B � BX(X 0

QX)�1X 0Q�Y

= Z + � +�B � BX(X 0

QX)�1X 0Q�";

où X = (X1jX2), Z = (Z1jZ2), et = ( 1; 2). Les 3 derniers

termes ci-dessus peuvent être traités comme des résidus centrés,

et il su�t de trouver des instruments pour Z2 a�n d'estimer .

L'estimateur IV de est

B = (Z 0PCZ)�1(Z 0PCM1);

où PC est la matrice de projection associée aux instruments C =

(X1; Z1). En utilisant les paramètres estimés �W et B, on forme

les résidus

uW = QY �QX�W and uB = BY �BX�W � Z B:

Ces 2 vecteurs de résidus sont utilisés pour calculer les compo-

santes de la variance comme dans le cas standard des �Feasible

GLS� (MCG admissibles).

52

4.5.1 Procédure complète d'estimation MCG-IV

� Etape 1. Calculer les moyennes individuelles et les écarts à

ces moyennes, BX, BY , QX et QY .

� Etape 2. Estimer les paramètres � associés à X en utilisant

les Within.

� Etape 3. Estimer B par la procédure IV ci-dessus.

� Etape 4. Calculer �2� et �2

" à partir de uW et uB, et calculer

� = 1 + T �2�=�

2".

� Etape 5. Transformer les variables par la procédure MCG

scalaire, e.g., (Q+p�B)Y = yit � (1�

p�)�yi.

� Etape 6. Calculer la matrice de projection PW à partir de la

matrice d'instruments W .

� Etape 7. Estimer les paramètres �.

4.6 Exemple : Equation de salaire

4.6.1 Spéci�cation du modèle

Théorie du Capital Humain :

logw = F [X1; �; ED]; où w : taux de salaire;

� : aptitude du travailleur (inobservée), X1 : variables supplé-

mentaires (secteur, statut, etc.), et ED : niveau d'éducation. Des

proxies pour l'aptitude peuvent être utilisée : nombre d'heures tra-

vaillées, expérience, etc.

Objectif principal : estimer le gain marginal associé àED : @w=@ED.

Mais problème si l'aptitude du travailleur est constante au cours

du temps et conditionne ED ? Le vrai modèle serait�logw = F [X1; �; ED];

ED = G[�;X2];

53

où X2 sont des variables supplémentaires, spéci�ques à l'individu.

Si l'aptitude � est remplacée par des proxies Z, on a�logw = F [X1; Z; ED] + U;

ED = G[X2; Z2] + V;

où U = F [X1; �; ED]� F [X1; Z; ED] et

V = G[X2; �]�G[X2; Z].

Deux problèmes lorsque l'on estime la première équation en négli-

geant la seconde :

� Si des variables sont communes à X1 et X2, biais d'endogénéité

(à cause de ED) ;

� Si Z est corrélé avec des variables omises (expliquant l'aptitude),

biais d'erreur de mesure.

4.6.2 Application : Rendements de l'éducation

Echantillon utilisé : Panel Study of Income Dynamics (PSID), Uni-

versity of Michigan. Voir Baltagi et Khanti�Akom 1990, Cornwell

et Rupert 1988.

595 individus, sur la période 1976-1982 (7 périodes) : Chefs de

ménage (hommes et femmes) agés de 18 à 65 en 1976, avec un sa-

laire non-nul, employés dans des entreprises privées, hors-secteur

agricole, pour les années 1976 à 1982.

54

Variables liées au statut de l'emploi

� LWAGE : log du salaire ;

� WKS : nombre de semaines travaillées dans l'année ;

� EXP : expérience professionnelle en années à la date de

l'échantillon ;

� OCC : 1 si col bleu ;

� IND : 1 si travail dans l'industrie ;

� UNION : 1 si convention collective dans l'entreprise.

Variables liées aux caractéristiques des chefs de famille

� SMSA : 1 si l'individu réside en zone urbaine ;

� SOUTH : 1 si l'individu réside dans le sud des Etats-Unis ;

� MS : Statut Marital, 1 si marié ;

� FEM : 1 si femme ;

� BLK : 1 si Noir ;

� ED : nombre d'années dans le système éducatif.

Variables spéci�ques à l'individu : ED, BLK et FEM .

Estimation du modèle non-augmenté (sans les Zi)

Variables a priori endogènes (car corrélées à l'aptitude) : X2 :

(EXPE, EXPE2, UNION , WKS, MS) ;

Variables a priori exogènes : X1 : (OCC, SOUTH, SMSA,

IND).

Modèle augmenté

Yit = X1it�1 +X2it�2 + Z1i 1 + Z2i 2 + �i + "it

Variables a priori endogènes : Z2 : ED ;

Variables a priori exogènes : Z1 : (BLK, FEM).

55

Tab. 2 � Echantillon 1 1976-1982. Statistiques descriptivesVariable Moyenne Ecart-type Minimum Maximum

LWAGE 6.6763 0.4615 4.6052 8.5370

EXP 19.8538 10.9664 1.0000 51.0000

WKS 46.8115 5.1291 5.0000 52.0000

OCC 0.5112 0.4999 0.0000 1.0000

IND 0.3954 0.4890 0.0000 1.0000

UNION 0.3640 0.4812 0.0000 1.0000

SOUTH 0.2903 0.4539 0.0000 1.0000

SMSA 0.6538 0.4758 0.0000 1.0000

MS 0.8144 0.3888 0.0000 1.0000

ED 12.8454 2.7880 4.0000 17.0000

FEM 0.1126 0.3161 0.0000 1.0000

BLK 0.0723 0.2590 0.0000 1.0000

56

Tab. 3 � Variable dépendante : log(salaire). Régresseurs exogènes

seulementWithin MCG

Constante � 0.0976 (0.0040)

OCC -0.0696 (0.02323) -0.0701 (0.02322)

SOUTH -0.0052 (0.05833) -0.0072 (0.05807)

SMSA -0.1287 (0.03295) -0.1275 (0.03290)

IND 0.0317 (0.02626) 0.0317 (0.02624)

�2(4) = 0:551

Notes. Les écarts-types sont entre parenthèses.

Tab. 4 � variable dépendante : log(salaire). Variables endogènes

seulement.Within MCG

Constante � 0.0561 (0.0024)

EXPE 0.1136 (0.002467) 0.1133 (0.002466)

EXPE2 -0.0004 (0.000054) -0.0004 (0.000054)

WKS 0.0008 (0.0005994) 0.0008 (0.0005994)

MS -0.0322 (0.01893) -0.0325 (0.01892)

UNION 0.0301 (0.01480) 0.0300 (0.01479)

�2(5) = 24:94


57

Tab. 5 � Variable dépendante : log(salaire). Modèle aAugmenté.

Within MCG

Constante � 0.1866 (0.01189)

OCC -0.0214 (0.01378) -0.0243 (0.01367)

SOUTH -0.0018 (0.03429) 0.0048 (0.03188)

SMSA -0.0424 (0.01942) -0.0468 (0.01891)

IND 0.0192 (0.01544) 0.0148 (0.01521)

EXPE 0.1132 (0.00247) 0.1084 (0.00243)

EXPE2 -0.0004 (0.00005) -0.0004 (0.00005)

WKS 0.0008 (0.00059) 0.0008 (0.00059)

MS -0.0297 (0.01898) -0.0391 (0.01884)

UNION 0.0327 (0.01492) 0.0375 (0.01472)

FEM � -0.1666 (0.12646)

BLK � -0.2639 (0.15413)

ED � 0.1373 (0.01415)

�2(9) = 495:3


Tab. 6 � Variable dépendante : log(salaire). Estimation IV

HT AM BMS

Constante 0.1772 (0.017) 0.1781 (0.016) 0.1748 (0.016)

OCC -0.0207 (0.013) -0.0208 (0.013) -0.0204 (0.013)

SOUTH 0.0074 (0.031) 0.0072 (0.031) 0.0077 (0.031)

SMSA -0.0418 (0.018) -0.0419 (0.018) -0.0423 (0.018)

IND 0.0135 (0.015) 0.0136 (0.015) 0.0138 (0.015)

EXPE 0.1131 (0.002) 0.1129 (0.002) 0.1127 (0.002)

EXPE2 -0.0004 (0.005) -0.0004 (0.000) -0.0004 (0.000)

WKS 0.0008 (0.000) 0.0008 (0.000) 0.0008 (0.000)

MS -0.0298 (0.018) -0.0300 (0.018) -0.0303 (0.018)

UNION 0.0327 (0.014) 0.0324 (0.014) 0.0326 (0.014)

FEM -0.1309 (0.126) -0.1320 (0.126) -0.1337 (0.126)

BLK -0.2857 (0.155) -0.2859 (0.155) -0.2793 (0.155)

ED 0.1379 (0.021) 0.1372 (0.020) 0.1417 (0.020)

Test �2(3) = 5:23 �

2(13) = 19:29 �2(13) = 12:23


58

5 Les modèles de panel dynamiques

5.1 Motivation

Utilité des panels dynamiques :

� Etudier la dynamique d'ajustement dans les variables micro- et

macro. ;

� Estimer des modèles économiques dans un cadre inter-temporel

(cycle de vie, �nance,...)

5.2 Le modèle dynamique à e�ets �xes

Modèle le plus simple :

yit = �yi;t�1 + �i + "it; i = 1; 2; : : : ; N ; t = 1; 2; : : : ; T;

où les conditions initiales yi0; i = 1; 2; : : : ; N sont supposées

connues. On fait l'hypothèse que E("it) = 0 8i; t, E("it"js) = �2"

si i = j; t = s et 0 sinon, E(�i"it) = 0 8i; t.Par substitution répétée :

yit = "it + �"i;t�1 + �2"i;t�2 + � � �+ �

t�1"i1 +

1� �t

1� ��i + �

tyi0:

5.2.1 Biais de l'estimateur des e�ets �xes

L'estimateur Within s'écrit :

� =

PNi=1

PTt=1(yit � �yi)(yi;t�1 � �yi;�1)PN

i=1

PTt=1(yi;t�1 � �yi;�1)2

;

�i = �yi � ��yi;�1;

59

où

�yi =1

T

TXt=1

yit; �yi;�1 =1

T

TXt=1

yi;t�1; �"i =1

T

TXt=1

"it:

Egalement,

� = �+1NT

PNi=1

PTt=1("it � �"i)(yi;t�1 � �yi;�1)

1NT

PNi=1

PTt=1(yi;t�1 � �yi;�1)2

;

Cet estimateur existe si le dénominateur 6= 0 et il est convergent

si le numerateur converge vers 0.

Numerateur :

plimN!11

NT

N;TXi;t

(yi;t�1 � �yi;�1)("it � �"i) = �plim 1

N

NXi=1

�yi;�1�"i

car "it est auto-corrélé mais n'est pas corrélé avec �i. On utilise

�yi;�1 =1

T

TXt=1

yi;t�1 =1

T

�1� �

T

1� �yi0 +

(T � 1)� T�+ �T

(1� �)2�i

+1� �

T�1

1� �"i1 +

1� �T�2

1� �"i2 + � � �+ "i;T�1

�:

On a

plim1

N

NXi=1

�yi;�1�"i = plim

(1

N

NXi=1

�"i1

T

"T�1Xt=1

1� �T�t

1� �"it

#)

= plim

(1

N

NXi=1

1

T

TXt=1

"it

!1

T

"T�1Xt=1

1� �T�t

1� �"it

#)

=�2"

T 2

�(T � 1)� T�+ �

T

(1� �)2

�:

60

De façon similaire, on montre que plim 1NT

PN;Ti;t (yi;t�1 � �yi;�1)

2

=�2"

1� �2

�1� 1

T� 2�

(1� �)2� (T � 1)� T�+ �

T

T 2

�

En formant le rapport de ces 2 termes, le biais asymptotique est

plimN!1(�� ) = � 1 + �

T � 1

�1� 1

T

1� �T

1� �

�

��1� 2�

(1� �)(T � 1)

�1� 1� �

T

T (1� �)

��1= O(1=T ):

Dans le modèle transformé

(yit � �yi) = �(yi;t�1 � �yi;�1) + ("it � �"i);

la variable explicative est corrélée avec le résidu, et la corrélation

est d'ordre 1=T . Par conséquent, l'estimateur des e�ets �xes est

biaisé dans le cas usuel où N est grand et T est petit.

61

Tab. 7 �Biais asymptotique de l'estimateur des e�ets �xes - Modèle

dynamique� T Biais Pourcent

0.2 6 -0.2063 -103.1693

8 -0.1539 -76.9597

10 -0.1226 -61.3139

20 -0.0607 -30.3541

40 -0.0302 -15.0913

0.5 6 -0.2756 -55.1282

8 -0.2049 -40.9769

10 -0.1622 -32.4421

20 -0.0785 -15.6977

40 -0.0384 -7.6819

0.7 6 -0.3307 -47.2392

8 -0.2479 -35.4084

10 -0.1966 -28.0912

20 -0.0938 -13.3955

40 -0.0449 -6.4114

0.9 6 -0.3939 -43.7633

8 -0.3017 -33.5179

10 -0.2432 -27.0248

20 -0.1196 -13.2934

40 -0.0563 -6.2561

62

5.2.2 Estimation par la Variable Instrumentale

Seule façon d'obtenir des estimateurs convergents de � lorsque T

est petit. Procédure di�érente pour éliminer les e�ets individuels :

on utilise lesDi�érences Premières au lieu de la transformation

Within :

(yit � yi;t�1) = �(yi;t�1 � yi;t�2) + ("it � "i;t�1)

�yit = ��yi;t�1 +�"it;

et sous forme vectorielle :

�yi = ��yi;�1 +�"i; i = 1; 2; : : : ; N:

Dans ce modèle, yi;t�1 corrélé par construction avec "i;t�1 ! Be-

soin d'instruments qui soient non-corréles avec ("it � "i;t�1) mais

corrélés avec (yi;t�1� yi;t�2). Seule possibilité dans le cadre d'une

équation unique sans variables �extérieures� : utiliser les valeurs

de la variable dépendante.

En raison de la nature autorégressive du modèle, des instruments

provenant de valeurs futures de yit ne sont pas envisageables, car

yit est une fonction récursive de "it; "i;t�1; : : : ; "i1; �i; yi0.

Pour les valeurs retardées de la variable dépendante, on peut uti-

liser soit yi;t�2, soit (yi;t�2 � yi;t�3) :

�E[yi;t�2("it � "i;t�1)] = E("i;t�2"it)� E("i;t�2"i;t�1) = 0;

�E[(yi;t�2 � yi;t�3)("it � "i;t�1)] = E["i;t�2("it � "i;t�1)]

�E["i;t�3("it � "i;t�1)] = 0;

�E[yi;t�2(yi;t�1 � yi;t�2)] = 0� E("2i;t�2) = ��2" ;

�E[(yi;t�2 � yi;t�3)(yi;t�1 � yi;t�2)] = 0� E("2i;t�2) = ��2" :

63

Les estimateurs IV sont convergents si N et/ou T !1 :

� =

PNi=1

PTt=3(yit � yi;t�1)(yi;t�2 � yi;t�3)PN

i=1

PTt=3(yi;t�1 � yi;t�2)(yi;t�2 � yi;t�3)

ou � =

PNi=1

PTt=3(yit � yi;t�1)yi;t�2PN

i=1

PTt=3(yi;t�1 � yi;t�2)yi;t�2

:

Conclusion : Avec la transformation Within d'un modèle dyna-

mique, même si �i est éliminé, le biais d'endogénéité demeure

pour T �xé, car l'opérateur Q introduit des erreurs "is corrélées

par construction avec la variable explicative (retardée).

Considérons maintenant un modèle plus général :

yit = �yi;t�1 + xit� + zi + �i + "it:

Estimation IV :

Etape 1. Modèle en di�érences premières

(yit � yi;t�1) = �(yi;t�1 � yi;t�2) + (xit � xi;t�1)� + "it � "i;t�1:

Utiliser yi;t�2 ou (yi;t�2� yi;t�3) comme instrument pour (yi;t�1�yi;t�2) et estimer �; � avec la procedure IV.

Etape 2. Substituer � et � dans l'équation Between en di�érences

premières :

�yi � ��yi;�1 � �xi� = zi + �i + �"i; i = 1; 2; : : : ; N;

et estimer par MCO.

64

Etape 3. Estimer les composantes des variances :

�2" =

12N(T�1)

PNi=1

PTt=1 [(yit � yi;t�1)� �(yi;t�1 � yi;t�2)

�(xit � xi;t�1)�i2;

�2� = 1

N

PNi=1

h�yi � ��yi;�1 � zi � �xi�

i2� 1

T�2";

Convergence de l'estimateur IV :

L'estimateur IV de �, � et �2" sont convergents quand N ou T

!1 ;

L'estimateur IV de and �2� sont convergents seulement si T

!1, mais non convergents quand T est �xé et N !1.

5.3 Exemple : L'étude de Balestra-Nerlove

Papier précurseur sur les modèles dynamiques en panel (1966).

Demande des ménages pour le gaz naturel aux Etats-Unis, in-

cluant a/ la demande due au remplacement des équipements fonc-

tionnant au gaz, et b/ la demande liée à des variations dans le

stock de ces équipements.

Système de demande :

G�it = Git � (1� r)Gi;t�1;

F�it = Fit � (1� r)Fi;t�1;

Fit = a0 + a1Nit + a2Iit;

G�it = b0 + b1Pit + b2F

�it;

où G�it et Git sont respectivement la nouvelle et la demande réelle

de gaz à la période t du ménage i, r est le taux de dépréciation

des équipements, F �it et Fit sont respectivement la nouvelle et la

65

demande réelle pour les autres types d'énergie, Nit est la popula-

tion totale, Iit est le revenu par tête, et Pit est le prix relatif du gaz.

Après résolution du système, l'équation à estimer s'écrit :

Git = �0 + �1Pit + �2�Nit + �3Ni;t�1

+�4�Iit + �5Ii;t�1 + �6Gi;t�1;

où �Nit = Nit �Ni;t�1, �Iit = Iit � Ii;t�1, et �6 = 1� r.

Estimation : MCO, Within (LSDV) et GLS (avec l'hypothèse que

les conditions initiales Gi0 sont �xées).

En accord avec la théorie, � (ici, �6) est biaisé vers le haut par les

MCO et vers le bas par les e�ets �xes (Within).

66

Tab. 3 � Résultats d'estimation, modèle de Balestra-Nerlove

Paramètre MCO Within MCG

�0 (Constante) -3.650 - -4.091

(3.316) - (11.544)

�1 (Pit) -0.0451(*) -0.2026 -0.0879(*)

(0.027) (0.0532) (0.0468)

�2 (�Nit) 0.0174(*) -0.0135 -0.00122

(0.0093) (0.0215) (0.0190)

�3 (Ni;t�1) 0.00111(**) 0.0327(**) 0.00360(**)

(0.00041) (0.0046) (0.00129)

�4 (�Iit) 0.0183(**) 0.0131 0.0170(**)

(0.0080) (0.0084) (0.0080)

�5 (Ii;t�1) 0.00326 0.0044 0.00354

(0.00197) (0.0101) (0.00622)

�6 (Gi;t�1) 1.010(**) 0.6799(**) 0.9546(**)

(0.014) (0.0633) (0.0372)

Notes. N = 36, T = 11. Ecarts-types entre parenthèses. (*) et (**) : para-

mètre signi�catif à 10% et 5% respectivement.

5.4 Estimateurs GMM pour panel dynamique

5.4.1 Introduction

Estimation par Méthode des Moments Généralisés (GMM) comme

alternative intéressante aux e�ets �xes et MCG. Ses avantages

sont évidents dans le cas de l'estimation des modèles dynamiques

à données de panel.

Modèle simple sans régresseurs exogènes :

yit = �yi;t�1 + uit; uit = �i + "it:

67

Procédure par IC d'Anderson-Hsiao : estimateur convergent quand

T est �xe, basé sur le modèle en di�érences premières.

Deux désavantages :

a) Dans les procédures IV, la matrice de variance-covariance est

contrainte (homoscédasticité, pas d'auto-corrélation des erreurs) ;

b) Seulement 1 instrument utilisé pour identi�er 1 paramètre (soit

yi;t�2, soit yi;t�2 � yi;t�3).

5.4.2 L'estimateur d'Arellano-Bond

Article important : Arellano et Bond (Review of Economics

and Statistics, 1991) : une procédedure robuste peut être utilisée

(point a)) et plus de conditions d'orthogonalité (d'instruments)

sont disponibles (point b)).

Hypothèses du modèle

(i) Pour tout i, "it n'est pas corrélé avec yi0 pour tout t ;

(ii) Pour tout i, "it n'est pas is corrélé avec �i, pour tout t ;

(iii) Pour tout i, les "it ne sont pas mutuellement corrélés.

Sous ces hypothèses, on a l'ensemble de conditions de moments :

E(yis�uit) = 0; t = 2; 3; : : : ; T; s = 0; 1; : : : ; t� 2;

où �uit = �"it = "it � "i;t�1. C'est un ensemble de T (T � 1)=2

conditions (comparer avec Anderson-Hsiao, où seulement 1 condi-

tion était disponible).

Hypothèse importante : les conditions ci-dessus tiennent si les

termes d'erreur " ne sont pas auto-corrélés, i.e., on doit avoir

E("it"i;t+s) = 0, pour s = �1; 1.

68

Si de l'auto-corrélation est présente, on a l'ensemble de conditions :

E(yis�uit) = 0; t = 3; : : : ; T; s = 0; 1; : : : ; t� 3;

ce qui donne (T � 1)(T � 2)=2 conditions (on en perd (T � 1)).

Par substitution répétée, on a :

yit = "it + �"i;t�1 + �2"i;t�2 + � � �+ �

t�1"i1 +

1� �t

1� ��i + �

tyi0;

de sorte que yit = f("it; "i;t�1; : : : ; "i1; �i; yi0), et

E(yi;t�2�uit) = E(yi;t�2("it � "i;t�1))

= E("i;t�2("it � "i;t�1)) = 0

car par hypothèse E(�i"it) = E("ityi0) = 0.

5.4.3 Mise en pratique de l'estimateur GMM

On a besoin de a) 1 matrice d'instruments W ;

b) 1 matrice de pondération initiale.

La sous-matrice pour l'individu i est de la forme :

Wi =

2666664

yi0 0 0 � � � � � � � � � � � � � � � 0

0 yi0 yi1 0 0 0 � � � � � � 0

0 0 0 yi0 yi1 yi2 0 � � � 0...

......

......

......

......

0... 0 0 0 0 yi0 � � � yi;T�2

3777775

69

de sorte que W 0i�ui =0

BBBBBBBBBBBBBBB@

�ui2 yi0�ui3 yi0�ui3 yi1�ui4 yi0�ui4 yi1�ui4 yi2

...

�uiT yi0...

�uiT yi;T�2

1CCCCCCCCCCCCCCCA

=

0BBBBBBBBBBBBBBB@

(�yi2 � ��yi1) yi0(�yi3 � ��yi2) yi0(�yi3 � ��yi2) yi1(�yi4 � ��yi3) yi0(�yi4 � ��yi3) yi1(�yi4 � ��yi3) yi2

...

(�yiT � ��yi;T�1) yi0...

(�yiT � ��yi;T�1) yi;T�2

1CCCCCCCCCCCCCCCA

et E(W 0i�ui) = 0.

Matrice de pondération initiale pour (W 0W )�1 : est la matrice

de variance-covariance de �" (dans le modèle transformé). Si "itest homoscédastique, on a

E(�"it�"i;t�1) = E[("it � "i;t�1)("i;t�1 � "i;t�2)] = ��2"

E(�"2it) = E[("it � "i;t�1)("it � "i;t�1)] = 2�2"

E(�"it�"i;t+1) = E[("it � "i;t�1)("i;t+1 � "it)] = ��2"

et pour chaque individu i, E(�ui�u0i) = �

2"H, où

H =

2666664

2 �1 0 � � � � � � 0

�1 2 �1 0 � � � 0

0 �1 2 �1 � � � 0...

......

......

...

0...

... 0 �1 2

3777775 ;

une matrice (T�2)(T�2). Nous pouvons utiliserH pour calculer

la matrice de pondération initiale comme

A1 =

NXi=1

W0iHWi:

70

Après calcul de l'estimateur GMM de première étape

�GMM = argmin�

�u0WA�11 W

0�u

=��y0�1WA

�11 W

0�y�1��1 �

�y0�1WA�11 W

0�y�;

on peut calculer la matrice de pondération de 2e étape par :

A2 =

NXi=1

W0i�ui�u

0iWi;

où �ui = �yi � ��yi;�1.

5.4.4 Des procédures plus e�caces : Ahn-Schmidt, Blundell-Bond

Ahn et Schmidt (1995) proposent T �2 conditions supplémen-

taires :

E(uiT�uit) = 0; t = 2; 3; : : : ; T � 1:

Avec Ahn-Schmidt et Arellano-Bond, on a T (T � 1)=2 + (T � 2)

conditions d'orthogonalité. Ahn-Schmidt montrent qu'elles repré-

sentent l'ensemble des conditions de moment impliquées par ces

hypothèses.

Hypothèses supplémentaires

Homoscédasticité Sous l'hypothèse : 8i, V ar("2it) est la même 8t,on a : E(u2it) est identique pour t = 1; 2; : : : ; T . Ceci ajoute T � 1

conditions, et l'ensemble �nal de conditions est, sous l'hypothèse

d'homoscédasticité :

E(yis�uit) = 0 t = 2; : : : ; T; s = 0; : : : ; t� 2;

E(yit�ui;t+1 � yi;t+1�ui;t+2) = 0 t = 1; : : : ; T � 2;

E(�ui�ui;t+1) = 0 t = 1; : : : ; T � 1;

71

où �ui =1T

PTt=1 uit.

Stationarité Quand on ajoute l'hypothèse de stationarité :Cov(�i; yit)

est la même 8t, cela ajoute 1 condition. L'ensemble complet de

T (T � 1)=2 + (2T � 2) conditions est maintenant

E(yis�uit) = 0 t = 2; : : : ; T; s = 0; : : : ; t� 2;

E(uiT�yit) = 0 t = 1; : : : ; T � 1;

E(uityit � ui;t�1yi;t�1) = 0 t = 2; : : : ; T:

Avantage : cet ensemble est constitué uniquement de conditions

linéaires.

L'estimateur d'Ahn et Schmidt s'obtient en ajoutant à la matrice

d'instruments d'Arellano-Bond le bloc suivant, pour l'individu i :

Wi =

0BBB@

yi2 0 ::: ::: 0 �ui 0 ::: 0

�yi3 yi3 0 ::: 0 0 �ui ::: 0...

......

......

......

......

0 ::: ::: ::: �yi;T�1 0 ::: ::: �ui

1CCCA :

Comment tester la pertinence d'hypothèses additionnelles ? Soit

W1 la matrice d'instruments associée à l'ensemble de conditions

à tester, et W 0 une matrice d'instruments associée à un ensemble

restreint de conditions valides. Soit � et �0les estimateurs GMM

obtenus avec les instruments (W 0;W

1) et W 0 respectivement,

J(�) et J(�0) les valeurs des critères GMM correspondants.

Alors, sous l'hypothèse nulle H0 : les conditions associées à W1

sont valides, on a

J(�)� J(�0) v �

2(rank(W 1)):

72

5.4.5 L'estimateur de Blundell-Bond

Blundell et Bond (1998) suggère d'utiliser des conditions de mo-

ment linéaires basées sur des hypothèses portant sur les conditions

initiales. Ils proposent

E(uit�yi;t�1) = 0 t = 3; 4; : : : ; T;

avec en plus,

E(ui3�yi2) = 0:

Cette dernière condition, combinée avec celle plus haut, implique

les restrictions non-linéaires d'Ahn et Schmidt (1995)E(uit�ui;t�1) =

0; t = 3; : : : ; T . Cela signi�e que nous avons la condition suivante

de stationarité sur le modèle :

yi0 =�i

1� �+ "i0:

En d'autres termes, les écarts initiaux de �i=(1 � �) ne doivent

pas être corrélés au niveau de �i=(1� �).

L'estimateur GMM de Blundell et Bond combine les conditions

d'Ahn et -SchmidtWi avec leur nouveaux instruments dé�nis plus

haut :

W+i =

2666664

Wi 0 0 � � � 0

0 �yi2 0 � � � 0

0 0 �yi3 � � � 0...

......

... 0

0 0 0 � � � �yi;T�1

3777775 ;

pour estimer les paramètres dans un système à 2 équations :

�yi = ��yi;�1 +�"iyi = �yi;�1 + �i + "i:

73

5.5 Exemple : Equation de demande d'énergie (gaz na-

turel)

74

___ ____ ____ ____ ____tm /__ / ____/ / ____/ ___/ / /___/ / /___/ Statistics/Data Analysis ------------------------------------------------------------------------------- log: E:\dea\panel\2004\energy3.smcl log type: smcl opened on: 15 Apr 2004, 22:49:23 1 . use energy 2 . set matsize 800 3 . tsset sire annee panel variable: sire, 5.481e+13 to 9.457e+15 time variable: annee, 1983 to 1996, but with gaps 4 . sort sire annee 5 . by sire : gen lag_we = we[_n - 1] (110 missing values generated) 6 . by sire : gen lag_wfl = wfl[_n - 1] (110 missing values generated) 7 . by sire : gen lag_wfd = wfd[_n - 1] (110 missing values generated) 8 . by sire : gen lag_wbp = wbp[_n - 1] (110 missing values generated) 9 . by sire : gen lag_wg = wg[_n - 1] (110 missing values generated) 10 . xtabond wg lag_we lag_wfl lag_wfd lag_wbp, twostep note: lag_wfl dropped due to collinearity Arellano-Bond dynamic panel data Number of obs = 770 Group variable (i): sire Number of groups = 94 Wald chi2(4) = 7881.35 Time variable (t): annee min number of obs = 1 max number of obs = 12 mean number of obs = 8.191489 Two-step results ------------------------------------------------------------------------------ wg | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- wg | LD | .8027447 .024249 33.10 0.000 .7552175 .8502718 lag_we | D1 | .447632 .022023 20.33 0.000 .4044678 .4907962 lag_wfd | D1 | .7429275 .02455 30.26 0.000 .6948104 .7910445 lag_wbp | D1 | 1.188523 .0898711 13.22 0.000 1.012379 1.364668 _cons | -.0054737 .0000973 -56.27 0.000 -.0056643 -.0052831 ------------------------------------------------------------------------------ Warning: Arellano and Bond recommend using one-step results for inference on coefficients

Sargan test of over-identifying restrictions: chi2(77) = 79.22 Prob > chi2 = 0.4089 Arellano-Bond test that average autocovariance in residuals of order 1 is 0: H0: no autocorrelation z = -3.20 Pr > z = 0.0014 Arellano-Bond test that average autocovariance in residuals of order 2 is 0: H0: no autocorrelation z = 0.35 Pr > z = 0.7294 11 . xtabond wg lag_we lag_wfl lag_wfd lag_wbp, twostep lags(2) note: lag_wfl dropped due to collinearity Arellano-Bond dynamic panel data Number of obs = 669 Group variable (i): sire Number of groups = 92 Wald chi2(5) = 26399.30 Time variable (t): annee min number of obs = 1 max number of obs = 11 mean number of obs = 7.271739 Two-step results ------------------------------------------------------------------------------ wg | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- wg | LD | 1.79913 .0475941 37.80 0.000 1.705847 1.892413 L2D | .0281091 .0012674 22.18 0.000 .0256251 .0305932 lag_we | D1 | 1.2724 .0446425 28.50 0.000 1.184902 1.359897 lag_wfd | D1 | 1.514443 .0516318 29.33 0.000 1.413247 1.61564 lag_wbp | D1 | 1.395866 .0594595 23.48 0.000 1.279328 1.512405 _cons | -.0000462 .0001437 -0.32 0.748 -.0003279 .0002355 ------------------------------------------------------------------------------ Warning: Arellano and Bond recommend using one-step results for inference on coefficients Sargan test of over-identifying restrictions: chi2(75) = 81.48 Prob > chi2 = 0.2848 Arellano-Bond test that average autocovariance in residuals of order 1 is 0: H0: no autocorrelation z = -2.63 Pr > z = 0.0085 Arellano-Bond test that average autocovariance in residuals of order 2 is 0: H0: no autocorrelation z = -0.18 Pr > z = 0.8576 12 . log close log: E:\dea\panel\2004\energy3.smcl log type: smcl closed on: 15 Apr 2004, 22:52:17 -------------------------------------------------------------------------------

6 Les modèles à choix discret

6.1 Bref rappel des modèles binaires à choix discret

Modèles à variables dépendantes qualitatives : rappel dans le cas

binaire, et pour une coupe instantanée.

y�i = xi� + ui; i = 1; 2; : : : ; N;

yi = 1 si y�i > 0;

yi = 0 si y�i � 0;

y�i et yi : respectivement la variable latente (inobservée) et la va-

riable dépendante observée ; xi : vecteur 1�K de régresseurs. Le

seuil 0 est arbitraire, car E(y�i ) est inconnu.

6.1.1 Modèle à Probabilité Linéaire

E(yi) = Prob(yi = 1) = xi� + ui:

Non satisfaisant, car les probabilités prédites peuvent sortir de l'in-

tervalle [0; 1]. 2 valeurs possibles pour le résidu ui : 1�xi� (quand

yi = 1) ou ui = �xi� (quand yi = 0). Hétéroscédasticité par

construction, car V ar(ui) = Prob(yi = 0)� (�xi�)2+Prob(yi =

1)� (1� xi�)2

= (1� xi�)� (�xi�)2 + xi� � (1� xi�)2

= (1� xi�)[(�xi�)2 + xi�(1� xi�)]

= xi� � (1� xi�):

75

6.1.2 Le modèle Logit

Basé sur la distribution Logistique :

Prob(yi = 1) = �(xi�) =exp(xi�)

1+exp(xi�);

Prob(yi = 0) = 1� �(xi�) =1

1+exp(xi�);

Density :�(xi�) =exp(xi�)

[1+exp(xi�)]2:

Dans ce cas, V ar(ui) = �2=3.

6.1.3 Le modèle Probit

Basé sur la distribution Normale : ui est N(0; �2)

Prob(yi = 1) = ��xi��

�=R xi�=��1

1

�p2�

exp(� u2i

2�2);

Prob(yi = 0) = 1� ��xi��

�=R +1xi�=�

1

�p2�

exp(� u2i

2�2);

Densité��xi��

�= 1

�p2�

exp(� u2i

2�2):

Le paramètre � n'est pas identi�é (apparaît dans le rapport �=�) :

� est donc normalisé à 1.

Méthode d'estimation : Maximum de Vraisemblance

� = argmax�

NYi=1

[Prob(yi = 1)]yi [1� Prob(yi = 0)]

1�yi

= argmin�

NYi=1

F (Æixi�);

où F (:) est la fonction de répartition (� ou �), et Æi = 2yi � 1.

76

Dans ces modèles, l'inference est conduite sur a) le signe des pa-

ramètres estimés ; b) les e�ets marginaux (@Prob(yi = 1)=@xi).

Passage aux données de panel. On considère uit = �i + "it, de

sorte que

Prob(yit = 1) = Prob(y�it > 0) = Prob("it > �xit� � �i)

= Prob("it < xit� + �i) = F (xit� + �i):

6.2 Modèle Logit pour données de panel

6.2.1 Statistiques su�santes

Considérons d'abord un modèle à e�ets �xes.

Esrimateur du Maximum de Vraisemblance (MV) : il faut estimer

à la fois � et �i; i = 1; : : : ; N , mais �i et � ne sont pas indépen-

dants dans ces modèles non-linéaires. Si T est petit, l'estimateur

MV de �i n'est pas convergent et par conséquent, celui de � ne

l'est pas non plus. Les e�ets individuels �i sont appelés paramètres

incidentaux (leur nombre augmente avec N).

Solution : Neyman et Scott (1948) posent le principe de l'esti-

mation en présence de paramètres incidentaux . Supposons qu'il

existe une statistique su�sante �i pour �, i = 1; 2; : : : ; N , qui ne

dépende pas de �.

Alors, la densité conditionnelle

f(yijxi; �i; �) =f(yijxi; �i; �)g(�ijxi; �i; �)

; pour g(�ijxi; �i; �) > 0;

ne dépend pas de �i.

Un estimateur convergent de � s'obtient alors en maximisant la

77

densité conditionnelle de (y1; : : : ; yN) étant donné (�1; : : : ; �N) :

� = argmax�

NYi=1

f(yijxi; �i; �):

Probabilité jointe yi :

Prob(yi) =exp

h�i

�PTt=1 yit

�+�PT

t=1 yitxit

��

iQT

t=1 [1 + exp(xit� + �i)]:

Si nous résolvons les conditions du 1er ordre associées à la maxi-

misation de la log-vraisemblance par rapport à � :

@ logL

@�=

NXi=1

TXt=1

�� exp(xit� + �i)

1 + exp(xit� + �i)+ yit

�xit = 0;

et par rapport à �i :

@ logL

@�i=

TXt=1


1 + exp(xit� + �i)+ yit

�= 0; i = 1; 2; : : : ; N;

,TXt=1

yit =

TXt=1


1 + exp(xit� + �i)

�i = 1; 2; : : : ; N:

Par conséquent, une statistique su�sante pour �i est : �i =PT

t=1 yit.

La probabilité quePT

t yit = s est :

T !

s!(T � s)!� exp(�is)Q

t[1 + exp(xit� + �i)]�(Xd2Bi

exp

TXt=1

ditxit

!�

)

78

6.2.2 Probabilités conditionnelles

La probabilité conditionnelle de yi étant donné �i est :

Prob (yij�i) =exp

h�PTt=1 yitxit

��

iP

d2Biexp

�PTt=1 ditxit�

�

�(P

t yit)!(T �P

t yit)!

T !;

où Bi est un ensemble d'indices pour l'individu i :

Bi =

((di1; di2; : : : ; diT )jdit = 0; 1 et

TXt=1

dit =

TXt=1

yit

):

L'ensemble Bi représente toutes les combinaisons possibles de yitpour l'individu i avec le même nombre de 1 que dans

PTt yit.

Les groupes pour lesquelsPT

t yit = 0 ouPT

t yit = T ont une

probabilité de 1, et ne contribuent en rien à la log-vraisemblance.

Seuls ensembles d'intérêt : lorsquePT

1 yit = s 2]0; T [ ; il y a

(T

s) =T !=[s!(T � s)!] éléments, qui correspondent à T séquences

distinctes, de valeur s.

Notes :

� La seconde expression ne dépend pas de � et peut être éliminée ;

� Pour calculer la probabilité ci-dessus, il faut considérer pour

chaque s toutes les séquences possibles de 0 et de 1. Exemple : si

79

T = 4 et s = 2, on aurait 6 cas possibles et

Xd2Bi

exp

TXt=1

ditxit�

!= vec

26666664

1 1 0 0

1 0 1 0

1 0 0 1

0 1 1 0

0 1 0 1

0 0 1 1

37777775

0BB@

exp(xi1�)

exp(xi2�)

exp(xi3�)

exp(xi4�)

1CCA

6.2.3 Exemple : T = 2

Seule séquence d'intérêt : yi1 + yi2 = 1. Soit

!i = 1 if (yi1; yi2) = (0; 1);

!i = 0 if (yi1; yi2) = (1; 0):

On a la probabilité conditionnelle :

Prob(!i = 1jyi1 + yi2 = 1) =Prob(!i = 1)

Prob(!i = 0) + Prob(!i = 1)

=

�exp(�i + yi2xi2�)

[1 + exp(�i + xi1�)][1 + exp(�i + xi2�)]

�

��[1 + exp(�i + xi1�)][1 + exp(�i + xi2�)]

exp(�i + xi1�) + exp(�i + xi2�)

�

=exp(�i + xi2�)

exp(�i + xi1) + exp(�i + xi2�)

=exp[(xi2 � xi1)�])

1 + exp[(xi2 � xi1)�]= �[(xi2 � xi1)�]:

Dans ce cas, Bi = fijyi1+ yi2 = 1g et la log-vraisemblance condi-

tionnelle est logL =Xi2Bi

f!i log�[(x2i � xi1)�] + (1� !i) log f1� �[(x2i � xi1)�]gg :

80

En pratique, lorsque T > 2, nous devons considérer d'autres en-

sembles de séquences possibles pour lesquellesPT

t yit est le même.

6.3 Le modèle Probit

On utilise traditionnellement le modèle Probit dans les cas des

e�ets aléatoires (facilité de calcul).

Considérons un modèle avec le terme d'erreur uit = �i + "it, où

�i est issu d'une distribution G(:) et est indépendant des xi. Sup-

posons que

V ar(�) = �2�; V ar("it) = 1; Corr(uit; uis) = � =

�2�

1 + �2�

:

La contribution à la vraisemblance de l'individu i est Li = Prob(yi)

=

Z Æi1xi1�

�1� � �Z ÆiTxiT�

�1f(ui1; ui2; : : : ; uiT )dui1 � � � duiT ;

où Æit = 2yit � 1 et f(:) est la fonction de densité jointe des élé-

ments dans ui.

L'intégration de cette densité n'est pas raisonnable (numérique-

ment, manque de précision) si T est grand, mais l'on peut tra-

vailler avec la densité conditionnelle, car conditionnellement à �i,

les uit sont indépendants :

f(ui1; ui2; : : : ; uiT ) =

Z +1

�1f(ui1; ui2; : : : ; uiT j�i)f(�i)d�i

=

Z +1

�1

TYt=1

f(uitj�i)f(�i)d�i;

81

où la densité de �i est N [0; �=(1� �)] (rappel : � = �2�=(1+�

2�)).

Butler et Mo�tt (1982) montrent que l'on peut écrire Li comme

Li(yi) =1p�

Z +1

�1e�t2

i

"TYt=1

�(Æitxit� + Æitti

p2�p

1� �)

#dti;

qui est à présent une intégrale à 1 dimension qui peut facilement

être calculée numériquement (algorithme d'intégration de Gauss-

Hermite). Désavantage de cette méthode : il faut imposer que la

corrélation (�) est constante sur les périodes.

82

___ ____ ____ ____ ____tm /__ / ____/ / ____/ ___/ / /___/ / /___/ Statistics/Data Analysis ------------------------------------------------------------------------------- log: E:\dea\panel\2004\paper31.smcl log type: smcl opened on: 13 Apr 2004, 22:44:46 1 . clear 1 . clear 1 . clear 1 . clear 2 . use paper31 2 . use paper31 2 . use paper31 2 . use paper31 3 . sum 3 . sum 3 . sum 3 . sum Variable | Obs Mean Std. Dev. Min Max -------------+----------------------------------------------------- pgn | 3892 2031.673 507.0337 649.3506 4935.065 eff | 3892 127.4245 124.4005 0 1200 pk | 3892 1854.373 8357.252 9 270000 we | 3892 .7526084 .1939825 .0755102 1 wg | 3892 .0691366 .1490749 0 .9244898 wfl | 3892 .0595062 .1532768 0 .8358098 wfd | 3892 .1048921 .1381208 0 .8143532 wbp | 3892 .0138567 .0599029 0 .7816901 lnpk | 3892 7.620966 .2802385 6.176086 8.751222 lnpgn | 3892 -4.36909 1.362804 -11.26895 -.1333181 lnpfl | 3892 -4.396743 1.319552 -10.76311 -.1630243 lnpfd | 3892 -4.372553 1.268942 -10.34875 -.2750275 lnpbp | 3892 -4.37296 1.285537 -10.44155 -.1853326 annee | 3892 1989.5 4.031647 1983 1996 sire | 3892 5.64e+15 2.28e+15 5.48e+13 9.98e+15 r | 3892 2.604573 .8067498 0 4 leff | 3891 4.447666 .9390137 2.302585 7.090077 4 . xtlogit wg lnpgn lnpk lnpfl lnpfd leff, i(sire) fe 4 . xtlogit wg lnpgn lnpk lnpfl lnpfd leff, i(sire) fe 4 . xtlogit wg lnpgn lnpk lnpfl lnpfd leff, i(sire) fe 4 . xtlogit wg lnpgn lnpk lnpfl lnpfd leff, i(sire) fe note: multiple positive outcomes within groups encountered. note: 197 groups (2758 obs) dropped due to all positive or all negative outcomes. Iteration 0: log likelihood = -440.50788 Iteration 1: log likelihood = -244.73554 Iteration 2: log likelihood = -218.80164 Iteration 3: log likelihood = -214.75859 Iteration 4: log likelihood = -214.58631 Iteration 5: log likelihood = -214.58586 Conditional fixed-effects logit Number of obs = 1133 Group variable (i) : sire Number of groups = 81

Obs per group: min = 13 avg = 14.0 max = 14 LR chi2(5) = 482.63 Log likelihood = -214.58586 Prob > chi2 = 0.0000 ------------------------------------------------------------------------------ wg | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- lnpgn | -4.911574 .5046251 -9.73 0.000 -5.900621 -3.922527 lnpk | .8308617 .7184896 1.16 0.248 -.577352 2.239075 lnpfl | -1.406169 .6057111 -2.32 0.020 -2.593341 -.2189966 lnpfd | 2.446032 .7488206 3.27 0.001 .9783705 3.913693 leff | .3644786 .6587024 0.55 0.580 -.9265543 1.655512 ------------------------------------------------------------------------------ 5 . xtprobit wg lnpgn lnpk lnpfl lnpfd leff, i(sire) re 5 . xtprobit wg lnpgn lnpk lnpfl lnpfd leff, i(sire) re 5 . xtprobit wg lnpgn lnpk lnpfl lnpfd leff, i(sire) re 5 . xtprobit wg lnpgn lnpk lnpfl lnpfd leff, i(sire) re Fitting comparison model: Iteration 0: log likelihood = -2219.598 Iteration 1: log likelihood = -1491.5615 Iteration 2: log likelihood = -1424.133 Iteration 3: log likelihood = -1421.415 Iteration 4: log likelihood = -1421.408 Fitting full model: rho = 0.0 log likelihood = -1421.4078 rho = 0.1 log likelihood = -1140.8174 rho = 0.2 log likelihood = -1016.5969 rho = 0.3 log likelihood = -942.64415 rho = 0.4 log likelihood = -892.79813 rho = 0.5 log likelihood = -857.7847 rho = 0.6 log likelihood = -832.86653 rho = 0.7 log likelihood = -814.12095 rho = 0.8 log likelihood = -804.14302 Iteration 0: log likelihood = -814.12092 Iteration 1: log likelihood = -730.50278 Iteration 2: log likelihood = -696.05937 Iteration 3: log likelihood = -679.81218 Iteration 4: log likelihood = -666.53806 Iteration 5: log likelihood = -665.50986 Iteration 6: log likelihood = -658.13604 Iteration 7: log likelihood = -657.09612 Iteration 8: log likelihood = -657.08286 Iteration 9: log likelihood = -657.08286 Random-effects probit Number of obs = 3891 Group variable (i) : sire Number of groups = 278 Random effects u_i ~ Gaussian Obs per group: min = 13

avg = 14.0 max = 14 Wald chi2(5) = 405.09 Log likelihood = -657.08286 Prob > chi2 = 0.0000 ------------------------------------------------------------------------------ wg | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- lnpgn | -3.541549 .2524669 -14.03 0.000 -4.036375 -3.046723 lnpk | .9321749 .3466973 2.69 0.007 .2526607 1.611689 lnpfl | -.6432045 .2752501 -2.34 0.019 -1.182685 -.1037243 lnpfd | 2.488594 .3997656 6.23 0.000 1.705068 3.27212 leff | .4004405 .138137 2.90 0.004 .1296969 .6711841 _cons | -18.61093 3.124295 -5.96 0.000 -24.73443 -12.48742 -------------+---------------------------------------------------------------- /lnsig2u | 1.970308 .1089466 1.756777 2.183839 -------------+---------------------------------------------------------------- sigma_u | 2.678224 .1458918 2.407017 2.979989 rho | .8776442 .0116992 .8528055 .8987889 ------------------------------------------------------------------------------ Likelihood ratio test of rho=0: chibar2(01) = 1528.65 Prob >= chibar2 = 0.000 6 . log close 6 . log close 6 . log close 6 . log close log: E:\dea\panel\2004\paper31.smcl log type: smcl closed on: 13 Apr 2004, 22:46:43 -------------------------------------------------------------------------------

Appendix 10. IV and GMM estimation withGauss c

/* IV2.PRG Instrumental variable estimation and GMM estimation

Model y(it) = X(it)beta + Z(i) gamma

We use Hausman-Taylor, Amemiya-MaCurdy, Breusch-Mizon-Schmidt instruments,

both for IV and GMM */

new ;clear all ;

/* You only need to change this block */

/* Define dimensions

N : number of units, T=number of time periods

nvar= Nb. of variables to be read

k1 : Nb. of X1it, k2 : Nb. of X2it, g1= Nb. of Z1i, g2 : Nb. of Z2i

kq= k1+k2, kb= k1+k2+g1+g2*/

n=595 ;

t=7 ;

nvar=13 ;

k1=4 ;

k2=5 ;

g1=2 ;

g2=1 ;

kq=k1+k2 ;

kb=k1+k2+g1+g2 ;

et=ones(t,1) ;

un=ones(n*t,1) ;

unb=ones(n,1) ;

/* Read data */

load x[n*t,nvar]=psid.dat ;

output file=iv1.out reset ;

expe=x[.,1] ;

expe2=x[.,2] ;

wks=x[.,3] ;

83

occ=x[.,4] ;

ind=x[.,5] ;

south=x[.,6] ;

smsa=x[.,7] ;

ms=x[.,8] ;

fem=x[.,9] ;

unioni=x[.,10] ;

edu=x[.,11] ;

blk=x[.,12] ;

lwage=x[.,13] ;

/* Define matrices X, Z and vector Y */

x1 = occ�south�smsa�ind ;

x2 = expe�expe2�wks�ms�unioni ;

z1 = fem�blk ;

z2 = edu ;

y = lwage ;

x = x1�x2 ;

z = z1�z2 ;

/* You don't need to change anything after this */

/* Compute Between and Within transformations : BX and QX

Caution : keep that order for BXZ : X,Z,Y */

qx=with(x�y) ;

bxz=bet(x�z�y) ;

by=bxz[.,cols(bxz)] ;

bxz=bxz[.,1 :cols(bxz)-1] ;

qy=qx[.,cols(qx)] ;

qx=qx[.,1 :cols(qx)-1] ;

/* Within regression and error term (uw) */

betaw=inv(qx'qx)*qx'qy ;

uw=qy-qx*betaw ;

/* Compute variance with instruments */

exob=un�bxz ;

gamb=inv(exob'exob)*(exob'by) ;

84

ub=by-exob*gamb ;

sigep=uw'uw/(n*(t-1)-kq) ;

sigq=sqrt(sigep*diag(inv(qx'qx))) ;

a=x1�z1 ;

di=by-bxz[.,1 :kq]*betaw ;

zz = un�z1�z2 ;

gamhatw=inv(zz'*a*inv(a'*a)*a'*zz)*zz'*a*inv(a'*a)*a'*di;

s2=(1/(n*t))*(by-bxz[.,1 :kq]*betaw

-zz*gamhatw)'*(by-bxz[.,1 :kq]*betaw-zz*gamhatw) ;

sigal=s2-(1/t)*sigep ;

theta=sqrt(sigep/(sigep+t*sigal)) ;

/* GLS transformation and estimate

Caution : keep the order 1,X1,X2,Z1,Z2 in matrix EXOG */

exog=gls(un�x1�x2�z1�z2�y) ;

yg=exog[.,cols(exog)] ;

exog=exog[.,1 :cols(exog)-1] ;

betagls=inv(exog'exog)*(exog'yg) ;

siggls=sqrt(sigep*diag(inv(exog'exog))) ;

/* HT */

aht=un�qx�bet(x1)�z1 ;

betaht=inv(exog'*aht*inv(aht'*aht)*aht'*exog)*exog'*aht*inv(aht'*aht)

*aht'*yg ;

sight=sqrt(sigep*diag(inv(exog'*aht*inv(aht'*aht)*aht'*exog)));

/* AM */

x1s=tam(x1) ;

aam=un�qx�x1s�z1 ;

betaam=inv(exog'*aam*inv(aam'*aam)*aam'*exog);

betaam=betaam*exog'*aam*inv(aam'*aam)*aam'*yg;

sigam=sqrt(sigep*diag(inv(exog'*aam*inv(aam'*aam)*aam'*exog)));

/* BMS */

85

abms1=aam�tbms(with(x2)) ;

/* This is the general form for BMS instrument, it should work in most

cases. But with the application to PSID data, we must drop some variables,

see below. This means you have to delete ABMS1 below for your application

*/

/* Remove abms1 just below : */

abms1=un�qx�bet(x1)�tbms(with(occ�south�smsa�ind�ms�wks�unioni))�z1;

betabms1=inv(exog'*abms1*inv(abms1'*abms1)*abms1'*exog)

*exog'*abms1*inv(abms1'*abms1)*abms1'*yg ;

sigbms1=sqrt(sigep*diag(inv(exog'*abms1*inv(abms1'*abms1)*abms1'*exog)));

/* Compute variance-covariance matrices */

varq=sigep*inv(qx'qx) ; varg=sigep*inv(exog'*exog) ;

varht=sigep*inv(exog'*aht*inv(aht'*aht)*aht'*exog);

varam=sigep*inv(exog'*aam*inv(aam'*aam)*aam'*exog);

varbms1=sigep*inv(exog'*abms1*inv(abms1'*abms1)*abms1'*exog);

test1=(betagls[2 :kq+1]-betaw)'*inv(varq-varg[2 :kq+1,2 :kq+1]) ;

test1=test1*(betagls[2 :kq+1]-betaw) ;

test2=(betaht[2 :kq+1]-betaw)'*inv(varq-varht[2 :kq+1,2 :kq+1])

*(betaht[2 :kq+1]-betaw) ;

test3=(betaht-betaam)'*inv(varht-varam)*(betaht-betaam);

test4=(betaam-betabms1)'*inv(varam-varbms1)*(betaam-betabms1);

output file=iv1.out reset ;

output on ;

"Within estimates " ;

" Estimate standard error t-stat " ;

betaw�sigq�betaw./sigq ;

"GLS estimates" ;

"sigma(alpha),sigma(epsilon),theta(=(sig(ep)/(sig(ep+t*sig(al)))**(1/2))";

sigal sigep theta ;


betagls�siggls�betagls./siggls ;

86

"HT estimates " ;


betaht�sight�betaht./sight ;

"AM estimates " ;


betaam�sigam�betaam./sigam ; "BMS estimates " ;


betabms1�sigbms1�betabms1./sigbms1 ;

"Hausman test statistics and p-value " ;

"Within vs. GLS " ;

test1�cdfchic(test1,kq) ;

"Within vs. HT " ;

test2�cdfchic(test2,k1-g2) ;

"AM vs. HT " ;

test3�cdfchic(test3,cols(aam)-cols(aht)) ;

"BMS vs. AM " ;

test4�cdfchic(test4,cols(abms1)-cols(aam));

/* GMM estimation */

b1,se1,b2,se2,sar = gmm(y,un�x1�x2�z1�z2,aht,1) ;

"GMM-HT estimates " ;


b2�se2�b2./se2 ;

"Hansen test and p-value " ;

sar cdfchic(sar,cols(aht)-rows(b2)) ;

b1,se1,b2,se2,sar = gmm(y,un�x1�x2�z1�z2,aam,1) ;

"GMM-AM estimates " ;


b2�se2�b2./se2 ;


sar cdfchic(sar,cols(aam)-rows(b2)) ;

b1,se1,b2,se2,sar = gmm(y,un�x1�x2�z1�z2,abms1,1) ;

"GMM-BMS estimates " ;

87


b2�se2�b2./se2 ;


sar cdfchic(sar,cols(abms1)-rows(b2)) ;

output off ;

proc bet(w) ;

/* Compute BX from matrix w */

local i,term,betx ;

term=reshape(w[.,1],n,t) ;

term=meanc(term').*.et ;

term=reshape(term,n*t,1) ;

betx=term ;

i=2 ;

do until i>cols(w) ;

term=reshape(w[.,i],n,t) ;

term=reshape(meanc(term').*.et,n*t,1) ;

betx=betx�term ;

i=i+1 ;

endo ;

retp(betx) ;

endp ;

proc with(w) ;

/* Compute Within transformation for matrix W */

retp(w-bet(w)) ;

endp ;

proc gls(w) ;

/* GLS transformation */

local term ; term=w-(1-theta)*bet(w) ;

retp(term) ;

endp ;

proc tam(w) ;

/* AM transformation, stacking time observations */

local i,term,xstar ;

term=reshape(w[.,1],n,t).*.et ;

xstar=term ;

88

i=2 ;


term=reshape(w[.,i],n,t).*.et ;

xstar=xstar�term ;

i=i+1 ;

endo ;

retp(xstar) ;

endp ;

proc tbms(w) ;

/* BMS transformation, stacking time observations but deleting last column

*/

local i,term,xstar ;

term=reshape(w[.,1],n,t).*.et ;

xstar=term[.,1 :cols(term)-1] ;

i=2 ;


term=reshape(w[.,i],n,t).*.et ;

xstar=xstar�term[.,1 :cols(term)-1] ;

i=i+1 ;

endo ;

retp(xstar) ;

endp ;

proc (5)=gmm(y,x,z,d) ;

local zx,w,w2,b,e,e2,b2,se,se2,sar2 ;

zx = z'x ;

if d==1 ;

w = invpd(inw(z)) ;

else ;

w = invpd(z'z) ;

endif ;

b = invpd(zx'w*zx)*zx'w*z'y ;

e = y-x*b ;

w2 = ezw(e,z) ;

se = invpd(zx'w*zx)*zx'w*w2*w*zx*invpd(zx'w*zx);

89

w = invpd(w2) ;

se2 = invpd(zx'w*zx) ;

b2 = se2*zx'w*z'y ;

e2 = y-x*b2 ;

sar2 = e2'z*w*z'e2 ;

retp(b,sqrt(diag(se)),b2,sqrt(diag(se2)),sar2);

endp ;

proc ezw(e,z) ;

local k,ez,T ;

T = rows(e)/N ;

k = cols(z) ;

ez = reshape(e.*z,N,K*T)*(ones(T,1).*.eye(K));

retp(ez'ez) ;

endp ;

proc inw(z) ;

local a,i,zi,zaz,T ;

t = rows(z)/N ;

a = eye(T) ;

zaz = 0 ;

i = 1 ;

do until i>N ;

zi = z[(i-1)*T+1 :i*T,.] ;

zaz = zaz + zi'a*zi ;

i = i+1 ;

endo ;

retp(zaz) ;

endp ;

90

Appendix 11. DPD estimation with Gauss c

/* DPD1.PRG Program for DPD (Dynamic Panel Data model)

Method : Arellano-Bond */

/* Defines variables below as global */

clearg N,T,y,x,z,alpha,sco,hes,zgy,fake,mom,w;

/*Read data*/

n=595 ; t=7 ; nvar=13 ;

load x[n*t,nvar]=d :/dea/panel/psid.dat ;

lwage=x[.,13] ;

wks=x[.,3] ;

occ=x[.,4] ;

clear x ;

/* Create a (NxT) matrix for dependent var. */

y=reshape(lwage,n,t) ;

/* Stack exogenous vars. */

x=wks�occ ;

/* Set top=0 for instruments from lagged Y's only ;

top=1 to add instruments from X that are weakly exogenous and in level ;

set top=2 to add for instruments from X that are strongly exogenous and

in first-difference form */

top=2 ;

/* Set AR1 to 0 for general case, and AR1 to 1

for serially correlated epsilon's of order 1 (E(epitepi; t+ 1) <> 0) */

ar1=1 ;

/* You don't need to change anything after this line */

/* Define identity matrices I(T-2) for AB and BB */

ddif = eye(T-2) ;

/* Construct AB instrument matrix Z.

91

First component matrix : lagged Y's

Recall : if AR1=1, restriction when epsilon's are serially correlated

of order 1 */

z = (y[.,1]).*.ddif[.,1] ;

j = 2 ;

do until j>cols(ddif) ;

z = z�((y[.,1 :j]).*.ddif[.,j]) ;

j = j+1 ;

endo ;

if ar1==1 ;

z = (y[.,1]).*.ddif[.,1] ;

j = 2 ;


z = z�((y[.,1 :j-1]).*.ddif[.,j]) ;

j = j+1 ;

endo ;

z=z[.,2 :cols(z)] ;

endif ;

/* Second component matrix : Instruments from X */

/* Delete this block if you want only instruments from y's */

if top==1 ;

/* Weakly exogenous X's, in level */

toto=shapent(x[.,1]) ;

z2 = (toto[.,1]).*.ddif[.,1] ;

j = 2 ;


z2 = z2�((toto[.,1 :j]).*.ddif[.,j]) ;

j = j+1 ;

endo ;

i=2 ;

do until i>cols(x) ;

toto=shapent(x[.,i]) ;

z2 =z2�((toto[.,1]).*.ddif[.,1]) ;

j = 2 ;


z2 = z2�((toto[.,1 :j]).*.ddif[.,j]) ;

92

j = j+1 ;

endo ;

i=i+1 ;

endo ;

z=z�z2 ;

endif ;

if top==2 ;

/* Strongly exogenous X's, in first-difference form */

toto=shapent(x[.,1]) ;

z2 = (toto[.,3]-toto[.,2]).*.ddif[.,1] ;

j = 2 ;


z2 = z2�((toto[.,j]-toto[.,j-1]).*.ddif[.,j]);

j = j+1 ;

endo ;

i=2 ;do until i>cols(x) ;

toto=shapent(x[.,i]) ;

z2 = z2�((toto[.,3]-toto[.,2]).*.ddif[.,1]);

j = 2 ;


z2 = z2�((toto[.,j]-toto[.,j-1]).*.ddif[.,j]);

j = j+1 ;

endo ;

i=i+1 ;

endo ;

z=z�z2 ;

endif ;

b1,se1,b2,se2,sar = gmm(vec((y[.,3 :T]-y[.,2 :T-1])'),

vec((y[.,2 :T-1]-y[.,1 :T-2])')

�trans(x),z,1) ;

output file = dpd1.out on ;

"Arellano-Bond GMM estimates" ;

if top ==0 ;

"Instruments from lagged Y's only (TOP=0)" ;

endif ;

if top==1 ;

93

"Instruments from X are weakly exogenous and in level (TOP=1)" ;

endif ;

if top==2 ;

"Instruments from X are strongly exogenous and first-differenced (TOP=2)" ;

endif ;

if ar1==1 ;

"Restricted estimates : epsilon are serially correlated of order 1 (AR1=1)" ;

endif ;

" Estimate standard error t-stat" ;

b2�se2�b2./se2 ;

"Nb. of conditions (instruments) " cols(z) ;

"Nb. of parameters " rows(b2) ;

"Hansen specification test and p-value " ;

sar�cdfchic(sar,cols(z)-rows(b2)) ;

output off ;

proc shapent(w) ;

/* Reshapes vector in NxT form */

retp(reshape(w,n,t)) ;

endp ;

proc trans(w) ;

/* Transforms matrix X in First Difference */

local toto,i,xfd ;

toto=reshape(w[.,1],n,t) ;

toto=vec((toto[.,3 :T]-toto[.,2 :T-1])') ;

xfd=toto ;

i=2 ;


toto=reshape(w[.,i],n,t) ;

toto=vec((toto[.,3 :T]-toto[.,2 :T-1])') ;

xfd=xfd�toto ;

i=i+1 ;

endo ;

retp(xfd) ;

endp ;

94

proc (2)=ls(y,x) ;

/* Computes OLS, returns White var-covar matrix */

local ixx,b,e,v ;

ixx = invpd(x'x) ;

b = ixx*x'y ;

e = y-x*b ;

v = ixx*(ezw(e,x))*ixx ;

retp(b,v) ;

endp ;

proc ezw(e,z) ;

local k,ez,T ;

T = rows(e)/N ;

k = cols(z) ;

ez = reshape(e.*z,N,K*T)*(ones(T,1).*.eye(K));

retp(ez'ez) ;

endp ;

proc inw(z) ;

local d,a,i,zi,zaz,T ;

T = rows(z)/N ;

d = zeros(T,1)�(eye(T-1)|zeros(1,T-1)) ;

a = 2*eye(T) - (d + d') ;

zaz = 0 ;

i = 1 ;

do until i>N ;

zi = z[(i-1)*T+1 :i*T,.] ;

zaz = zaz + zi'a*zi ;

i = i+1 ;

endo ;

retp(zaz) ;

endp ;

proc (5)=gmm(y,x,z,d) ;

local zx,w,w2,b,e,e2,b2,se,se2,sar2 ;

zx = z'x ;

95

if d==1 ;

w = invpd(inw(z)) ;

else ;

w = invpd(z'z) ;

endif ;

b = invpd(zx'w*zx)*zx'w*z'y ;

e = y-x*b ;

w2 = ezw(e,z) ;

se = invpd(zx'w*zx)*zx'w*w2*w*zx*invpd(zx'w*zx);

w = invpd(w2) ;

se2 = invpd(zx'w*zx) ;

b2 = se2*zx'w*z'y ;

e2 = y-x*b2 ;

sar2 = e2'z*w*z'e2 ;

retp(b,sqrt(diag(se)),b2,sqrt(diag(se2)),sar2);

endp ;

96

Références bibliographiques

T. Amemiya et T.E. MaCurdy, Instrumental-Variable Estima-

tion of an Error-Components Model, Econometrica, 54(4), 869�880,

1986.

T.W. Anderson et C. Hsiao, Formulation and Estimation of

Dynamic Models Using Panel Data, Journal of Econometrics, 18,

47�82, 1982.

M. Arellano et S. Bond, Some Tests of Speci�cation for Panel

Data : Monte Carlo Evidence and an Application to Employment

Equations, Review of Economic Studies, 58, 277�297, 1991.

M. Arellano et O. Bover, Another Look at the Instrumental Va-

riable Estimation of Error-Components Models, Journal of Eco-

nometrics, 68, 29�51, 1995.

M. Arellano, Panel data econometrics. Oxford Universiy Press,

Oxford, 2003.

P. Balestra et M. Nerlove, Pooling cross-section and time-series

data in the estimation of a dynamic model : the demand for na-

tural gas, Econometrica, 34, 585-612,1966.

B.H. Baltagi, Econometric Analysis of Panel Data, J. Wiley,

1995.

B.H. Baltagi, Speci�cation issues, in The econometrics of pa-

nel data : Handbook of theory and applications, chap. 9, L. Ma-

97

tyas and P. Sevestre eds., Kluwer Academix Publishers, Dordrecht,

196-205, 1992.

T.S. Breusch, G.E. Mizon et P. Schmidt, E�cient Estimation

Using Panel Data, Econometrica, 57(3), 695-700, 1989.

G. Chamberlain, Panel data, in Handbook of Econometrics, pp.

1247-1318, Z. Griliches and M. Intriligator eds., North- Holland,

Amsterdam, 1984.

B. Dormont, Introduction à l'Econométrie des Données de Pa-

nel, Editions du Centre National de la Recherche Scienti�que, Pa-

ris, 1989.

L.P. Hansen, Large sample properties of generalized method of

moments estimators, Econometrica, 50, 102-1054, 1982.

J.A. Hausman, Speci�cation Tests in Econometrics, Econome-

trica, 46(6), 1251�1271, 1978.

J.A. Hausman et W.E. Taylor, Panel Data and Unobservable

Individual E�ects, Econometrica, 49(6), 1377�1398, 1981.

C. Hsiao, Analysis of Panel Data, Cambridge University Press,

1986.

L. Matyas et P. Sevestre, The Econometrics of Panel Data.

Handbook of Theory and Applications, Kluwer Academic Publi-

shers, 1992.

98

M. Nerlove, A note on error components models, Econometrica,

39, 383-396, 1971.

W.K. Newey, E�cient estimation of models with conditional

moment restrictions, in Handbook of Statistics, C.R. Rao and

H.D. Vinod (Eds.), Vol. 11, Elsevier Science Publishers, 1993.

P. Sevestre, Econométrie des données de panel. Dunod, Paris,

2002.

P.A.V.B. Swamy et S.S. Arora, The exact �nite sample pro-

perties of the estimators of coe�cients in the error components

regression models, Econometrica, 40, 261-275, 1972.

J.M. Wooldridge, Econometric analysis of cross section and pa-

nel data. MIT Press, Cambridge, 2003.

99

l'économétrie - institut national de la recherche …2).pdf1.1.2 iden ti cation de termes...

Documents