l'économétrie - institut national de la recherche …2).pdf1.1.2 iden ti cation de termes...
TRANSCRIPT
1 Introduction
Données de panel : Séquence d'observations sur une population
(ménages, entreprises, pays).
En anglais : cross-sections over time ou pooled cross-section time-
series data.
Fondamental : Deux dimensions (individuelle et temporelle).
1.1 Gains à fusionner des données dans les deux dimen-
sions
1.1.1 Moins de collinéarité entre les variables explicatives
En économie de la production et de la consommation, les prix
sont di�ciles à utiliser :
� Séries temporelles : Les indices de prix agrégés sont très col-
linéaires ;
� Coupe instantanée : Pas su�samment de variation de prix
entre �rmes ou individus.
Avec données de panel, prise en compte des variations entre indi-
vidus et périodes.
� Séries temporelles : pas d'information sur l'impact des carac-
téristiques individuelles (variables socio-économiques,...) ;
� Coupes instantanées : pas d'information sur les dynamiques
d'ajustement.
2
1.1.2 Identi�cation de termes individuels inobservables
Sous certaines conditions (voir plus loin). Si le nombre d'ob-
servations est su�samment grand, on peut estimer des termes
d'hétérogénéité individuelle inobservable.
1.1.3 Réduction du biais (variables manquantes/inobservables)
Avec le panel, facile de contrôler l'hétérogénéité inobservable
entre les individus (d'où la popularité de ces méthodes).
Exemple : Décision de production et e�cacité des entreprises
max� = pQ� C(�;Q) où C(�;Q) = � � c(Q);
p : prix de vente, Q : quantité produite, � : terme d'e�cacité,
C(:) : coût total de production.
, p = �@c(Q)
@Q= A��Q
��1 (coût Cobb-Douglas)
= �(�0 + �1Q) (coût quadratique).
Cas Cobb-Douglas : logQ = 1��1 (log p� log � � A� �).
De la condition d'équilibre à l'équation estimable :
Observations (Qit; pit), hétérogenéité inobservable �i, entre-
prise i, période t.
logQit =1
� � 1(log pit � log �i � A� �)
Problème d'identi�cation : l'équation estimable est
~Qit = a0 + a1~pit + uit; i = 1; 2; : : : ; N; t = 1; 2; : : : ; T;
3
où ~Qit = logQit,
~pit = log pit,
a1 = 1=(� � 1),
a0 = (�A� � � E log �i) =(� � 1), Euit = 0.
Le modèle est identi�é si E log �i = 0, i.e., E�i = 1. Sinon, A est
biasé si �i est négligé et E log �i 6= 0.
Problème empirique : Corrélation possible entre prix de vente
pit et e�cacité �i. �
1.2 Analyse de variance
Considérons le modèle
yit = �i + xit�i + "it; i = 1; 2; : : : ; N; t = 1; 2; : : : ; Ti;
où xit est scalaire, �i et �i sont des paramètres, et Ti : nombre de
périodes disponibles pour l'individu i.
Moments empiriques utiles :
yi =1
T
TiXt=1
yit; xi =1
T
TiXt=1
xit;
Sxxi =
TiXt=1
(xit � xi)2; Sxyi =
TiXt=1
(xit � xi)(yit � yi);
et
Syyi =
TiXt=1
(yit � yi)2; i = 1; 2; : : : ; N:
L'estimateur par Moindres Carrés est calculé par
�i = Sxyi=Sxxi et �i = yi � xi�;
4
et la Somme des Carrés des Résidus (RSS) pour l'individu
i est
RSSi = Syyi � S2xyi=Sxxi; with (Ti � 2) degrés de liberté:
Considérons à présent un modèle restreint avec des ordonnées
et des pentes constantes :
yit = �+ xit� + "it;
que l'on obtient en imposant les conditions suivantes :��1 = �2 = � � � = �N(= �)
�1 = �2 = � � � = �N(= �):
Sous ces restrictions, l'estimateur des Moindres Carrés sera
� =
PNi=1
PTit=1(xit � �x)(yit � �y)PN
i=1
PTit=1(xit � �x)2
et � = �y � �x�, où
�y =1
NP
i Ti
NXi=1
TiXt=1
yit; �x =1
NP
i Ti
NXi=1
TiXt=1
xit:
La Somme des Carrés des Résidus est
RSS =
NXi=1
TiXt=1
(yit � �y)2 �
hPNi=1
PTit=1(yit � �y)(xit � �x)
i2PN
i=1
PTit=1(xit � �x)2
;
avec comme degrés de liberté :PN
i=1 Ti � 2.
5
Pour une majorité d'applications, le premier modèle est trop
général et l'estimation demanderait un nombre important de pé-
riodes. Si l'hétérogénéité est aditive dans le modèle, on peut consi-
dérer la spéci�cation suivante, avec pente constante mais ordon-
nées di�érentes :
yit = �i + xit� + "it:
En minimisantP
i
Pt(yit � �i � xit�)
2 par rapport à �i and �,
on obtient :Xi
Xt
(yit � �i � xit�) = 0;Xi
Xt
xit(yit � �i � xit�) = 0;
de sorte que
�i = �yi � �xi� et � =
Pi
Pt xit(yit � �yi)P
i
Pt xit(xit � �xi)
:
La RSS a maintenantP
i Ti � (N + 1) degrés de liberté (N + 1
paramètres sont estimés).
C'est le modèle le plus utilisé dans les applications empiriques.
1.3 Quelques dé�nitions
� Panel typique : le nombre d'individu N est grand et celui des
périodes (T ) est petit.
� Panel court (long) : quand T est petit (grand).
� Panel cylindré (balanced panel) : même nombre de périodes
pour chaque individu.
6
� Panel rotatif : un sous-échantillon d'individus est remplacé à
chaque période. Les panels rotatifs peuvent être cylindrés ou non.
� Pseudo panel : obtenu par fusion de coupes instantanées à
di�érentes périodes, avec des individus di�érents.
� Attrition : avec des panels longs, la probabilité que l'indivi-
dual reste dans l'échantillon décroît avec le nombre de périodes
(lassitude, déménagement, décès, faillite, etc.)
2 Le modèle linéaire
2.1 Notation
2.1.1 Notation sous forme scalaire
yit = xit� + uit; i = 1; 2; : : : ; N; t = 1; 2; : : : ; T;
où xit est un vecteur 1 � K de variables explicatives, � est un
vecteur (K � 1) de paramètres, et uit est le résidu.
yit et les composantes de xit varient à la fois entre les individus et
dans le temps.
Composante de la variable dépendante inexpliquée par xit :
uit = �i + �t + "it;
où �i est l'e�et individuel, �t est l' e�et temporel, et "it est
une erreur i.i.d.
7
Modèle à erreurs composées de type I : uit = �i + "it.
Modèle à erreurs composées de type II : uit = �i+ �t+ "it.
Permet di�érentes prédictions de yit sachant Xit :
E(yitjxit) = xit�;
E(yitjxit; i) = xit� + �i pour l'individu i,
E(yitjxit; t) = xit� + �t pour la période t,
E(yitjxit; i; t) = xit� + �i + �t pour l'individu i et la période t.
2.1.2 Notation sous forme matricielle
Y = X� + �+ �+ ";
où Y; �; � et " sont (NT � 1), X est (NT �K).
Convention : l'indice t est le plus rapide, l'indice i est le plus lent :
0BBBBBBBBBBBBBBBBBBBB@
y11...
y1T
y21...
y2T...
yit...
yN1...
yNT
1CCCCCCCCCCCCCCCCCCCCA
=
266666666666666666666664
X(1)11 � � � X
(K)11
... � � � ...
X(1)1T � � � X
(K)1T
X(1)21 � � � X
(K)21
... � � � ...
X(1)
2T � � � X(K)
2T... � � � ...
X(1)it � � � X
(K)it
... � � � ...
X(1)N1 � � � X
(K)N1
... � � � ...
X(1)NT � � � X
(K)NT
377777777777777777777775
0BBBBBBB@
�1
�2...
�k...
�K
1CCCCCCCA
+ �+ �+ "
8
2.1.3 Modèle sous forme vectorielle
yi = Xi� + ��i + �+ "i; i = 1; 2; : : : ; N;
où yi is T � 1, Xi est T �K.
Note : � = (�1; �2; : : : ; �T )0 et ��i = (�i; �i; : : : ; �i)
0 sont (T � 1).
2.1.4 Matrices et opérateurs usuels
� INT : matrice identité avec NT lignes et NT colonnes ;
� eT : vecteur T � 1 de 1 ;
� B = IN (1=T )eTe0T : Opérateur Inter-individus (Bet-
ween Groups) ;
� �B = (1=N)eNe0NIT : Opérateur Inter-périodes (Between
Periods) ;
� Q = INT � IN (1=T )eTe0T = INT �B :
Opérateur Intra-individu (Within Groups) ;
� �Q = INT � (1=N)eNe0N IT = INT � �B :
Opérateur Intra-période (Within Periods) ;
� B �B = (1=NT )eNTe0NT :
Calcule la moyenne dans la population.
Hypothèse importante : Pas de terme constant dans le modèle.
Sinon, utiliser B �B pour décentrer toutes les variables.
9
Les opérateurs B sont utilisés pour calculer, à partir des vecteurs
et matrices à NT lignes, les moyennes spéci�ques aux individus
et aux périodes, qui sont aussi à NT lignes.
Les opérateursQ sont utilisés pour calculer les écarts à ces moyennes.
2.1.5 Propriétés importantes de ces opérateurs
Symétrie, idempotence et orthogonalité
Q0 = Q; B
0 = B; Q2 = Q; B
2 = B; BQ = QB = 0;
Rang d'une matrice idempotente = sa trace
) rank(Q) = N(T � 1) and rank(B) = N:
Décomposition de l'opérateur Q avec N = T = 2 :
Qy =
0BB@2664
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
3775�
�1 0
0 1
� 1
2
�1 1
1 1
�1CCA y
=
0BB@
y11
y12
y21
y22
1CCA� 1
2
2664
1 1 0 0
1 1 0 0
0 0 1 1
0 0 1 1
37750BB@
y11
y12
y21
y22
1CCA
=
0BB@
y11
y12
y21
y22
1CCA� 1
2
0BB@
y11 + y12
y11 + y12
y21 + y22
y21 + y22
1CCA
Nous utiliserons aussi, dans la notation vectorielle
� BT = (1=T )eTe0T : Opérateur Between pour un seul individu ;
10
� QT = IT � (1=T )eTe0T = IT � BT : Opérateur Within pour un
seul individu.
2.2 Le modèle à e�ets �xes de type I
Terminologie : le modèle à e�ets �xes ne signi�e pas que les
e�ets individuels �i ne sont pas aléatoires dans le vrai modèle !
Plutôt, l'estimation est menée conditionnellement à l'hétérogé-
néité inobservée : les �i sont �traités comme� des paramètres à
estimer.
2.2.1 L'estimateur en termes du théorème de Frisch-Waugh-Lovell
L'inférence est conditionnelle aux e�ets individuels : les esti-
mations sont obtenues en régressant Y sur X et des indicatrices
individuelles.
Soit E la matrice NT �N des indicatrices individuelles :
E =
266666666666666666664
1 0 0 � � � 0
1 0 0 � � � 0
1 0 0 � � � 0
0 1 0 � � � 0
0 1 0 � � � 0
0 1 0 � � � 0... � � � � � � � � � ...
0 0 0 � � � 1
0 0 0 � � � 1
0 0 0 � � � 1
" " "(i = 1) (i = 2) � � � � � � (i = N)
377777777777777777775
11
et considérons le modèle
Y = X� + E + " = W� + u
où W = [X;E], � = (� 0; 0)0, u = ".
Théorème de Frish-Waugh-Lovell : Les paramètres estimés � sont
numériquement identiques dans les 2 procédures suivantes :
� � de �MCO = (�0; 0)0 = (W 0
W )�1W 0Y
� � = (X�0
X�)�1X�0
Y�; où
X� = [I �E(E 0
E)�1E 0]X = PEX;
Y� = [I �E(E 0
E)�1E 0]Y = PEY
(résidus de la régression linéaire de X et Y sur E).
Mais E = IN eT , E0E = IN e
0TeT = IN � T
, PE = I � E(E 0E)�1E 0 = I � 1
TE(IN)E
0
= I � 1T(IN eT )(IN eT )
0 = I � IN 1TeTe
0T = Q.
Par conséquent, � = (X�0
X�)�1(X�0
Y�) = (X 0
P0EPEX)�1(X 0
P0EPEY )
= (X 0QX)�1(X 0
QY ).
Idée derrière la procédure d'estimation des e�ets �xes :
Eliminer les e�ets individuels , Eliminer les écarts spéci�ques
aux individus
(des variables)
Transformation du modèle linéaire :
yit � 1=TXt
yit = (xit � 1=TXt
xit)� + uit � 1=TXt
uit
, Y �BY = (X � BX)� + u�Bu , QY = QX� +Qu:
12
Estimateur par Moindres Carrés :
� = [(QX)0(QX)]�1
(QX)0QY = [X 0Q0QX]
�1(X 0
Q0QY )
= (X 0QX)�1X 0
QY et V ar(�) = �2"(X
0QX)�1.
2.2.2 Interprétation comme un estimateur de covariance
Modèle en forme vectorielle :26664y1
y2...
yN
37775 =
26664x1
x2...
xN
37775 � +
26664eT
0T...
0T
37775�1 +
26664
0TeT...
0T
37775�2
+ � � �+
26664
0T0T...
eT
37775�N +
26664"1
"2...
"N
37775 ;
avec les hypothèses :
E("i) = 0; E("i"0i) = �
2"IT ; E("i"
0j) = 0 i 6= j:
Les estimateurs MCO (Moindres Carrés Ordinaires) de � et �is'obtiennent comme
min
NXi=1
"0i"i =
NXi=1
(yi � ��i � xi�)
0(yi � ��i � xi�)
, �i = �yi � �xi�; i = 1; 2; : : : ; N;
et, en substituant la dérivée partielle par rapport à �, nous avons
� =
"N;TXi;t
(xit � �xi)(xit � �xi)0
#�1 "N;TXi;t
(xit � �xi)(yit � �yi)
#:
13
Cet estimateur est appelé L'estimateur de la covariance (cova-
riance estimator), ou l'estimateur LSDV (Least-Square Dummy-
Variable). � est sans biais, convergent lorsque N ou T tend vers
l'in�ni. Sa matrice de variance-covariance s'écrit
V ar
��
�= �
2"
"NXi=1
xiQTx0i
#�1;
où QT = IT � (1=T )eTe0T .
�i est sans biais mais convergent seulement quand T !1.
2.2.3 Commentaires
� Transformation du modèle par �ltrage de la composante indivi-
duelle) les coe�cients associés aux régresseurs invariant dans le
temps ne sont pas identi�és.
� La procédure "E�ets Fixes" utilise les variations within entre
les périodes pour chaque individu, d'où son nom.
� Autre possibilité : la procédure Between, qui utilise les va-
riations entre les individus :
BY = BX� + B� +B";
� = [(BX)0(BX)]�1
(BX)0BY = [X 0BX]
�1X0BY:
Cet estimateur utilise les di�érences entre les moyennes indivi-
duelles des variables du modèle.
Si X1 varie dans le temps seulement, BX1 = f 1T
PTt x1itgi;t =
�x1 8i, et le terme constant (ordonnée à l'origine) n'est pas identi�é.
Une remarque concernant le calcul de l'estimateur de la
variance-covariance. Dans le modèle QY = QX� + Qu, les
14
logiciels statistiques diviseraient RSS par NT � K (e�ets �xes
exclus). Mais dans le modèle Y = X�+E +�+ ", la RSS serait
divisée par N(T � 1)�K.
L'estimateur de la variance dans le modèle à e�ets �xes doit être
multiplié par (NT �K)=[N(T � 1)�K].
Y
X
Between
Within
y
�
Æ
�1
�2
�3
................................................................................
...........
15
2.2.4 Tests de �poolability� et e�ets individuels
�Poolability�
Comme avant :yit = �i + xit�i + "it
versus
yit = �i + xit� + "it;
mais maintenant xit est un vecteur 1�K.
H0 : �1 = �2 = � � � = �N(= �) (K(N � 1) contraintes).
La statistique de test de Fisher est :
(RRSS � URSS)=K(N � 1)
URSS=N(T �K � 1)v F (K(N � 1); N(T �K � 1)) ;
où RRSS : de la régression Within
et URSS : =PN
i=1RSSi où RSSi = Syyi � S2xyi=Sxxi.
Test des e�ets individuels
H0 : �1 = � � � = �N(= �).
yit = � + xit� + "it (MCO)
versus
yit = �i + xit� + "it (Within):
La statistique de test de Fisher est :
(RRSS � URSS)=(N � 1)
URSS=(NT �N �K)v F ((N � 1); NT �N �K)) ;
où RRSS : provient de la régression MCO sur les données fusion-
nées (�pooled data�)
et URSS : provient de la régression Within (LSDV) .
16
2.3 Le modèle à e�ets aléatoires
2.3.1 Notations et hypothèses
Problème avec le modèle E�ets Fixes : perte de (beaucoup de)
degrés de liberté quand N !1. Approche di�érente : traiter les
e�ets individuels comme des e�ets aléatoires, i.e., l'inférence sur
le modèle est marginale (non conditionnelle aux �i) par rapport
à la population de tous les e�ets.
Hypothèses :
�i v IID(0; �2�); "it v IID(0; �2
"); E(�i"it) = E(�ixit) = 0;
avec
E(�i�j) =
��2� si i = j;
0 sinon;
E("it"sj) =
��2" si i = j et t = s;
0 sinon:
Ainsi cov(uit; ujs) = �2� + �
2" si i = j et t = s, et �2
� si i = j et
t 6= s.
Soit
T = E(uiu0i) =
26664�2� + �
2" �
2� � � � �
2�
�2� �
2� + �
2" � � � �
2�
... � � � � � � ...
�2� �
2� � � � �
2� + �
2"
37775 ;
une matrice (T � T ), pour chaque individu i, i = 1; 2; : : : ; N .
On a
E(uu0) = = IN T = IN ��2�(eTe
0T ) + �
2"IT
�= IN
��2�(T � BT ) + �
2"(QT + BT )
�17
puisque QT = IT � BT and BT = (1=T )eTe0T . Par conséquent,
= IN ��2�(T � BT ) + �
2"(QT + BT )
�= T�
2�B + �
2"INT
ou de façon équivalente : = �2"Q+ (T�2
� + �2")B.
2.3.2 Estimation par Moindres Carrés Généralisés du Modèle à
E�ets Aléatoires
Forme générale : Y = X� + U; with E(UU 0) = .
Les Moindres Carrés Généralisés (MCG, GLS en anglais) four-
nissent des estimations e�caces (de variance minimum) de �, �2�
et �2" , basées sur une structure connue de variance-covariance .
�MCG =�X0�1X
��1X0�1Y
et V ar(�MCG) = �2"
�X0�1X
��1.
Calcul de �1 : utilisation de la formule
r = (�2")rQ+ (T�2
� + �2")rB
pour un scalaire arbitraire r. On se base sur les propriétés d'idem-
potence et d'orthogonalité de Q and B.
En particulier, des matrices utiles sont
�1 =1
�2"
Q+1
T�2� + �2
"
B
et
�1=2 =1
�"Q+
1
(T�2� + �2
")1=2
B:
On a �MCG =�X0�1X
��1X0�1Y
=
"X0�
�2"
��1X
#�1 "X0�
�2"
��1Y
#:
18
=hX0 (Q+ �B)
�1X
i�1 hX0 (Q+ �B)
�1Y
i;
où � = (T�2� + �
2")=�
2" = 1 + T�
2�=�
2" .
Les MCG comme des Moindres Carrés Pondérés. Pré-
multiplions le modèle par �"�1=2 et utilisons la formule MCO :
Y� = X
�� + u
�, où
Y� = �"
�1=2Y =
�Q+
�"
(�" + T��)1=2B
�Y
X� = �"
�1=2X =
�Q+
�"
(�" + T��)1=2B
�X;
de sorte que Y� = (Q + �
�1=2B)Y; X� = (Q + �
�1=2B)X; et
sous forme scalaire :
fy�itg = (yit � �yi) + ��1=2�yi = yit � (1� 1p
�)�yi
fx�itg = (xit � �xi) + ��1=2�xi = xit � (1� 1p
�)�xi:
2.3.3 Comparaison entre les MCG, MCO et E�ets Fixes
�MCG =
�X0QX +
1
�X0BX
��1�X0QY +
1
�X0BY
�
�Within = (X 0QX)�1X 0
QY; �Between = (X 0BX)�1X 0
BY;
de sorte que
�MCG = S1�Within + S2�Between;
19
où S1 = [X 0QX + 1
�X0BX]�1X 0
QX et
S2 = [X 0QX + 1
�X0BX]�1X
0BX�
.
� (i) Si �2� = 0, alors 1=� = 1 et �MCG = �MCO.
� (ii) Si T !1, alors 1=�! 0 et �MCG ! �Within.
� (iii) Si 1=�!1, alors �MCG ! �Between.
� (iv) V ar(�Within) � V ar(�MCG) est une matrice semi-dé�nie
positive.
� (v) Si 1=�! 0, alors V ar(�Within)! V ar(�MCG).
2.3.4 E�ets individuels �xes ou aléatoires ?
Problème crucial en économétrie des panels : comment traiter
les e�ets �i ? Comme des paramètres ou comme des e�ets aléa-
toires ?
) Si l'inférence est limitée aux individus spéci�ques dans l'échan-
tillon : inférence conditionnelle, on utilise les E�ets Fixes. Exemple :
Les individus ne sont pas sélectionnés aléatoirement, ou bien toutes
les entreprises dans un secteur donné sont sélectionnées.
) Si l'inférence porte sur la population totale : inférence margi-
nale (non conditionelle), on utilise les E�ets Aléatoires. Exemple :
Les individus sont sélectionnés au hasard à partir d'une (grande)
population (consommateurs).
20
Quelques critères de choix En pratique
� Interprétation des e�ets dans le modèle économique ;
� Processus d'échantillonnage : purement aléatoire ou non ;
� Nombre d'individus (pays, régions, ménages,...) ;
� Interchangeabilité des individus ;� Endogénéité des Xit (voir plus loin).
Terminologie Lorsque l'on considère des e�ets �xes individuels,
procédure d'estimation Fixed-E�ects ou Within. Avec des ef-
fets aléatoires, procédure d'estimationMCG (Moindres Carrés
Généralisés).
L'estimateur MCG est une moyenne pondérée des estimateurs
Within et Between, où le poids est l'inverse de la variance cor-
respondante.
L'estimateur Within néglige les variations entre les individus, l'es-
timateur Between néglige les variations
temporelles pour un individu, et en�n les MCO donnent un poids
égal aux variations Within et Between.
Note. Si le modèle contient une ordonnée à l'origine :
yit = �+ xit� + �i + "it;
on utiliseB�B �B au lieu de B (pour éliminer �) dans les formules.
21
2.3.5 Estimateurs �Best Quadratic Unbiased Estimators� (BQU)
des variances
Si les erreurs sont normales, les estimations BQU de �2� et �2
"
s'obtiennent à partir de
�2" = u
0Qu=tr(Q) =
PNi=1
PTt=1(uit � �ui)
2
N(T � 1)
et \�2" + T�2
� = u0Bu=tr(B) = T
NXi=1
�u2i=N;
car tr(Q) = N(T � 1) and tr(B) = N .
Mais en pratique, les uit sont inconnus et l'on doit estimer les
variances à partir de uit.
1/ Wallace et Hussain (1969) : Utiliser les résidus MCO à la place
des vrais u ;
2/ Amemiya (1971) : Utiliser les résidus estimés LSDV. On a� pNT (�2
" � �2")p
N(�2� � �
2�)
�v N
�0;
�2�4
" 0
0 2�4�
��;
où �2� =
�\�2" + T�2
� � �2"
�=T .
3/ Swamy et Arora (1972) : Utiliser les erreurs quadratiques moyennes
des régressions Within et Between.
Erreur quadratique moyenne de la régression Within :
�2" =
�Y0QY � Y
0QX(X 0
QX)�1X 0QY�=[N(T � 1)�K]
et de la régression Between :
\�2" + T�2
� =�Y0BY � Y
0BX(X 0
BX)�1X 0BY�=[N �K � 1]:
22
Note : Ordonnée à l'origine dans les régresseurs Between (X), pas
dans la régression Within.
4/ Nerlove (1971) : Calculer �2� = 1
N�1
PNi=1(�i� ��i)
2, où �i sont
des �paramètres� estimés associés aux indicatrices individuelles de
la régression LSDV. Et �2" est estimé à partir de la régression Wi-
thin.
La méthode d'estimation MCG ci-dessus avec les composantes des
variances remplacées par des estimateurs convergents : �Feasible
GLS�, MCG Admissibles.
23
2.4 Exemple : Demande d'eau des ménages
Utilisation des logiciels SAS et GAUSS.
Dé�nition des variables :
� LCONSO : log de la consommation d'eau potable par tête ;
� LPRICE : log du prix moyen de l'eau distribué, par mètre cube ;
� LREVENUE : log du revenu par tête.
Nombre d'observations : 696 (N = 116, T = 6).
Equation linéaire en log :
logQit = �i + � log pit + logRit + "it:
Utilité : calculer les élasticités-prix et revenu :
�P =@Q
@p� p
Q=@ logQ
@ log p= �; �R =
@Q
@R�RQ
=@ logQ
@ logR= :
24
Exemple : Le logiciel Gauss c
/* DYNTAB.PRG 16 01 2001 Residential water use */
new ; clear all ;
library tscs,pgraph ;
tscsset ;graphset ;
output �le=d :/dea/panel/dyntab.out reset ;
output on ;
n=116 ; t=6 ;
load x[n*t,6]=d :/dea/panel/dyntab3.dat ;
id=x[.,1] ;
year=x[.,2] ;
conso=ln(x[.,3]) ;
price=ln(x[.,4]) ;
revenue=ln(x[.,5]) ;
precip=ln(x[.,6]) ;
vnames="year","conso","price","revenue","precip","id" ;
call saved(year�conso�price�revenue�precip�id,"wat�le",vnames) ;
y= conso ;
x= price,revenue ;
grp= id ;
__title("Water demand equation") ;
call tscs("wat�le",y,x,grp) ;
25
=====================================================================
TSCS Version 3.1.2 1/17/01 3 :51 pm
=====================================================================
Data Set : watfile
����������������������������������-
��������� OLS DUMMY VARIABLE RESULTS ��������-
��������������
Dependent variable : conso
��������������
Observations : 696
Number of Groups : 116
Degrees of freedom : 578
Residual SS : 2.578
Std error of est : 0.067
Total SS (corrected) : 2.891
F = 35.033 with 2,578 degrees of freedom
P-value = 0.000
Var Coef. Std. Coef. Std. Error t-Stat P-Value
��- ���- ������ ������� ���� ������-
price -0.134245 -0.347461 0.018447 -7.277506 0.000
revenue 0.024386 0.035045 0.033223 0.734009 0.463
Group Number Dummy Variable Standard Error
1 4.643484 0.365639
2 4.876781 0.370063
3 5.252595 0.369474
... ... ... ... ... ... ...
114 4.839490 0.365496
115 4.858434 0.359065
116 5.099257 0.366957
F-statistic for equality of dummy variables :
F(115, 578) = 58.3964 P-value : 0.0000
26
�������
OLS ESTIMATE OF CONSTRAINED MODEL
��������
��������������
Dependent variable : conso
��������������
Observations : 696
Number of Groups : 116
Degrees of freedom : 693
R-squared : 0.172
Rbar-squared : 0.170
Residual SS : 32.532
Std error of est : 0.217
Total SS (corrected) : 39.308
F = 72.175 with 3,693 degrees of freedom
P-value = 0.000
Var Coef. Std. Coef. Std. Error t-Stat P-Value
��- ���- ������ ������� ���� ���������
CONSTANT 1.164761 �- 0.598014 1.947715 0.052
price -0.249873 -0.406149 0.022153 -11.279345 0.000
revenue 0.376643 0.257121 0.052746 7.140637 0.000
��������������������������������-
FULL, RESTRICTED, AND PARTIAL R-SQUARED TERMS�DUMMY VARIABLES ARE CONSTRAINED
������������������-
TABLE OF R-SQUARED TERMS
������������������-R-squared�full model : 0.934
R-squared�constrained model : 0.172
Partial R-squared : 0.921������������������-
��������������������������������������
FULL, RESTRICTED, AND PARTIAL R-SQUARED TERMS�X VARIABLES ARE CONSTRAINED
27
������������������-
TABLE OF R-SQUARED TERMS
������������������-
R-squared�full model : 0.934
R-squared�constrained model : 0.926
Partial R-squared : 0.108������������������-
��������-
GLS ERROR COMPONENTS RESULTS
��������-
��������������
Dependent variable : conso
��������������
Observations : 696
Number of Groups : 116
Degrees of freedom : 693
Residual SS : 3.135
Std error of est : 0.067
Total SS (corrected) : 3.517
F = 22047.870 with 3,693 degrees of freedom
P-value = 0.000
Std. errors of error terms :
Individual constant terms : 0.206
White noise error : 0.067
Var Coef. Std. Coef. Std. Error t-Stat P-Value
��- ���- ������ ������� ���� ���������
CONSTANT 4.687235 �- 0.355285 13.192903 0.000
price -0.149316 -0.363264 0.017623 -8.472974 0.000
revenue 0.053560 0.071009 0.032338 1.656247 0.098
28
Group Number Random Components
1 -0.346522
2 -0.121608
3 0.250638
4 -0.020350
5 0.128761
... ... ... ...
112 0.512636
113 -0.216224
114 -0.151243
115 -0.125587
116 0.104064
Lagrange Multiplier Test for Error Components Model
Null hypothesis : Individual error components do not exist.
Chi-squared statistic (1) : 1367.1014
P-value : 0.0000
29
3 Extensions
3.1 Le modèle linéaire de panel Type II
La structure d'erreur est de la forme :
uit = �i + �t + "it i = 1; 2; : : : ; N; t = 1; 2; : : : ; T;
ou sous forme matricielle :
U = (IN eT )� + (eN IT )�+ ";
avec � = (�1; : : : ; �N)0 et � = (�1; : : : ; �T )
0.
3.1.1 Le modèle à e�ets �xes
�i et �t sont traités comme des paramètres �xes, l'inférence est
menée conditionnellement aux N individus sur la période 1! T .
3.1.2 Notations
L'estimateur e�ets �xes est obtenu en utilisant le nouvel opé-
rateur :
Q = IN IT � IN (eTe0T=T )� (eNe
0N=N) IT ;
de sorte que Qu = fuit � �ui � �utgit :En prenant la moyenne sur les individus, nous avons
�yt = �xt� + �t + �"t avec la contrainte
NXi=1
��i = 0:
Et en prenant la moyenne sur les périodes :
�yi = �xi� + ��i + �"i avec la contrainte
TXt=1
�t = 0;
30
Les MCO sur les écarts aux moyennes donnent :
� = (X 0QX)�1X 0
QY;
�i = �yi � �xi�;
�t = �yt � �xt�:
Si le modèle contient un terme constant, l'opérateurQ devient :
Q = IN IT � IN (eTe0T=T )� (eNe
0N=N) IT
+(eNe0N=N) (eTe
0T=T )
de sorte que Qu = fuit � �ui � �ut + �ugit, et l'estimateur Within
est� = (X 0
QX)�1X 0QY;
�i = (�yi � �y)� (�xi � �x)�;
�t = (�yt � �y)� (�xt � �x)�:
Test des e�ets 1/ H0 : �1 = � � � = �N = �1 = � � � = �T = 0.
Statistique de test de Fisher :
(RRSS � URSS)=(N + T � 2)
URSS=[(N � 1)(T � 1)�K]v F (k1; k2);
où
k1 = N + T � 2; k2 = (N � 1)(T � 1)�K); et
URSS (RSS Non contrainte) : à partir du modèle Within,
RRSS : (RSS contrainte) : à partir des MCO sur données fusionnées.
2/ H0 : �1 = � � � = �N = 0 étant donné �t 6= 0; t � T � 1.
Statistique de test de Fisher :
(RRSS � URSS)=(N � 1)
URSS=[(N � 1)(T � 1)�K]v F (k1; k2);
31
où
k1 = N � 1; k2 = (N � 1)(T � 1)�K); et
URSS : du modèle Within,
RRSS : de la régression avec indicatrices temporelles seulement :
(yit � �yt) = (xit � �xt)� + (uit � �ut):
3/ H0 : �1 = � � � = �T�1 = 0 étant donné �i 6= 0; i � N � 1.
Statistique de test de Fisher :
(RRSS � URSS)=(T � 1)
URSS=[(N � 1)(T � 1)�K]v F (k1; k2);
où
k1 = T � 1; k2 = (N � 1)(T � 1)�K); et
URSS : du modèle Within,
RRSS : de la régression Within comme dans le modèle de Type I :
(yit � �yi) = (xit � �xi)� + (uit � �ui):
32
3.1.3 Exemple : Fonction de production agricole (Hoch, 1962)
Echantillon : 63 agriculteurs du Minnesota (US), sur la période
1946-1951.
Estimation d'une fonction de production Cobb-Douglas :
logProduitit = �0 + �1 logTravailit + �2 logFoncierit+�3 logMachinesit + �4 logEngraisit:
Motivation pour incorporer des e�ets spéci�ques (dans uit) :
� Climat, identique a priori entre les exploitations (�t) ;
� Facteurs spéci�ques à l'exploitation (qualité du sol, savoir-faire,
etc.) (�i).
Tab. 1 � Résultats d'estimation - Fonction de production Cobb-
DouglasHypothèse
(I) (II) (III)
Estimation �i = �t = 0 �i = 0 �t = 0
�1 (Travail) 0.256 0.166 0.043
�2 (Foncier) 0.135 0.230 0.199
�3 (Machines) 0.163 0.261 0.194
�4 (Engrais) 0.349 0.311 0.289
Somme des � 0.904 0.967 0.726�R2 0.721 0.813 0.884
33
Exemple : Le logiciel SAS c
* ;
* DYNTAB.SAS ;
* ;
* Uses datafile DYNTAB3.DAT ;
* ;
* Create library and file names ;
* Change directory information below ;
libname water 'd :/dea/panel' ;
filename watfile 'd :/dea/panel/dyntab3.dat' ;
* Create SAS table and read data from Ascii file ;
data wat ;
infile watfile ;
input id year conso price revenue precip ;
* Compute logs ;
lconso=log(conso) ; lprice=log(price) ;
lrevenue=log(revenue) ;
run ;
* Descriptive statistics ;
proc means data=wat ;run ;
* OLS regression ;
proc reg data=wat ;
model lconso = lprice lrevenue ;
run ;
* Model 1 : One-way Fixed effects ;
34
* cs=116 : Set the number of cross-sections ;
* option /fixone : Set one-way Fixed-effect ;
proc tscsreg data=wat cs=116 ;
model lconso= lprice lrevenue /fixone ;
run ;
* Model 2 : Two-way Fixed effects ;
* option /fixtwo : Set two-way Fixed-effect ;
proc tscsreg data=wat cs=116 ;
model lconso= lprice lrevenue /fixtwo ;
run ;
* Model 3 : One-way Random effects ;
* option /ranone : Set one-way Random-effect ;
proc tscsreg data=wat cs=116 ;
model lconso= lprice lrevenue /ranone ;
run ;
* Model 4 : Two-way Random effects ;
* option /rantwo Set Two-way Random-effect ;
proc tscsreg data=wat cs=116 ;
model lconso= lprice lrevenue /rantwo ;
run ;
* Model 5 : One-way Random effects with AR(1) ;
* option /ranone parks rho Set One-way Random-effect ;
* and compute RHO : Ar(1) parameter ;
proc tscsreg data=wat cs=116 ;
model lconso= lprice lrevenue /ranone parks rho ;
run ;
* Compute parameter estimates on each cross section ;
proc sort data=wat ;
by year ;
35
proc reg data=wat ;
model lconso= lprice lrevenue ;
by year ;
run ;
* Compute Within and Between estimates ;
* using the MEANS procedure ;
proc sort data=wat ;
by id ;
proc means data=wat noprint ;
var lconso lprice lrevenue ;
by id ;
output out=out1 mean=mconso mprice mrevenue ;
data out1 ;set out1 ;
keep id mconso mprice mrevenue ;
data wat ;
merge wat out1 ;
by id ;
data wat ;set wat ;
qconso=lconso-mconso ; qprice=lprice-mprice ;
qrevenue=lrevenue-mrevenue ;
* Within regression ;
proc reg data=wat ;
model qconso = qprice qrevenue ;
run ;
* Between regression ;
proc reg data=wat ;
model mconso = mprice mrevenue ;
run ;
36
ESTIMATES USING TSCSREG PROCEDURE
MODEL 1. ONE-WAY FIXED EFFECTS
The SAS System 16 :15 Monday, January 22, 2001 3
TSCSREG Procedure
Dependent Variable : LCONSO
Model Description
Estimation Method FIXONE
Number of Cross Sections 116
Time Series Length 6
Model VarianceSSE 2.578099 DFE 578
MSE 0.00446 Root MSE 0.066786
RSQ 0.9344
F Test for No Fixed EffectsNumerator DF : 115 F value : 58.3964
Denominator DF : 578 Prob.>F : 0.0000
Parameter Estimates
Parameter Standard T for H0 : Variable
Variable DF Estimate Error Parameter=0 Prob > |T| Label
CS 1 1 -0.455773 0.039463 -11.549433 0.0001 Cross Sec
CS 2 1 -0.222476 0.039923 -5.572620 0.0001 Cross Sec
CS 3 1 0.153338 0.038900 3.941882 0.0001 Cross Sec
CS 4 1 -0.131488 0.039174 -3.356518 0.0008 Cross Sec
CS 5 1 0.027422 0.038890 0.705132 0.4810 Cross Sec
... ... ... ... ... ... ... ...
CS 112 1 0.420843 0.040309 10.440506 0.0001 Cross Sec
CS 113 1 -0.322888 0.039376 -8.200102 0.0001 Cross Sec
CS 114 1 -0.259767 0.038678 -6.716134 0.0001 Cross Sec
CS 115 1 -0.240823 0.039379 -6.115479 0.0001 Cross Sec
INTERCEP 1 5.099257 0.366957 13.896065 0.0001 Intercept
LPRICE 1 -0.134245 0.018447 -7.277506 0.0001
LREVENUE 1 0.024386 0.033223 0.734009 0.4632
37
MODEL 2. TWO-WAY FIXED EFFECTS
The SAS System 16 :15 Monday, January 22, 2001 7
TSCSREG Procedure
Dependent Variable : LCONSO
Model Description
Estimation Method FIXTWO
Number of Cross Sections 116
Time Series Length 6
Model VarianceSSE 2.205671 DFE 573
MSE 0.003849 Root MSE 0.062043
RSQ 0.9439
F Test for No Fixed EffectsNumerator DF : 120 F value : 65.6530
Denominator DF : 573 Prob.>F : 0.0000
Parameter EstimatesParameter Standard T for H0 : Variable
Variable DF Estimate Error Parameter=0 Prob > |T| Label
CS 1 1 -0.535192 0.040793 -13.119702 0.0001 Cross Sec
CS 2 1 -0.302435 0.041809 -7.233670 0.0001 Cross Sec
CS 3 1 0.120803 0.037066 3.259125 0.0012 Cross Sec
... ... ... ... ... ... ... ...
CS 114 1 -0.288486 0.036463 -7.911820 0.0001 Cross Sec
CS 115 1 -0.256215 0.036669 -6.987209 0.0001 Cross Sec
TS 1 1 -0.102087 0.017883 -5.708681 0.0001 Time Seri
TS 2 1 -0.047565 0.016463 -2.889216 0.0040 Time Seri
TS 3 1 -0.030524 0.014486 -2.107135 0.0355 Time Seri
TS 4 1 -0.007359 0.012507 -0.588378 0.5565 Time Seri
TS 5 1 -0.025528 0.009992 -2.554900 0.0109 Time Seri
INTERCEP 1 6.316873 0.396540 15.929983 0.0001 Intercept
LPRICE 1 -0.251061 0.034210 -7.338896 0.0001
LREVENUE 1 -0.053316 0.033244 -1.603773 0.1093
MODEL 3. ONE-WAY RANDOM EFFECTS
38
The SAS System 16 :15 Monday, January 22, 2001 11
TSCSREG Procedure
Dependent Variable : LCONSO
Model Description
Estimation Method RANONE
Number of Cross Sections 116
Time Series Length 6
Variance Component Estimates
SSE 3.12498 DFE 693
MSE 0.004509 Root MSE 0.067152
RSQ 0.1087
Variance Component for Cross Sections 0.043243
Variance Component for Error 0.004460
Hausman Test for Random Effects
Degrees of Freedom : 2
m value : 14.4912 Prob. > m : 0.0007
Parameter EstimatesParameter Standard T for H0 : Variable
Variable DF Estimate Error Parameter=0 Prob > |T| Label
INTERCEP 1 4.692305 0.354917 13.220844 0.0001 Intercept
LPRICE 1 -0.149074 0.017611 -8.465039 0.0001
LREVENUE 1 0.053077 0.032306 1.642977 0.1008
39
MODEL 4. TWO-WAY FIXED EFFECTS
The SAS System 16 :15 Monday, January 22, 2001 12
TSCSREG Procedure
Dependent Variable : LCONSO
Model Description
Estimation Method RANTWO
Number of Cross Sections 116
Time Series Length 6
Variance Component Estimates
SSE 2.707154 DFE 693
MSE 0.003906 Root MSE 0.062501
RSQ 0.0907
Variance Component for Cross Sections 0.043638
Variance Component for Time Series 0.000746
Variance Component for Error 0.003849
Hausman Test for Random Effects
Degrees of Freedom : 2
m value : 22.2377 Prob. > m : 0.0000
Parameter EstimatesParameter Standard T for H0 : Variable
Variable DF Estimate Error Parameter=0 Prob > |T| Label
INTERCEP 1 5.674742 0.371984 15.255323 0.0001 Intercept
LPRICE 1 -0.225151 0.027604 -8.156464 0.0001
LREVENUE 1 -0.018251 0.032401 -0.563297 0.5734
40
WITHIN REGRESSION USING PROC REG
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Prob>F
Model 2 0.31252 0.15626 42.003 0.0001
Error 693 2.57810 0.00372
c Total 695 2.89062
Root MSE 0.06099 R-square 0.1081
Dep Mean -0.00000 Adj R-sq 0.1055
C.V. -1.291786E17
Parameter EstimatesParameter Standard T for H0 : Variable
Variable DF Estimate Error Parameter=0 Prob > |T| Label
INTERCEP 1 -5.28092E-17 0.00231195 -0.000 1.0000
QPRICE 1 -0.134245 0.01684666 -7.969 0.0001
QREVENUE 1 0.024386 0.03034107 0.804 0.4218
BETWEEN REGRESSION USING PROC REG
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Prob>F
Model 2 7.13103 3.56551 84.369 0.0001
Error 693 29.28684 0.04226
C Total 695 36.41786
Root MSE 0.20557 R-square 0.1958
Dep Mean 4.99481 Adj R-sq 0.1935
C.V. 4.11576
Parameter EstimatesParameter Standard T for H0 : Variable
Variable DF Estimate Error Parameter=0 Prob > |T| Label
INTERCEP 1 -0.176444 0.68091356 -0.259 0.7956
MPRICE 1 -0.259461 0.02278084 -11.389 0.0001
MREVENUE 1 0.494483 0.05958703 8.298 0.0001
41
3.2 Panels non cylindrés
3.2.1 Introduction
Dé�nition : Le nombre de périodes est di�érent entre les individus.
Pour l'individu i, nous avons Ti périodes, et le nombre total d'ob-
servations est maintenantPN
i=1 Ti (au lieu de NT auparavant).
Exemples
� Entreprises : peuvent fermer, ou être des nouveaux entrants dans
le secteur ;
� Consommateurs : peuvent démenager, décéder, refuser de ré-
pondre ;
� Salariés : Chômage, changement de statut, etc.
Problème de l'attrition : la probabilité qu'un individu reste dans
l'échantillon diminue au fur et à mesure que le nombre de périodes
augmente.
3.2.2 Modèles à e�ets �xes pour panels non-cylindrés
Le modèle à e�ets �xes de type I pour panel non-cylindré Consi-
dérons le modèle non-cylindré avec T1 = 3 et T2 = 2 :0BBBB@
y11
y12
y13
y21
y22
1CCCCA =
0BBBB@
x11
x12
x13
x21
x22
1CCCCA � +
0BBBB@
�1
�1
�1
�2
�2
1CCCCA+
0BBBB@
"11
"12
"13
"21
"22
1CCCCA :
Pour éliminer �, nous avons besoin d'un nouvel opérateur Within :
Q� =
�I3 � e3e
03=3 0
0 I2 � e2e02=2
�
42
=
266664
2=3 �1=3 �1=3 0 0
�1=3 2=3 �1=3 0 0
�1=3 �1=3 2=3 0 0
0 0 0 1=2 �1=20 0 0 �1=2 1=2
377775 ;
et la même procédure que dans le cas cylindré s'applique :
�Within = (X 0Q�X)
�1X0Q�Y
où Q� = diag(ITi � eTie0Ti=Ti)ji=1;2;:::;N .
43
4 Le modèle de panel �augmenté�
Que sont les modèles de panel �augmentés� ? Implication pour l'es-
timation ? Techniques spéciales d'estimation lorsque les MCG ne
sont plus appropriés.
4.1 Introduction
Considérons le modèle
yit = xit� + zi + �i + "it; i = 1; 2; : : : ; N; t = 1; 2; : : : ; T;
avec xit un vecteur 1�K de régresseurs variant dans le temps et
entre les individus, et zi un vecteur 1 � G de régresseurs spéci-
�ques à l'individu (invariant dans le temps).
Exemple :
logSALAIRE = �1HEURES+ 1EDUC+ 2SEXE+�i+"it:
Méthode d'estimation :
� Within : n'est pas identi�able car
QY = QX� + (I �B)Z +Q�+Q" = QX� +Q";
puisque BZ = Z. Seul � est identi�able. Mais une procédure en
2 étapes est possible :
1/ Régression Within ) � ;
2/ Régression Between sur
�yi � �xi� = �i + Zi + �"i; i = 1; 2; : : : ; N;
44
pour estimer les .
� MCG : A la fois � et sont identi�ables.
4.2 Choix entre Within et MCG
L'un des critères de choix entre Within et MCG : présence de
zi dans le modèle.
Rappel : L'estimateur MCG est convergent et e�cace à la condi-
tion que les régresseurs soient exogènes :
E(�ixit) = 0 et E(�izi) = 0 8i; t:
Considérons le modèle non-augmenté yit = xit� + �i + "it.
Si xit est endogène dans le sens E(�ixit) 6= 0, alors les MCG ne
sont pas convergents :
�MCG = � +�X0�1X
��1 �X0�1U
�= � +
�X0 �Q+ �
�1B�X��1 �
X0 �Q+ �
�1B�U�;
où � = 1 + T�2�=�
2" , de sorte que�
X0 �Q+ �
�1B�U�= [X 0
Q"+X0(B� +B")=�]
= 0 +X0B�=� + 0 = X
0�=� 6= 0;
car E(X 0") = 0 and B� = �.
Même problème avec le modèle augmenté, si E(X 0�) 6= 0 et/ou
E(Z 0�) 6= 0.
45
Conséquence importante en practique : Si les (certains)
régresseurs sont endogènes, les estimateurs MCG ne sont pas
convergents, mais les estimateurs Within le sont car � est éliminé.
Un autre critère de choix entre Within et MCG :
� Si régresseurs endogènes) Choisir l'estimation Within (mais
n'est pas identi�é) ;
� Si tous les régresseurs sont exogènes, utiliser les MCG (les plus
e�caces).
Trois problèmes demeurent :
� toujours pas identi�é, car dans la régression Between
�yi � �xi� = zi + �i + �"i,
zi reste corrélé avec �i.
� Si l'on utiliser les Within, tous les régresseurs sont traités comme
endogènes (pas de distinction entre xit exogènes et endogènes).
� Les estimateurs Within ne sont pas e�caces.
4.3 Un important test de l'endogénéité
Hypothèse nulle : H0 : E(X 0�) = E(Z 0�) = 0 (exogénéité).
Comparaison entre 2 estimateurs :
�MCG �Within
H0 Convergent, Convergent,
e�cace pas e�cace
Alternative Pas convergent Convergent
Hausman (1978) : Même si les xit sont exogènes, les estimateurs
MCG de ne sont pas convergents dans le modèle augmenté. Par
46
conséquent, on peut tester l'exogénéité en utilisant les paramètres
estimés de � seulement.
Statistique de test de Hausman : Sous H0,
HT =��Within � �MCG
�0 hV ar(�Within)� V ar(�MCG)
i�1���Within � �MCG
�v �
2(K):
Remarques
� �MCG et �Within doivent avoir les mêmes dimensions.
� La matrice de pondérationhV ar(�Within)� V ar(�MCG)
iest
positive : les MCG sont plus e�caces que les Within sous l'hypo-
thèse nulle.
Rappel : V ar(�MCG) = �2"(X
0QX + �X
0BX)�1 et V ar(�w) =
�2"(X
0QX)�1.
Interprétation du nombre de degrés de liberté du test :
L'estimateurWithin est basé sur la condition E(X 0QU) = 0, alors
que le MCG est basé sur E(X 0�1U) = 0 ) E(X 0QU) = 0 et
E(X 0BU) = 0.
Pour les MCG, nous ajoutons K conditions supplémentaires (en
termes de B) : rang de X. Le test d'Hausman utilise ces restric-
tions additionnelles.
47
___ ____ ____ ____ ____tm /__ / ____/ / ____/ ___/ / /___/ / /___/ Statistics/Data Analysis ------------------------------------------------------------------------------- log: E:\dea\panel\2004\energy.smcl log type: smcl opened on: 15 Apr 2004, 21:59:56 1 . use energy 2 . desc Contains data from energy.dta obs: 1,003 vars: 16 15 Apr 2004 21:59 size: 68,204 (93.0% of memory free) ------------------------------------------------------------------------------- storage display value variable name type format label variable label ------------------------------------------------------------------------------- pgn float %9.0g Prix gaz naturel eff float %9.0g Effectifs employes pk float %9.0g Prix electricite we float %9.0g Part cout energie : electricite wg float %9.0g Part cout energie : gaz wfl float %9.0g Part cout energie : fuel lourd wfd float %9.0g Part cout energie : fuel domestique wbp float %9.0g Part cout energie : Butane - Propane lnpk float %9.0g Log prix electricite lnpgn float %9.0g Log prix gaz naturel, normalise par prix electricite lnpfl float %9.0g Log prix fuel lourd, normalise par prix electricite lnpfd float %9.0g Log prix fuel domestique, normalise par prix electricite lnpbp float %9.0g Log prix Butane-Propane, normalise par prix electricite annee float %9.0g Annee sire float %9.0g Identifiant entreprise leff float %9.0g Log effectifs employes ------------------------------------------------------------------------------- Sorted by: sire annee 3 . sum Variable | Obs Mean Std. Dev. Min Max -------------+----------------------------------------------------- pgn | 1003 1593.143 575.2697 649.3506 4935.065 eff | 1003 196.7009 165.1831 0 1200 pk | 1003 3591.579 12531.49 76 270000 we | 1003 .6535525 .1700342 .0755102 .989083 wg | 1003 .2682747 .1811665 .0017207 .9244898 wfl | 1003 .0336884 .1027124 0 .7529242 wfd | 1003 .0405599 .0892802 0 .5299442 wbp | 1003 .0039245 .0116155 0 .1561713 lnpk | 1003 7.536383 .2859703 6.365459 8.255204 lnpgn | 1003 -12.74313 1.400228 -18.18878 -9.613284 lnpfl | 1003 -12.56832 1.226006 -17.68294 -9.556078 lnpfd | 1003 -12.48682 1.189972 -17.26859 -9.694551 lnpbp | 1003 -12.45441 1.183546 -17.36138 -9.731269 annee | 1003 1990.54 3.847273 1983 1996 sire | 1003 5.49e+15 2.17e+15 5.48e+13 9.46e+15 leff | 1002 5.044025 .663634 3.332205 7.090077
4 . xtreg wg lnpgn lnpfl lnpfd lnpbp leff, i(sire) fe Fixed-effects (within) regression Number of obs = 1002 Group variable (i) : sire Number of groups = 110 R-sq: within = 0.1410 Obs per group: min = 1 between = 0.0733 avg = 9.1 overall = 0.0366 max = 14 F(5,887) = 29.12 corr(u_i, Xb) = -0.1955 Prob > F = 0.0000 ------------------------------------------------------------------------------ wg | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- lnpgn | -.1537251 .0181908 -8.45 0.000 -.1894272 -.1180229 lnpfl | .1140461 .0207206 5.50 0.000 .073379 .1547132 lnpfd | -.0047182 .0254882 -0.19 0.853 -.0547425 .045306 lnpbp | .1014905 .0164493 6.17 0.000 .0692063 .1337747 leff | -.0160971 .0193974 -0.83 0.407 -.0541674 .0219731 _cons | 1.029037 .1338883 7.69 0.000 .7662621 1.291812 -------------+---------------------------------------------------------------- sigma_u | .14842561 sigma_e | .09943612 rho | .69021761 (fraction of variance due to u_i) ------------------------------------------------------------------------------ F test that all u_i=0: F(109, 887) = 12.30 Prob > F = 0.0000 5 . xtreg wg lnpgn lnpfl lnpfd lnpbp leff, i(sire) re Random-effects GLS regression Number of obs = 1002 Group variable (i) : sire Number of groups = 110 R-sq: within = 0.1239 Obs per group: min = 1 between = 0.4670 avg = 9.1 overall = 0.2909 max = 14 Random effects u_i ~ Gaussian Wald chi2(5) = 187.45 corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000 ------------------------------------------------------------------------------ wg | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- lnpgn | -.2144363 .0167928 -12.77 0.000 -.2473497 -.181523 lnpfl | .1528693 .0200142 7.64 0.000 .1136423 .1920964 lnpfd | .0070502 .0252708 0.28 0.780 -.0424797 .05658 lnpbp | .0799307 .0155383 5.14 0.000 .0494761 .1103852 leff | -.0083034 .0143499 -0.58 0.563 -.0364287 .0198219 _cons | .575301 .0904628 6.36 0.000 .3979972 .7526048 -------------+---------------------------------------------------------------- sigma_u | .09913539 sigma_e | .09943612 rho | .49848553 (fraction of variance due to u_i) ------------------------------------------------------------------------------
6 . xthausman Hausman specification test ---- Coefficients ---- | Fixed Random wg | Effects Effects Difference -------------+----------------------------------------- lnpgn | -.1537251 -.2144363 .0607113 lnpfl | .1140461 .1528693 -.0388232 lnpfd | -.0047182 .0070502 -.0117684 lnpbp | .1014905 .0799307 .0215598 leff | -.0160971 -.0083034 -.0077937 Test: Ho: difference in coefficients not systematic chi2( 5) = (b-B)'[S^(-1)](b-B), S = (S_fe - S_re) = 90.39 Prob>chi2 = 0.0000 7 . xtreg wg lnpgn lnpfl lnpfd lnpbp leff, i(sire) be Between regression (regression on group means) Number of obs = 1002 Group variable (i) : sire Number of groups = 110 R-sq: within = 0.0950 Obs per group: min = 1 between = 0.5116 avg = 9.1 overall = 0.3100 max = 14 F(5,104) = 21.78 sd(u_i + avg(e_i.))= .109751 Prob > F = 0.0000 ------------------------------------------------------------------------------ wg | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- lnpgn | -.4574283 .0462411 -9.89 0.000 -.5491261 -.3657306 lnpfl | .1751386 .0940214 1.86 0.065 -.0113093 .3615866 lnpfd | .2341099 .1059095 2.21 0.029 .0240874 .4441324 lnpbp | .0808667 .0512214 1.58 0.117 -.0207073 .1824407 leff | -.0404652 .0212932 -1.90 0.060 -.0826905 .0017601 _cons | .7752163 .146705 5.28 0.000 .4842948 1.066138 ------------------------------------------------------------------------------ 8 . predict alpha,u 9 . log close log: E:\dea\panel\2004\energy.smcl log type: smcl closed on: 15 Apr 2004, 22:08:27 -------------------------------------------------------------------------------
4.4 Estimation par la Variable Instrumentale : l'estima-
teur MCG de Hausman-Taylor
4.4.1 Estimation par la Variable Instrumentale
Méthode alternative : Estimation IV (� Instrumental Variable�).
Dans un contexte de coupe instantanée avec N observations :
Y = X� + "; E(X 0") 6= 0; E(W 0
") = 0;
où W est une matrice N � L d'instruments.
� Si K = L,
[W 0(Y �X�)] = 0 , (W 0Y ) = (W 0
X)�
� = (W 0X)�1W 0
Y (Estimateur IV):
� Si L > K,
[W 0(Y �X�)] = 0 (L conditions sur K paramètres)
et l'on construit la forme quadratique (Y �X�)0W (W 0W )�1W 0
�(Y �X�) où PW = W (W 0W )�1W 0
) � = (X 0P0WX)�1(X 0
PWY ):
Note : en général, les instrumentsW ne proviennent pas de l'équa-
tion.
4.4.2 IV dans un contexte de panel
� Prise en compte de la structure de variance-covariance () ;
� Trouver des instruments pertinents, non corrélés avec �.
Considérons le modèle augmenté général :
Y = X1�1 +X2�2 + Z1 1 + Z2 2 + � + ";
48
oùX1 : N �K1 exogène, varie selon i et t;
X2 : N �K2 endogène, varie selon i et t;
Z1 : N �G1 exogène, varie selon i;
Z2 : N �G2 endogène, varie selon i:
Posons � = (X 01; X
02; Z
01; Z
02) et � = (� 01; �
02;
01;
02)0.
Forme générale d'un estimateur de la variable instrumentale
pour données de panel : Soit Y � = �1=2Y , X� = �1=2X, et
�� = �1=2�. Nous avons
�IV =h��
0
PW��i�1 h
��0
PWY�i
=h�0�1=2PW�1=2�
i�1 h�0�1=2PW�1=2Y
i:
Calcul de �1=2 : comme dans le cas MCG usuel.
4.4.3 Hypothèses d'exogénéité et une première matrice d'instru-
ments
Hypothèses d'exogénéité : E(X 01�) = E(Z 01�) = 0
) Des instruments évidents sont X1 et Z1, pas su�sant car
K1 +G1 < K1 +K2 +G1 +G2.
Instruments supplémentaires : ne doicent pas être corrélés avec �.
Puisque � est la �source� de l'endogénéity, toute variable non cor-
rélée avec � sera un instrument valide. Les meilleurs instruments
valides sont fortement corrélés avec X2 et Z2.
QX1 etQX2 sont des instruments valides :E[(QX1)0�] = E[X 0
1Q�] =
0 et E[(QX2)0�] = E[X 0
2Q�] = 0.
Pour X1, équivalent d'utiliser BX1 car nous devons avoir
E[X 01
�1U ] = E[X 0
1(Q+ ��1B)U ] = E[X 0
1B(Q+ ��1B)U ]
49
puisque BQ = 0 et BB = B.
Matrice d'instruments de Hausman-Taylor (1981) :
WHT = [QX1; QX2; BX1; Z1] = [QX1; QX2; X1; Z1]:
Condition d'identi�cation : Nous avons K1+K2+G1+G2 para-
mètres à estimer, avec K1+K1+K2+G1 instruments (K1 +K2
instruments dans QX). Par conséquent, la condition d'identi�ca-
tion est K1 � G2.
4.4.4 Des procédures plus e�caces : Amemiya-MaCurdy et Breusch-
Mizon-Schmidt
Amemiya et MaCurdy (1986) Utilisent le fait que si xit est exo-
gène, nous pouvons partir des conditions : E(xit�i) = 0 8i; 8t aulieu de E(x0i�i) = 0.
Amemiya et MaCurdy (1986) suggèrent d'utiliser la matrice
X�1 dans la liste des instruments :
X�1 =
26666666666666664
x11 x12 : : : x1T (i = 1; t = 1)
x11 x12 : : : x1T (i = 1; t = 2)
: : : : : : : : : : : : : : :
x21 x22 : : : x2T (i = 2; t = 1)
x21 x22 : : : x2T (i = 2; t = 2)
: : : : : : : : : : : : : : :
xN1 xN2 : : : xNT (i = N; t = 1)
xN1 xN2 : : : xNT (i = N; t = 2)
: : : : : : : : : : : : : : :
xN1 xN2 : : : xNT (i = N; t = T )
37777777777777775
50
tel que QX�1 = 0 et BX�
1 = X�1 . La matrice d'instruments est
WAM = [QX;X�1 ; Z1], et un estimateur équivalent s'obtient en
utilisant
WAM = [QX; (QX1)�; BX1; Z1];
où (QX1)� est construit comme X�
1 ci-dessus.
Amemiya et MaCurdy : leur matrice d'instruments fournit un
estimateur au moins aussi e�cace que celui d'Hausman-Taylor, si
�i n'est pas corrélé avec les régrésseurs 8t.
Condition d'identi�cation : On ajoute (QX1)� à la liste des ins-
truments de Hausman-Taylor, mais comme [(QX1)�; X1] est de
rang K1, on ajoute seulement (T � 1)K1 instruments. La condi-
tion d'identi�cation est TK1 � G2.
Breusch, Mizon et Schmidt (1989) Estimateur encore plus e�-
cace : basé sur les conditions
E[(QX2it)0�i] = 0 8i; 8t, au lieu de la condition
E[(QTX2i)0�i] = 0.
Pour BMS, l'estimateur est plus e�cace si l'endogénéité dans X2
provient d'une composante invariant dans le temps. Matrice d'ins-
truments de BMS :
WBMS = [QX; (QX1)�; (QX2)
�; BX1; Z1]
où (QX1)� et (QX2)
� sont construites de la même façon que X�1
pour AM.
Condition d'identi�cation : Avec BMS, on ajoute (QX2)� aux ins-
truments de Amemiya-MaCurdy. La condition est alors TK1 +
(T � 1)K2 � G2. Comme précédemment, on ajoute seulement
(T � 1)K2 instruments, puisque (QX2)� n'est pas de rang plein,
mais de rang égal à (T � 1)K2.
51
4.5 Calcul de la matrice de variance-covariance matrix
des estimateurs IV
Problème ici : Les régresseurs endogènes peuvent fournir des esti-
mateurs non convergents des composantes de la variance dans ,
en particulier le paramètre �.
La méthode suggérée par Hausman-Taylor (1981) procure des es-
timateurs convergents.
Soit M1 le vecteur des moyennes individuelles du résidu Within :
M1 = BY �BX�W =�B � BX(X 0
QX)�1X 0Q�Y
= Z + � +�B � BX(X 0
QX)�1X 0Q�";
où X = (X1jX2), Z = (Z1jZ2), et = ( 1; 2). Les 3 derniers
termes ci-dessus peuvent être traités comme des résidus centrés,
et il su�t de trouver des instruments pour Z2 a�n d'estimer .
L'estimateur IV de est
B = (Z 0PCZ)�1(Z 0PCM1);
où PC est la matrice de projection associée aux instruments C =
(X1; Z1). En utilisant les paramètres estimés �W et B, on forme
les résidus
uW = QY �QX�W and uB = BY �BX�W � Z B:
Ces 2 vecteurs de résidus sont utilisés pour calculer les compo-
santes de la variance comme dans le cas standard des �Feasible
GLS� (MCG admissibles).
52
4.5.1 Procédure complète d'estimation MCG-IV
� Etape 1. Calculer les moyennes individuelles et les écarts à
ces moyennes, BX, BY , QX et QY .
� Etape 2. Estimer les paramètres � associés à X en utilisant
les Within.
� Etape 3. Estimer B par la procédure IV ci-dessus.
� Etape 4. Calculer �2� et �2
" à partir de uW et uB, et calculer
� = 1 + T �2�=�
2".
� Etape 5. Transformer les variables par la procédure MCG
scalaire, e.g., (Q+p�B)Y = yit � (1�
p�)�yi.
� Etape 6. Calculer la matrice de projection PW à partir de la
matrice d'instruments W .
� Etape 7. Estimer les paramètres �.
4.6 Exemple : Equation de salaire
4.6.1 Spéci�cation du modèle
Théorie du Capital Humain :
logw = F [X1; �; ED]; où w : taux de salaire;
� : aptitude du travailleur (inobservée), X1 : variables supplé-
mentaires (secteur, statut, etc.), et ED : niveau d'éducation. Des
proxies pour l'aptitude peuvent être utilisée : nombre d'heures tra-
vaillées, expérience, etc.
Objectif principal : estimer le gain marginal associé àED : @w=@ED.
Mais problème si l'aptitude du travailleur est constante au cours
du temps et conditionne ED ? Le vrai modèle serait�logw = F [X1; �; ED];
ED = G[�;X2];
53
où X2 sont des variables supplémentaires, spéci�ques à l'individu.
Si l'aptitude � est remplacée par des proxies Z, on a�logw = F [X1; Z; ED] + U;
ED = G[X2; Z2] + V;
où U = F [X1; �; ED]� F [X1; Z; ED] et
V = G[X2; �]�G[X2; Z].
Deux problèmes lorsque l'on estime la première équation en négli-
geant la seconde :
� Si des variables sont communes à X1 et X2, biais d'endogénéité
(à cause de ED) ;
� Si Z est corrélé avec des variables omises (expliquant l'aptitude),
biais d'erreur de mesure.
4.6.2 Application : Rendements de l'éducation
Echantillon utilisé : Panel Study of Income Dynamics (PSID), Uni-
versity of Michigan. Voir Baltagi et Khanti�Akom 1990, Cornwell
et Rupert 1988.
595 individus, sur la période 1976-1982 (7 périodes) : Chefs de
ménage (hommes et femmes) agés de 18 à 65 en 1976, avec un sa-
laire non-nul, employés dans des entreprises privées, hors-secteur
agricole, pour les années 1976 à 1982.
54
Variables liées au statut de l'emploi
� LWAGE : log du salaire ;
� WKS : nombre de semaines travaillées dans l'année ;
� EXP : expérience professionnelle en années à la date de
l'échantillon ;
� OCC : 1 si col bleu ;
� IND : 1 si travail dans l'industrie ;
� UNION : 1 si convention collective dans l'entreprise.
Variables liées aux caractéristiques des chefs de famille
� SMSA : 1 si l'individu réside en zone urbaine ;
� SOUTH : 1 si l'individu réside dans le sud des Etats-Unis ;
� MS : Statut Marital, 1 si marié ;
� FEM : 1 si femme ;
� BLK : 1 si Noir ;
� ED : nombre d'années dans le système éducatif.
Variables spéci�ques à l'individu : ED, BLK et FEM .
Estimation du modèle non-augmenté (sans les Zi)
Variables a priori endogènes (car corrélées à l'aptitude) : X2 :
(EXPE, EXPE2, UNION , WKS, MS) ;
Variables a priori exogènes : X1 : (OCC, SOUTH, SMSA,
IND).
Modèle augmenté
Yit = X1it�1 +X2it�2 + Z1i 1 + Z2i 2 + �i + "it
Variables a priori endogènes : Z2 : ED ;
Variables a priori exogènes : Z1 : (BLK, FEM).
55
Tab. 2 � Echantillon 1 1976-1982. Statistiques descriptivesVariable Moyenne Ecart-type Minimum Maximum
LWAGE 6.6763 0.4615 4.6052 8.5370
EXP 19.8538 10.9664 1.0000 51.0000
WKS 46.8115 5.1291 5.0000 52.0000
OCC 0.5112 0.4999 0.0000 1.0000
IND 0.3954 0.4890 0.0000 1.0000
UNION 0.3640 0.4812 0.0000 1.0000
SOUTH 0.2903 0.4539 0.0000 1.0000
SMSA 0.6538 0.4758 0.0000 1.0000
MS 0.8144 0.3888 0.0000 1.0000
ED 12.8454 2.7880 4.0000 17.0000
FEM 0.1126 0.3161 0.0000 1.0000
BLK 0.0723 0.2590 0.0000 1.0000
56
Tab. 3 � Variable dépendante : log(salaire). Régresseurs exogènes
seulementWithin MCG
Constante � 0.0976 (0.0040)
OCC -0.0696 (0.02323) -0.0701 (0.02322)
SOUTH -0.0052 (0.05833) -0.0072 (0.05807)
SMSA -0.1287 (0.03295) -0.1275 (0.03290)
IND 0.0317 (0.02626) 0.0317 (0.02624)
�2(4) = 0:551
Notes. Les écarts-types sont entre parenthèses.
Tab. 4 � variable dépendante : log(salaire). Variables endogènes
seulement.Within MCG
Constante � 0.0561 (0.0024)
EXPE 0.1136 (0.002467) 0.1133 (0.002466)
EXPE2 -0.0004 (0.000054) -0.0004 (0.000054)
WKS 0.0008 (0.0005994) 0.0008 (0.0005994)
MS -0.0322 (0.01893) -0.0325 (0.01892)
UNION 0.0301 (0.01480) 0.0300 (0.01479)
�2(5) = 24:94
Notes. Les écarts-types sont entre parenthèses.
57
Tab. 5 � Variable dépendante : log(salaire). Modèle aAugmenté.
Within MCG
Constante � 0.1866 (0.01189)
OCC -0.0214 (0.01378) -0.0243 (0.01367)
SOUTH -0.0018 (0.03429) 0.0048 (0.03188)
SMSA -0.0424 (0.01942) -0.0468 (0.01891)
IND 0.0192 (0.01544) 0.0148 (0.01521)
EXPE 0.1132 (0.00247) 0.1084 (0.00243)
EXPE2 -0.0004 (0.00005) -0.0004 (0.00005)
WKS 0.0008 (0.00059) 0.0008 (0.00059)
MS -0.0297 (0.01898) -0.0391 (0.01884)
UNION 0.0327 (0.01492) 0.0375 (0.01472)
FEM � -0.1666 (0.12646)
BLK � -0.2639 (0.15413)
ED � 0.1373 (0.01415)
�2(9) = 495:3
Notes. Les écarts-types sont entre parenthèses.
Tab. 6 � Variable dépendante : log(salaire). Estimation IV
HT AM BMS
Constante 0.1772 (0.017) 0.1781 (0.016) 0.1748 (0.016)
OCC -0.0207 (0.013) -0.0208 (0.013) -0.0204 (0.013)
SOUTH 0.0074 (0.031) 0.0072 (0.031) 0.0077 (0.031)
SMSA -0.0418 (0.018) -0.0419 (0.018) -0.0423 (0.018)
IND 0.0135 (0.015) 0.0136 (0.015) 0.0138 (0.015)
EXPE 0.1131 (0.002) 0.1129 (0.002) 0.1127 (0.002)
EXPE2 -0.0004 (0.005) -0.0004 (0.000) -0.0004 (0.000)
WKS 0.0008 (0.000) 0.0008 (0.000) 0.0008 (0.000)
MS -0.0298 (0.018) -0.0300 (0.018) -0.0303 (0.018)
UNION 0.0327 (0.014) 0.0324 (0.014) 0.0326 (0.014)
FEM -0.1309 (0.126) -0.1320 (0.126) -0.1337 (0.126)
BLK -0.2857 (0.155) -0.2859 (0.155) -0.2793 (0.155)
ED 0.1379 (0.021) 0.1372 (0.020) 0.1417 (0.020)
Test �2(3) = 5:23 �
2(13) = 19:29 �2(13) = 12:23
Notes. Les écarts-types sont entre parenthèses.
58
5 Les modèles de panel dynamiques
5.1 Motivation
Utilité des panels dynamiques :
� Etudier la dynamique d'ajustement dans les variables micro- et
macro. ;
� Estimer des modèles économiques dans un cadre inter-temporel
(cycle de vie, �nance,...)
5.2 Le modèle dynamique à e�ets �xes
Modèle le plus simple :
yit = �yi;t�1 + �i + "it; i = 1; 2; : : : ; N ; t = 1; 2; : : : ; T;
où les conditions initiales yi0; i = 1; 2; : : : ; N sont supposées
connues. On fait l'hypothèse que E("it) = 0 8i; t, E("it"js) = �2"
si i = j; t = s et 0 sinon, E(�i"it) = 0 8i; t.Par substitution répétée :
yit = "it + �"i;t�1 + �2"i;t�2 + � � �+ �
t�1"i1 +
1� �t
1� ��i + �
tyi0:
5.2.1 Biais de l'estimateur des e�ets �xes
L'estimateur Within s'écrit :
� =
PNi=1
PTt=1(yit � �yi)(yi;t�1 � �yi;�1)PN
i=1
PTt=1(yi;t�1 � �yi;�1)2
;
�i = �yi � ��yi;�1;
59
où
�yi =1
T
TXt=1
yit; �yi;�1 =1
T
TXt=1
yi;t�1; �"i =1
T
TXt=1
"it:
Egalement,
� = �+1NT
PNi=1
PTt=1("it � �"i)(yi;t�1 � �yi;�1)
1NT
PNi=1
PTt=1(yi;t�1 � �yi;�1)2
;
Cet estimateur existe si le dénominateur 6= 0 et il est convergent
si le numerateur converge vers 0.
Numerateur :
plimN!11
NT
N;TXi;t
(yi;t�1 � �yi;�1)("it � �"i) = �plim 1
N
NXi=1
�yi;�1�"i
car "it est auto-corrélé mais n'est pas corrélé avec �i. On utilise
�yi;�1 =1
T
TXt=1
yi;t�1 =1
T
�1� �
T
1� �yi0 +
(T � 1)� T�+ �T
(1� �)2�i
+1� �
T�1
1� �"i1 +
1� �T�2
1� �"i2 + � � �+ "i;T�1
�:
On a
plim1
N
NXi=1
�yi;�1�"i = plim
(1
N
NXi=1
�"i1
T
"T�1Xt=1
1� �T�t
1� �"it
#)
= plim
(1
N
NXi=1
1
T
TXt=1
"it
!1
T
"T�1Xt=1
1� �T�t
1� �"it
#)
=�2"
T 2
�(T � 1)� T�+ �
T
(1� �)2
�:
60
De façon similaire, on montre que plim 1NT
PN;Ti;t (yi;t�1 � �yi;�1)
2
=�2"
1� �2
�1� 1
T� 2�
(1� �)2� (T � 1)� T�+ �
T
T 2
�
En formant le rapport de ces 2 termes, le biais asymptotique est
plimN!1(�� �) = � 1 + �
T � 1
�1� 1
T
1� �T
1� �
�
��1� 2�
(1� �)(T � 1)
�1� 1� �
T
T (1� �)
���1= O(1=T ):
Dans le modèle transformé
(yit � �yi) = �(yi;t�1 � �yi;�1) + ("it � �"i);
la variable explicative est corrélée avec le résidu, et la corrélation
est d'ordre 1=T . Par conséquent, l'estimateur des e�ets �xes est
biaisé dans le cas usuel où N est grand et T est petit.
61
Tab. 7 �Biais asymptotique de l'estimateur des e�ets �xes - Modèle
dynamique� T Biais Pourcent
0.2 6 -0.2063 -103.1693
8 -0.1539 -76.9597
10 -0.1226 -61.3139
20 -0.0607 -30.3541
40 -0.0302 -15.0913
0.5 6 -0.2756 -55.1282
8 -0.2049 -40.9769
10 -0.1622 -32.4421
20 -0.0785 -15.6977
40 -0.0384 -7.6819
0.7 6 -0.3307 -47.2392
8 -0.2479 -35.4084
10 -0.1966 -28.0912
20 -0.0938 -13.3955
40 -0.0449 -6.4114
0.9 6 -0.3939 -43.7633
8 -0.3017 -33.5179
10 -0.2432 -27.0248
20 -0.1196 -13.2934
40 -0.0563 -6.2561
62
5.2.2 Estimation par la Variable Instrumentale
Seule façon d'obtenir des estimateurs convergents de � lorsque T
est petit. Procédure di�érente pour éliminer les e�ets individuels :
on utilise lesDi�érences Premières au lieu de la transformation
Within :
(yit � yi;t�1) = �(yi;t�1 � yi;t�2) + ("it � "i;t�1)
�yit = ��yi;t�1 +�"it;
et sous forme vectorielle :
�yi = ��yi;�1 +�"i; i = 1; 2; : : : ; N:
Dans ce modèle, yi;t�1 corrélé par construction avec "i;t�1 ! Be-
soin d'instruments qui soient non-corréles avec ("it � "i;t�1) mais
corrélés avec (yi;t�1� yi;t�2). Seule possibilité dans le cadre d'une
équation unique sans variables �extérieures� : utiliser les valeurs
de la variable dépendante.
En raison de la nature autorégressive du modèle, des instruments
provenant de valeurs futures de yit ne sont pas envisageables, car
yit est une fonction récursive de "it; "i;t�1; : : : ; "i1; �i; yi0.
Pour les valeurs retardées de la variable dépendante, on peut uti-
liser soit yi;t�2, soit (yi;t�2 � yi;t�3) :
�E[yi;t�2("it � "i;t�1)] = E("i;t�2"it)� E("i;t�2"i;t�1) = 0;
�E[(yi;t�2 � yi;t�3)("it � "i;t�1)] = E["i;t�2("it � "i;t�1)]
�E["i;t�3("it � "i;t�1)] = 0;
�E[yi;t�2(yi;t�1 � yi;t�2)] = 0� E("2i;t�2) = ��2" ;
�E[(yi;t�2 � yi;t�3)(yi;t�1 � yi;t�2)] = 0� E("2i;t�2) = ��2" :
63
Les estimateurs IV sont convergents si N et/ou T !1 :
� =
PNi=1
PTt=3(yit � yi;t�1)(yi;t�2 � yi;t�3)PN
i=1
PTt=3(yi;t�1 � yi;t�2)(yi;t�2 � yi;t�3)
ou � =
PNi=1
PTt=3(yit � yi;t�1)yi;t�2PN
i=1
PTt=3(yi;t�1 � yi;t�2)yi;t�2
:
Conclusion : Avec la transformation Within d'un modèle dyna-
mique, même si �i est éliminé, le biais d'endogénéité demeure
pour T �xé, car l'opérateur Q introduit des erreurs "is corrélées
par construction avec la variable explicative (retardée).
Considérons maintenant un modèle plus général :
yit = �yi;t�1 + xit� + zi + �i + "it:
Estimation IV :
Etape 1. Modèle en di�érences premières
(yit � yi;t�1) = �(yi;t�1 � yi;t�2) + (xit � xi;t�1)� + "it � "i;t�1:
Utiliser yi;t�2 ou (yi;t�2� yi;t�3) comme instrument pour (yi;t�1�yi;t�2) et estimer �; � avec la procedure IV.
Etape 2. Substituer � et � dans l'équation Between en di�érences
premières :
�yi � ��yi;�1 � �xi� = zi + �i + �"i; i = 1; 2; : : : ; N;
et estimer par MCO.
64
Etape 3. Estimer les composantes des variances :
�2" =
12N(T�1)
PNi=1
PTt=1 [(yit � yi;t�1)� �(yi;t�1 � yi;t�2)
�(xit � xi;t�1)�i2;
�2� = 1
N
PNi=1
h�yi � ��yi;�1 � zi � �xi�
i2� 1
T�2";
Convergence de l'estimateur IV :
L'estimateur IV de �, � et �2" sont convergents quand N ou T
!1 ;
L'estimateur IV de and �2� sont convergents seulement si T
!1, mais non convergents quand T est �xé et N !1.
5.3 Exemple : L'étude de Balestra-Nerlove
Papier précurseur sur les modèles dynamiques en panel (1966).
Demande des ménages pour le gaz naturel aux Etats-Unis, in-
cluant a/ la demande due au remplacement des équipements fonc-
tionnant au gaz, et b/ la demande liée à des variations dans le
stock de ces équipements.
Système de demande :
G�it = Git � (1� r)Gi;t�1;
F�it = Fit � (1� r)Fi;t�1;
Fit = a0 + a1Nit + a2Iit;
G�it = b0 + b1Pit + b2F
�it;
où G�it et Git sont respectivement la nouvelle et la demande réelle
de gaz à la période t du ménage i, r est le taux de dépréciation
des équipements, F �it et Fit sont respectivement la nouvelle et la
65
demande réelle pour les autres types d'énergie, Nit est la popula-
tion totale, Iit est le revenu par tête, et Pit est le prix relatif du gaz.
Après résolution du système, l'équation à estimer s'écrit :
Git = �0 + �1Pit + �2�Nit + �3Ni;t�1
+�4�Iit + �5Ii;t�1 + �6Gi;t�1;
où �Nit = Nit �Ni;t�1, �Iit = Iit � Ii;t�1, et �6 = 1� r.
Estimation : MCO, Within (LSDV) et GLS (avec l'hypothèse que
les conditions initiales Gi0 sont �xées).
En accord avec la théorie, � (ici, �6) est biaisé vers le haut par les
MCO et vers le bas par les e�ets �xes (Within).
66
Tab. 3 � Résultats d'estimation, modèle de Balestra-Nerlove
Paramètre MCO Within MCG
�0 (Constante) -3.650 - -4.091
(3.316) - (11.544)
�1 (Pit) -0.0451(*) -0.2026 -0.0879(*)
(0.027) (0.0532) (0.0468)
�2 (�Nit) 0.0174(*) -0.0135 -0.00122
(0.0093) (0.0215) (0.0190)
�3 (Ni;t�1) 0.00111(**) 0.0327(**) 0.00360(**)
(0.00041) (0.0046) (0.00129)
�4 (�Iit) 0.0183(**) 0.0131 0.0170(**)
(0.0080) (0.0084) (0.0080)
�5 (Ii;t�1) 0.00326 0.0044 0.00354
(0.00197) (0.0101) (0.00622)
�6 (Gi;t�1) 1.010(**) 0.6799(**) 0.9546(**)
(0.014) (0.0633) (0.0372)
Notes. N = 36, T = 11. Ecarts-types entre parenthèses. (*) et (**) : para-
mètre signi�catif à 10% et 5% respectivement.
5.4 Estimateurs GMM pour panel dynamique
5.4.1 Introduction
Estimation par Méthode des Moments Généralisés (GMM) comme
alternative intéressante aux e�ets �xes et MCG. Ses avantages
sont évidents dans le cas de l'estimation des modèles dynamiques
à données de panel.
Modèle simple sans régresseurs exogènes :
yit = �yi;t�1 + uit; uit = �i + "it:
67
Procédure par IC d'Anderson-Hsiao : estimateur convergent quand
T est �xe, basé sur le modèle en di�érences premières.
Deux désavantages :
a) Dans les procédures IV, la matrice de variance-covariance est
contrainte (homoscédasticité, pas d'auto-corrélation des erreurs) ;
b) Seulement 1 instrument utilisé pour identi�er 1 paramètre (soit
yi;t�2, soit yi;t�2 � yi;t�3).
5.4.2 L'estimateur d'Arellano-Bond
Article important : Arellano et Bond (Review of Economics
and Statistics, 1991) : une procédedure robuste peut être utilisée
(point a)) et plus de conditions d'orthogonalité (d'instruments)
sont disponibles (point b)).
Hypothèses du modèle
(i) Pour tout i, "it n'est pas corrélé avec yi0 pour tout t ;
(ii) Pour tout i, "it n'est pas is corrélé avec �i, pour tout t ;
(iii) Pour tout i, les "it ne sont pas mutuellement corrélés.
Sous ces hypothèses, on a l'ensemble de conditions de moments :
E(yis�uit) = 0; t = 2; 3; : : : ; T; s = 0; 1; : : : ; t� 2;
où �uit = �"it = "it � "i;t�1. C'est un ensemble de T (T � 1)=2
conditions (comparer avec Anderson-Hsiao, où seulement 1 condi-
tion était disponible).
Hypothèse importante : les conditions ci-dessus tiennent si les
termes d'erreur " ne sont pas auto-corrélés, i.e., on doit avoir
E("it"i;t+s) = 0, pour s = �1; 1.
68
Si de l'auto-corrélation est présente, on a l'ensemble de conditions :
E(yis�uit) = 0; t = 3; : : : ; T; s = 0; 1; : : : ; t� 3;
ce qui donne (T � 1)(T � 2)=2 conditions (on en perd (T � 1)).
Par substitution répétée, on a :
yit = "it + �"i;t�1 + �2"i;t�2 + � � �+ �
t�1"i1 +
1� �t
1� ��i + �
tyi0;
de sorte que yit = f("it; "i;t�1; : : : ; "i1; �i; yi0), et
E(yi;t�2�uit) = E(yi;t�2("it � "i;t�1))
= E("i;t�2("it � "i;t�1)) = 0
car par hypothèse E(�i"it) = E("ityi0) = 0.
5.4.3 Mise en pratique de l'estimateur GMM
On a besoin de a) 1 matrice d'instruments W ;
b) 1 matrice de pondération initiale.
La sous-matrice pour l'individu i est de la forme :
Wi =
2666664
yi0 0 0 � � � � � � � � � � � � � � � 0
0 yi0 yi1 0 0 0 � � � � � � 0
0 0 0 yi0 yi1 yi2 0 � � � 0...
......
......
......
......
0... 0 0 0 0 yi0 � � � yi;T�2
3777775
69
de sorte que W 0i�ui =0
BBBBBBBBBBBBBBB@
�ui2 yi0�ui3 yi0�ui3 yi1�ui4 yi0�ui4 yi1�ui4 yi2
...
�uiT yi0...
�uiT yi;T�2
1CCCCCCCCCCCCCCCA
=
0BBBBBBBBBBBBBBB@
(�yi2 � ��yi1) yi0(�yi3 � ��yi2) yi0(�yi3 � ��yi2) yi1(�yi4 � ��yi3) yi0(�yi4 � ��yi3) yi1(�yi4 � ��yi3) yi2
...
(�yiT � ��yi;T�1) yi0...
(�yiT � ��yi;T�1) yi;T�2
1CCCCCCCCCCCCCCCA
et E(W 0i�ui) = 0.
Matrice de pondération initiale pour (W 0W )�1 : est la matrice
de variance-covariance de �" (dans le modèle transformé). Si "itest homoscédastique, on a
E(�"it�"i;t�1) = E[("it � "i;t�1)("i;t�1 � "i;t�2)] = ��2"
E(�"2it) = E[("it � "i;t�1)("it � "i;t�1)] = 2�2"
E(�"it�"i;t+1) = E[("it � "i;t�1)("i;t+1 � "it)] = ��2"
et pour chaque individu i, E(�ui�u0i) = �
2"H, où
H =
2666664
2 �1 0 � � � � � � 0
�1 2 �1 0 � � � 0
0 �1 2 �1 � � � 0...
......
......
...
0...
... 0 �1 2
3777775 ;
une matrice (T�2)(T�2). Nous pouvons utiliserH pour calculer
la matrice de pondération initiale comme
A1 =
NXi=1
W0iHWi:
70
Après calcul de l'estimateur GMM de première étape
�GMM = argmin�
�u0WA�11 W
0�u
=��y0�1WA
�11 W
0�y�1��1 �
�y0�1WA�11 W
0�y�;
on peut calculer la matrice de pondération de 2e étape par :
A2 =
NXi=1
W0i�ui�u
0iWi;
où �ui = �yi � ��yi;�1.
5.4.4 Des procédures plus e�caces : Ahn-Schmidt, Blundell-Bond
Ahn et Schmidt (1995) proposent T �2 conditions supplémen-
taires :
E(uiT�uit) = 0; t = 2; 3; : : : ; T � 1:
Avec Ahn-Schmidt et Arellano-Bond, on a T (T � 1)=2 + (T � 2)
conditions d'orthogonalité. Ahn-Schmidt montrent qu'elles repré-
sentent l'ensemble des conditions de moment impliquées par ces
hypothèses.
Hypothèses supplémentaires
Homoscédasticité Sous l'hypothèse : 8i, V ar("2it) est la même 8t,on a : E(u2it) est identique pour t = 1; 2; : : : ; T . Ceci ajoute T � 1
conditions, et l'ensemble �nal de conditions est, sous l'hypothèse
d'homoscédasticité :
E(yis�uit) = 0 t = 2; : : : ; T; s = 0; : : : ; t� 2;
E(yit�ui;t+1 � yi;t+1�ui;t+2) = 0 t = 1; : : : ; T � 2;
E(�ui�ui;t+1) = 0 t = 1; : : : ; T � 1;
71
où �ui =1T
PTt=1 uit.
Stationarité Quand on ajoute l'hypothèse de stationarité :Cov(�i; yit)
est la même 8t, cela ajoute 1 condition. L'ensemble complet de
T (T � 1)=2 + (2T � 2) conditions est maintenant
E(yis�uit) = 0 t = 2; : : : ; T; s = 0; : : : ; t� 2;
E(uiT�yit) = 0 t = 1; : : : ; T � 1;
E(uityit � ui;t�1yi;t�1) = 0 t = 2; : : : ; T:
Avantage : cet ensemble est constitué uniquement de conditions
linéaires.
L'estimateur d'Ahn et Schmidt s'obtient en ajoutant à la matrice
d'instruments d'Arellano-Bond le bloc suivant, pour l'individu i :
Wi =
0BBB@
yi2 0 ::: ::: 0 �ui 0 ::: 0
�yi3 yi3 0 ::: 0 0 �ui ::: 0...
......
......
......
......
0 ::: ::: ::: �yi;T�1 0 ::: ::: �ui
1CCCA :
Comment tester la pertinence d'hypothèses additionnelles ? Soit
W1 la matrice d'instruments associée à l'ensemble de conditions
à tester, et W 0 une matrice d'instruments associée à un ensemble
restreint de conditions valides. Soit � et �0les estimateurs GMM
obtenus avec les instruments (W 0;W
1) et W 0 respectivement,
J(�) et J(�0) les valeurs des critères GMM correspondants.
Alors, sous l'hypothèse nulle H0 : les conditions associées à W1
sont valides, on a
J(�)� J(�0) v �
2(rank(W 1)):
72
5.4.5 L'estimateur de Blundell-Bond
Blundell et Bond (1998) suggère d'utiliser des conditions de mo-
ment linéaires basées sur des hypothèses portant sur les conditions
initiales. Ils proposent
E(uit�yi;t�1) = 0 t = 3; 4; : : : ; T;
avec en plus,
E(ui3�yi2) = 0:
Cette dernière condition, combinée avec celle plus haut, implique
les restrictions non-linéaires d'Ahn et Schmidt (1995)E(uit�ui;t�1) =
0; t = 3; : : : ; T . Cela signi�e que nous avons la condition suivante
de stationarité sur le modèle :
yi0 =�i
1� �+ "i0:
En d'autres termes, les écarts initiaux de �i=(1 � �) ne doivent
pas être corrélés au niveau de �i=(1� �).
L'estimateur GMM de Blundell et Bond combine les conditions
d'Ahn et -SchmidtWi avec leur nouveaux instruments dé�nis plus
haut :
W+i =
2666664
Wi 0 0 � � � 0
0 �yi2 0 � � � 0
0 0 �yi3 � � � 0...
......
... 0
0 0 0 � � � �yi;T�1
3777775 ;
pour estimer les paramètres dans un système à 2 équations :
�yi = ��yi;�1 +�"iyi = �yi;�1 + �i + "i:
73
5.5 Exemple : Equation de demande d'énergie (gaz na-
turel)
74
___ ____ ____ ____ ____tm /__ / ____/ / ____/ ___/ / /___/ / /___/ Statistics/Data Analysis ------------------------------------------------------------------------------- log: E:\dea\panel\2004\energy3.smcl log type: smcl opened on: 15 Apr 2004, 22:49:23 1 . use energy 2 . set matsize 800 3 . tsset sire annee panel variable: sire, 5.481e+13 to 9.457e+15 time variable: annee, 1983 to 1996, but with gaps 4 . sort sire annee 5 . by sire : gen lag_we = we[_n - 1] (110 missing values generated) 6 . by sire : gen lag_wfl = wfl[_n - 1] (110 missing values generated) 7 . by sire : gen lag_wfd = wfd[_n - 1] (110 missing values generated) 8 . by sire : gen lag_wbp = wbp[_n - 1] (110 missing values generated) 9 . by sire : gen lag_wg = wg[_n - 1] (110 missing values generated) 10 . xtabond wg lag_we lag_wfl lag_wfd lag_wbp, twostep note: lag_wfl dropped due to collinearity Arellano-Bond dynamic panel data Number of obs = 770 Group variable (i): sire Number of groups = 94 Wald chi2(4) = 7881.35 Time variable (t): annee min number of obs = 1 max number of obs = 12 mean number of obs = 8.191489 Two-step results ------------------------------------------------------------------------------ wg | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- wg | LD | .8027447 .024249 33.10 0.000 .7552175 .8502718 lag_we | D1 | .447632 .022023 20.33 0.000 .4044678 .4907962 lag_wfd | D1 | .7429275 .02455 30.26 0.000 .6948104 .7910445 lag_wbp | D1 | 1.188523 .0898711 13.22 0.000 1.012379 1.364668 _cons | -.0054737 .0000973 -56.27 0.000 -.0056643 -.0052831 ------------------------------------------------------------------------------ Warning: Arellano and Bond recommend using one-step results for inference on coefficients
Sargan test of over-identifying restrictions: chi2(77) = 79.22 Prob > chi2 = 0.4089 Arellano-Bond test that average autocovariance in residuals of order 1 is 0: H0: no autocorrelation z = -3.20 Pr > z = 0.0014 Arellano-Bond test that average autocovariance in residuals of order 2 is 0: H0: no autocorrelation z = 0.35 Pr > z = 0.7294 11 . xtabond wg lag_we lag_wfl lag_wfd lag_wbp, twostep lags(2) note: lag_wfl dropped due to collinearity Arellano-Bond dynamic panel data Number of obs = 669 Group variable (i): sire Number of groups = 92 Wald chi2(5) = 26399.30 Time variable (t): annee min number of obs = 1 max number of obs = 11 mean number of obs = 7.271739 Two-step results ------------------------------------------------------------------------------ wg | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- wg | LD | 1.79913 .0475941 37.80 0.000 1.705847 1.892413 L2D | .0281091 .0012674 22.18 0.000 .0256251 .0305932 lag_we | D1 | 1.2724 .0446425 28.50 0.000 1.184902 1.359897 lag_wfd | D1 | 1.514443 .0516318 29.33 0.000 1.413247 1.61564 lag_wbp | D1 | 1.395866 .0594595 23.48 0.000 1.279328 1.512405 _cons | -.0000462 .0001437 -0.32 0.748 -.0003279 .0002355 ------------------------------------------------------------------------------ Warning: Arellano and Bond recommend using one-step results for inference on coefficients Sargan test of over-identifying restrictions: chi2(75) = 81.48 Prob > chi2 = 0.2848 Arellano-Bond test that average autocovariance in residuals of order 1 is 0: H0: no autocorrelation z = -2.63 Pr > z = 0.0085 Arellano-Bond test that average autocovariance in residuals of order 2 is 0: H0: no autocorrelation z = -0.18 Pr > z = 0.8576 12 . log close log: E:\dea\panel\2004\energy3.smcl log type: smcl closed on: 15 Apr 2004, 22:52:17 -------------------------------------------------------------------------------
6 Les modèles à choix discret
6.1 Bref rappel des modèles binaires à choix discret
Modèles à variables dépendantes qualitatives : rappel dans le cas
binaire, et pour une coupe instantanée.
y�i = xi� + ui; i = 1; 2; : : : ; N;
yi = 1 si y�i > 0;
yi = 0 si y�i � 0;
y�i et yi : respectivement la variable latente (inobservée) et la va-
riable dépendante observée ; xi : vecteur 1�K de régresseurs. Le
seuil 0 est arbitraire, car E(y�i ) est inconnu.
6.1.1 Modèle à Probabilité Linéaire
E(yi) = Prob(yi = 1) = xi� + ui:
Non satisfaisant, car les probabilités prédites peuvent sortir de l'in-
tervalle [0; 1]. 2 valeurs possibles pour le résidu ui : 1�xi� (quand
yi = 1) ou ui = �xi� (quand yi = 0). Hétéroscédasticité par
construction, car V ar(ui) = Prob(yi = 0)� (�xi�)2+Prob(yi =
1)� (1� xi�)2
= (1� xi�)� (�xi�)2 + xi� � (1� xi�)2
= (1� xi�)[(�xi�)2 + xi�(1� xi�)]
= xi� � (1� xi�):
75
6.1.2 Le modèle Logit
Basé sur la distribution Logistique :
Prob(yi = 1) = �(xi�) =exp(xi�)
1+exp(xi�);
Prob(yi = 0) = 1� �(xi�) =1
1+exp(xi�);
Density :�(xi�) =exp(xi�)
[1+exp(xi�)]2:
Dans ce cas, V ar(ui) = �2=3.
6.1.3 Le modèle Probit
Basé sur la distribution Normale : ui est N(0; �2)
Prob(yi = 1) = ��xi��
�=R xi�=��1
1
�p2�
exp(� u2i
2�2);
Prob(yi = 0) = 1� ��xi��
�=R +1xi�=�
1
�p2�
exp(� u2i
2�2);
Densit�xi��
�= 1
�p2�
exp(� u2i
2�2):
Le paramètre � n'est pas identi�é (apparaît dans le rapport �=�) :
� est donc normalisé à 1.
Méthode d'estimation : Maximum de Vraisemblance
� = argmax�
NYi=1
[Prob(yi = 1)]yi [1� Prob(yi = 0)]
1�yi
= argmin�
NYi=1
F (Æixi�);
où F (:) est la fonction de répartition (� ou �), et Æi = 2yi � 1.
76
Dans ces modèles, l'inference est conduite sur a) le signe des pa-
ramètres estimés ; b) les e�ets marginaux (@Prob(yi = 1)=@xi).
Passage aux données de panel. On considère uit = �i + "it, de
sorte que
Prob(yit = 1) = Prob(y�it > 0) = Prob("it > �xit� � �i)
= Prob("it < xit� + �i) = F (xit� + �i):
6.2 Modèle Logit pour données de panel
6.2.1 Statistiques su�santes
Considérons d'abord un modèle à e�ets �xes.
Esrimateur du Maximum de Vraisemblance (MV) : il faut estimer
à la fois � et �i; i = 1; : : : ; N , mais �i et � ne sont pas indépen-
dants dans ces modèles non-linéaires. Si T est petit, l'estimateur
MV de �i n'est pas convergent et par conséquent, celui de � ne
l'est pas non plus. Les e�ets individuels �i sont appelés paramètres
incidentaux (leur nombre augmente avec N).
Solution : Neyman et Scott (1948) posent le principe de l'esti-
mation en présence de paramètres incidentaux . Supposons qu'il
existe une statistique su�sante �i pour �, i = 1; 2; : : : ; N , qui ne
dépende pas de �.
Alors, la densité conditionnelle
f(yijxi; �i; �) =f(yijxi; �i; �)g(�ijxi; �i; �)
; pour g(�ijxi; �i; �) > 0;
ne dépend pas de �i.
Un estimateur convergent de � s'obtient alors en maximisant la
77
densité conditionnelle de (y1; : : : ; yN) étant donné (�1; : : : ; �N) :
� = argmax�
NYi=1
f(yijxi; �i; �):
Probabilité jointe yi :
Prob(yi) =exp
h�i
�PTt=1 yit
�+�PT
t=1 yitxit
��
iQT
t=1 [1 + exp(xit� + �i)]:
Si nous résolvons les conditions du 1er ordre associées à la maxi-
misation de la log-vraisemblance par rapport à � :
@ logL
@�=
NXi=1
TXt=1
�� exp(xit� + �i)
1 + exp(xit� + �i)+ yit
�xit = 0;
et par rapport à �i :
@ logL
@�i=
TXt=1
�� exp(xit� + �i)
1 + exp(xit� + �i)+ yit
�= 0; i = 1; 2; : : : ; N;
,TXt=1
yit =
TXt=1
�� exp(xit� + �i)
1 + exp(xit� + �i)
�i = 1; 2; : : : ; N:
Par conséquent, une statistique su�sante pour �i est : �i =PT
t=1 yit.
La probabilité quePT
t yit = s est :
T !
s!(T � s)!� exp(�is)Q
t[1 + exp(xit� + �i)]�(Xd2Bi
exp
TXt=1
ditxit
!�
)
78
6.2.2 Probabilités conditionnelles
La probabilité conditionnelle de yi étant donné �i est :
Prob (yij�i) =exp
h�PTt=1 yitxit
��
iP
d2Biexp
�PTt=1 ditxit�
�
�(P
t yit)!(T �P
t yit)!
T !;
où Bi est un ensemble d'indices pour l'individu i :
Bi =
((di1; di2; : : : ; diT )jdit = 0; 1 et
TXt=1
dit =
TXt=1
yit
):
L'ensemble Bi représente toutes les combinaisons possibles de yitpour l'individu i avec le même nombre de 1 que dans
PTt yit.
Les groupes pour lesquelsPT
t yit = 0 ouPT
t yit = T ont une
probabilité de 1, et ne contribuent en rien à la log-vraisemblance.
Seuls ensembles d'intérêt : lorsquePT
1 yit = s 2]0; T [ ; il y a
(T
s) =T !=[s!(T � s)!] éléments, qui correspondent à T séquences
distinctes, de valeur s.
Notes :
� La seconde expression ne dépend pas de � et peut être éliminée ;
� Pour calculer la probabilité ci-dessus, il faut considérer pour
chaque s toutes les séquences possibles de 0 et de 1. Exemple : si
79
T = 4 et s = 2, on aurait 6 cas possibles et
Xd2Bi
exp
TXt=1
ditxit�
!= vec
26666664
1 1 0 0
1 0 1 0
1 0 0 1
0 1 1 0
0 1 0 1
0 0 1 1
37777775
0BB@
exp(xi1�)
exp(xi2�)
exp(xi3�)
exp(xi4�)
1CCA
6.2.3 Exemple : T = 2
Seule séquence d'intérêt : yi1 + yi2 = 1. Soit
!i = 1 if (yi1; yi2) = (0; 1);
!i = 0 if (yi1; yi2) = (1; 0):
On a la probabilité conditionnelle :
Prob(!i = 1jyi1 + yi2 = 1) =Prob(!i = 1)
Prob(!i = 0) + Prob(!i = 1)
=
�exp(�i + yi2xi2�)
[1 + exp(�i + xi1�)][1 + exp(�i + xi2�)]
�
��[1 + exp(�i + xi1�)][1 + exp(�i + xi2�)]
exp(�i + xi1�) + exp(�i + xi2�)
�
=exp(�i + xi2�)
exp(�i + xi1) + exp(�i + xi2�)
=exp[(xi2 � xi1)�])
1 + exp[(xi2 � xi1)�]= �[(xi2 � xi1)�]:
Dans ce cas, Bi = fijyi1+ yi2 = 1g et la log-vraisemblance condi-
tionnelle est logL =Xi2Bi
f!i log�[(x2i � xi1)�] + (1� !i) log f1� �[(x2i � xi1)�]gg :
80
En pratique, lorsque T > 2, nous devons considérer d'autres en-
sembles de séquences possibles pour lesquellesPT
t yit est le même.
6.3 Le modèle Probit
On utilise traditionnellement le modèle Probit dans les cas des
e�ets aléatoires (facilité de calcul).
Considérons un modèle avec le terme d'erreur uit = �i + "it, où
�i est issu d'une distribution G(:) et est indépendant des xi. Sup-
posons que
V ar(�) = �2�; V ar("it) = 1; Corr(uit; uis) = � =
�2�
1 + �2�
:
La contribution à la vraisemblance de l'individu i est Li = Prob(yi)
=
Z Æi1xi1�
�1� � �Z ÆiTxiT�
�1f(ui1; ui2; : : : ; uiT )dui1 � � � duiT ;
où Æit = 2yit � 1 et f(:) est la fonction de densité jointe des élé-
ments dans ui.
L'intégration de cette densité n'est pas raisonnable (numérique-
ment, manque de précision) si T est grand, mais l'on peut tra-
vailler avec la densité conditionnelle, car conditionnellement à �i,
les uit sont indépendants :
f(ui1; ui2; : : : ; uiT ) =
Z +1
�1f(ui1; ui2; : : : ; uiT j�i)f(�i)d�i
=
Z +1
�1
TYt=1
f(uitj�i)f(�i)d�i;
81
où la densité de �i est N [0; �=(1� �)] (rappel : � = �2�=(1+�
2�)).
Butler et Mo�tt (1982) montrent que l'on peut écrire Li comme
Li(yi) =1p�
Z +1
�1e�t2
i
"TYt=1
�(Æitxit� + Æitti
p2�p
1� �)
#dti;
qui est à présent une intégrale à 1 dimension qui peut facilement
être calculée numériquement (algorithme d'intégration de Gauss-
Hermite). Désavantage de cette méthode : il faut imposer que la
corrélation (�) est constante sur les périodes.
82
___ ____ ____ ____ ____tm /__ / ____/ / ____/ ___/ / /___/ / /___/ Statistics/Data Analysis ------------------------------------------------------------------------------- log: E:\dea\panel\2004\paper31.smcl log type: smcl opened on: 13 Apr 2004, 22:44:46 1 . clear 1 . clear 1 . clear 1 . clear 2 . use paper31 2 . use paper31 2 . use paper31 2 . use paper31 3 . sum 3 . sum 3 . sum 3 . sum Variable | Obs Mean Std. Dev. Min Max -------------+----------------------------------------------------- pgn | 3892 2031.673 507.0337 649.3506 4935.065 eff | 3892 127.4245 124.4005 0 1200 pk | 3892 1854.373 8357.252 9 270000 we | 3892 .7526084 .1939825 .0755102 1 wg | 3892 .0691366 .1490749 0 .9244898 wfl | 3892 .0595062 .1532768 0 .8358098 wfd | 3892 .1048921 .1381208 0 .8143532 wbp | 3892 .0138567 .0599029 0 .7816901 lnpk | 3892 7.620966 .2802385 6.176086 8.751222 lnpgn | 3892 -4.36909 1.362804 -11.26895 -.1333181 lnpfl | 3892 -4.396743 1.319552 -10.76311 -.1630243 lnpfd | 3892 -4.372553 1.268942 -10.34875 -.2750275 lnpbp | 3892 -4.37296 1.285537 -10.44155 -.1853326 annee | 3892 1989.5 4.031647 1983 1996 sire | 3892 5.64e+15 2.28e+15 5.48e+13 9.98e+15 r | 3892 2.604573 .8067498 0 4 leff | 3891 4.447666 .9390137 2.302585 7.090077 4 . xtlogit wg lnpgn lnpk lnpfl lnpfd leff, i(sire) fe 4 . xtlogit wg lnpgn lnpk lnpfl lnpfd leff, i(sire) fe 4 . xtlogit wg lnpgn lnpk lnpfl lnpfd leff, i(sire) fe 4 . xtlogit wg lnpgn lnpk lnpfl lnpfd leff, i(sire) fe note: multiple positive outcomes within groups encountered. note: 197 groups (2758 obs) dropped due to all positive or all negative outcomes. Iteration 0: log likelihood = -440.50788 Iteration 1: log likelihood = -244.73554 Iteration 2: log likelihood = -218.80164 Iteration 3: log likelihood = -214.75859 Iteration 4: log likelihood = -214.58631 Iteration 5: log likelihood = -214.58586 Conditional fixed-effects logit Number of obs = 1133 Group variable (i) : sire Number of groups = 81
Obs per group: min = 13 avg = 14.0 max = 14 LR chi2(5) = 482.63 Log likelihood = -214.58586 Prob > chi2 = 0.0000 ------------------------------------------------------------------------------ wg | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- lnpgn | -4.911574 .5046251 -9.73 0.000 -5.900621 -3.922527 lnpk | .8308617 .7184896 1.16 0.248 -.577352 2.239075 lnpfl | -1.406169 .6057111 -2.32 0.020 -2.593341 -.2189966 lnpfd | 2.446032 .7488206 3.27 0.001 .9783705 3.913693 leff | .3644786 .6587024 0.55 0.580 -.9265543 1.655512 ------------------------------------------------------------------------------ 5 . xtprobit wg lnpgn lnpk lnpfl lnpfd leff, i(sire) re 5 . xtprobit wg lnpgn lnpk lnpfl lnpfd leff, i(sire) re 5 . xtprobit wg lnpgn lnpk lnpfl lnpfd leff, i(sire) re 5 . xtprobit wg lnpgn lnpk lnpfl lnpfd leff, i(sire) re Fitting comparison model: Iteration 0: log likelihood = -2219.598 Iteration 1: log likelihood = -1491.5615 Iteration 2: log likelihood = -1424.133 Iteration 3: log likelihood = -1421.415 Iteration 4: log likelihood = -1421.408 Fitting full model: rho = 0.0 log likelihood = -1421.4078 rho = 0.1 log likelihood = -1140.8174 rho = 0.2 log likelihood = -1016.5969 rho = 0.3 log likelihood = -942.64415 rho = 0.4 log likelihood = -892.79813 rho = 0.5 log likelihood = -857.7847 rho = 0.6 log likelihood = -832.86653 rho = 0.7 log likelihood = -814.12095 rho = 0.8 log likelihood = -804.14302 Iteration 0: log likelihood = -814.12092 Iteration 1: log likelihood = -730.50278 Iteration 2: log likelihood = -696.05937 Iteration 3: log likelihood = -679.81218 Iteration 4: log likelihood = -666.53806 Iteration 5: log likelihood = -665.50986 Iteration 6: log likelihood = -658.13604 Iteration 7: log likelihood = -657.09612 Iteration 8: log likelihood = -657.08286 Iteration 9: log likelihood = -657.08286 Random-effects probit Number of obs = 3891 Group variable (i) : sire Number of groups = 278 Random effects u_i ~ Gaussian Obs per group: min = 13
avg = 14.0 max = 14 Wald chi2(5) = 405.09 Log likelihood = -657.08286 Prob > chi2 = 0.0000 ------------------------------------------------------------------------------ wg | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- lnpgn | -3.541549 .2524669 -14.03 0.000 -4.036375 -3.046723 lnpk | .9321749 .3466973 2.69 0.007 .2526607 1.611689 lnpfl | -.6432045 .2752501 -2.34 0.019 -1.182685 -.1037243 lnpfd | 2.488594 .3997656 6.23 0.000 1.705068 3.27212 leff | .4004405 .138137 2.90 0.004 .1296969 .6711841 _cons | -18.61093 3.124295 -5.96 0.000 -24.73443 -12.48742 -------------+---------------------------------------------------------------- /lnsig2u | 1.970308 .1089466 1.756777 2.183839 -------------+---------------------------------------------------------------- sigma_u | 2.678224 .1458918 2.407017 2.979989 rho | .8776442 .0116992 .8528055 .8987889 ------------------------------------------------------------------------------ Likelihood ratio test of rho=0: chibar2(01) = 1528.65 Prob >= chibar2 = 0.000 6 . log close 6 . log close 6 . log close 6 . log close log: E:\dea\panel\2004\paper31.smcl log type: smcl closed on: 13 Apr 2004, 22:46:43 -------------------------------------------------------------------------------
Appendix 10. IV and GMM estimation withGauss c
/* IV2.PRG Instrumental variable estimation and GMM estimation
Model y(it) = X(it)beta + Z(i) gamma
We use Hausman-Taylor, Amemiya-MaCurdy, Breusch-Mizon-Schmidt instruments,
both for IV and GMM */
new ;clear all ;
/* You only need to change this block */
/* Define dimensions
N : number of units, T=number of time periods
nvar= Nb. of variables to be read
k1 : Nb. of X1it, k2 : Nb. of X2it, g1= Nb. of Z1i, g2 : Nb. of Z2i
kq= k1+k2, kb= k1+k2+g1+g2*/
n=595 ;
t=7 ;
nvar=13 ;
k1=4 ;
k2=5 ;
g1=2 ;
g2=1 ;
kq=k1+k2 ;
kb=k1+k2+g1+g2 ;
et=ones(t,1) ;
un=ones(n*t,1) ;
unb=ones(n,1) ;
/* Read data */
load x[n*t,nvar]=psid.dat ;
output file=iv1.out reset ;
expe=x[.,1] ;
expe2=x[.,2] ;
wks=x[.,3] ;
83
occ=x[.,4] ;
ind=x[.,5] ;
south=x[.,6] ;
smsa=x[.,7] ;
ms=x[.,8] ;
fem=x[.,9] ;
unioni=x[.,10] ;
edu=x[.,11] ;
blk=x[.,12] ;
lwage=x[.,13] ;
/* Define matrices X, Z and vector Y */
x1 = occ�south�smsa�ind ;
x2 = expe�expe2�wks�ms�unioni ;
z1 = fem�blk ;
z2 = edu ;
y = lwage ;
x = x1�x2 ;
z = z1�z2 ;
/* You don't need to change anything after this */
/* Compute Between and Within transformations : BX and QX
Caution : keep that order for BXZ : X,Z,Y */
qx=with(x�y) ;
bxz=bet(x�z�y) ;
by=bxz[.,cols(bxz)] ;
bxz=bxz[.,1 :cols(bxz)-1] ;
qy=qx[.,cols(qx)] ;
qx=qx[.,1 :cols(qx)-1] ;
/* Within regression and error term (uw) */
betaw=inv(qx'qx)*qx'qy ;
uw=qy-qx*betaw ;
/* Compute variance with instruments */
exob=un�bxz ;
gamb=inv(exob'exob)*(exob'by) ;
84
ub=by-exob*gamb ;
sigep=uw'uw/(n*(t-1)-kq) ;
sigq=sqrt(sigep*diag(inv(qx'qx))) ;
a=x1�z1 ;
di=by-bxz[.,1 :kq]*betaw ;
zz = un�z1�z2 ;
gamhatw=inv(zz'*a*inv(a'*a)*a'*zz)*zz'*a*inv(a'*a)*a'*di;
s2=(1/(n*t))*(by-bxz[.,1 :kq]*betaw
-zz*gamhatw)'*(by-bxz[.,1 :kq]*betaw-zz*gamhatw) ;
sigal=s2-(1/t)*sigep ;
theta=sqrt(sigep/(sigep+t*sigal)) ;
/* GLS transformation and estimate
Caution : keep the order 1,X1,X2,Z1,Z2 in matrix EXOG */
exog=gls(un�x1�x2�z1�z2�y) ;
yg=exog[.,cols(exog)] ;
exog=exog[.,1 :cols(exog)-1] ;
betagls=inv(exog'exog)*(exog'yg) ;
siggls=sqrt(sigep*diag(inv(exog'exog))) ;
/* HT */
aht=un�qx�bet(x1)�z1 ;
betaht=inv(exog'*aht*inv(aht'*aht)*aht'*exog)*exog'*aht*inv(aht'*aht)
*aht'*yg ;
sight=sqrt(sigep*diag(inv(exog'*aht*inv(aht'*aht)*aht'*exog)));
/* AM */
x1s=tam(x1) ;
aam=un�qx�x1s�z1 ;
betaam=inv(exog'*aam*inv(aam'*aam)*aam'*exog);
betaam=betaam*exog'*aam*inv(aam'*aam)*aam'*yg;
sigam=sqrt(sigep*diag(inv(exog'*aam*inv(aam'*aam)*aam'*exog)));
/* BMS */
85
abms1=aam�tbms(with(x2)) ;
/* This is the general form for BMS instrument, it should work in most
cases. But with the application to PSID data, we must drop some variables,
see below. This means you have to delete ABMS1 below for your application
*/
/* Remove abms1 just below : */
abms1=un�qx�bet(x1)�tbms(with(occ�south�smsa�ind�ms�wks�unioni))�z1;
betabms1=inv(exog'*abms1*inv(abms1'*abms1)*abms1'*exog)
*exog'*abms1*inv(abms1'*abms1)*abms1'*yg ;
sigbms1=sqrt(sigep*diag(inv(exog'*abms1*inv(abms1'*abms1)*abms1'*exog)));
/* Compute variance-covariance matrices */
varq=sigep*inv(qx'qx) ; varg=sigep*inv(exog'*exog) ;
varht=sigep*inv(exog'*aht*inv(aht'*aht)*aht'*exog);
varam=sigep*inv(exog'*aam*inv(aam'*aam)*aam'*exog);
varbms1=sigep*inv(exog'*abms1*inv(abms1'*abms1)*abms1'*exog);
test1=(betagls[2 :kq+1]-betaw)'*inv(varq-varg[2 :kq+1,2 :kq+1]) ;
test1=test1*(betagls[2 :kq+1]-betaw) ;
test2=(betaht[2 :kq+1]-betaw)'*inv(varq-varht[2 :kq+1,2 :kq+1])
*(betaht[2 :kq+1]-betaw) ;
test3=(betaht-betaam)'*inv(varht-varam)*(betaht-betaam);
test4=(betaam-betabms1)'*inv(varam-varbms1)*(betaam-betabms1);
output file=iv1.out reset ;
output on ;
"Within estimates " ;
" Estimate standard error t-stat " ;
betaw�sigq�betaw./sigq ;
"GLS estimates" ;
"sigma(alpha),sigma(epsilon),theta(=(sig(ep)/(sig(ep+t*sig(al)))**(1/2))";
sigal sigep theta ;
" Estimate standard error t-stat " ;
betagls�siggls�betagls./siggls ;
86
"HT estimates " ;
" Estimate standard error t-stat " ;
betaht�sight�betaht./sight ;
"AM estimates " ;
" Estimate standard error t-stat " ;
betaam�sigam�betaam./sigam ; "BMS estimates " ;
" Estimate standard error t-stat " ;
betabms1�sigbms1�betabms1./sigbms1 ;
"Hausman test statistics and p-value " ;
"Within vs. GLS " ;
test1�cdfchic(test1,kq) ;
"Within vs. HT " ;
test2�cdfchic(test2,k1-g2) ;
"AM vs. HT " ;
test3�cdfchic(test3,cols(aam)-cols(aht)) ;
"BMS vs. AM " ;
test4�cdfchic(test4,cols(abms1)-cols(aam));
/* GMM estimation */
b1,se1,b2,se2,sar = gmm(y,un�x1�x2�z1�z2,aht,1) ;
"GMM-HT estimates " ;
" Estimate standard error t-stat " ;
b2�se2�b2./se2 ;
"Hansen test and p-value " ;
sar cdfchic(sar,cols(aht)-rows(b2)) ;
b1,se1,b2,se2,sar = gmm(y,un�x1�x2�z1�z2,aam,1) ;
"GMM-AM estimates " ;
" Estimate standard error t-stat " ;
b2�se2�b2./se2 ;
"Hansen test and p-value " ;
sar cdfchic(sar,cols(aam)-rows(b2)) ;
b1,se1,b2,se2,sar = gmm(y,un�x1�x2�z1�z2,abms1,1) ;
"GMM-BMS estimates " ;
87
" Estimate standard error t-stat " ;
b2�se2�b2./se2 ;
"Hansen test and p-value " ;
sar cdfchic(sar,cols(abms1)-rows(b2)) ;
output off ;
proc bet(w) ;
/* Compute BX from matrix w */
local i,term,betx ;
term=reshape(w[.,1],n,t) ;
term=meanc(term').*.et ;
term=reshape(term,n*t,1) ;
betx=term ;
i=2 ;
do until i>cols(w) ;
term=reshape(w[.,i],n,t) ;
term=reshape(meanc(term').*.et,n*t,1) ;
betx=betx�term ;
i=i+1 ;
endo ;
retp(betx) ;
endp ;
proc with(w) ;
/* Compute Within transformation for matrix W */
retp(w-bet(w)) ;
endp ;
proc gls(w) ;
/* GLS transformation */
local term ; term=w-(1-theta)*bet(w) ;
retp(term) ;
endp ;
proc tam(w) ;
/* AM transformation, stacking time observations */
local i,term,xstar ;
term=reshape(w[.,1],n,t).*.et ;
xstar=term ;
88
i=2 ;
do until i>cols(w) ;
term=reshape(w[.,i],n,t).*.et ;
xstar=xstar�term ;
i=i+1 ;
endo ;
retp(xstar) ;
endp ;
proc tbms(w) ;
/* BMS transformation, stacking time observations but deleting last column
*/
local i,term,xstar ;
term=reshape(w[.,1],n,t).*.et ;
xstar=term[.,1 :cols(term)-1] ;
i=2 ;
do until i>cols(w) ;
term=reshape(w[.,i],n,t).*.et ;
xstar=xstar�term[.,1 :cols(term)-1] ;
i=i+1 ;
endo ;
retp(xstar) ;
endp ;
proc (5)=gmm(y,x,z,d) ;
local zx,w,w2,b,e,e2,b2,se,se2,sar2 ;
zx = z'x ;
if d==1 ;
w = invpd(inw(z)) ;
else ;
w = invpd(z'z) ;
endif ;
b = invpd(zx'w*zx)*zx'w*z'y ;
e = y-x*b ;
w2 = ezw(e,z) ;
se = invpd(zx'w*zx)*zx'w*w2*w*zx*invpd(zx'w*zx);
89
w = invpd(w2) ;
se2 = invpd(zx'w*zx) ;
b2 = se2*zx'w*z'y ;
e2 = y-x*b2 ;
sar2 = e2'z*w*z'e2 ;
retp(b,sqrt(diag(se)),b2,sqrt(diag(se2)),sar2);
endp ;
proc ezw(e,z) ;
local k,ez,T ;
T = rows(e)/N ;
k = cols(z) ;
ez = reshape(e.*z,N,K*T)*(ones(T,1).*.eye(K));
retp(ez'ez) ;
endp ;
proc inw(z) ;
local a,i,zi,zaz,T ;
t = rows(z)/N ;
a = eye(T) ;
zaz = 0 ;
i = 1 ;
do until i>N ;
zi = z[(i-1)*T+1 :i*T,.] ;
zaz = zaz + zi'a*zi ;
i = i+1 ;
endo ;
retp(zaz) ;
endp ;
90
Appendix 11. DPD estimation with Gauss c
/* DPD1.PRG Program for DPD (Dynamic Panel Data model)
Method : Arellano-Bond */
/* Defines variables below as global */
clearg N,T,y,x,z,alpha,sco,hes,zgy,fake,mom,w;
/*Read data*/
n=595 ; t=7 ; nvar=13 ;
load x[n*t,nvar]=d :/dea/panel/psid.dat ;
lwage=x[.,13] ;
wks=x[.,3] ;
occ=x[.,4] ;
clear x ;
/* Create a (NxT) matrix for dependent var. */
y=reshape(lwage,n,t) ;
/* Stack exogenous vars. */
x=wks�occ ;
/* Set top=0 for instruments from lagged Y's only ;
top=1 to add instruments from X that are weakly exogenous and in level ;
set top=2 to add for instruments from X that are strongly exogenous and
in first-difference form */
top=2 ;
/* Set AR1 to 0 for general case, and AR1 to 1
for serially correlated epsilon's of order 1 (E(epitepi; t+ 1) <> 0) */
ar1=1 ;
/* You don't need to change anything after this line */
/* Define identity matrices I(T-2) for AB and BB */
ddif = eye(T-2) ;
/* Construct AB instrument matrix Z.
91
First component matrix : lagged Y's
Recall : if AR1=1, restriction when epsilon's are serially correlated
of order 1 */
z = (y[.,1]).*.ddif[.,1] ;
j = 2 ;
do until j>cols(ddif) ;
z = z�((y[.,1 :j]).*.ddif[.,j]) ;
j = j+1 ;
endo ;
if ar1==1 ;
z = (y[.,1]).*.ddif[.,1] ;
j = 2 ;
do until j>cols(ddif) ;
z = z�((y[.,1 :j-1]).*.ddif[.,j]) ;
j = j+1 ;
endo ;
z=z[.,2 :cols(z)] ;
endif ;
/* Second component matrix : Instruments from X */
/* Delete this block if you want only instruments from y's */
if top==1 ;
/* Weakly exogenous X's, in level */
toto=shapent(x[.,1]) ;
z2 = (toto[.,1]).*.ddif[.,1] ;
j = 2 ;
do until j>cols(ddif) ;
z2 = z2�((toto[.,1 :j]).*.ddif[.,j]) ;
j = j+1 ;
endo ;
i=2 ;
do until i>cols(x) ;
toto=shapent(x[.,i]) ;
z2 =z2�((toto[.,1]).*.ddif[.,1]) ;
j = 2 ;
do until j>cols(ddif) ;
z2 = z2�((toto[.,1 :j]).*.ddif[.,j]) ;
92
j = j+1 ;
endo ;
i=i+1 ;
endo ;
z=z�z2 ;
endif ;
if top==2 ;
/* Strongly exogenous X's, in first-difference form */
toto=shapent(x[.,1]) ;
z2 = (toto[.,3]-toto[.,2]).*.ddif[.,1] ;
j = 2 ;
do until j>cols(ddif) ;
z2 = z2�((toto[.,j]-toto[.,j-1]).*.ddif[.,j]);
j = j+1 ;
endo ;
i=2 ;do until i>cols(x) ;
toto=shapent(x[.,i]) ;
z2 = z2�((toto[.,3]-toto[.,2]).*.ddif[.,1]);
j = 2 ;
do until j>cols(ddif) ;
z2 = z2�((toto[.,j]-toto[.,j-1]).*.ddif[.,j]);
j = j+1 ;
endo ;
i=i+1 ;
endo ;
z=z�z2 ;
endif ;
b1,se1,b2,se2,sar = gmm(vec((y[.,3 :T]-y[.,2 :T-1])'),
vec((y[.,2 :T-1]-y[.,1 :T-2])')
�trans(x),z,1) ;
output file = dpd1.out on ;
"Arellano-Bond GMM estimates" ;
if top ==0 ;
"Instruments from lagged Y's only (TOP=0)" ;
endif ;
if top==1 ;
93
"Instruments from X are weakly exogenous and in level (TOP=1)" ;
endif ;
if top==2 ;
"Instruments from X are strongly exogenous and first-differenced (TOP=2)" ;
endif ;
if ar1==1 ;
"Restricted estimates : epsilon are serially correlated of order 1 (AR1=1)" ;
endif ;
" Estimate standard error t-stat" ;
b2�se2�b2./se2 ;
"Nb. of conditions (instruments) " cols(z) ;
"Nb. of parameters " rows(b2) ;
"Hansen specification test and p-value " ;
sar�cdfchic(sar,cols(z)-rows(b2)) ;
output off ;
proc shapent(w) ;
/* Reshapes vector in NxT form */
retp(reshape(w,n,t)) ;
endp ;
proc trans(w) ;
/* Transforms matrix X in First Difference */
local toto,i,xfd ;
toto=reshape(w[.,1],n,t) ;
toto=vec((toto[.,3 :T]-toto[.,2 :T-1])') ;
xfd=toto ;
i=2 ;
do until i>cols(w) ;
toto=reshape(w[.,i],n,t) ;
toto=vec((toto[.,3 :T]-toto[.,2 :T-1])') ;
xfd=xfd�toto ;
i=i+1 ;
endo ;
retp(xfd) ;
endp ;
94
proc (2)=ls(y,x) ;
/* Computes OLS, returns White var-covar matrix */
local ixx,b,e,v ;
ixx = invpd(x'x) ;
b = ixx*x'y ;
e = y-x*b ;
v = ixx*(ezw(e,x))*ixx ;
retp(b,v) ;
endp ;
proc ezw(e,z) ;
local k,ez,T ;
T = rows(e)/N ;
k = cols(z) ;
ez = reshape(e.*z,N,K*T)*(ones(T,1).*.eye(K));
retp(ez'ez) ;
endp ;
proc inw(z) ;
local d,a,i,zi,zaz,T ;
T = rows(z)/N ;
d = zeros(T,1)�(eye(T-1)|zeros(1,T-1)) ;
a = 2*eye(T) - (d + d') ;
zaz = 0 ;
i = 1 ;
do until i>N ;
zi = z[(i-1)*T+1 :i*T,.] ;
zaz = zaz + zi'a*zi ;
i = i+1 ;
endo ;
retp(zaz) ;
endp ;
proc (5)=gmm(y,x,z,d) ;
local zx,w,w2,b,e,e2,b2,se,se2,sar2 ;
zx = z'x ;
95
if d==1 ;
w = invpd(inw(z)) ;
else ;
w = invpd(z'z) ;
endif ;
b = invpd(zx'w*zx)*zx'w*z'y ;
e = y-x*b ;
w2 = ezw(e,z) ;
se = invpd(zx'w*zx)*zx'w*w2*w*zx*invpd(zx'w*zx);
w = invpd(w2) ;
se2 = invpd(zx'w*zx) ;
b2 = se2*zx'w*z'y ;
e2 = y-x*b2 ;
sar2 = e2'z*w*z'e2 ;
retp(b,sqrt(diag(se)),b2,sqrt(diag(se2)),sar2);
endp ;
96
Références bibliographiques
T. Amemiya et T.E. MaCurdy, Instrumental-Variable Estima-
tion of an Error-Components Model, Econometrica, 54(4), 869�880,
1986.
T.W. Anderson et C. Hsiao, Formulation and Estimation of
Dynamic Models Using Panel Data, Journal of Econometrics, 18,
47�82, 1982.
M. Arellano et S. Bond, Some Tests of Speci�cation for Panel
Data : Monte Carlo Evidence and an Application to Employment
Equations, Review of Economic Studies, 58, 277�297, 1991.
M. Arellano et O. Bover, Another Look at the Instrumental Va-
riable Estimation of Error-Components Models, Journal of Eco-
nometrics, 68, 29�51, 1995.
M. Arellano, Panel data econometrics. Oxford Universiy Press,
Oxford, 2003.
P. Balestra et M. Nerlove, Pooling cross-section and time-series
data in the estimation of a dynamic model : the demand for na-
tural gas, Econometrica, 34, 585-612,1966.
B.H. Baltagi, Econometric Analysis of Panel Data, J. Wiley,
1995.
B.H. Baltagi, Speci�cation issues, in The econometrics of pa-
nel data : Handbook of theory and applications, chap. 9, L. Ma-
97
tyas and P. Sevestre eds., Kluwer Academix Publishers, Dordrecht,
196-205, 1992.
T.S. Breusch, G.E. Mizon et P. Schmidt, E�cient Estimation
Using Panel Data, Econometrica, 57(3), 695-700, 1989.
G. Chamberlain, Panel data, in Handbook of Econometrics, pp.
1247-1318, Z. Griliches and M. Intriligator eds., North- Holland,
Amsterdam, 1984.
B. Dormont, Introduction à l'Econométrie des Données de Pa-
nel, Editions du Centre National de la Recherche Scienti�que, Pa-
ris, 1989.
L.P. Hansen, Large sample properties of generalized method of
moments estimators, Econometrica, 50, 102-1054, 1982.
J.A. Hausman, Speci�cation Tests in Econometrics, Econome-
trica, 46(6), 1251�1271, 1978.
J.A. Hausman et W.E. Taylor, Panel Data and Unobservable
Individual E�ects, Econometrica, 49(6), 1377�1398, 1981.
C. Hsiao, Analysis of Panel Data, Cambridge University Press,
1986.
L. Matyas et P. Sevestre, The Econometrics of Panel Data.
Handbook of Theory and Applications, Kluwer Academic Publi-
shers, 1992.
98
M. Nerlove, A note on error components models, Econometrica,
39, 383-396, 1971.
W.K. Newey, E�cient estimation of models with conditional
moment restrictions, in Handbook of Statistics, C.R. Rao and
H.D. Vinod (Eds.), Vol. 11, Elsevier Science Publishers, 1993.
P. Sevestre, Econométrie des données de panel. Dunod, Paris,
2002.
P.A.V.B. Swamy et S.S. Arora, The exact �nite sample pro-
perties of the estimators of coe�cients in the error components
regression models, Econometrica, 40, 261-275, 1972.
J.M. Wooldridge, Econometric analysis of cross section and pa-
nel data. MIT Press, Cambridge, 2003.
99