klasyfikacja modeli ekonometrycznych -...
TRANSCRIPT
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 1
MODEL EKONOMETRYCZNY
„Model jest to schematyczne uproszczenie, pomijające nieistotne aspekty w celu
wyjaśnienia wewnętrznego działania, formy lub konstrukcji bardziej
skomplikowanego mechanizmu.” (Lawrence R. Klein)
ZALETY MODELU- możliwość względnie taniego eksperymentowania, możliwość
analizy, realizacji prognozy, symulacji.
Model ekonometryczny- formalny matematyczny zapis istniejących
prawidłowości ekonomicznych. Celem takiego modelu może być opis zależności,
przewidywanie przyszłego kształtowania się zależności, symulacja.
KLASYFIKACJA MODELI EKONOMETRYCZNYCH
Ze względu na wyróżnione cechy:
występowanie lub brak w modelu zmiennej losowej;
modele deterministyczne lub stochastyczne.
ze względu na formę związku między zmiennymi występującymi w modelu;
modele liniowe i nieliniowe
ze względu na ilość rozpatrywanych zależności
modele jednorównaniowe i wielorównaniowe
ze względu na czynnik czasu;
modele statyczne [związki zachodzą w tej samej jednostce czasowej] i
modele dynamiczne [uwzględniają czynnik czasu w formie opóźnień lub
zmiennej czasowej]
ze względu na charakter analizowanych związków;
modele przyczynowo-skutkowe i modele symptomatyczne.
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 2
KLASYFIKACJA ZMIENNYCH I PARAMETRÓW
WYSTĘPUJĄCYCH W EKONOMETRYCZNYCH MODELACH.
Zmienne endogeniczne i egzogeniczne w modelu ekonometrycznym.
Zmienne egzogeniczne (zmienne objaśniające w modelu, wśród nich zmienne
sterujące będące przedmiotem polityki gospodarczej).
Zmienne objaśniane i objaśniające (dot. danego równania )
Zmienne z góry ustalone (zm. egzogeniczne, zmienne endogeniczne z
opóźnieniami i z wyprzedzeniami, zmienna czasowa-wyrażająca systematyczne
zmiany w czasie zmiennej endogenicznej).
Zmienne zerojedynkowe (dla określenia czynników niemierzalnych).
Składnik losowy ( zmienna wyrażająca łączny efekt tych czynników, które nie
zostały wyspecyfikowane w modelu, a także z błędów wynikających z przyjęcia
niewłaściwej postaci funkcyjnej modelu, błędów pomiaru wartości zmiennych.
Parametry struktury stochastycznej modelu (parametry rozkładu składnika
losowego)
Parametry strukturalne modelu (parametry występujące przy kolejnych
zmiennych, określające kształtowanie zmiennej objaśnianej).
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 3
ETAPY ANALIZY EKONOMETRYCZNEJ
SPECYFIKACJA ZMIENNYCH I DOBÓR POSTACI MODELU
USTALENIE PRZEDMIOTU BADANIA, LISTA ZMIENNYCH
OBJAŚNIAJĄCYCH I OBJAŚNIANYCH, POSTAĆ FUNKCYJNA MODELU. W OPARCIU O TEORIĘ EKONOMII, ZEBRANE DANE STATYSTYCZNE, KORELACJE.
ZEBRANIE DANYCH STATYSTYCZNYCH
ZEBRANIE DANYCH, UPORZĄDKOWANIE (SZEREGI CZASOWE, PRZEKROJOWE,
PRZEKROJOWO-CZASOWE) I ANALIZA PRZYDATNOŚCI DANYCH. OKREŚLENIE
MIERNIKA, PORÓWNYWALNOŚĆ DANYCH.
ESTYMACJA PARAMETRÓW
WYZNACZENIE OCEN PARAMETRÓW STRUKTURALNYCH ORAZ
PARAMETRÓW STRUKTURY STOCHASTYCZNEJ MODELU.
NARZĘDZIE - METODA NAJMNIEJSZYCH KWADRATÓW (MNK).
WERYFIKACJA MODELU
ANALIZA OTRZYMANYCH OCEN PARAMETRÓW STRUKTURALNYCH
I STRUKTURY STOCHASTYCZNEJ MODELU. WERYFIKACJA MERYTORYCZNA I STATYSTYCZNA.
PRAKTYCZNE WYKORZYSTANIE MODELU
ANALIZA PRAWIDŁOWOŚCI ( HISTORYCZNA ).
PROGNOZOWANIE
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 4
ESTYMACJA PARAMETRÓW
MODELU EKONOMETRYCZNEGO (ESTYMACJA PUNKTOWA)
METODA NAJMNIEJSZYCH KWADRATÓW
(MNK)
Model
ttkkttt XXXy 2211
ty - empiryczna wartość zmiennej objaśnianej w okresie t
tjX - empiryczna wartość zmiennej objaśniającej j w okresie t
j- nieznany parametr stojący przy zmiennej jX
t - zakłócenie w okresie t (składnik losowy)
Zapis macierzowy modelu
ny
y
y
2
1
y
nknn
k
k
xxx
xxx
xxx
21
22221
11211
.
X
k
2
1
α
n
2
1
ε
εXαy
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 5
Model po oszacowaniu parametrów
strukturalnych
ttkkttt eXaXaXay 2211
lub
tkkttt XaXaXay 2211ˆ
ty - empiryczna wartość zmiennej objaśnianej w okresie t
ty - teoretyczna wartość zmiennej objaśnianej w okresie t
tjX - empiryczna wartość zmiennej objaśniającej j w okresie t
ja- oszacowany parametr stojący przy zmiennej jX
te -realizacja zakłócenia w okresie t (reszta w okresie t)
Zapis macierzowy oszacowanego modelu
ny
y
y
2
1
y
ny
y
y
ˆ
ˆ
ˆ
ˆ2
1
y
nknn
k
k
xxx
xxx
xxx
21
22221
11211
.
X
ne
e
e
2
1
e
ka
a
a
2
1
a
eXay
lub Xay ˆ
gdzie yye ˆ
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 6
Wzór MNK (Wyprowadzenie wzoru)
Minimalizujemy sumę kwadratów reszt modelu:
n
t
te
1
2
eeT
XayXayT
min2 XaXayXayyTTTTT
Znajdujemy wartość najmniejszą powyższej funkcji
(pochodna po a przyrównana do 0)
022 XaXyXTT
2:
yXXaXTT
ielewostronn
T 1 XX
Wzór MNK ma postać:
yXXXaTT 1
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 7
WARUNKI STOSOWALNOŚCI MNK
1. Zmienna objaśniana y jest zmienną losową,
2. Zmienne objaśniające X nie są zmiennymi losowymi,
3. n>k , tzn. liczba obserwacji n powinna być większa
od liczby szacowanych parametrów (zmiennych
objaśniających) k
4. zmienne objaśniające nie mogą być współliniowe, tzn
wektory obserwacji zmiennych objaśniających (kolumny
macierzy X) powinny być liniowo niezależne.
5. składnik losowy musi spełniać następujące założenia:
t : N(0, 2 ),
E(t )=0,
D2 (t )=
2 oraz
Cov (ij) =0, ij
W zapisie macierzowym 4 powyższe założenia
sprowadzają się do następującej postaci macierzy wariancji i
kowariancji składnika losowego
2
2
2
2
...00
............
0...0
0...0
)(
TE
Przy w/w założeniach MNK daje estymatory:
zgodne,
nieobciążone i
najefektywniejsze.
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 8
Estymacja przedziałowa parametrów
strukturalnych modelu Zakładając, że t:N(0,) dla każdego t otrzymujemy, że estymatory
(aj) parametrów (j) mają również rozkłady normalne:
jjj aDNa ,:
W praktyce zastępujemy nieznane odchylenie standardowe D(aj)
odchyleniem S(aj) postaci:
jjej cSaS 2
gdzie:
jjc- j-ty element głównej przekątnej macierzy (X
TX)
-1
2
eS - wariancja resztowa wyliczana jako:
)(12
yXayyTTT
knSe
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 9
Można oszacować nieznane wartości parametrów używając
techniki estymacji przedziałowej (przedziały ufności).
Przedział ufności z przyjętym z góry prawdopodobieństwem
u=1- (poziom ufności) pokrywa nieznaną wartość parametru j.
1,, jrjjrj aStaaStaP
t,r - wartość krytyczna zmiennej o rozkładzie t-Studenta
dla r=n-k stopniach swobody przy ustalonym z góry poziomie
istotności ().
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 10
Miara dopasowania oszacowanego modelu
do danych empirycznych
(współczynnik determinacji R2)
Mówi nam w jakim procencie zmienność y
jest objaśniana przez model.
W modelu musi występować wyraz wolny.
Interpretacja jest poprawna pod warunkiem, że
badane związki są liniowe.
R2 przyjmuje wartości z przedziału (0, 1)
n
t
t
n
t
t
yy
e
R
1
2
1
2
2 1
2
2 1yn
R
yy
eeT
T
2
22
yn
ynR
yy
yXaT
TT
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 11
ŚREDNI BŁĄD SZACUNKU (SEE-Standard Error of Estimation)
Wariancja resztowa
eeT
knSe
12
)(12
yXayyTTT
knSe
Średni błąd szacunku
2
ee SS
Przewidywane przez oszacowane równanie (model)
wartości zmiennej objaśnianej y (y teoretyczne)
średnio różnią się od empirycznych wartości tej
zmiennej (y empiryczne) o wartość błędu Se.
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 12
Testowanie istotności ocen parametrów
(tj. testowanie trafności doboru zmiennej objaśniającej)
HIPOTEZY
H0: j = 0 (zmienna Xj nie ma wpływu
na zmienną objaśnianą y)
H1: j 0 (zmienna Xj ma wpływ
na zmienną objaśnianą y)
SPRAWDZIAN
j
j
jaS
aat
S(aj) jest średnim błędem szacunku nieznanego parametru j.
jjej cSaS 2
cjj jest j-tym elementem głównej przekątnej macierzy (XTX)
-1.
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 13
Statystyka t(aj) ma rozkład Studenta o n-k stopniach swobody.
Wyliczoną wartość sprawdzianu t(aj) porównujemy z odczytaną z tablic
Studenta wartością krytyczną t,r. Jeżeli:
t(aj) t,r. nie ma podstaw do odrzucenia hipotezy H0
t(aj) > t,r. odrzucamy H0 na korzyść H1.
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 14
Testowanie założeń
dla składnika losowego modelu
Macierz wariancji składnika losowego powinna mieć w przypadku
MNK następującą postać:
2
2
2
2
...00
............
0...0
0...0
)(
TE
W przypadku braku spełnienia założeń odnośnie do składnika
losowego nie wolno używać metody MNK.
1. O przypadku heteroskedstyczności mówimy gdy na głównej
przekątnej tej macierzy są różne elementy.
2. O przypadku autokorelacji powiemy gdy poza główną
przekątną tej macierzy będą elementy niezerowe.
3. Dodatkowo powinniśmy sprawdzić czy składniki losowe mają
rozkłady normalne.
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 15
Testowanie przypadku
heteroskedastyczności
Problem ten najczęściej występuje przy estymacji modelu na
podstawie danych przekrojowych lub przekrojowo-czasowych.
Załóżmy że dane pochodzą z dwóch różnych populacji.
Wówczas na głównej przekątnej macierzy wariancji i kowariancji
mogą wystąpić dwie różne wartości wariancji: 2
1 oraz 2
2 .
Statystyczną istotność różnic testujemy wykorzystując test F
Snedecora. 2
2
2
1:0 H 2
2
2
1:1 H
Sprawdzianem hipotezy (H0) jest statystyka F Snedecora postaci:
2
2
2
1
e
e
S
SF
przy czym 22
21 ee SS
o 111 nr oraz 122 nr stopniach swobody 2
1eS ,2
2eS - oznaczają wariancje resztowe dla prób odpowiednio
z populacji pierwszej i z populacji drugiej
Jeżeli 21 ,, rrFF przy określonym poziomie istotności , to należy
użyć uogólnionej MNK (UMNK) zamiast klasycznej MNK.
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 16
Testowanie przypadku autokorelacji
składnika losowego
Przyczyny autokorelacji:
1. Dłuższe działanie czynników przypadkowych (powodujących
zaburzenia w normalnym przebiegu zjawiska) niż w czasie przyjętym
za jednostkę.
2. Błędy w budowie modelu.
3. Pominięcie jednej lub kilku istotnych zmiennych objaśniających.
4. Użycie zmiennej z nieprawidłowo określonym opóźnieniem.
5. Przyjęcie niewłaściwej postaci analitycznej modelu.
Test Durbina-Watsona (test DW)
Na początek obliczamy współczynnik autokorelacji reszt r dla modelu
oszacowanego MNK:
n
t
n
t
tt
n
t
tt
ee
ee
r
1 2
2
1
2
2
1
et - reszta empiryczna dla okresu t w modelu oszacowanym MNK
Następnie weryfikujemy poniższe hipotezy ( jest nieznanym
współczynnikiem autokorelacji składnika losowego):
0:0 H (nie istnieje autokorelacja)
0:1 H (istnieje autokorelacja dodatnia; jeżeli r jest dodatni)
lub
0:1 H (istnieje autokorelacja ujemna; jeżeli r jest ujemny)
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 17
Sprawdzianem hipotezy H0 przy hipotezie alternatywnej H1: >0 jest
statystyka d.
Sprawdzianem hipotezy H0 przy hipotezie alternatywnej H1: <0 jest
statystyka 4d.
Statystyka d ma rozkład Durbina-Watsona.
n
t
t
n
t
tt
e
ee
d
1
2
2
2
1
Jeżeli ddL odrzucamy H0 na rzecz H1. Istnieje autokorelacja.
Jeżeli ddU przyjmujemy H0. Brak autokorelacji.
Jeżeli dL<d<dU test nie daje odpowiedzi. Nie możemy podjąć decyzji o
przyjęciu lub odrzuceniu H0. Należy podjąć decyzję o powiększeniu próby.
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 18
Testowanie normalności zakłóceń
(składnika losowego)
TEST JARQUE-BERA (TEST JB)
TEST JB jest oparty o trzeci oraz czwarty moment rozkładu.
Trzeci moment mówi o asymetrii. Dla rozkładów symetrycznych jest on
równy zero (rozkład normalny jest rozkładem symetrycznym).
Czwarty moment mówi o smukłości rozkładu (tzw. kurtoza); (dla rozkładu
normalnego kurtoza=3).
Test JB oparto na porównaniu jak miary asymetrii i kurtozy odbiegają od
wielkości charakterystycznych dla rozkładu normalnego.
H0: składniki losowe podlegają rozkładowi normalnemu
H1: składniki losowe nie podlegają rozkładowi normalnemu
Sprawdzianem testu jest statystyka Jarque-Bera postaci:
2
21 324
1
6
1nJB
gdzie:
2
13
3
1
1
n
t
t
S
e
n
n
t
t
S
e
n 14
4
2
1
n
t
ten
S1
21
Statystyka JB ma rozkład 2 zawsze o r=2 stopniach swobody
(przykładowo dla poziomu istotności =0,05 wartość krytyczna wynosi
991,52
2;05,0 ).
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 19
Wnioskowanie na podstawie statystyki JB
Jeżeli 2
2;JB , to wówczas nie mamy podstaw do odrzucenia hipotezy H0
mówiącej o tym, że składniki losowe podlegają rozkładowi normalnemu.
Jeżeli natomiast 2
2;JB , to odrzucamy H0 i przyjmujemy hipotezę H1
mówiącą o tym, że składniki losowe podlegają rozkładowi innemu niż
normalny.
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 20
Prognozowanie na podstawie modelu
ekonometrycznego
TP – numer okresu na który dokonujemy prognozy
TPy - nieznana przyszła wartość zmiennej objaśnianej dla okresu TP
TPy - przyszła wartość zmiennej objaśnianej dla okresu TP wyliczona na
podstawie modelu ekonometrycznego
TPx - wektor obserwacji dla zmiennych objaśniających w okresie TP
(dodatkowy wiersz w macierzy X)
kTPTPTPTP xxx ,2,1, x
PROGNOZA PUNKTOWA
Wartość prognozy TPy dla zmiennej objaśnianej na okres TP wyliczmy
następująco:
axTPTPy ˆ
ŚREDNI BŁĄD PREDYKCJI (STP)
1122 T
TP
T
TPeTP SS xXXx
2
TPTP SS
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 21
PROGNOZA PRZEDZIAŁOWA
Przedział ufności dla nieznanej wartości zmiennej objaśnianej TPy
w okresie TP.
1ˆˆ,, TPrTPTPTPrTP StyyStyP
gdzie:
u1 - poziom ufności
1 nr - liczba stopni swobody
rt , - wartość krytyczna rozkładu Studenta o r stopniach swobody przy
poziomie istotności
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 22
Komentarz do miar wyznaczanych
przez arkusz kalkulacyjny EXCEL
(analiza danych, regresja)
Wielokrotność R - współczynnik korelacji wielorakiej
R kwadrat – współczynnik determinacji (R2)
OSK
RSK
OSK
WSKR
n
t
t
n
t
t
1
)(
1
2_
1
2_^
2
YY
YY
gdzie:
WSK - wyjaśniona suma kwadratów (ta część zmienności zmiennej objaśnianej,
która została wyjaśniona przez model)
RSK – resztowa suma kwadratów (ta część zmienności zmiennej objaśnianej,
której model nie wyjaśnia)
OSK – ogólna suma kwadratów OSK=WSK+RSK
n
t
tRSK
1
2YY
Dopasowany R kw – skorygowany R kwadrat2 (współczynnik determinacji
skorygowany stopniami swobody). Pozwala porównać dopasowanie równań
różniących się ilością zmiennych objaśniających.
1)(
1)var(
)var(1
2_
2
nyn
kn
yR
T
T
YY
ee
Błąd standardowy – pierwiastek z wariancji resztowej ( 2ee SS )
Obserwacje – liczba obserwacji (n)
Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 23
ANALIZA WARIANCJI
df – degrees of freedom – liczba stopni swobody
liczba zmiennych objaśniających (k)
liczba obserwacji pomniejszona o liczbę szacowanych parametrów (n k1)
lub (n k) dla modelu bez wyrazu wolnego
razem (k+ n k1= n1) lub (k+ n k= n) dla modelu bez wyrazu wolnego
SS – sum of squares (kolejno: WSK, RSK, OSK)
MS – mean of squares (kolejno:
WSK/k, k – liczba zmiennych objaśniających,
RSK/(n-k-1), (k+1)liczba szacowanych parametrów.
Statystyka F
2
2
1
1
1 Rk
Rkn
knRSK
kWSKF
Statystyka F ma rozkład Fishera. Jest ona związana z hipotezą odnośnie
istotności szacunków parametrów.
H0: 1=2=...=k=0 Wszystkie zmienne objaśniające są nieistotne;
nie mają wpływu na zmienną objaśnianą
H1: co najmniej jeden z parametrów jest różny od zera Co najmniej jedna zmienna objaśniająca ma wpływ
na zmienną objaśnianą
Uwaga! Stosowanie testów t oraz F jest poprawne przy założeniu,
że składnik losowy ma rozkład normalny