klasyfikacja modeli ekonometrycznych -...

Ekonometria – materiały („folie”) do wykładu D.Miszczyńska, M.Miszczyński 1

MODEL EKONOMETRYCZNY

„Model jest to schematyczne uproszczenie, pomijające nieistotne aspekty w celu

wyjaśnienia wewnętrznego działania, formy lub konstrukcji bardziej

skomplikowanego mechanizmu.” (Lawrence R. Klein)

ZALETY MODELU- możliwość względnie taniego eksperymentowania, możliwość

analizy, realizacji prognozy, symulacji.

Model ekonometryczny- formalny matematyczny zapis istniejących

prawidłowości ekonomicznych. Celem takiego modelu może być opis zależności,

przewidywanie przyszłego kształtowania się zależności, symulacja.

KLASYFIKACJA MODELI EKONOMETRYCZNYCH

Ze względu na wyróżnione cechy:

występowanie lub brak w modelu zmiennej losowej;

modele deterministyczne lub stochastyczne.

ze względu na formę związku między zmiennymi występującymi w modelu;

modele liniowe i nieliniowe

ze względu na ilość rozpatrywanych zależności

modele jednorównaniowe i wielorównaniowe

ze względu na czynnik czasu;

modele statyczne [związki zachodzą w tej samej jednostce czasowej] i

modele dynamiczne [uwzględniają czynnik czasu w formie opóźnień lub

zmiennej czasowej]

ze względu na charakter analizowanych związków;

modele przyczynowo-skutkowe i modele symptomatyczne.


KLASYFIKACJA ZMIENNYCH I PARAMETRÓW

WYSTĘPUJĄCYCH W EKONOMETRYCZNYCH MODELACH.

Zmienne endogeniczne i egzogeniczne w modelu ekonometrycznym.

Zmienne egzogeniczne (zmienne objaśniające w modelu, wśród nich zmienne

sterujące będące przedmiotem polityki gospodarczej).

Zmienne objaśniane i objaśniające (dot. danego równania )

Zmienne z góry ustalone (zm. egzogeniczne, zmienne endogeniczne z

opóźnieniami i z wyprzedzeniami, zmienna czasowa-wyrażająca systematyczne

zmiany w czasie zmiennej endogenicznej).

Zmienne zerojedynkowe (dla określenia czynników niemierzalnych).

Składnik losowy ( zmienna wyrażająca łączny efekt tych czynników, które nie

zostały wyspecyfikowane w modelu, a także z błędów wynikających z przyjęcia

niewłaściwej postaci funkcyjnej modelu, błędów pomiaru wartości zmiennych.

Parametry struktury stochastycznej modelu (parametry rozkładu składnika

losowego)

Parametry strukturalne modelu (parametry występujące przy kolejnych

zmiennych, określające kształtowanie zmiennej objaśnianej).


ETAPY ANALIZY EKONOMETRYCZNEJ

SPECYFIKACJA ZMIENNYCH I DOBÓR POSTACI MODELU

USTALENIE PRZEDMIOTU BADANIA, LISTA ZMIENNYCH

OBJAŚNIAJĄCYCH I OBJAŚNIANYCH, POSTAĆ FUNKCYJNA MODELU. W OPARCIU O TEORIĘ EKONOMII, ZEBRANE DANE STATYSTYCZNE, KORELACJE.

ZEBRANIE DANYCH STATYSTYCZNYCH

ZEBRANIE DANYCH, UPORZĄDKOWANIE (SZEREGI CZASOWE, PRZEKROJOWE,

PRZEKROJOWO-CZASOWE) I ANALIZA PRZYDATNOŚCI DANYCH. OKREŚLENIE

MIERNIKA, PORÓWNYWALNOŚĆ DANYCH.

ESTYMACJA PARAMETRÓW

WYZNACZENIE OCEN PARAMETRÓW STRUKTURALNYCH ORAZ

PARAMETRÓW STRUKTURY STOCHASTYCZNEJ MODELU.

NARZĘDZIE - METODA NAJMNIEJSZYCH KWADRATÓW (MNK).

WERYFIKACJA MODELU

ANALIZA OTRZYMANYCH OCEN PARAMETRÓW STRUKTURALNYCH

I STRUKTURY STOCHASTYCZNEJ MODELU. WERYFIKACJA MERYTORYCZNA I STATYSTYCZNA.

PRAKTYCZNE WYKORZYSTANIE MODELU

ANALIZA PRAWIDŁOWOŚCI ( HISTORYCZNA ).

PROGNOZOWANIE


ESTYMACJA PARAMETRÓW

MODELU EKONOMETRYCZNEGO (ESTYMACJA PUNKTOWA)

METODA NAJMNIEJSZYCH KWADRATÓW

(MNK)

Model

ttkkttt XXXy 2211

ty - empiryczna wartość zmiennej objaśnianej w okresie t

tjX - empiryczna wartość zmiennej objaśniającej j w okresie t

j- nieznany parametr stojący przy zmiennej jX

t - zakłócenie w okresie t (składnik losowy)

Zapis macierzowy modelu

ny

y

y

2

1

y

nknn

k

k

xxx

xxx

xxx

21

22221

11211

.

X

k

2

1

α

n

2

1

ε

εXαy


Model po oszacowaniu parametrów

strukturalnych

ttkkttt eXaXaXay 2211

lub

tkkttt XaXaXay 2211ˆ

ty - empiryczna wartość zmiennej objaśnianej w okresie t

ty - teoretyczna wartość zmiennej objaśnianej w okresie t

tjX - empiryczna wartość zmiennej objaśniającej j w okresie t

ja- oszacowany parametr stojący przy zmiennej jX

te -realizacja zakłócenia w okresie t (reszta w okresie t)

Zapis macierzowy oszacowanego modelu

ny

y

y

2

1

y

ny

y

y

ˆ

ˆ

ˆ

ˆ2

1

y

nknn

k

k

xxx

xxx

xxx

21

22221

11211

.

X

ne

e

e

2

1

e

ka

a

a

2

1

a

eXay

lub Xay ˆ

gdzie yye ˆ


Wzór MNK (Wyprowadzenie wzoru)

Minimalizujemy sumę kwadratów reszt modelu:

n

t

te

1

2

eeT

XayXayT

min2 XaXayXayyTTTTT

Znajdujemy wartość najmniejszą powyższej funkcji

(pochodna po a przyrównana do 0)

022 XaXyXTT

2:

yXXaXTT

ielewostronn

T 1 XX

Wzór MNK ma postać:

yXXXaTT 1


WARUNKI STOSOWALNOŚCI MNK

1. Zmienna objaśniana y jest zmienną losową,

2. Zmienne objaśniające X nie są zmiennymi losowymi,

3. n>k , tzn. liczba obserwacji n powinna być większa

od liczby szacowanych parametrów (zmiennych

objaśniających) k

4. zmienne objaśniające nie mogą być współliniowe, tzn

wektory obserwacji zmiennych objaśniających (kolumny

macierzy X) powinny być liniowo niezależne.

5. składnik losowy musi spełniać następujące założenia:

t : N(0, 2 ),

E(t )=0,

D2 (t )=

2 oraz

Cov (ij) =0, ij

W zapisie macierzowym 4 powyższe założenia

sprowadzają się do następującej postaci macierzy wariancji i

kowariancji składnika losowego

2

2

2

2

...00

............

0...0

0...0

)(

TE

Przy w/w założeniach MNK daje estymatory:

zgodne,

nieobciążone i

najefektywniejsze.


Estymacja przedziałowa parametrów

strukturalnych modelu Zakładając, że t:N(0,) dla każdego t otrzymujemy, że estymatory

(aj) parametrów (j) mają również rozkłady normalne:

jjj aDNa ,:

W praktyce zastępujemy nieznane odchylenie standardowe D(aj)

odchyleniem S(aj) postaci:

jjej cSaS 2

gdzie:

jjc- j-ty element głównej przekątnej macierzy (X

TX)

-1

2

eS - wariancja resztowa wyliczana jako:

)(12

yXayyTTT

knSe


Można oszacować nieznane wartości parametrów używając

techniki estymacji przedziałowej (przedziały ufności).

Przedział ufności z przyjętym z góry prawdopodobieństwem

u=1- (poziom ufności) pokrywa nieznaną wartość parametru j.

1,, jrjjrj aStaaStaP

t,r - wartość krytyczna zmiennej o rozkładzie t-Studenta

dla r=n-k stopniach swobody przy ustalonym z góry poziomie

istotności ().


Miara dopasowania oszacowanego modelu

do danych empirycznych

(współczynnik determinacji R2)

Mówi nam w jakim procencie zmienność y

jest objaśniana przez model.

W modelu musi występować wyraz wolny.

Interpretacja jest poprawna pod warunkiem, że

badane związki są liniowe.

R2 przyjmuje wartości z przedziału (0, 1)

n

t

t

n

t

t

yy

e

R

1

2

1

2

2 1

2

2 1yn

R

yy

eeT

T

2

22

yn

ynR

yy

yXaT

TT


ŚREDNI BŁĄD SZACUNKU (SEE-Standard Error of Estimation)

Wariancja resztowa

eeT

knSe

12

)(12

yXayyTTT

knSe

Średni błąd szacunku

2

ee SS

Przewidywane przez oszacowane równanie (model)

wartości zmiennej objaśnianej y (y teoretyczne)

średnio różnią się od empirycznych wartości tej

zmiennej (y empiryczne) o wartość błędu Se.


Testowanie istotności ocen parametrów

(tj. testowanie trafności doboru zmiennej objaśniającej)

HIPOTEZY

H0: j = 0 (zmienna Xj nie ma wpływu

na zmienną objaśnianą y)

H1: j 0 (zmienna Xj ma wpływ

na zmienną objaśnianą y)

SPRAWDZIAN

j

j

jaS

aat

S(aj) jest średnim błędem szacunku nieznanego parametru j.

jjej cSaS 2

cjj jest j-tym elementem głównej przekątnej macierzy (XTX)

-1.


Statystyka t(aj) ma rozkład Studenta o n-k stopniach swobody.

Wyliczoną wartość sprawdzianu t(aj) porównujemy z odczytaną z tablic

Studenta wartością krytyczną t,r. Jeżeli:

t(aj) t,r. nie ma podstaw do odrzucenia hipotezy H0

t(aj) > t,r. odrzucamy H0 na korzyść H1.


Testowanie założeń

dla składnika losowego modelu

Macierz wariancji składnika losowego powinna mieć w przypadku

MNK następującą postać:

2

2

2

2

...00

............

0...0

0...0

)(

TE

W przypadku braku spełnienia założeń odnośnie do składnika

losowego nie wolno używać metody MNK.

1. O przypadku heteroskedstyczności mówimy gdy na głównej

przekątnej tej macierzy są różne elementy.

2. O przypadku autokorelacji powiemy gdy poza główną

przekątną tej macierzy będą elementy niezerowe.

3. Dodatkowo powinniśmy sprawdzić czy składniki losowe mają

rozkłady normalne.


Testowanie przypadku

heteroskedastyczności

Problem ten najczęściej występuje przy estymacji modelu na

podstawie danych przekrojowych lub przekrojowo-czasowych.

Załóżmy że dane pochodzą z dwóch różnych populacji.

Wówczas na głównej przekątnej macierzy wariancji i kowariancji

mogą wystąpić dwie różne wartości wariancji: 2

1 oraz 2

2 .

Statystyczną istotność różnic testujemy wykorzystując test F

Snedecora. 2

2

2

1:0 H 2

2

2

1:1 H

Sprawdzianem hipotezy (H0) jest statystyka F Snedecora postaci:

2

2

2

1

e

e

S

SF

przy czym 22

21 ee SS

o 111 nr oraz 122 nr stopniach swobody 2

1eS ,2

2eS - oznaczają wariancje resztowe dla prób odpowiednio

z populacji pierwszej i z populacji drugiej

Jeżeli 21 ,, rrFF przy określonym poziomie istotności , to należy

użyć uogólnionej MNK (UMNK) zamiast klasycznej MNK.


Testowanie przypadku autokorelacji

składnika losowego

Przyczyny autokorelacji:

1. Dłuższe działanie czynników przypadkowych (powodujących

zaburzenia w normalnym przebiegu zjawiska) niż w czasie przyjętym

za jednostkę.

2. Błędy w budowie modelu.

3. Pominięcie jednej lub kilku istotnych zmiennych objaśniających.

4. Użycie zmiennej z nieprawidłowo określonym opóźnieniem.

5. Przyjęcie niewłaściwej postaci analitycznej modelu.

Test Durbina-Watsona (test DW)

Na początek obliczamy współczynnik autokorelacji reszt r dla modelu

oszacowanego MNK:

n

t

n

t

tt

n

t

tt

ee

ee

r

1 2

2

1

2

2

1

et - reszta empiryczna dla okresu t w modelu oszacowanym MNK

Następnie weryfikujemy poniższe hipotezy ( jest nieznanym

współczynnikiem autokorelacji składnika losowego):

0:0 H (nie istnieje autokorelacja)

0:1 H (istnieje autokorelacja dodatnia; jeżeli r jest dodatni)

lub

0:1 H (istnieje autokorelacja ujemna; jeżeli r jest ujemny)


Sprawdzianem hipotezy H0 przy hipotezie alternatywnej H1: >0 jest

statystyka d.

Sprawdzianem hipotezy H0 przy hipotezie alternatywnej H1: <0 jest

statystyka 4d.

Statystyka d ma rozkład Durbina-Watsona.

n

t

t

n

t

tt

e

ee

d

1

2

2

2

1

Jeżeli ddL odrzucamy H0 na rzecz H1. Istnieje autokorelacja.

Jeżeli ddU przyjmujemy H0. Brak autokorelacji.

Jeżeli dL<d<dU test nie daje odpowiedzi. Nie możemy podjąć decyzji o

przyjęciu lub odrzuceniu H0. Należy podjąć decyzję o powiększeniu próby.


Testowanie normalności zakłóceń

(składnika losowego)

TEST JARQUE-BERA (TEST JB)

TEST JB jest oparty o trzeci oraz czwarty moment rozkładu.

Trzeci moment mówi o asymetrii. Dla rozkładów symetrycznych jest on

równy zero (rozkład normalny jest rozkładem symetrycznym).

Czwarty moment mówi o smukłości rozkładu (tzw. kurtoza); (dla rozkładu

normalnego kurtoza=3).

Test JB oparto na porównaniu jak miary asymetrii i kurtozy odbiegają od

wielkości charakterystycznych dla rozkładu normalnego.

H0: składniki losowe podlegają rozkładowi normalnemu

H1: składniki losowe nie podlegają rozkładowi normalnemu

Sprawdzianem testu jest statystyka Jarque-Bera postaci:

2

21 324

1

6

1nJB

gdzie:

2

13

3

1

1

n

t

t

S

e

n

n

t

t

S

e

n 14

4

2

1

n

t

ten

S1

21

Statystyka JB ma rozkład 2 zawsze o r=2 stopniach swobody

(przykładowo dla poziomu istotności =0,05 wartość krytyczna wynosi

991,52

2;05,0 ).


Wnioskowanie na podstawie statystyki JB

Jeżeli 2

2;JB , to wówczas nie mamy podstaw do odrzucenia hipotezy H0

mówiącej o tym, że składniki losowe podlegają rozkładowi normalnemu.

Jeżeli natomiast 2

2;JB , to odrzucamy H0 i przyjmujemy hipotezę H1

mówiącą o tym, że składniki losowe podlegają rozkładowi innemu niż

normalny.


Prognozowanie na podstawie modelu

ekonometrycznego

TP – numer okresu na który dokonujemy prognozy

TPy - nieznana przyszła wartość zmiennej objaśnianej dla okresu TP

TPy - przyszła wartość zmiennej objaśnianej dla okresu TP wyliczona na

podstawie modelu ekonometrycznego

TPx - wektor obserwacji dla zmiennych objaśniających w okresie TP

(dodatkowy wiersz w macierzy X)

kTPTPTPTP xxx ,2,1, x

PROGNOZA PUNKTOWA

Wartość prognozy TPy dla zmiennej objaśnianej na okres TP wyliczmy

następująco:

axTPTPy ˆ

ŚREDNI BŁĄD PREDYKCJI (STP)

1122 T

TP

T

TPeTP SS xXXx

2

TPTP SS


PROGNOZA PRZEDZIAŁOWA

Przedział ufności dla nieznanej wartości zmiennej objaśnianej TPy

w okresie TP.

1ˆˆ,, TPrTPTPTPrTP StyyStyP

gdzie:

u1 - poziom ufności

1 nr - liczba stopni swobody

rt , - wartość krytyczna rozkładu Studenta o r stopniach swobody przy

poziomie istotności


Komentarz do miar wyznaczanych

przez arkusz kalkulacyjny EXCEL

(analiza danych, regresja)

Wielokrotność R - współczynnik korelacji wielorakiej

R kwadrat – współczynnik determinacji (R2)

OSK

RSK

OSK

WSKR

n

t

t

n

t

t

1

)(

1

2_

1

2_^

2

YY

YY

gdzie:

WSK - wyjaśniona suma kwadratów (ta część zmienności zmiennej objaśnianej,

która została wyjaśniona przez model)

RSK – resztowa suma kwadratów (ta część zmienności zmiennej objaśnianej,

której model nie wyjaśnia)

OSK – ogólna suma kwadratów OSK=WSK+RSK

n

t

tRSK

1

2YY

Dopasowany R kw – skorygowany R kwadrat2 (współczynnik determinacji

skorygowany stopniami swobody). Pozwala porównać dopasowanie równań

różniących się ilością zmiennych objaśniających.

1)(

1)var(

)var(1

2_

2

nyn

kn

yR

T

T

YY

ee

Błąd standardowy – pierwiastek z wariancji resztowej ( 2ee SS )

Obserwacje – liczba obserwacji (n)


ANALIZA WARIANCJI

df – degrees of freedom – liczba stopni swobody

liczba zmiennych objaśniających (k)

liczba obserwacji pomniejszona o liczbę szacowanych parametrów (n k1)

lub (n k) dla modelu bez wyrazu wolnego

razem (k+ n k1= n1) lub (k+ n k= n) dla modelu bez wyrazu wolnego

SS – sum of squares (kolejno: WSK, RSK, OSK)

MS – mean of squares (kolejno:

WSK/k, k – liczba zmiennych objaśniających,

RSK/(n-k-1), (k+1)liczba szacowanych parametrów.

Statystyka F

2

2

1

1

1 Rk

Rkn

knRSK

kWSKF

Statystyka F ma rozkład Fishera. Jest ona związana z hipotezą odnośnie

istotności szacunków parametrów.

H0: 1=2=...=k=0 Wszystkie zmienne objaśniające są nieistotne;

nie mają wpływu na zmienną objaśnianą

H1: co najmniej jeden z parametrów jest różny od zera Co najmniej jedna zmienna objaśniająca ma wpływ

na zmienną objaśnianą

Uwaga! Stosowanie testów t oraz F jest poprawne przy założeniu,

że składnik losowy ma rozkład normalny

klasyfikacja modeli ekonometrycznych -...

Documents