1. kolokvij - dodatak - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ......

66
1. Kolokvij - DODATAK

Upload: phungque

Post on 04-Jun-2018

232 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

1. Kolokvij - DODATAK

Page 2: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

1

FAKULTET ZA MENADŽMENT U TURIZMU I UGOSTITELJSTVU U OPATIJI

EKONOMETRIJA

6. TEMATSKA JEDINICA

Opatija, 2013.

Page 3: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

1

ŠESTA TEMATSKA JEDINICA

VIŠESTRUKI LINEARNI REGRESIJSKI MODEL: OCJENJIVANJE PARAMETARA I TESTIRANJE HIPOTEZA UVOD

1. LINEARNI REGRESIJSKI MODEL S TRI VARIJABLE 2. PRETPOSTAVKE VIŠESTRUKOG LINEARNOG REGRESIJSKOG MODELA 3. PROCJENA PARAMETARA

3.1. OLS OCJENJIVAČI

3.2. VARIJANCA I STANDARDNA POGREŠKA OLS OCJENJIVAČA

4. KOEFICIJENT VIŠESTRUKE DETERMINACIJE R2 5. TESTIRANJE HIPOTEZA U MODELU VIŠESTRUKE LINEARNE REGRESIJE ZADACI ZA VJEŽBU

RJEŠENJA ODABRANIH ZADATAKA

LITERATURA

UVOD

U prethodnim predavanjima razmatran je linearni regresijski model s dvije varijable, sastavljen od jedne nezavisne i jedne zavisne varijable. Takav se model sada proširuje pa se razmatra mogućnost da više nezavisnih varijabli utječu na zavisnu varijablu. Regresijski model s više od jedne nezavisne varijable poznat je kao višestruki regresijski model. Višestruki upravo zbog višestrukih utjecaja (eksplanatornih varijabli) koje djeluju na zavisnu varijablu. Diskusija o višestrukom regresijskom modelu sastojat će se u pronalaženju odgovora na sljedećih nekoliko pitanja: 1. Kako se procjenjuje višestruki regresijski mode? Da li je postupak procjene

drugačiji od postupka procjene regresijskog modela s dvije varijable? 2. Da li se postupak testiranja hipoteza razlikuje od onog u modelu s dvije varijable? 3. Postoji li neka specifična obilježja višestruke regresije koja se ne susreću u modelu

s dvije varijable? Za dobiti odgovore na ova i dodatna pitanja razmotrit ćemo najjednostavniji višestruki regresijski model: model s tri varijable u kojem se ponašanje zavisne varijable Y analizira u odnosu na dvije nezavisne varijable X1 i X2. 1. LINEARNI REGRESIJSKI MODEL S TRI VARIJABLE

Regresijska funkcija populacije za model s tri varijable u nestohastičkom obliku piše se

t33t221t XX)Y(E (1)

te u stohastičkom obliku

Page 4: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

2

ttt

tt33t221t

u)Y(EY

uXXY

(2)

gdje je

Y = zavisna varijabla

X2 i X3 = nezavisne varijable

u = slučajno odstupanje

t = t-to opažanje (u slučaju podataka vremenskog presjeka upotrebljava se indeks i)

1 = konstantni član, odnosno odsječak na ordinati, a predstavlja prosječnu vrijednost Y kada su X2 i X3 jednaki nuli.

2 i 3 = parcijalni regresijski koeficijenti Izraz (1) daje uvjetnu prosječnu vrijednost Y, uvjetnu za dane ili fiksirane vrijednosti varijabli X2 i X3. Stoga je, kao i u modelu s dvije varijable, višestruka regresijska analiza uvjetna regresijska analiza, uvjetna za dane vrijednosti nezavisnih varijable. Dobije se tako prosječna ili srednja vrijednost Y za fiksirane vrijednosti varijabli X. Stohastički oblik, izraz (2) tvrdi da se svaka pojedinačna vrijednost Y može prikazati kao zbroj dviju komponenti:

1. sustavne ili determinističke komponente (1+2X2t+3X3t), koja predstavlja srednju vrijednost E(Yt), te

2. ut, koja predstavlja nesustavnu ili stohastičnu komponentu, određenu čimbenicima drugačijima od X2 i X3.

Značenje parcijalnih regresijskih koeficijenata

Regresijski koeficijenti 2 i 3 poznati su kao parcijalni regresijski koeficijenti ili

parcijalni koeficijenti smjera. 2 mjeri promjenu u srednjoj vrijednosti Y, E(Y), za jedinicu promjene u varijabli X2, kada je vrijednost varijable X3 konstantna.

Analogno, 3 mjeri promjenu u srednjoj vrijednosti Y za jedinicu promjene u X3, kada je vrijednost X2 konstantna. Ovo je specifična značajka višestruke regresije. U regresijskom modelu s tri varijable mora se utvrditi koji dio promjene u srednjoj vrijednosti Y, može biti pripisan varijabli X2, a koji varijabli X3. PRIMJER

Pretpostavimo da imamo sljedeću regresijsku funkciju populacije:

t3t2t X8,0X2,115)Y(E (3)

Pretpostavimo da je vrijednost varijable X3 fiksirana na konstantnoj vrijednosti od 10. Uvrštavanjem dane vrijednosti u izraz 3 dobije se

t2t

t2t

t2t

X2,123)Y(E

X2,1)815()Y(E

)10(8,0X2,115)Y(E

(4)

Page 5: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

3

Koeficijent nagiba 2= -0,12 označava da srednja vrijednost Y opada za 1,2 za svaku jediničnu promjenu varijable X2, kada je X3 konstantna. Ovakav koeficijent nagiba naziva se parcijalni regresijski koeficijent. Analogno, ako je vrijednost X2 konstantna na vrijednosti od 5 dobije se

t3t

t3t

X8,09)Y(E

X8,0)5(2,115)Y(E

(5)

Koeficijent nagiba 3= 0,8 označava da srednja vrijednost Y raste za 0,8 za svaku jediničnu promjenu varijable X3, kada je X2 konstanta. I ovaj je regresijski koeficijent parcijalni regresijski koeficijent.

Parcijalni regresijski koeficijent odražava (parcijalni) utjecaj jedne od nezavisnih varijabli na srednju vrijednost zavisne varijable, kada su vrijednosti ostalih nezavisnih varijabli uključenih u model održavane konstantnima. Ovakvo specifično obilježje višestruke regresije, omogućava, ne samo uključivanje većeg broja nezavisnih varijabli u model, već i «izoliranje» utjecaja svake pojedine varijable X na varijablu Y od ostalih X varijabli uključenih u model. 2. PRETPOSTAVKE VIŠESTRUKOG LINEARNOG REGRESIJSKOG MODELA

Kao i u slučaju jednostavnog linearnog regresijskog modela, regresijska analiza višestrukog modela započinje procjenom parametara. U svrhu dobivanja ocjena parametara djeluje se u okvirima klasičnog linearnog regresijskog modela (CLRM) uvedenog u prijašnjim predavanjima te se, za ocjenu regresijskih parametara, upotrebljava metoda najmanjih kvadrata (OLS metoda). Za model iz izraza (2) pretpostavlja se: P1

Regresijski model je linearan u parametrima te je korektno specificiran.

P2

Objasnidbene varijable X2 i X3 nisu korelirane sa slučajnim odstupanjima u, tj. kovarijanca između svake objasnidbene varijable i slučajne varijable u jednaka je nuli. Ukoliko su X2 i X3 nestohastične ova je pretpostavka automatski ispunjena.

P3

Očekivana vrijednost odstupanja jednaka je nuli: E(ui)=0.

P4

Homoskedastičnost: varijanca slučajne varijable u konstanta je i jednaka 2.

P5

Odsutnost autokorelacije: vrijednosti slučajne varijable u međusobno su nekorelirane slučajne veličine, tj. njihova je kovarijanca jednaka nuli: cov(ui,uj)=0, i≠j.

Page 6: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

4

P6

Odsutnost multikolinearnosti: ne postoji egzaktna linearna kombinacija nezavisnih varijabli, tj. ne postoji ovisnost oblika.

P7

Slučajna odstupanja su normalno distribuirana s matematičkim očekivanjem

jednakim nula i homoskedastičnom varijancom 2: uiN(0, 2)

Navedene pretpostavke, osim pretpostavke P6, iste su kao za model s dvije varijable. 3. OCJENA PARAMETARA VIŠESTRUKE REGRESIJE

Za procjenu parametara iz izraza (2) koristi se metoda najmanjih kvadrata. 3.1. OLS OCJENJIVAČI

Za definiranje OLS ocjenjivača potrebno je napisati regresijsku funkciju uzorka koja odgovara regresijskoj funkciji populacije iz izraza (2), kako slijedi:

tt3t221t eˆXˆˆY (6)

gdje e predstavlja rezidual, a s ocjenjivače populacijskih koeficijenata.

Prema načelu metode najmanjih kvadrata vrijednosti nepoznatih parametara odabrane su na način da je suma kvadrata reziduala što je moguće manja:

mine)RSS( 2

i .

Algebarskim izračunima dobiju se izrazi za OLS ocjenjivače parametara:

33221

232

3322

232y223y

3

232

3322

233y332y

2

XXYˆ

mmm

mmmm

mmm

mmmm

(7)

gdje je

i

kikjijjk

kik

i

iyk

)XX)(XX(m

)XX()YY(m

(8)

PRIMJER

Pretpostavimo da moramo ocijeniti vezu između cijene određenog turističkog aranžmana (X3), troškova oglašavanja za dati turistički aranžman (X2) te broj prodanih turističkih aranžmana (Y) u 12 uzastopnih dana:

i3i32i21i XˆXˆˆY .

Page 7: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

5

Podaci su dani u tablici 1.

Tablica 1.

broj prodanih aranžmana cijena aranžmana troškovi oglašavanja

55 100 5,50 70 90 6,30 90 80 7,20

100 70 7,0 90 70 6,30

105 70 7,35 80 70 5,60

110 65 7,15 125 60 7,50 115 60 6,90 130 55 7,15 130 50 6,50

Slijedi tablica međurezultata za izračun ocijenjenih parametara.

Tablica 2.

Y X2 X3 )YY( i )XX( 2i2 2ym )XX( 3i3

33m 3ym

23m 22m yym

55 100 5,50 -45 30 -1350 -1,2 1,4 54 -36 900 2025

70 90 6,30 -30 20 -600 -0,4 0,16 12 -8 400 900

90 80 7,20 -10 10 -100 0,5 0,25 -5 5 100 100

100 70 7,0 0 0 0 0,3 0,09 0 0 0 0

90 70 6,30 -10 0 0 -0,4 0,16 4 0 0 100

105 70 7,35 5 0 0 0,65 0,42 3,25 0 0 25

80 70 5,60 -20 0 0 -1,1 1,21 22 0 0 400

110 65 7,15 10 -5 -50 0,45 0,20 4,5 -2,25 25 100

125 60 7,50 25 -10 -250 0,8 0,64 20 -8 100 625

115 60 6,90 15 -10 -150 0,2 0,04 3 -2 100 225

130 55 7,15 30 -15 -450 0,45 0,20 13,5 -6,75 225 900

130 50 6,50 30 -20 -600 -0,2 0,04 -6 4 400 900

Σ -3550 0,45 4,81 125,25 -54 2250 6300

Rezultati osnovnih izračuna su sljedeći:

100Y m22=2250 my2=-3550

70X 2 m33=4,81 my3=125,25

7,6X 3 m23=-54 myy=6300

k=3 (dvije objasnidbene i jedna zavisna varijabla) Iz izraza (7) računaju se vrijednosti parametara.

3,1

5481,42250

5425,12581,43550

mmm

mmmm

2

232

3322

233y332y

2

Page 8: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

6

3,11

5481,42250

543350225025,125

mmm

mmmm

2

232

3322

232y223y

3

29,115

7,63,11703,1100

XXYˆ33221

Prema tome, ocijenjena jednadžba regresije glasi:

i132ii X3,11X3,129,115Y

To znači da ocjenjujemo da bi se smanjenje cijene turističkog aranžmana od jedne novčane jedinice, uz nepromijenjene troškove oglašavanja, odrazilo na povećanje broja prodanih aranžmana za 1,3, dok bi porast troškova oglašavanja za jednu novčanu jedinicu, uz nepromijenjene cijene, prouzrokovao povećanje prodaje za 11,3 turističkih aranžmana.

3.2. VARIJANCA I STANDARDNA POGREŠKA OLS OCJENJIVAČA

Nakon određivanja OLS ocjenjivača konstantnog člana i parcijalnih regresijskih koeficijenata, mogu se izračunati njihove varijance i standardne pogreške. Varijance i standardne pogreške daju uvid o varijabilnosti ocjenjivača od uzorka do uzorka. Kao i u slučaju linearnog regresijskog modela s dvije varijable standardne pogreške potrebne su za: (1) određivanje intervala povjerenja za stvarne vrijednosti parametara te za (2) testiranje hipoteza. Izrazi za određivanje varijance i standardne pogreške konstantnog člana i parcijalnih regresijskih koeficijenata su:

2

2

t3t2

2

t3

2

t2

t3t2322

t2

2

32

t3

2

2

1

xxxx

xxXX2XXXX

n

1)ˆvar(

(9)

)ˆvar()ˆ(se 11 (10)

2

2

t3t2

2

t3

2

t2

2

t3

2

xxxx

x)ˆvar(

(11)

22ˆvar)ˆ(se (12)

Page 9: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

7

2

2

t3t2

2

t3

2

t2

2

t2

3

xxxx

x)ˆvar(

(13)

)ˆvar()ˆ(se 33 (14)

Napomena u izrazima (9) do (12) mala slova označavaju devijaciju srednjih

vrijednosti uzorka pa je )XX(x ii .

U izrazima (9) i (11) 2 je homoskedastična varijanca slučajnog odstupanja ut. OLS ove nepoznate varijance je

3n

2

t2

(15)

Drugi korijen ocijenjene varijance iz izraza (15) daje standardnu grešku ocjene:

2ˆˆ (16)

Izraz (16) daje vrijednost standardne pogreške regresije, koja predstavlja standardnu devijaciju vrijednosti Y oko procijenjenog regresijskog pravca. 4. KOEFICIJENT VIŠESTRUKE DETERMINACIJE R2

U jednostavnom linearnom regresijskom modelu s dvije varijable koeficijent determinacije predstavlja mjeru prilagođenosti regresijskog pravca uzorka, odnosno predočuje proporciju ukupnih varijacija u zavisnoj varijabli Y koje su objašnjene nezavisnom varijablom. U slučaju linearne regresije s tri varijable, želimo znati koliki je udio varijacija u zavisnoj varijabli posljedica objašnjenih varijacija zbog nezavisnih varijabli X2 i X3. Taj je pokazatelj dan koeficijentom višestruke determinacije, R2 (ili r2). Kao u slučaju modela s dvije varijable, vrijedi jednakost:

TSS=ESS+RSS (17) gdje je TSS = ukupan zbroj kvadrata zavisne varijable ESS = objašnjeni zbroj kvadrata (objašnjen od svij nezavisnih varijabli) RSS = rezidualni zbroj kvadrata Koeficijent višestruke determinacije dan je izrazom:

TSS

ESSR2 (18)

Page 10: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

8

Tako definirani koeficijent determinacije je omjer zbroja kvadrata protumačenoga modelom i ukupnog zbroja kvadrata, te predstavlja opći pokazatelj kvalitete modela Napominje se da je drugi korijen koeficijenta višestruke determinacije, koeficijent višestruke korelacije, r.

Korigirani koeficijent determinacije 2R

Osnovni problem koeficijenta determinacije jest da dodavanjem novih objasnidbenih varijabli u funkciju, R2 raste, čak i onda kada nova objasnidbena varijabla ništa ne znači za model. Taj se nedostatak rješava korigiranim koeficijentom determinacije. Korigirani koeficijent determinacije dan je izrazom:

)R1(

1Kn

1n1R

22

(19)

Korigirani koeficijent determinacije jednak je koeficijentu multiple determinacije ili je manji od njega. Pri računanju korigiranog koeficijenta determinacije uzima se u obzir broj stupnjeva slobode, koji za fiksno n zavisi o broju nezavisnih varijabli u modelu. Uvođenjem varijable koja je nerelevantna za model, smanjuje se vrijednost korigiranog koeficijenta determinacije, pa ona može postati čak i negativna, naročito ako se u funkciju uvodi više nerelevantnih varijabli, a R2 ima malu vrijednost. PRIMJER: AUKCIJSKE CIJENE ANTIKNIH SATOVA

Poznata njemačka tvrtka održava godišnju aukciju antiknih satova. Podaci za 32 antikna sata (starost sata, broj ponuđača te cijena sata) dani su u sljedećoj tablici.

Tablica 3: Aukcijski podaci o cijenama, starosti satova i broju ponuđača

broj opažanja

cijena starost u

godinama broj

ponuđača broj

opažanja cijena

starost u godinama

broj ponuđača

1 1235 127 13 20 1545 175 8

2 1080 115 12 21 729 108 6

3 845 127 7 22 1792 179 9

4 1552 150 9 23 1175 111 15

5 1047 156 6 24 1593 187 8

6 1979 182 11 25 1147 137 8

7 1822 156 12 26 1092 153 6

8 1253 132 10 27 1152 117 13

9 1297 137 9 28 1336 126 10

10 946 113 9 29 785 111 7

11 1713 137 15 30 744 115 7

12 1024 117 11 31 1356 194 5

13 2131 170 14 32 1262 168 7

14 1550 182 8

15 1884 162 11

16 2041 184 10

17 854 143 6

18 1483 159 9

19 1055 108 14

Page 11: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

9

Neka je zavisna varijabla Y aukcijska cijena, X2 = starost sata, X3= broj ponuđača. A priori se očekuje pozitivna veza između Y i dvije nezavisne varijable. U primjeru je pretpostavljeno da cijena pobjedničke ponude zavisi o starosti sata – što je sat stariji to je viša aukcijska cijena, ceteris paribus – tako da se očekuje pozitivan odnos dvije varijable. Analogno, što je veći broj ponuđača to je cijena sata viša, jer veći broja ponuđača za određeni sat, sugerira da je dani sat vrjedniji, što rezultira pozitivnim odnosom između dviju varijabli. Iz podataka iz tablice 3 dobiveni su sljedeći rezultati regresijske analize upotrebom EXCEL programske potpore.

Regression

Descriptive Statistics

Mean Std. Deviation N

cijena 1328,09 393,649 32

starost 144,94 27,395 32

ponuđači 9,53 2,840 32

Correlations

cijena starost ponuđači

Pearson Correlation

cijena 1,000 ,730 ,394

starost ,730 1,000 -,254

ponuđači ,394 -,254 1,000

Sig. (1-tailed)

cijena . ,000 ,013

starost ,000 . ,081

ponuđači ,013 ,081 .

N

cijena 32 32 32

starost 32 32 32

ponuđači 32 32 32

Variables Entered/Removed(b)

Model Variables Entered Variables Removed Method

1 ponuđači, starost(a) . Enter

a All requested variables entered.

b Dependent Variable: cijena

Model Summary(b)

Model R R Square Adjusted R Square Std. Error of the Estimate

1 ,944(a) ,891 ,883 134,608

a Predictors: (Constant), ponuđači, starost

b Dependent Variable: cijena

Page 12: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

10

Coefficients(a)

Model

Unstandardized Coefficients

Standardized Coefficients

t Sig.

95% Confidence Interval for B

B Std. Error Beta

Lower Bound

Upper Bound

1

(Constant) -1336,049 175,272 -7,623 ,000 -1694,522 -977,577

starost 12,741 ,912 ,887 13,965 ,000 10,875 14,607

ponuđači 85,764 8,802 ,619 9,744 ,000 67,762 103,766

a Dependent Variable: cijena

Residuals Statistics(a)

Minimum Maximum Mean Std. Deviation N

Predicted Value 554,60 2030,68 1328,09 371,496 32

Residual -208,599 212,540 ,000 130,194 32

Std. Predicted Value -2,082 1,891 ,000 1,000 32

Std. Residual -1,550 1,579 ,000 ,967 32

a Dependent Variable: cijena

Sažeti rezultati regresijske analize dani su sljedećim izrazom:

118,058F 891,0R

(9,7437) (13,9653) (-7,6226) t

(8,802) (0,912) (175,272) se

X764,85X741,12049,1336Y

2

i3i2i

(20)

Aukcijska cijena pozitivno je korelirana s obje nezavisne varijable, cijenom sata i brojem ponuđača. Interpretacija koeficijenta smjera od 12,741 znači da, održavajući ostale varijable konstantnima, ako se starost sata povećava za jednu godinu, prosječna aukcijska cijena raste za 12,741 boda. Analogno, održavajući ostale varijable konstantnima, ako se broj ponuđača poveća za jedan, aukcijska cijena sata raste za 85,764 boda. Negativna vrijednost konstantnog člana nema ekonomskog značenja. Vrijednost R2 od 0,891 znači da dvije nezavisne varijable procjenjuju oko 89% varijacija u aukcijskoj cijeni. Značenje F vrijednosti biti će objašnjeno dalje u tekstu.

5. TESTIRANJE HIPOTEZA U MODELU VIŠESTRUKE LINEARNE REGRESIJE

Iako koeficijent višestruke determinacije mjeri prilagođenost ocijenjenog regresijskog modela, ne pokazuje da li su ocijenjeni parcijalni regresijski koeficijenti statistički značajni, odnosno statistički različiti od nule. Prvi korak u statističkoj analizi modela višestruke linearne regresije sastoji se u procjeni parametara. Na postupak procjene parametara nadovezuje se postupak testiranja hipoteza. Postoji više testova, a najčešće se koriste sljedeći testovi:

(1) Test značajnosti regresije, odnosno svih parametara u modelu, ili što je isto test značajnosti prisutnosti svih regresorskih varijabli u modelu – skupni test.

Page 13: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

11

(2) Test o značajnosti jednog parametra (jedne regresorske varijable u modelu) – pojedinačni test.

(3) Test značajnosti podskupa parametara (test značajnosti prisutnosti podskupa regresorskih varijabli u modelu) – parcijalni test.

Test o značajnosti jednog parametra – pojedinačni test

Za postupak testiranja potrebno je odrediti sampling distribuciju za 2 kao

ocjenjivača od 2. U slučaju modela s dvije varijable dokazano je kako su OLS

ocjenjivači 1 i 2 normalno distribuirani pod pretpostavkom da slučajno odstupanje

u slijedi normalnu distribuciju. U poglavlju o pretpostavkama višestrukog linearnog regresijskog modela u pretpostavci P7, također se pretpostavlja da slučajno odstupanje u slijedi normalnu distribuciju sa očekivanjem nula i konstantnom

varijancom 2. Zbog te i ostalih pretpostavki, može se dokazati da 1 , 2 i 3 slijede

normalnu. No, kao i u slučaju modela s dvije varijable, ako se, stvarna, ali nepoznata

2 zamijeni njenim nepristranim ocjenjivačem 2 danim izrazom (15), OLS ocjenjivač slijedi t distribuciju sa (n-3) stupnjeva slobode:

3-n

3

33

3-n

2

22

3-n

1

11

t~)ˆ(se

ˆt

t~)ˆ(se

ˆt

t~)ˆ(se

ˆt

(21)

Pretpostavimo da želimo istražiti hipotezu da starost sata ne utječe na njegovu cijenu. Drugim riječima, želimo testirati nul hipotezu:

H0:2=0 i H1:2≠0 U režimu nulte hipoteze, starost antiknih satova nema utjecaja na njihovu cijenu, dok alternativna hipoteza tvrdi suprotno: starost satova ima utjecaja, pozitivnog ili negativnog, na njihovu cijenu. Dane prijašnje nul hipoteze poznato je da

3-n

2

22 t~)ˆ(se

ˆt

(22)

Napomena: 2=0

slijedi t distribuciju s (n-3)=29 stupnjeva slobode, budući je n=32 u razmatranom primjeru. Iz

rezultata regresijske analize iz izraza (20) imamo:

97,13

912,0

0741,12t

(23)

Page 14: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

12

Temeljem izračunate t vrijednosti da li odbacujemo ili prihvaćamo nul hipotezu da starost sata

ne utječe na njegovu aukcijsku cijenu? Za odgovoriti na to pitanje može se koristiti ili test

signifikantnosti ili interval povjerenja.

Testiranje signifikantnosti

Za testiranje hipoteza potrebno je odrediti test statistiku, pronaći sammpling distribuciju,

odabrati razinu signifikantnosti , te odrediti kritičnu vrijednost test veličine na određenoj

razini signifikantnosti. Vrijednost test veličine dobivene iz uzorka uspoređuje se tada s

kritičnom vrijednošću. Nulta hipoteza se odbacuje ukoliko je izračunata vrijednost veća od

kritične vrijednosti. Alternativno se može odrediti i p vrijednost test veličine te odbaciti nul

hipotezu ukoliko je p vrijednost manja od odabrane vrijednosti.

U primjeru aukcijskih cijena antiknih satova znamo da je test statistika t statistika koja slijedi t

distribuciju s (n-3) stupnjeva slobode. Koristi se stoga, t test signifikantnosti. Pretpostavimo

da smo odabrali =0,05 ili 5%. Kako je alternativna hipoteza dvostrana, potrebno je pronaći

kritičnu vrijednost t na razini /2=2,5% za (n-3)s.s.=29. Iz t tablice iščitana vrijednost za s.s.

29 iznosi

95,0)045,2(t)045,2( (24)

Što označava 95%-tnu vjerojatnost da t vrijednost leži u intervalu od -2,045 do +2,045. Iz

izraza (23) vidimo da izračunata t vrijednost uz H0:2=0 iznosi oko 14, što je očito veće od kritične vrijednosti od 2,045. Stoga se nul hipoteza odbacuje, a starost antiknih satova ima utjecaja na njihovu cijenu. Interval povjerenja Pokazano je da

95,0)045,2(t)045,2(P (25) te da je

3-n

2

22 t~)ˆ(se

ˆt

(26)

Supstituiranjem t vrijednosti u izraz (25) dobije se

95,0)ˆ(se045,2ˆ)ˆ(se045,2ˆP

95,0045,2)ˆ(se

ˆ045,2P

22222

2

22

(27)

Izraz (27) predstavlja 95% interval povjerenja za 2. Ukoliko interval povjerenja (područje prihvaćanja) sadrži vrijednost nul hipoteze, nul hipoteza se ne odbacuje. Izraz (27) postaje

Page 15: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

13

6069,148757,10

)912,0(045,2741,12)912,0(045,2741,12

2

2

(28)

što predstavlja 95% interval povjerenja za stvarnu vrijednost 2. Kako interval ne sadrži vrijednost nulte hipoteze ona se odbacuje. Test o značajnosti svih parametara u modelu – skupni test

Test o značajnosti regresije oslanja se na sljedeće hipoteze

0: 320 (29)

U nultoj hipotezi sadržana je tvrdnja da niti jedna regresorska varijabla nije signifikantna u modelu, ili, što je isto, da su svi parametri uz regresorske varijable u modelu jednaki nuli. Alternativna hipoteza sadrži suprotnu tvrdnju, odnosno da postoji barem jedna regresorska varijabla koja je signifikantna za objašnjenje

varijabilnosti zavisne varijable, tj. da postoji barem jedan parametar i različit od nule. Sadržaj nulte hipoteze da niti jedna regresorska varijabla nije signifikantna u modelu isto je kao i tvrditi da

0R: 2

0 (30)

odnosno da dvije nezavisne varijable objašnjavaju 0% varijacija u zavisnoj varijabli. Hipoteza dana izrazom (30) testira se tehnikom poznatom pod imenom analiza varijance (ANOVA).

Tablica 4: ANOVA tablica za regresijski model s 3 varijable

izvor varijacije

suma kvadrata stupnjevi slobode

sredina kvadrata F-vrijednost

objašnjena regresijom ESS= 2i YY

k=2

k

YY

k

ESS2

i

)1kn/(RSS

)k/(ESSF

neobjašnjena

regresijom (rezidualna odstupanja)

RSS= 2ie

nk-1= (n-3)

22i s1kn

e

1kn

RSS

ukupna TSS= 2i YY n-1

Test veličina je empirijski F omjer:

varijanca naneobjašnje

avarijablam nezavisnim objašnjena varijanca

s.s.RSS

s.s.ESSF

odnosno 1Kn)1R(

KRF

odnosno

1KnYY

K)YY(

F

2

2

2

ii

n

1i

2

i

(31)

Page 16: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

14

Brojčane vrijednosti za izračunavanje test veličine dane su u tablici ANOVA. Ako je nulta hipoteza istinita i ako varijable u modelu imaju opisana svojstva, tada se može pokazati da se test veličina ravna po F distribuciji s K i n-(K+1) stupnjevima slobode.

Testira li se na razini signifikantnosti , odluka se donosi usporedbom empirijske test veličine i teorijske vrijednosti F-distribucije. Područje prihvaćanja nulte hipoteze jest

)1k(n,k,FF . Područje odbacivanja nulte hipoteze jest )1k(n,k,FF . Prihvaćanjem

nulte hipoteze prihvaća se pretpostavka da regresorske varijable nisu signifikantne u modelu. Ne prihvati li se nulta hipoteza, to znači da barem jedna od K regresorskih varijabli značajno pridonosi objašnjavanju varijacije zavisne varijable. U primjeru o aukcijskim cijenama antiknih satova SPSS programskom potporom dobivena je sljedeća ANOVA tablica.

Tablica 5: ANOVA tablica za regresijski model aukcijskih cijena antiknih satova

ANOVA(b)

Model Sum of Squares df Mean Square F Sig.

1

Regression 4278294,568 2 2139147,284 118,058 ,000(a)

Residual 525462,151 29 18119,385

Total 4803756,719 31

a Predictors: (Constant), ponuđači, starost

b Dependent Variable: cijena

Iz tablice je vidljivo da izračunata F vrijednosti iznosi 118,058 119. Pod nultom

hipotezom da su 2=3=0, te pod danim pretpostavkama klasičnog standardnog linearnog regresijskog modela, znamo da izračunata F vrijednost slijedi F distribuciju s 2 stupnja slobode u brojniku i 29 stupnjeva slobode u nazivniku. Kritična F vrijednost iznosi 3,33. Izračunata F vrijednost veća je od kritične F vrijednosti te se nulta hipoteza odbacuje.

Page 17: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

15

ZADACI ZA VJEŽBU

1. ZADATAK Služba za marketing kompanije Ratex ispituje opseg prodaje proizvoda FIT u 2002. godini po segmentima tržišta. Pretpostavlja se da su glavni čimbenici (varijable) koje utječu na prodaju izdaci za reklamu (u 000 eura)-X2 i prodajna cijena (u eurima)-X3. Podaci o prodaju, izdaci za reklamu i prodajne cijene dani su u tablici.

područje prodaja u 000 komada, Y izdaci za reklamu u 000 eura, X2

prodajna cijena u eurima, X3

I 331 220 129

II 299 285 138

III 301 256 121

IV 398 395 139

V 402 317 127

VI 487 500 111

VII 601 432 103

VIII 614 599 122

IX 703 701 101

X 711 794 110

XI 799 802 100

XII 927 980 99

XIII 990 1021 97

XIV 1015 1128 95

Pretpostavite da se ispitivanje vrši pomoću modela višestruke linearne regresije. SPSS programskom potporom dobiveni su sljedeći rezultati regresijske analize.

Regression

Descriptive Statistics

Mean Std. Deviation N

Y 612,71 253,720 14

X2 602,14 305,249 14

X3 113,71 15,424 14

Correlations

Y X2 X3

Pearson Correlation

Y 1,000 ,981 -,874

X2 ,981 1,000 -,819

X3 -,874 -,819 1,000

Sig. (1-tailed)

Y . ,000 ,000

X2 ,000 . ,000

X3 ,000 ,000 .

N

Y 14 14 14

X2 14 14 14

X3 14 14 14

Page 18: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

16

Variables Entered/Removed(b)

Model Variables Entered Variables Removed Method

1 X3, X2(a) . Enter

a All requested variables entered.

b Dependent Variable: Y

Model Summary(b)

Model R R

Square

Adjusted R

Square

Std. Error of the

Estimate

Change Statistics

R Square

Change

F

Change df1 df2

Sig. F

Change

1 ,989(a) ,978 ,974 41,193 ,978 241,088 2 11 ,000

a Predictors: (Constant), X3, X2

b Dependent Variable: Y

ANOVA(b)

Model Sum of Squares df Mean Square F Sig.

1

Regression 818193,176 2 409096,588 241,088 ,000(a)

Residual 18665,681 11 1696,880

Total 836858,857 13

a Predictors: (Constant), X3, X2

b Dependent Variable: Y

Coefficients(a)

Model

Unstandardized

Coefficients

Standardized

Coefficients

t Sig.

95% Confidence Interval

for B

B Std. Error

Beta

Lower

Bound

Upper

Bound

1

(Constant) 611,170 180,713 3,382 ,006 213,424 1008,916

X2 ,669 ,065 ,805 10,261 ,000 ,526 ,813

X3 -3,531 1,291 -,215 -2,735 ,019 -6,372 -,689

a Dependent Variable: Y

Residuals Statistics(a)

Minimum Maximum Mean Std. Deviation N

Predicted Value 302,96 1030,77 612,71 250,874 14

Std. Predicted Value -1,235 1,666 ,000 1,000 14

Standard Error of Predicted Value 14,231 26,213 18,674 4,003 14

Adjusted Predicted Value 296,28 1037,82 610,29 251,888 14

Residual -66,929 64,341 ,000 37,892 14

Std. Residual -1,625 1,562 ,000 ,920 14

Stud. Residual -1,739 2,025 ,025 1,054 14

Page 19: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

17

Deleted Residual -76,697 108,124 2,420 50,315 14

Stud. Deleted Residual -1,948 2,438 ,030 1,152 14

Mahal. Distance ,623 4,336 1,857 1,231 14

Cook's Distance ,001 ,930 ,119 ,240 14

Centered Leverage Value ,048 ,334 ,143 ,095 14

a Dependent Variable: Y

Temeljem dobivenih rezultata:

a) Odredite status varijabli u modelu. b) Kako glasi model višestruke regresije za ovaj primjer? c) Napišite jednadžbu s procijenjenim parametrima i protumačite je. d) Ispod procjena parametara naznačite vrijednosti njihovih standardnih pogrešaka.

e) Odredite granice 100(1-)%-tnog intervala procjene parametara uz regresorske varijable. f) Koliko je koeficijent determinacije i korigirani koeficijent determinacije za analizirani primjer

modela? Interpretirajte rezultate. 2. ZADATAK Ocijenjen je model prodaje jedne vrste kave u 12 prodavaonica na temelju podataka u mjesecu ožujku:

ii22i110i uXbXbbY .

Varijable modela su: Y – količina prodane kave u kg X1 – cijena kave u kunama X2 – broj reklamnih oglašavanja

MODEL ^const 18006,0 X1 -237,07 (t-vrijednost) (-2,88) X2 3,7022 (t-vrijednost) (0,17)

2R 0,6578

F 11,57

a) Testirajte značajnost nezavisnih varijabli. Razina signifikantnosti je 5%. b) Provedite test o značajnosti regresije za model. Razina signifikantnosti je 5%. c) Uz poznatu F vrijednost i standardnu pogrešku regresije s=991,734 ispunite tablicu ANOVA.

Page 20: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

18

RJEŠENJA ODABRANIH ZADATAKA

1. ZADATAK

a) Iskustvo i teorija poslovanja pokazuju da na opseg prodaje utječe velik broj faktora od kojih su izdvojeni izdaci za reklamu i prosječne cijene. Opseg prodaje je zavisna varijabla. To je numerička varijabla čije se vrijednosti (njih 14) odnose na prodaju po područjima. Budući da se varijacije prodaje po tržišnim segmentima (područjima) objašnjavaju pomoću izdataka za reklamu i prosječnih cijena, to su ovdje nezavisne varijable, izdaci za reklamu i prosječne cijene. Varijable su numeričke, a njihove se vrijednosti (14 po svakoj varijabli) odnose na segmente tržišta. Vrijednosti su povezane s područjima, a vremenski su vezane za isto razdoblje, 2002. godinu (cross-sectional dana, mješoviti podaci).

b) Model je osnovnog skupa: ii33i2211 uXXY , a model

uzorka: ii33i221i eXˆXˆˆY .

c) i3i2i X531,3X669,0170,611Y

d) (1,291) (0,065) (180,713) se

X531,3X669,0170,611Y i3i2i

e)

95% Interval

povjerenja

procjene

parametara

Standardne

pogreške procjena

donja

granica

gornja

granica

konstantni

član 611,170 180,713 213,424 1008,916

X2 ,669 ,065 ,526 ,813

X3 -3,531 1,291 -6,372 -,689

f) Koeficijent determinacije iznosi 0,978, a korigirani koeficijent determinacije 0,974. Koeficijent

determinacije pokazuje da je primjenom modela protumačeno oko 97,8% varijacija zavisne varijable, pa je po tome pokazatelju model reprezentativan. Korigirani koeficijent determinacije blizu je njegove maksimalne vrijednosti. Primjena ovog koeficijenta važna je u postupku odabira modela s različitim brojem nezavisnih varijabli.

1. ZADATAK

a) H0:b1=0, HA:b1≠, t=2,88, t0.05(9)=2,62. Nulta hipoteza se ne prihvaća, nezavisna varijabla X1 značajna je za model. H0:b2=0, HA:b2≠, t=0,17, t0.05(9)=2,62. Nulta hipoteza se ne prihvaća, nezavisna varijabla X1 značajna je za model.

b) H0:b1=b2=0, HA: bj≠0, j=1,2, F=11,57, F0,05(2,9)=4,26. Nulta hipoteza se ne prihvaća. Ne može se prihvatiti pretpostavka da varijable cijena kave i broj reklamnih oglašavanja nisu signifikantne u objašnjavanju varijacija količine prodane kave.

c)

izvori varijacija suma kvadrata stupnjevi slobode

sredina kvadrata F vrijednost

objašnjena 22759030,66 2 11379515,33 11,57

neobjašnjena 8851826,97 9 983536,33

ukupna 31610857,63 11 2873714,33

Page 21: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

19

LITERATURA

1. Biljan-August, M,; Pivac, S.; Štambuk, A. (2007.), «Primjena statistike u ekonomiji», Ekonomski fakultet Sveučilišta u Rijeci, Rijeka.

2. Gujarati, D. (1992.), «Essentials of Econometrics», McGraw-Hill, New York. 3. Jovičić, M. (1989.), «Ekonometrijski metodi», Ekonomski fakultet, Beograd. 4. Jurun, E; Pivac, S.; Arnerić, J. (2006.), «Primijenjena ekonometrija 1», Sveučilište u

Splitu, Ekonomski fakultet, Split. 5. Kmenta, J. (1997.), «Počela ekonometrije», MATE, Zagreb. 6. Lovrić, LJ. (2005.), «Uvod u ekonometriju», Sveučilište u Rijeci, Ekonomski fakultet

Rijeka. 7. Maddala, G. S. (1992.), «Introduction to Econometrics», Second Edition, Macmillian

Publishing Company, New York. 8. Šošić, I. (2004.), «Primijenjena statistika», Školska knjiga, Zagreb.

Page 22: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

FAKULTET ZA MENADŽMENT U TURIZMU I UGOSTITELJSTVU U OPATIJI

EKONOMETRIJA

7. TEMATSKA JEDINICA

Opatija, 2013.

Page 23: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

1

SEDMA TEMATSKA JEDINICA

OCJENJIVANJE U UVJETIMA NEISPUNJENIH PRETPOSTAVKI KLASIČNOG MODELA 1. MULTIKOLINEARNOST

1.1. SAVRŠENA MULTIKOLINEARNOST

1.2. NESAVRŠENA MULTIKOLINEARNOST

1.3. POSLJEDICE MULTIKOLINEARNOSTI

1.4. OTKRIVANJE MULTIKOLINEARNOSTI

1.5. RJEŠAVANJE PROBLEMA MULTIKOLINEARNOSTI

2. AUTOKORELACIJA 2.1. DEFINICIJA I UZROCI AUTOKORELACIJE

2.2. POSLJEDICE AUTOKORELACIJE

2.3. OTKRIVANJE AUTOKORELACIJE

2.3.1. GRAFIČKA METODA

2.3.2. DURBIN-WATSONOV TEST

2.4. UKLANJANJE AUTOKORELACIJE

2.4.1. GENERALIZIRANA METODA NAJMANJIH KVADRATA

2.4.2. METODE PROCJENJIVANJA 3. HETEROSKEDASTIČNOST

3.1. DEFINICIJA I UZROCI HETEROSKEDASTIČNOSTI

3.2. POSLJEDICE HETEROSKEDASTIČNOSTI

3.3. OTKRIVANJE HETEROSKEDASTIČNOSTI

3.4. UKLANJANJE HETEROSKEDASTIČNOSTI

ZADACI ZA VJEŽBU

RJEŠENJA ODABRANIH ZADATAKA

LITERATURA

1. MULTIKOLINEARNOST

Jedna od pretpostavki klasičnog standardnog linearnog regresijskog modela je odsustvo savršene mulitkolinearnosti – odsutnost egzaktne linearne kombinacije nezavisnih varijabli u višestrukoj regresiji. 1.1. SAVRŠENA MULTIKOLINEARNOST U praksi se rijetko susreće savršena multikolinearnost, dok je češća nesavršena multikolinearnost, odnosno približna linearna zavisnost. Važno je poznavati probleme koji nastaju kao posljedica multikolinearnosti prilikom OLS procjene parametara višestruke regresije. Tablica 1.: Potražnja za osobnim računalima

Y X2 X3 X4 količina cijena tjedni dohodak

(procjena) tjedna zarada

(stvarne vrijednosti)

49 1 298 297,5 45 2 296 294,9 44 3 294 293,5 39 4 292 292,8

Page 24: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

2

38 5 290 290,2 37 6 288 289,7 34 7 286 285,8 33 8 284 284,6 30 9 282 281,1 29 10 280 278,8

Tablica 1 prikazuje podatke za količinu potražnje za osobnim računalima u odnosu na cijenu (X2) i na dvije mjere tjedne raspoložive količine novca, (X3) kao procjena tjednog dohotka i (X4) kao podaci za stvarno raspoloživu količinu novca. Za razlikovanje varijabli X3 i X4 nazvane su tjedni dohodak i tjedna zarada. Kako je, pored cijene, dohodak važna determinanta potražnje proširena funkcija potražnje može se pisati

ii43i221i

ii33i221i

uXBXBBY

uXAXAAY

(1) (2)

Prikazane funkcije potražnje razlikuju se u korištenim mjerama dohotka. A priori se očekuje da A2 i B2 imaju negativan predznak, dok se za koeficijente A3 i B3 očekuje da su pozitivni. Kada se temeljem podataka tablice 1 i pomoću programske potpore želi ocijeniti model (1), računalo «odbija» procijeniti regresiju. Zašto? Uvrštavanjem podataka za cijenu (X2) i tjedni dohodak (X3) u dijagram dobije se slika 1.

Slika 1.: Dijagram rasipanja varijabli dohodak (X3)i cijene (X2)

Izračunom regresije varijable (X2 )cijene i dohotka (X3) dobiju se sljedeći rezultati:

00,1R

X2300X

2

i23

(3)

Varijabla (X3) se može prikazati kao linearna funkcija varijable (X2). Drugim riječima, tjedni dohodak (X3) i cijena (X2) savršeno su linearno korelirane, postoji dakle savršena multikolinearnost. Zbog odnosa u izrazu (3), izraz (1) se ne može procijeniti. Supstituiranjem izraza (3) u izraz (1) dobije se

Page 25: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

3

32

31

i2i21

i2i3231

ii23i221i

2A-AC

300AAC

uXCC

u)X2A(A)300A(A

u)X2300(AXAAY

(4)

Izraz (4) pokazuje zašto se izraz (1) nije mogao procijeniti: ne radi se o slučaju višestruke regresije, već o jednostavnoj regresiji s dvije varijable Y i X2. No, iako se izraz (4) može procijeniti te dobiti procjene za C1 i C2, iz njega nije moguće dobiti procjene za originalne parametre A1, A2 i A3, jer u izrazu (4) imamo samo dvije jednadžbe i tri nepoznanice. Rezultati procjene regresije (4) su

9757,0R (-17,935) (66,583) t

(0,1203) (0,746) se

X1576,2667,49Y

2

i2i

(5)

Kao što je vidljivo 1C iznosi 49,667 a 2C -2,1756. Iz ovih vrijednosti nije moguće dobiti

vrijednosti za tri nepoznanice A1, A2 i A3. U slučaju savršene multikolinearnosti, savršene linearne veze, među nezavisnim varijablama nije moguće dobiti jedinstvene procjene parametara. A budući da se parametri ne mogu procijeniti, nije moguće pristupiti testiranju hipoteza i bilom kakvom drugom postupku statističkog zaključivanja o njima temeljem određenog uzorka. 1.2. NESAVRŠENA MULTIKOLINEARNOST Vrlo često makroekonomski podaci vremenskih serija uključuju multikolinearnost jer pokazuju slične tendencije rasta u određenom vremenskom razdoblju. Savršena multikolinearnost, kao pojava kada se varijacije jedne nezavisne varijable mogu u potpunosti objasniti varijacijama druge nezavisne varijable, tj. ako se u modelu

ii22i110i uXXY (6)

nezavisna varijabla X1 može prikazati kao linearna funkcija druge nezavisne varijable, tj.

i210i1 XX (7)

U praksi je češća pojava nesavršene multikolinearnosti, odnosno približne linearni

zavisnosti, kada veza među varijablama nije egzaktna već uključuje i odstupanje i:

ii210i1 XX (8)

Page 26: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

4

To znači da se varijacije varijable X1 mogu predstaviti varijacijama varijable X2, ali ne u potpunosti, veće neke neobjašnjene varijacije još postoje. Za objašnjenje nesavršene multikolinearnosti razmotrimo podatke iz tablice 1 te ocijenimo izraz (2) sa tjednom zaradom u stvarnim vrijednostima (X4). Rezultati regresije su

9778,0R (-0,7971) (-3,4444) (1,2107) t

(0,4003) (0,8122) (120,06) se

X3191,0X7975,237,145Y

2

i4i2i

(9)

Rezultati su zanimljivi iz nekoliko razloga: 1. Iako regresiju (1) nije moguće procijeniti, moguće je procijeniti regresiju (2), iako

su razlike između dviju dohodovnih varijabli neznatne. 2. Prema očekivanjima, cjenovni koeficijenti su negativni. Svaki je cjenovni

koeficijent statistički značajno različit od nule. No t vrijednost cjenovnog koeficijenta u izrazu (4) puno je veći od t vrijednosti u izrazu (9), odnosno standardna pogreška cjenovnog koeficijenta manja je u izrazu (4) od one u izrazu (9).

3. Vrijednost R2 u izrazu (4) s jednom nezavisnom varijablom iznosi 0,9757, dok u izrazu (9) s dvije nezavisne varijable iznosi 0,9778, te raste za tek 0,0021.

4. Koeficijent dohotka (tjedne zarade) statistički je nesignifikantan, no što je zanimljivije ima negativan predznak. Za većinu dobara, dohodak pozitivno utječe na količinu potražnje.

5. Unatoč neznačajnosti dohodovne varijable testiranjem hipoteze 2=3=0 (hipoteza da je R2=0), ona se lako može odbaciti primjenom F testa. Drugim riječima, cijena i zarada imaju značajnog utjecaja na količinu potražnje.

Kako se objašnjavaju tako neobični rezultati? Uvrštavanjem u dijagram rasipanja podataka za varijablu X2 i X4, cijena nasuprot tjednoj zaradi dobije se slika 2.

Slika 2.: Odnos tjedne zarade (X4)i cijene (X2)

X4 =299,92 -2,0055X2

275

280

285

290

295

300

0 1 2 3 4 5 6 7 8 9 10

cijena

tjed

na z

ara

da

Page 27: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

5

Iz slike je vidljivo da, iako cijena i tjedna zarada nisu egzaktno linearno povezane, među njima postoji visok stupanj zavisnosti. Navedeno se može potvrditi i iz rezultata regresije

9770,0R (-18,44) (444,44) t

(0,1088) (0,6748) se

eX0055,292,2999X

2

ii2i4

(10)

Kako rezultati regresije pokazuju, cijena i tjedna zarada usko su povezane: koeficijent korelacije iznosi -0,9884, što je slučaj skoro savršene multikolinearnosti. 1.3. POSLJEDICE MULTIKOLINEARNOSTI Govorit će se o nesavršenoj multikolinearnosti s kojom se uglavnom u praksi često i susrećemo. Ocjene parametara su efikasne i nepristrane, dakle još uvijek imaju svojstva da su najbolje linearne nepristrane, tj. BLUE, no postoji niz drugih posljedica:

1. Velike varijance i standardne pogreške parametara. Velika standardna greška znači i širi interval pouzdanosti pa je teže procijeniti pravu vrijednost parametara, tj. pada preciznost ocjene parametara.

2. Nesignifikantne t-vrijednosti koje su posljedica velikih standardnih pogrešaka, zbog kojih će se kod testiranja hipoteze o značajnosti pojedine regresorske varijable prihvatiti H0 hipoteza (da je važna varijabla nesignifikantna).

3. Visok R2 i niske t-vrijednosti jasan su pokazatelj multikolinearnosti. 4. Ocjene parametara i njihove standardne greške postaju vrlo nestabilne i vrlo

osjetljive na male promjene u podacima. 5. Pogrešan predznak parametara jest čest slučaj upravo zbog neefikasne i

neprecizne ocjene parametra. 6. Nije moguće utvrditi zasebne utjecaje svake nezavisne varijable u objašnjenoj

varijaciji, odnosno u R2. Ako postoji multikolinearnost prilagođenost se ne mijenja značajno, ali se ne može utvrditi uloga pojedine nezavisne varijable.

1.4. OTKRIVANJE MULTIKOLINEARNOSTI Ne postoji test ili točno definiran način za otkrivanje multikolinearnosti. Nije bitno praviti razliku između prisutnosti i odsutnosti multikolinearnosti, već između različitih stupnjeva multikolinearnosti. Za to postoje različiti indikatori: 1. Visok R2, a niske t-vrijednosti

Ako je R2 visok, npr. viši od 0,8, F testom će se odbaciti hipoteza da su svi parametri u funkciji jednaki nuli. Tako je i kod multikolinearnosti, međutim ono što je kontradiktorno, pojedini t-testovi pokazuju da niti jedan parametar (ili samo neki od njih) nije statistički različit od nule. 2. Visoki koeficijent korelacije između eksplanatornih varijabli

Ako su koeficijenti korelacije među nezavisnim varijablama visoki (recimo iznad 0,8), to može biti znak visoke koreliranosti među tim varijablama. Međutim, taj pokazatelj

Page 28: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

6

nije uvijek pouzdan jer može biti nizak, a da multikolinearnost u modelu ipak postoji. Naime, moguće je da nezavisne varijable u grupi djeluju multikolinearno. Zato je, kada se radi o modelu s više od dvije nezavisne varijable, potrebno računati koeficijent parcijalne korelacije. Na primjer u modelu

ii33i22i110i uXXXY (11)

koeficijent parcijalne korelacije r12,3 jest koeficijent korelacije između X1 i X2, držeći utjecaj varijable X3 konstantnim. Iako koeficijent jednostavne linearne korelacije r12 može biti nizak, koeficijent parcijalne korelacije r12,3 može biti visok, a to znači da je, ne uzimajući u obzir utjecaj varijable X3, korelacija između varijabli X1 i X2 visoka. Ukratko, visoki koeficijent jednostavne linearne korelacije među eksplanatornim varijablama pokazatelj je postojanja multikolinearnosti, ali samo ako se radi o modelu s dvije nezavisne varijable. 3. Pomoćne regresije

Kako se kod multikolinearnosti jedna ili više eksplanatornih varijabli može prikazati kao linearna kombinacija ostalih eksplanatornih varijabli u modelu, da bi se utvrdilo postoji li ta linearna funkcijska veza među nezavisnim varijablama ocjenjuju se tzv. pomoćne regresije: ocjenjuje se regresija za svaku od nezavisnih varijabli Xi i računa pripadni Ri2. Testirajući hipotezu Ri2=0, ispitujemo tvrdnju da nema kolinearnosti među Xi i preostalih nezavisnih varijabli u modelu. Pri tome se koristi F test

1kn)R1(

kRF

2

2

(12)

gdje je n broj opažanja, a (n-k-1) broj parametara u modelu. Iako R2 nije jako visok, prema F testu može biti signifikantno različit od nule. 4. Inflacijski faktor varijance (VIF)

Ri2 dobiven iz pomoćnih regresija nije potpuno pouzdan pokazatelj kolinearnosti. Varijanca parametar uz nezavisnu varijablu računa se prema izrazima

2

1

2

1i1

2

1

R1XX)var(

(13)

2

2

2

2i2

2

2

R1XX)var(

(14)

Kako se omjer 2

iR1

1

naziva inflacijski faktor varijance (VIF), varijance iz izraza (13) i

(14) mogu se pisati

Page 29: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

7

VIF

XX)var(

2

1i1

2

1

(15)

VIF

XX)var(

2

2i2

2

2

(16)

Ako je Ri2=0 znači da nema multikolinearnosti, VIF=1. Kako Ri2 raste, povećava se varijanca i standardna pogreška parametra, a i VIF. Varijanca parametra ne ovisi

samo o Ri2, nego i o varijanci odstupanja 2 i o varijaciji podataka nezavisne varijable

Xi oko njezine sredine X , zato visok Ri2 dobiven iz pomoćnih regresija može biti samo grubi pokazatelj prisustva multikolinearnosti. 1.5. RJEŠAVANJE PROBLEMA MULTIKOLINEARNOSTI Jedan od načina rješavanja problema multikolinearnosti jest izbaciti varijablu ili varijable koje su korelirane. To nije jednostavno rješenje jer može prouzrokovati specifikacijsku pogrešku i sve posljedice koje ona nosi. Drugi način je povećavanje broja podataka u uzorku, s obzirom da je multikolinearnosti problem uzorka, a ne populacije. Time će se obuhvatiti više varijacija promatranih varijabli. Ipak, nije moguće uvijek dobiti veći uzorak podataka. Postoji i mogućnost transformacije podataka. Kako je multikolinearnost svojstvena podacima vremenskog niza, korištenjem diferenciranja podataka za varijable

1tt

*

t XXX

zapravo dobivamo nizove koji predstavljaju promjene podataka od razdoblja do razdoblja. Na taj se način rješavamo trenda u opažanjima za pojedinu varijablu, a koji je često uzrok prisutnosti multikolinearnosti. Potrebno je imati na umu da transformiranjem podataka transformiramo i mode, a time i ocijenjeni parametri imaju drugačiju ekonomsku interpretaciju. 2. AUTOKORELACIJA

U ovom dijelu govori se o posljedicama kršenja treće (odsutnost autokorelacije) pretpostavke klasičnog linearnog regresijskog modela, tj. o pojavi autokorelacije ili serijske korelacije odstupanja ui. Autokorelacija ostavlja takve posljedice na model da on postaje nepogodan za prognoziranje. Važno je stoga, razumjeti o kakvom se problemu radi , kakve on posljedice ostavlja na ocijenjeni model te kako ga riješiti. 2.1. DEFINICIJA I UZROCI Autokorelacija postoji kada su vrijednosti slučajne varijable u međusobno korelirane veličine

j)(i ,0)u,u( ji (17)

Page 30: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

8

Izraz (17) znači da je očekivana vrijednost produkta između dviju različitih komponenata varijable u različita od nule. Autokorelacija je češće prisutna kod ocjenjivanja modela na osnovi podataka vremenski nizova nego u slučaju ocijenjenog modela na osnovi podataka vremenskog presjeka. Stoga, kada se raspravlja o autokorelaciji, u literaturi je uobičajeno uz varijable stavljati oznaku t (za vrijeme) umjesto oznake i. Prema tome, kada su odstupanja autokorelirana piše se

s)(t ,0)u,u( stt (18)

Taj izraz znači da je odstupanje koje se zbilo u vremenu t povezano s odstupanjem u vremenu (t-s). Npr. pri proučavanju potražnje za nekim proizvodom na temelju mjesečnih podat pri proučavanju potražnje za nekim proizvodom na temelju mjesečnih podataka, neautokoreliranost odstupanja znači da je posljedica zastoja u isporuci proizvoda privremena, tj. utječe samo na potražnju tekućeg vremena. Najjednostavnija je i najčešća autokorelacija prvog reda koja se može izraziti autoregresijskom funkcijom AR(1)

t1-tt uu (19)

gdje je: ut - odstupanje u razdoblju t ut-1 - odstupanje u prethodnom razdoblju

- jednostavni korelacijski koeficijent između ut i ut-1, <1 vt - normalno distribuirana nezavisna odstupanja koja su u skladu s klasičnim

pretpostavkama, tj. tN(0, 2) Tada kažemo da se odstupanja ponašaju prema autoregresijskom procesu 1. reda, tj.

utAR(1) Postoje dvije vrste autokorelacije: pozitivna i negativna. Kod pozitivne odstupanja ui obično imaju isti predznak. Kod negativne autokorelacije pozitivna odstupanja slijede negativna, pa opet pozitivna, itd. Kada je autokorelaija prisutna, vizualno odstupanja kroz vrijeme pokazuju određeno pravilo ponašanja, sistematičnost (slika 3)

Slika 3: Odstupanja bez autokorelacije (a) i s autokorelacijom (b)i (c)

Page 31: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

9

Postoji više razloga zbog kojih se autokorelacija pojavljuje. Često je uzrok sadržan u samim podacima uzorka na osnovi kojeg se model ocjenjuje. To je tzv. prava

autokorelacija. Ekonomski podaci pokazuju kroz vrijeme ciklično kretanje. Iz recesije preko razdoblja oporavka, podaci vremenske serije idu po uzlaznoj putanji i u svakoj točki im je vrijednost veća nego u prethodnoj, sve dok se nešto ne dogodi slijedom ekonomskih ciklusa. Tako sukcesivne vrijednosti opažanja izgledaju međusobno korelirane, bilo da pratimo bruto društveni proizvod, proizvodnju, zaposlenost, kretanje cijena itd. Razlog može biti i «friziranje» statističkih podataka, npr. umjesto prikupljanja podataka za razna vremenska razdoblja, oni se izračunavaju kao prosjeci iz kraćih vremenskih razdoblja. Zato podaci izgledaju «izglađeno», pa odstupanja pokazuju pravilnost pojavljivanja, tj. autokorelaciju. Čest razlog je specifikacijska pogreška, a to je izostavljena signifikantna varijabla ili odabir pogrešne funkcijske veze. To je tzv. neprava autokorelacija. Odstupanja na sebe preuzimaju tu pogrešku, nisu više slučajna, nego se ponašaju po određenom pravilu, što je moguće vidjeti iz dijagrama rasipanja. 2.2. POSLJEDICE AUTOKORELACIJE Pod pretpostavkama klasičnog regresijskog modela, ocjene parametara su najbolje linearne nepristrane ocjene (BLUE). Znači da imaju minimalnu varijancu (efikasne su) i nepristrane su. Dogodi li se da pretpostavka o autokorelaciji nije zadovoljena, to ostavlja ozbiljne posljedice na ocijenjeni model. Ocjene parametara su nepristrane, ali su nepouzdane jer:

Nisu više efikasne (tj. nemaju minimalnu varijancu, nisu više BLUE). Podcijenjena je varijanca i standardna pogreška parametra, zbog toga t i F test

nisu pouzdani pokazatelji.

Podcijenjena je ocijenjena rezidualna varijanca 2 , pa R2 nije pouzdan pokazatelj.

Model nije pogodan za predviđanje jer su i varijanca i standardna pogreška predviđanja neefikasne.

2.3. OTKRIVANJE AUTOKORELACIJE Kako je pojava autokorelacije povezana s pogreškama relacije koja nam je nepoznata, otkrivanje i analiza autokorelacije oslanja se na procijenjene pogreške, tj. rezidualna odstupanja. Postoji više načina za otkrivanje autokorelacije, među kojima se spominju grafička metoda i Durbin-Watsonov test, koji se najčešće i koriste. Ozbiljna autokorelacija često je očita iz dijagrama rasipanja rezidualnih odstupanja (slika 3), no pouzdaniji je i češće korišten Durbin-Watsonov (DW) test. 2.3.1. GRAFIČKA METODA

Grafička metoda sastoji se u prikazivanju raspršenosti reziduala kroz vrijeme iz kojeg je moguće vidjeti postoji li neka pravilnost ili su odstupanja stvarno slučajno distribuirana.

Page 32: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

10

Radi lakšeg razumijevanja ocijenit ćemo model stvarnih plaća i produktivnosti rada u poslovnom sektoru u SAD-u od 1959. do 2002. Iz makroekonomske teorije očekuje se pozitivan odnos između plaća i produktivnosti rada-što je viša produktivnost rada veća je i plaća. U tablici 2 prikazani su podaci o plaćama i produktivnosti rada za navedeno razdoblje.

Tablica 2.: Plaće i produktivnost rada u SAD-u za razdoblje od 1959. do

2002. godine

godina plaća (W) produktivnost (P) godina plaća (W) produktivnost (P)

1959 59,2 48,6 1981 89 81,9 1960 60,7 49,5 1982 90,5 81,6 1961 62,5 51,3 1983 90,4 84,5 1962 64,6 53,6 1984 90,7 86,8 1963 66,1 55,7 1985 92,1 88,5 1964 67,7 57,6 1986 95,2 91,2 1965 69,1 59,7 1987 95,6 91,6 1966 71,7 62,1 1988 97 93 1967 73,6 63,5 1989 95,5 93,9 1968 76 65,5 1990 96,3 95,3 1969 77,2 65,8 1991 97,4 96,4 1970 78,6 67,1 1992 100 100 1971 80,1 70 1993 99,9 100,5 1972 82,3 72,2 1994 99,7 101,7 1973 84,1 74,5 1995 99,4 102,3 1974 83,1 73,2 1996 99,8 105,1 1975 83,9 75,8 1997 100,7 107,4 1976 86,2 78,4 1998 104,8 110,2 1977 87,4 79,7 1999 107,2 113 1978 88,9 80,6 2000 111 116,5 1979 89,1 80,5 2001 112,1 118,8 1980 88,9 80,3 2002 113,5 125,1

Iz podataka iz tablice 2 dobiju se sljedeći regresijski rezultati

0,2136 d

9755,0R

(40,9181) (20,2496) t

(0,0171) )4605,1(se

P7005,05749,29W

2

(20)

Prema očekivanjima postoji pozitivna veza između plaća i produktivnosti rada. t vrijednosti i R2 su visoki. No, prije prihvaćanja ovih rezultata kao zadovoljavajućih potrebno je testirati mogućnost postojanja autokorelacije. Kao i u slučaju heteroskedastičnosti, grafički prikaz OLS reziduala može dati vrijednu sliku o postojanju autokorelacije među slučajnim varijablama. Postoji više načina grafičkog prikazivanja reziduala. Reziduali se mogu prikazati u dijagramu rasipanja u odnosu na vrijeme kao na slici 4.

Page 33: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

11

Slika 4.: Reziduali regresije iz izraza (20)

vrijeme

rezid

ua

li

Reziduali na slici (4) čini se da su slučajno distribuirani. U početku su negativni, pa pozitivni, pa opet negativni.

Tablica 3.: Reziduali i pripadajući podaci iz regresije plaće i

produktivnost rada

et et-1 D=et-et-1 D2 et2 predznak

od e

-4,42361 - - - 19,56833 -

-3,55414 -4,42361 0,86947 0,755977 12,63192 -

-3,0152 -3,55414 0,538939 0,290455 9,091443 -

-2,52656 -3,0152 0,488645 0,238773 6,383492 -

-2,49779 -2,52656 0,028762 0,000827 6,23898 -

-2,22891 -2,49779 0,26888 0,072297 4,968061 -

-2,30015 -2,22891 -0,07124 0,005075 5,290701 -

-1,38157 -2,30015 0,918586 0,8438 1,908727 -

-0,46239 -1,38157 0,919175 0,844883 0,213806 -

0,53643 -0,46239 0,998821 0,997644 0,287757 +

1,526253 0,53643 0,989823 0,97975 2,329448 +

2,015487 1,526253 0,489234 0,23935 4,062186 +

1,483778 2,015487 -0,53171 0,282715 2,201596 +

2,142481 1,483778 0,658703 0,43389 4,590225 +

2,331126 2,142481 0,188645 0,035587 5,434146 +

2,241892 2,331126 -0,08923 0,007963 5,026078 +

1,220359 2,241892 -1,02153 1,043528 1,489277 +

1,698827 1,220359 0,478468 0,228931 2,886014 +

1,988061 1,698827 0,289234 0,083656 3,952387 +

2,857531 1,988061 0,86947 0,755977 8,165482 +

3,12759 2,857531 0,270059 0,072932 9,781817 +

3,067707 3,12759 -0,05988 0,003586 9,410829 +

2,046765 3,067707 -1,02094 1,042324 4,189245 +

3,756941 2,046765 1,710177 2,924705 14,11461 +

1,625232 3,756941 -2,13171 4,544184 2,64138 +

0,313877 1,625232 -1,31136 1,719653 0,098519 +

0,522875 0,313877 0,208998 0,04368 0,273398 +

1,731284 0,522875 1,208409 1,460252 2,997343 +

1,851048 1,731284 0,119764 0,014343 3,426379 +

2,270223 1,851048 0,419175 0,175708 5,153912 +

0,139693 2,270223 -2,13053 4,53916 0,019514 +

-0,04113 0,139693 -0,18083 0,032698 0,001692 -

0,288219 -0,04113 0,329352 0,108473 0,08307 +

0,366098 0,288219 0,077878 0,006065 0,134027 +

-0,0842 0,366098 -0,45029 0,202765 0,007089 -

Page 34: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

12

-1,1249 -0,0842 -1,04071 1,083071 1,265409 -

-1,84526 -1,1249 -0,72035 0,518909 3,404976 -

-3,40691 -1,84526 -1,56165 2,438751 11,60702 -

-4,11826 -3,40691 -0,71136 0,506027 16,96009 -

-1,97991 -4,11826 2,13835 4,57254 3,920058 -

-1,54156 -1,97991 0,43835 0,192151 2,376418 -

-0,19363 -1,54156 1,347937 1,816935 0,037491 -

-0,70498 -0,19363 -0,51136 0,261484 0,496999 -

-3,71869 -0,70498 -3,01371 9,082465 13,82869 -

Isto se može uočiti ukoliko se reziduali et iz prve kolone tablice (3) usporede s rezidualima et-1 iz druge kolone (slika 5).

Slika 5.: Reziduali et u odnosu na et-1 regresije iz izraza (20)

et

et-1

Opći trend slike je da su sukcesivni reziduali pozitivno korelirani, što ukazuje na pozitivnu autokorelaciju. 2.3.2. DURBIN-WATSONOV TEST

Durbin-Watsonov d test najpoznatiji je test za otkrivanje autokorelacije. Njegova prednost je što je jednostavan za primjenu i uključen u sve ekonometrijske pakete. Test veličina je

n

1t

2

t

n

2t

2

1tt

e

)ee(

d (21)

Koja predstavlja omjer zbroja kvadrata prvih diferencije rezidualnih odstupanja i zbroja kvadrata rezidualnih odstupanja. Zbog diferenciranja u brojniku se gubi jedno opažanje, pa sumiranje kreće od drugog opažanja (t=2). DW test se može upotrijebiti ako su zadovoljene sljedeće pretpostavke:

1. Koristi se za otkrivanje autokorelacije 1. reda. 2. Regresijski model uključuje konstantu (odsječak na ordinati). Ne može se

primijeniti na regresiju kroz ishodiše. 3. Nezavisne varijable su nestohastične, znači imaju fiksne vrijednosti kod

ponovljenih uzoraka.

Page 35: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

13

4. Regresijski model ne uključuje vrijednosti zavisne varijable s pomakom u vremenu kao eksplanatorne varijable, tj. test nije primjenjiv na modele kao

t1t2t10t uYXY

poznate pod nazivom autoregresijski modeli.

Izraz (21) može se približno pisati kao

)ˆ1(2d (22)

gdje je

n

1t

2

t

n

2t

1tt

e

ee

(23)

koji je procjenjivač koeficijenta autokorelacije autoregresijske funkcije dane izrazom (19). Kada ispitujemo je li autokorelacija prisutna u ocijenjenom modelu, tada zapravo

testirano hipotezu je li autokorelacijski parametar iz relacije (19) jednak ili različit

od nule. Ako je =0 u relaciji (19), tada je ut=t, pa odstupanja u regresijskoj jednadžbi neće biti autokorelirana. Zato za nul hipotezu da nema autokorelacije,

možemo upotrijebiti 0:=0. Za alternativnu hipotezu možemo upotrijebiti A:>0 ili

A:<0 ili A:≠0. U većini ekonomskih empirijskih istraživanja koristi se A:>0 jer je pozitivna autokorelacija u praksi najčešća.

Kako je -10 vrijedi:

0ˆ , d2, nema autokorelacije

1ˆ , d0 postoji savršena pozitivna autokorelacija

1ˆ , d4 postoji savršena negativna autokorelacija

Izračunati d kreće se u intervalu [0,4]. Što je bliže vrijednosti 0, pokazatelj je pozitivne autokorelacije, a čim je bliže vrijednosti 4, pokazatelj je negativne autokorelacije. Kada se vrijednost od d kreće oko 2, znači da autokorelacije nema. No postoje i vrijednosti kada nismo sigurni za postojanje autokorelacije (tablica 4)

Tablica 4: Durbin-Watsonov pokazatelj (test veličine)

POZITIVNA AUTOKORELACIJA

(odbaciti H0) ?

NEMA AUTOKORELACIJE

PRVOG REDA (prihvatiti H0)

?

NEGATIVNA AUTOKORELACIJA

(odbaciti H0)

0 dL dU 2 4- dU 4-dL 4 dU – gornja vrijednost u DW tablici H0: nema autokorelacije dL – donja vrijednost u DW tablici

Page 36: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

14

U DW tablicama nalazimo dvije kritične vrijednosti: dL donju i dU gornju. Te vrijednosti ovise o broju opažanja n i o broju eksplanatornih varijabli k. Durbin-Watsonov test provodi se u nekoliko koraka:

1. Ocijeniti model pomoću metode najmanjih kvadrata i izračunati reziduale et. 2. Izračunati Durbin-Watsonovu d vrijednost iz formule (21). Obično je to rutina

uključena u ekonometrijski programski paket, koja se iskazuje u rezultatima regresijske analize.

3. Naći kritične vrijednosti dL i dU u tablicama za danu veličinu uzorka i broj eksplanatornih varijabli.

4. Zaključak o prisutnosti autokorelacije donosi se prema pravilima u tablici (4) odnosno (5).

Tablica 5: Način donošenja odluke kod Durbin-Watsonovog testa

VRIJEDNOST DW ODLUKA

0<d<dL odbaciti H0: prisutna pozitivna autokorelacija

dLddU bez odluke

dU<d4 prihvatiti H0: nema autokorelacije

4d4- dU prihvatiti H0: nema autokorelacije

4- dUd4-dL bez odluke

4-dL<d<4 odbaciti H0: prisutna negativna autokorelacija

Iz primjera o plaćama i produktivnosti rada regresijski rezultati dali su d vrijednost od 0,2136 (izraz 21). Iz Durbin-Watsonove tablice vidimo da je za n=45 i jednu eksplanatornu varijablu, dL=1,475 a dU=1,566 na razini signifikantnosti od 5%. Kako je izračunati d=0,2136 ispod donje kritične vrijednosti od 1,475 zaključujemo da postoji pozitivna autokorelacija u rezidualima regresije o plaćama i produktivnosti rada. 2.4. OTKLANJANJE AUTOKORELACIJE Autokorelacija se otklanja generaliziranom metodom najmanjih kvadrata (GLS- Generalized Least Squares). Generalizirana metoda najmanjih kvadrata koristi tehniku kvazidiferenciranja kako bi se autokorelirana odstupanja ut zamijenila odstupanjima vt koja su neautokorelirana. 2.4.1. GENERALIZIRANA METODA NAJMANJIH KVADRATA

Uz pretpostavku da odstupanja slijede autoregresijski proces 1. reda, tj. da vrijedi

izraz (19) i kada je poznat , autokorelacija se može riješiti ako da se izračunaju generalizirane diferencije vrijednosti zavisne varijable po formuli

Yt-Yt-1, pri čemu je

tt10t uXY (24)

Page 37: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

15

Generalizirana diferencijska jednadžba piše se kao

tt1*

10

*

t X)1(Y (25)

gdje je

vt =ut-ut-1

Yt*=Yt-Yt-1

Xt*=X1t-Xt-1

Ocijeni li se jednadžba (25) pomoću OLS, parametri 21ˆ i ˆ najbolje su nepristrane

linearne ocjene, a DW vrijednost je blizu 2. GLS metoda pomaže u ispravljanju autokorelacije, no postoje slučajevi kada ju nije uputno upotrebljavati:

1. Kada se radi o nepravoj autokorelaciji, tj. kada je uzrok autokorelacije specifikacijska pogreška. Tada je rješenje ispravljanje specifikacijske pogreške.

2. Kada se radi o malim uzorcima teško je naći dobru ocjenu i, ako se koristi

loša ocjena , pomoću GLS može se dobiti lošije ocjene parametara modela

nego što su bile, a kako znamo, kod prisutnosti autokorelacije ocjene parametara dobivene metodom najmanjih kvadrata, neefikasne su, ali nisu pristrane.

2.4.2. METODE PROCJENJIVANJA

Procjenjivanje autoregresijskog parametra nije problem, budući da ekonometrijski programski paketi to rade automatski. Ukoliko se radi o malom uzorku podataka, moguće je da će izračunavanje pomoću poznatog d i relacije (22) dati bolju ocjenu

nego generiranjem pomoću računalne procedure. Postoji nekoliko pristupa

procjenjivanju vrijednosti među kojima se mogu spomenuti: Cochran-Orcutt procedura Hildret-Lu procedura

Cochran-Orcutt procedura:Radi se o iterativnoj proceduri kojom računalo izračunava niz vrijednosti sve dok razlike među njima nisu zadovoljavajuće male.

Hildret-Lu procedura: Zasniva se na definiranju mogućih vrijednosti za i

ocjenjivanju nekoliko regresija pomoću GLS kak bi se našlo transformaciju koja minimizira RSS. 3. HETEROSKEDASTIČNOST

Heteroskedastičnost je problem koji je uglavnom povezan s podacima vremenskog presjeka. Proučavamo li vezu između dohotka zaposlenih i potrošnje, interpretacija ocijenjenih parametara zavisit će o tome odnose li se podaci na godine ili zaposlenika, tj. pratimo li vezu kroz vrijeme ili u određenom vremenskom trenutku.

Page 38: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

16

Ako se podaci odnose na zaposlenika, ocijenjeni regresijski parametar uz varijablu dohodak zavisit će o distribuciji dohotka. Naime, potrošač s većim dohotkom troši više neko onaj s manjim dohotkom. Zbog toga ćemo imati različitu raspršenost (heteroskedastičnost) odstupanja oko regresijske funkcije, koja ostavlja teške posljedice na ocijenjeni model, koje trebamo znati otkriti i pokušati riješiti. 3.1. DEFINICIJA I UZROCI HETEROSKEDASTIČNOSTI Kada četvrta pretpostavka klasičnog linearnog regresijskog modela nije poštivana, varijanca odstupanja je promjenjiva, tj. zavisi o opažanju i, tj.

2

ii )uvar( (26)

tada kažemo da su odstupanja heteroskedastična. Ukoliko je ova varijanca stalna, ona ne zavisi o opažanju i, tj.

2

i )uvar( (27)

tada kažemo da su odstupanja homoskedstična. Heteroskedastičnost je povezana s nezavisnim varijablama. U primjeru potrošnje, veličina varijable dohodak (X) uzrok je različitoj potrošnji (Y). Veličina raspršenosti odstupanja zavisi o veličini varijable X, tj. o veličini dohotka jer ona omogućuje veličinu potrošnje. Heteroskedastičnost je prikazana u (X, Y) prostoru i u (X, u) prostoru. To je slučaj prave heteroskedastičnosti. U slučaju da je kod specifikacije modela ispuštena važna eksplanatorna varijable koja je uzrok heteroskedastičnosti, njezini utjecaji će se prikloniti odstupanjima pa ćemo imati nepravu

heteroskedastičnost koja je nastala zbog specifikacijske pogreške. 3.2. POSLJEDICE HETEROSKEDASTIČNOSTI Heteroskedastičnost ostavlja ozbiljne u slične posljedice na ocijenjeni model kao i autokorelacija, tako su ocjene parametara su nepristrane, ali:

Nisu više efikasne, tj. nemaju minimalnu varijancu (nisu više BLUE). Ocjena varijance parametara je pristrana, što proizlazi iz pristranosti varijance

odstupanja; no ne znamo je li podcijenjena ili precijenjena; zbog toga t i F test nisu valjani.

3.3. OTKRIVANJE HETEROSKEDASTIČNOSTI Otkrivanje heteroskedastičnosti nije lak zadatak. To je zbog toga što nam je stvarna

varijanca i2 nepoznata jer ne raspolažemo podacima za cijelu populaciju. Ne postoji opći efikasan i siguran test za otkrivanje heteroskedastičnosti.

GRAFIČKA METODA

Ova je metoda jednostavan početni način za utvrđivanje heteroskedastičnosti. Mogu se prikazati reziduali prema pojedinoj nezavisnoj varijabli ili u slučaju kada više

Page 39: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

17

nezavisnih varijabli zajedno uzrokuje heteroskedastičnost, koristi se prikaz reziduala prema ocijenjenoj vrijednosti zavisne varijable. Reziduale je korisno prikazati u (X, Y) prostoru i u (X, u) prostoru. Takvi prikazi daju istu informaciju, ali iz različite perspektive i korisni su i onda kada nismo sigurni koja je od nezavisnih varijabli u višestrukoj regresiji uzrokovala heteroskedastičnost. Katkad je korisno umjesto reziduala ei, prikazati njegove kvadrirane vrijednosti ei2. Iako to nisu stvarne vrijednosti ui2, ei2 su njihova dobra zamjena, pogotovo ako se radi o velikom uzorku.

Kraći način u višestrukoj regresiji ispitivanje je grafičkog odnosa između ei2 i iY zato

što je iY linearna kombinacija nezavisnih varijabli, Xk.

Grafička metoda ne omogućuje precizno ispitivanje heteroskedastičnosti već je potrebno koristiti rigoroznije metode. U nastavku se obrazlažu neke od najčešće korištenih metoda, no općenito ne postoji najbolja metoda jer uspješnost otkrivanja zavisi o izvoru heteroskedastičnosti. Testovi koji se uobičajeno koriste za otkrivanje heteroskedastičnosti su:

Prak test Goldfeld-Quandt test Glejser test Breusch-Pagan test CUSUMSQ test Peak test

GOLDFELD-QUANDT TEST

Ovaj se test vrlo često koristi za otkrivanje heteroskedastičnosti. Jednostavan je i ne zahtijeva poznavanje oblika funkcijske veze između reziduala i nezavisne varijable koja je uzrok heteroskedastičnosti. Osnovna ideja jest da je varijanca pridružena velikim vrijednostima varijable X, značajno različita od varijance pridružene malim vrijednostima varijable X (za koju se pretpostavlja da je razlog heteroskedastičnosti). Ta pretpostavka se testira F testom, gdje je nul hipoteza da je varijanca konstantna (postojanje homoskedastičnosti). Koraci kod Goldfeld-Quandt testa su:

1. Složiti empirijske podatke varijable X (za koju se pretpostavlja da je razlog heteroskedastičnosti) prema veličini.

2. Izbaciti srednji dio d opažanja, obično petinu opažanja. 3. Ocijeniti dvije zasebne regresije, posebno za niske vrijednosti Xi i posebno za

visoke vrijednosti varijable X. Svaka regresija imat će (n-d)/2 podataka i [(n-d)/2]-2 stupnjeva slobode. Izračunati RSS1 i RSS2 iz dviju regresija.

4. Izračunati omjer RSS2/RSS1 tako da budu u brojniku RSS za niz većih vrijednosti Xi. Taj omjer je F vrijednosti sa (n-d-4)/2 stupnjeva slobode za brojnik i nazivnik. Ako je veći od kritične tablične F vrijednosti, nul hipoteza da postoji homoskedastičnost se odbacuje.

3.4. OTKLANJANJE HETEROSKEDASTIČNOSTI Kod otkrivanja heteroskedastičnosti dobro je u praksi primijeniti više metoda s obzirom da niti jedna od njih nije sasvim pouzdana. Znamo da su ocjene parametara kod prisutnosti heteroskedastičnosti neefikasne i zato da je heteroskedastičnost

Page 40: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

18

utvrđena potrebno je model transformirati kako bismo dobili odstupanja koja se ponašaju homoskedastično. Način transformacije modela zavisi o tome je li stvarna

varijanca pogreške i2 poznata ili nije. Uklanjanje heteroskedastičnosti kada je varijanca poznata. Vagana metoda

najmanjih kvadrata

Kada je varijanca odstupanja i2 poznata, heteroskedastičnost je lako riješiti. Objasnit ćemo to na modelu jednostavne regresije

i110i uXY (28)

kojeg transformiramo tako da cijelu jednadžbu podijelimo sa i kojeg dobivamo iz

poznate varijance i2:

i

i

i

11

i

0

i

i uX1Y

(29)

Odstupanja su sada transformirana i označavaju se sa vt:

i

it

uv

(30)

Kada se upotrijebi metoda najmanjih kvadrata za ocjenu modela (29), kaže se da se koristi vagana metoda najmanjih kvadrata (WLS-Weighted Least Squares).

Uklanjanje heteroskedastičnosti kada varijanca nije poznata

Na žalost, u praksi je stvarna vrijednost varijance pogreške i2 rijetko poznata. Zbog toga smo prisiljeni pretpostavljati oblik heteroskedastičnosti i transformirati model kako bi imao odstupanja sa svojstvom homoskedastičnosti. Te transformacije su u literaturi poznate pod nazivom transformacije stabiliziranja varijance. Neke od tih transformacija su: varijanca pogreške je proporcionalna varijabli X te varijanca pogreške je proporcionalna X2. Varijanca pogreške je proporcionalna varijabli X2

Ako je graf raspršenosti reziduala ocijenjenog model sličan slici (6), onda to može biti pokazatelj da je varijanca pogreške proporcionalna varijabli X2. Tada transformiramo originalni mode tako da obje strane jednadžbe podijelimo s X. PRIMJER

Ocijenit ćemo jednostavni regresijski model izdataka za obrazovanje O (u % GDP) kao funkcije visine GDp (u mlrd $) G za grupu od 31 zemlje za 1980. godinu (tablica 6).

Page 41: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

19

Tablica 6: Izdaci za obrazovanje (% GDP), GDP (mlrd $) i broj stanovnika

(mil) za grupu zemalja 1980. godine.

zemlja izdaci za obrazovanje GDP broj stanovnika

Urugvaj 0,22 10,13 2,90 Singapur 0,32 11,34 2,39 Irska 1,23 18,88 3,44 Izrael 1,81 20,94 3,87 Mađarska 1,02 22,16 10,71 Novi Zeland 1,27 23,83 3,10 Portugal 1,07 24,67 9,93 Hong Kong 0,67 27,56 5,07 Čile 1,25 27,57 11,10 Grčka 0,75 40,15 9,60 Finska 2,80 51,62 4,78 Norveška 4,90 57,71 4,09 Danska 4,45 66,32 5,12 Turska 1,60 66,97 44,92 Austrija 4,26 76,88 7,51 Švicarska 5,31 101,65 6,37 Saud. Arabija 6,40 115,97 8,37 Belgija 7,17 119,49 9,86 Švedska 11,22 124,15 8,31 Australija 8,66 140,98 14,62 Argentina 5,56 153,85 27,06 Nizozemska 13,41 169,38 14,14 Meksiko 5,46 186,33 67,40 Španjolska 4,79 211,78 37,43 Brazil 8,92 249,72 123,03 Kanada 18,90 261,4 23,94 Italija 15,95 395,52 57,04 Vel. Britanija 29,90 534,97 55,95 Francuska 33,59 655,29 53,71 Njemačka 38,62 815,00 61,56 Japan 61,61 1040,45 116,78

U grupi zemalja su i male i velike zemlje, koje imaju različite mogućnosti izdvajanja za obrazovanje i ta izdvajanja se kreću od 1,9% do 9% GDP. Ocijenjeni model glasi

617,23F 9551,0R

(24,844) (-0,471) t

G05373,03159,0O

2

ii

(31)

Model izgleda dobro prilagođen podacima. R2 i F vrijednosti su visoke, predznak parametra uz nezavisnu varijablu slaže s a priori očekivanjima. Ipak, budući da se radi o podacima vremenskog presjeka, realno je očekivati prisutnost heteroskedastičnosti. Jasno je da će veće zemlje imati veću varijaciju u izdvajanju za obrazovanje nego one manje. U prvom koraku pogledat ćemo grafove reziduala. Na slici 6 prikazan je dijagram raspršenosti podataka izdvajanja za obrazovanja.

Slika 6: Reziduali ocijenjene funkcije izdataka za obrazovanje

Page 42: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

20

-6,3

-4,3

-2,3

-0,3

1,7

3,7

5,7

0 200 400 600 800 1000 1200

GDP

Re

zid

ua

li

Vidimo da raspršenost raste kako raste GDP.

Slika 7: Reziduali ocijenjene funkcije izdataka za obrazovanje

-10

0

10

20

30

40

50

60

70

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

izd

aci

za o

bra

zo

van

je

reziduali ocijenjene vrijednosti stvardi podaci izdvajanja za obrazovanje

To je još očitije na gornjoj slici gdje je na dnu prikazana krivulja reziduala, a gornje dvije krivulje predstavljaju ocijenjene vrijednosti i stvarne podatke izdvajanja za obrazovanje. Zemlje su poredane po veličini GDP. Očito je da rezidualna varijanca raste od 18. podatka. Iako slike ukazuju na postojanje heteroskedastičnosti, pouzdaniji su pokazatelji testovi. Pokazat ćemo primjenu Goldfeld-Quandt testa. U tablici 6 zemlje su već poredane po veličini GDP. Izbacit ćemo 7 zemalja u sredini niza i ocijeniti dvije regresije, za prvu grupu s manjim GDP i za drugu grupu s većim GDP. Rezultati za obje regresije dani su u tablici 7.

Tablica 7: Rezultati dviju regresija

SUMMARY OUTPUT

ZEMLJE S NIŽIM DOHOTKOM: 1-12 Regression Statistics

Multiple R 0,822157

R Square 0,675942

Adjusted R Square 0,643536

Standard Error 0,767811

Observations 12

ANOVA

df SS MS F Significance F

Regression 1 12,29689 12,29689 20,85866 0,001031

Residual 10 5,895339 0,589534

Total 11 18,19223

Page 43: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

21

Coefficients Standard Error

t Stat P-value Lower 95% Upper 95%

Lower 95,0%

Upper 95,0%

Intercept -0,57305 0,493851 -1,16037 0,272849 -1,67342 0,527317 -1,67342 0,527317

X Variable 1 0,071864 0,015735 4,567128 0,001031 0,036804 0,106924 0,036804 0,106924

SUMMARY OUTPUT

ZEMLJE S NIŽIM DOHOTKOM: 20-31

Regression Statistics

Multiple R 0,968981

R Square 0,938925 Adjusted R Square 0,932817 Standard Error 4,504387

Observations 12

ANOVA

df SS MS F Significance F

Regression 1 3119,168 3119,168 153,7331 2,15E-07

Residual 10 202,895 20,2895

Total 11 3322,063

Coefficients Standard

Error t Stat P-value Lower 95% Upper 95%

Lower 95,0%

Upper 95,0%

Intercept -2,30991 2,249359 -1,02692 0,328658 -7,32179 2,701977 -7,32179 2,701977

X Variable 1 0,05672 0,004575 12,39892 2,15E-07 0,046527 0,066913 0,046527 0,066913

Omjer RSS za drugu skupinu zemalja i RSS za prvu skupinu zemalja iznosi 34,41, a kritična F-vrijednost uz 5% signifikantnosti za (n-7-4)/2=10 stupnjeva slobode iznosi 2,97. Kako je kritična vrijednost manja od izračunate, odbacuje se nul hipoteza da postoji homoskedastičnost. Sada, kada je jasno da heteroskedastičnost postoji, treba vidjeti bismo li mogli problem riješiti. Radi se o izdvajanju koje ovisi o visini GDP, a znamo da zemlje s brojnijom populacijom uglavnom imaju i veći GDP, a i veća ulaganja u obrazovanje. Zbog toga očekujemo da je varijanca proporcionalna varijabli broj stanovnika (P). Primijenit ćemo vaganu metodu najmanjih kvadrata tako da ćemo cijelu funkciju podijeliti s varijablom P, tj.

i

i

i

i1

i

0i

P

u

P

G

P

1

p

O (32)

odnosno ako uvedemo nove oznake O/P=OP, i/P=RP, G/P=GP i u/P=v, imat ćemo nove varijable: OP: izdvajanje za obrazovanje po stanovniku, GP bruto društveni proizvod po stanovniku, tj. GDPPC, a RP je recipročna vrijednost varijable broj stanovnika,

ii1i0i vGPRPOP (33)

Sada imamo regresiju kroz ishodište. Rezultati su u tablici 8.

Tablica 8.: Rezultati vagane metode najmanjih kvadrata

Page 44: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

22

SUMMARY OUTPUT

Regression Statistics

Multiple R 0,905689

R Square 0,820273

Adjusted R Square 0,779593

Standard Error 0,15437

Observations 31

ANOVA

df SS MS F Significance

F

Regression 2 3,15405 1,577025 66,17795 2,45E-11

Residual 29 0,691072 0,02383

Total 31 3,845122

Coefficients Standard

Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%

GP 0,062988 0,003988 15,7927 8,83E-16 0,05483 0,071145 0,05483 0,071145

RP -0,1457 0,21865 -0,66638 0,510433 -0,59289 0,301485 -0,59289 0,301485

Ako usporedimo slike reziduala, vidimo da su onu ravnomjernije raspršeni oko nule.

Slika 8: Reziduali ocijenjene funkcije izdataka po stanovniku

-0,3

-0,1

0,1

0,3

0,5

0 5 10 15 20

GDPpc

Re

zid

ua

li

Ocijenjeni parametri originalnog modela i transformiranog modela vrlo su slični po veličini, nešto su veći kod transformiranog modela, dok su t vrijednosti manje. Zaključujemo da jeheteroskedastičnost u originalnom modelu podcijenila standardne pogreške. R2 je visok, ali nije usporediv jer su u transformiranom modelu radi o drugoj zavisnoj varijabli. Primijenjen je ponovo Goldfeld-Quandt test na transformirani mode. Prije toga je bilo potrebno ponovno sortirati podatke jer se radi o novoj varijabli, a to je GDPPC. Opet su ocijenjene dvije regresije i kroz ishodište, za prvih 12 i posljednjih 12 zemalja rangiranih prema GDPPC. Dobili smo da je RSSS omjer 0,0,3875. To je nešto veći iznos od tablične kritične vrijednosti FC=2,987 za 10 d.f. i 5% signifikantnosti, no, ako uzmemo signifikantnost od 1%, FC= 4,85, prihvaćamo nul hipotezu da je prisutna homoskedastičnost.

Page 45: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

23

ZADACI ZA VJEŽBU

1. ZADATAK Ocijenjeni su modeli kumulativnih troškova održavanja strojeva (O) u tvornici za vrijeme od 27 tjedana. a kao nezavisne varijable uzete su starost strojeva (G) i sati rada strojeva (S). Ocijenjeni su modeli:

Model A:

897,0R

(22,2) t

G48,815,630O

2

tt

Model B:

843,0R

(16,25) t

S25,5005,875O

2

tt

Model A:

942,0R

(-0,49) (1,75) t

S15,149G63,2556,7O

2

ttt

a) Kakve predznake parametara očekujete? b) Koji biste model prihvatili i zašto? c) Koeficijent jednostavne linearne korelacije između varijabli G i S iznosi 0.996 vodeći računa o

ostalim pokazateljima u modelu C. obrazložite postojanje multikolinearnosti. 2. ZADATAK U tablici su dati podaci o količini prodanih proizvoda (X) i ukupnog prihoda poduzeća (Y): Y 175 370 520 640 795 859 854 840 782 640 525 160

X 5 10 15 20 25 30 35 40 45 50 55 60

a) Ocijenite linearnu regresijsku funkciju. b) Testirajte ocijenjenu funkciju na prisutnost autokorelacije prvog reda uz signifikantnost 5%. c) Prikažite graf raspršenosti reziduala. d) Na osnovi grafičkog prikaza zaključite što je uzrok autokorelacije. e) Kako se takva autokorelacije zove.? f) Može li se primijeniti GLS za otklanjanje ove vrste autokorelacije?

3. ZADATAK

Na osnovi podataka popisa stanovništva ocijenjen je model ii10i uYO za 59 popisnih

područja, gdje je O omjer broja domaćinstava s vlastitim stambenim prostorom i broja domaćinstava s iznajmljenim stambenim prostorom, a Y dohodak domaćinstava. Ocijenjeni model glasi:

59n 597,0R

(3,50) (-3,64) t

Y000297,022,2O

2

ii

a) Obrazložite očekujete li prisutnost heteroskedastičnosti u modelu. b) Kako biste primijenili WLS metodu na ovaj model.

Page 46: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

24

RJEŠENJA ODABRANIH ZADATAKA

1. ZADATAK

a) Parametri uz obje nezavisne varijable bi trebali imati pozitivan predznak. jer porast godina starosti. a isto tako i sati rada strojeva utječu na trošenje pa tako i na izdatke za održavanje strojeva.

b) Prihvatljiv su modeli A i B. dok model C nije. Nezavisna varijabla u modelu A ima očekivani predznak i značajna je za objašnjenje kumulativnih troškova održavanja. 90% varijacija tih troškova objašnjeno je modelom. Isto tako je i s modelom B samo što ima nešto manji koeficijent determinacije. U modelu C varijabla S ima neočekivani predznak. a nije značajna za model. kao ni varijabla G.

c) Jednostavni koeficijent korelacije pokazuje da se radi o visoko koreliranim varijablama. koje zapravo mjere istu pojavu. tj. istrošenost strojeva. Visoka vrijednost R2 i niske t-vrijednosti nezavisnih varijabli. sve su to pokazatelji jake multikolinearnosti. Posljedica je promijenjen predznak uz varijablu S i neefikasne ocjene parametara.

2. ZADATAK

a)

0,215F 0,3994DW 0211,0R 12n

(0,464) t

X03497,2530,530Y

2

ii

b) H0:=0. HA:≠0. dL=0.971. dU=1.331. d<dL. prihvaćamo HA. tj. prihvaćamo pretpostavku da su pogreške autokorelirane.

c) Dijagram raspršenosti reziduala

X

Re

sid

ua

ls

d) Ocijenjena je linearna funkcija umjesto polinoma. e) Neprava autokorelacija. f) Ne. Potrebno je ispraviti grešku specifikacije koja je uzrok autokorelacije.

3. ZADATAK

a) Radi se o podacima vremenskog presjeka i očekujemo različitu raspršenost podataka po popisnim područjima.

b) Viša razina dohotka utječe na veću raspršenost zavisne varijable. Vaganu metodu najmanjih kvadrata primijenit ćemo tako da cijeli model podijelimo varijablom dohodak, koja je uzrok heteroskedastičnosti.

LITERATURA

1. Biljan-August, M,; Pivac, S.; Štambuk, A. (2007.), «Primjena statistike u ekonomiji», Ekonomski fakultet

Sveučilišta u Rijeci, Rijeka. 2. Gujarati, D. (1992.), «Essentials of Econometrics», McGraw-Hill, New York. 3. Jovičić, M. (1989.), «Ekonometrijski metodi», Ekonomski fakultet, Beograd. 4. Jurun, E; Pivac, S.; Arnerić, J. (2006.), «Primijenjena ekonometrija 1», Sveučilište u Splitu, Ekonomski fakultet,

Split. 5. Kmenta, J. (1997.), «Počela ekonometrije», MATE, Zagreb. 6. Lovrić, LJ. (2005.), «Uvod u ekonometriju», Sveučilište u Rijeci, Ekonomski fakultet Rijeka. 7. Maddala, G. S. (1992.), «Introduction to Econometrics», Second Edition, Macmillian Publishing Company, New

York. 8. Šošić, I. (2004.), «Primijenjena statistika», Školska knjiga, Zagreb.

Page 47: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

FAKULTET ZA MENADŽMENT U TURIZMU I UGOSTITELJSTVU U OPATIJI

EKONOMETRIJA

8. TEMATSKA JEDINICA

Opatija, 2012.

Page 48: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

1

OSMA TEMATSKA JEDINICA

SPECIFIKACIJA MODELA I PREDVIĐANJE EKONOMETRIJSKIM MODELOM UVOD

1. FUNKCIJSKI OBLIK REGRESIJSKOG MODELA 2. SPECIFIKACIJSKE POGREŠKE

2.1. KARAKTERISTIKE KOREKTNO SPECIFICIRANOG MODELA

2.2. POGREŠKE KOD ODABIRA VARIJABLI

3. TESTOVI SPECIFIKACIJSKIH POGREŠAKA 4. PREDVIĐANJE

4.1. PREDVIĐANJE EKONOMETRIJSKIM MODELOM

4.2. TESTIRANJE MOĆI PREDVIĐANJA REGRESIJSKOG MODELA

LITERATURA

UVOD

Pod specifikacijom ekonometrijskog modela podrazumijeva se odabir prave funkcijske veze te odabir važnih objasnidbenih varijabli u modelu. Ukoliko se ta dva koraka ne obave kako treba dolazi do specifikacijske pogreške, koja ostavlja najteže posljedice na ocijenjeni model. Koristeći nepravilno specificiran ekonometrijski model dolazi se do pogrešnih zaključaka u njegovoj interpretaciji i ekonomskoj primjeni. Stoga, specifikacija predstavlja najteži i najvažniji korak u ekonometrijskom istraživanju. 1. FUNKCIJSKI OBLIK REGRESIJSKOG MODELA Pri odabiru funkcijskog oblika potrebno je rukovoditi se ekonomskom teorijom. Veza između zavisne i nezavisnih varijabli razmatranog problema trebala bi se usporediti s različitim funkcijskim oblicima i izabrati onaj koji je po svojstvima najbliži ekonomskim teorijskim postavkama o kojima je riječ. Tablica 1 daje pregled najčešće upotrebljavanih funkcijskih oblika.

Tablica 1: Pregled najčešće upotrebljavanih funkcijskih oblika

VRSTA MODEL

1. LINEARNI ii10i uXY

2. RECIPROČNI i

i

10i uX

1Y

3. EKSPONENCIJALNI ii10i uXlnYln

4. POLU-LOG

ii10i

ii10i

uXlnY

uXYln

Pogrešna funkcijska veza može imati za posljedicu da se, inače važna objasnidbena varijabla, može pokazati nesignifikantnom ili imati neočekivani predznak. Kako je već ranije spomenuto, ekonometričarima je važno da je model linearan u parametrima, ali ne mora biti linearan u varijablama.

Page 49: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

2

LINEARNI MODEL

Linearni model se uzima kao osnova za proučavanje regresije

ii22i110i uXXY (1)

Nagib u modelu je konstantan, jer je

1,2k dY

dYk

k

(2)

Elastičnost nije konstantna

Y

X

dX

dY

Y

XE k

k

k

kX,Y k

(3)

Koeficijent elastičnosti predstavlja % promjene zavisne varijable Y kao posljedica promjene nezavisne varijable X za 1%, držeći ostale nezavisne varijable u modelu na konstantnoj razini. Treba napomenuti problem regresije kroz ishodiše, tj. regresijski model iz izraza (1)

bez parametra 0. Takav model ne zadovoljava 2. klasičnu pretpostavku da je suma odstupanja jednaka nuli. Zbog navedenih problema, a i zbog mogućnosti specifikacijske pogreške ako se koristi regresija kroz ishodište a da to ne odgovara stvarnom modelu, potrebno je takav model izbjegavati. Ukoliko je ipak teorijski i praktično regresija kroz ishodište adekvatna, tada model treba biti ocijenjen s većom preciznošću. EKSPONENCIJALNI MODEL

Eksponencijalna funkcija je vrlo često upotrebljavana u ekonomskim istraživanjima. To je funkcija koja se može linearizirati logaritamskom transformacijom:

i21 u

i2i10i eXXY (4)

ii22i110i uXlnXlnlnYln (5)

Supstitucijom ln0=0, dobije se

ii22i110i uXlnXlnYln (6)

Ovako log-linearizirani model može se ocijeniti metodom najmanjih kvadrata, pod uvjetom da u podacima nema negativnih opažanja. Karakteristika eksponencijalnog modela konstantna je elastičnost:

1,2k dX

dY

Y

XE k

k

kX,Y k

(7)

Page 50: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

3

Ekonomistima je najpoznatiji eksponencijalni model Cobb-Douglasova funkcija proizvodnje:

ttt0t uKLQ 21 (8)

gdje je: Q – količina proizvodnje L – uloženi rad K – uloženi kapital

012 – parametri regresije u – slučajna varijabla Zbog svojstva konstantne elastičnosti eksponencijalni model često se koristi za specificiranje funkcije ponude te potražne odnosno potrošnje. POLU-LOG MODELI

Modeli (9) i (10) zovu se polu-log modeli jer je samo zavisna ili nezavisna varijabla u logaritamskom obliku.

ii10i uXYln (9)

ii10i uXlnY (10)

U modelu (9) parametar 1 mjeri udio relativne vrijednosti promjene Y u datoj apsolutnoj vrijednosti promjene od X:

dX

Y

dY

dX

dYY

1

dX

)Y(lnd1

(11)

Ako varijabla X predstavlja vrijeme, tada parametar 1 predstavlja stopu rasta varijable Y. PRIMJER

Tablica 2: Kretanja realne neto plaće (D) u kunama (stalne cijene 1996.

godine) za razdoblje od 1996.-2003. godine

GODINE D Dnl Dnle

1 2032 7,616776 2164,89

2 2282 7,732808 2274,99

3 2419 7,79111 2390,68

4 2663 7,887209 2515,26

5 2754 7,92081 2640,03

6 2798 7,93666 2774,29

7 2884 7,966933 2915,38

8 2915 7,977625 3063,64

Page 51: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

4

Ocijenjen je model (9) kretanja realne neto plaće (D) u kunama (stalne cijene 1996. godine) za razdoblje od 1996.-2003. godine:

8959,0R

(7,18671)t

t4905,063052,7Dln

2

(12)

Iz modela se čita da je u razdoblju 1996. – 2003. godine prosječna realna neto plaća u RH rasla po prosječnoj stopi od 4,9%. Slika 1: Kretanje realne prosječne neto plaće u RH u razdoblju 1996.-2003.

y = 7,6305+0,0496x

7,55

7,6

7,65

7,7

7,75

7,8

7,85

7,9

7,95

8

8,05

0 2 4 6 8 10

godine

lnD

Ocjenjivanjem linearnog trenda za iste podatke, dobije se:

9192,0R

(8,2644)t

04,1242,2035

2

tDt

(13)

Iz ocijenjenog linearnog modela očitava se da je u razdoblju 1996.-2003. godine realna plaća po zaposlenome u RH rasla u apsolutnom iznosu prosječno 124 kune godišnje (Slika 2). Slika 2: Kretanje realne prosječne neto plaće u RH u razdoblju 1996.-2003.

y = 2035,2+124,04t+e

0

500

1000

1500

2000

2500

3000

3500

0 2 4 6 8 10

vrijeme

D

Izbor modela zavisi o tome želimo li dobiti apsolutnu ili relativnu promjenu prosječne plaće. S obzirom da su za oba modela zavisne varijable izražene u različitim jedinicama, ne može se jednostavno uspoređivati izračunate koeficijente determinacije. U tom slučaju koristimo kvazi R2 pokazatelj kako bismo mogli usporediti ocijenjene vrijednosti nelinearne zavisne varijable s originalnim vrijednostima zavisne varijable:

Page 52: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

5

2i

2Ynl

i2

YY

eY1kvaziR

i

(14)

To znači da iz (12) izračunamo ocijenjene vrijednosti tDnl , zatim izračunamo

antilogaritam tih vrijednosti i onda koeficijent determinacije prema izrazu (14).

Vrijednosti izračunatih ocijenjenih vrijednosti tDnl i njihovih antilogaritama dani su

u tablici 2. Izračunati kvazi R2 za model (12) iznosi 0,88923 i ova vrijednost se sada može usporediti sa R2 linearnog modela. Linearni model pokazuje nešto bolju prilagođenost.

U modelu (10), parametar 1 mjeri odnos apsolutne vrijednosti promjene Y i date relativne vrijednosti promjene od X:

X

dX

dY

dXX

1

dY

)X(lnd

dY1

(15)

RECIPROČNI MODELI

Recipročni (inverzni) model prikazuje Y kao funkciju inverzne vrijednosti jedne ili više nezavisnih varijabli:

ii22

i

10i uXX

1Y (16)

Recipročni model se koristi kada utjecaj neke zavisne varijable na zavisnu varijablu teži nuli kada ta nezavisna varijabla teži u beskonačnost. PRIMJER

Ocjenjuje se Phillipsova krivulja za SAD za razdoblje 1958.-.1969. Podaci su dani u tablici 3. Tablica 3: Kretanje stope rasta plaće radnika (Y) i stope nezaposlenosti

(X)u SAD-u u razdoblju 1958.-1969.

GODINA Y X

1958 4,2 6,8

1959 3,5 5,5

1960 3,4 5,5

1961 3,0 6,7

1962 3,4 5,5

1963 2,8 5,7

1964 2,8 5,2

1965 3,6 4,5

1966 4,3 3,8

1967 5,0 3,8

1968 6,1 3,6

1969 6,7 3,5

Ocijenjeni model glasi:

Page 53: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

6

19,36F 6253,0R 6594,0R

(4,3996) (-0,2572) t

X

15879,202594,0Y

22

t

t

(17)

Model je dobro prilagođen podacima, iako parametar 0 od -0,2594 nije statistički signifikantno različit od nule. Slika 3: Kretanje stope rasta plaće radnika (Y) i stope nezaposlenosti (X)u

SAD-u u razdoblju 1958.-1969.

0

1

2

3

4

5

6

7

8

0 0,05 0,1 0,15 0,2 0,25 0,3

stopa nezaposlenosti

sto

pa r

asta

pla

ća r

ad

nik

a

2. SPECIFIKACIJSKE POGREŠKE Jedna od pretpostavki klasičnog modela je da je model korektno specificiran. Zbog toga se mora znati što su karakteristike takvog modela, koje se specifikacijske pogreške javljaju i kako ih se otkriva. 2.1. KARAKTERISTIKE KOREKTNO SPECIFICIRANOG MODELA U empirijskoj analizi model mora biti odabran slijedom nekoliko kriterija odnosno smjernica: SAŽETOST. Model je pojednostavljena slika stvarnosti. Model nikada ne može u potpunosti prikazati stvarnost. Određena razina apstrakcije ili pojednostavljenja neizbježna je u svakom modelu. Model mora biti što je moguće jednostavniji. Presloženi modeli nemaju praktičnu vrijednost. Načelo sažetosti kaže da model treba biti toliko jednostavan koliko može biti, tj. u model treba uključiti nekoliko ključnih varijabli kojima će se obuhvatiti bit proučavane pojave i prepustiti sve manje i slučajne utjecaje odstupanjima. IDENTIFICIRANOST. Postoji samo jedna ocjena za određeni parametar, tj. za dati skup podataka parametri trebaju imati jedinstvenu vrijednost. PRILAGOĐENOST. Kvaliteta modela utvrđuje se i njegovom prilagođenošću empirijskim podacima, tj. što su bolje varijacije zavisne varijable objašnjene varijacijama nezavisnih varijabli u modelu, to je model reprezentativniji. Prilagođenost se mjeri pomoću koeficijenta determinacije i korigiranog koeficijenta determinacije, ali i ostali kriteriji reprezentativnosti moraju biti zadovoljeni.

Page 54: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

7

TEORIJSKA DOSLJEDNOST. Bez obzira na zadovoljavajuće mjere prilagođenosti, model se može smatrati ne dobrim ukoliko jedan ili više koeficijenata ima krivi predznak. Stoga, je potrebno prije konstrukcije modela, posjedovati određena teorijska znanja. Model stoga, treba zadovoljiti ekonomske kriterije, tj. predznaci i veličina ocijenjenih parametara trebaju biti u skladu s ekonomskom teorijom. PREDIKTORNA SPOSOBNOST. Kako je Milton Friedman , dobitnik Nobelove nagrade, izjavio: «Jedini relevantni test valjanosti određene hipoteze [modela] je uspoređivanje njene moći predviđanja s iskustvom». Visoki koeficijent determinacije znači visoku prediktornu moć modela, ali unutar uzorka podataka za koji je ocijenjen. Ovdje je važna objasnidbena moć modela koja se utvrđuje post predviđanjem, tj. koristeći empirijske podatke za nezavisne varijable izvan uzorka na osnovi kojih je model ocijenjen. 2.2. POGREŠKE KOD ODABIRA VARIJABLI Osnova za odabir nezavisnih varijabli u model ekonomska je teorija. Međutim, to su samo opće upute, tj. riječ je o samo primarnom skupu varijabli koje treba uključiti, no postoje i druge varijable koje mogu imati ili ne moraju imati utjecaj na zavisnu varijablu koja se modelom želi objasniti. Zbog toga se može dogoditi pogreška da je iz modela ispuštena važna varijabla ili da je uključena nevažna varijabla. Takve pogreške ostavljaju specifične posljedice na ocijenjeni model i zato ih je potrebno znati otkriti i izbjeći. Razmotrit ćemo kakve posljedice ostavlja pogreška kod odabira nezavisne varijable u model. Pretpostavimo da želimo regresijom objasniti ponašanje varijable Y pomoću sljedeća dva modela:

ii33i22i110i uXXXY (18)

i

ii110i vXY (19)

U modelu (19) ispustili smo varijablu X2 i X3, što znači da smo pretpostavili da one nemaju sistemske utjecaje na varijablu Y i zato su kao manje važne varijable prepuštene odstupanjima v:

ii33i22i uXXv (20)

Ukoliko se primjeni metoda najmanjih kvadrata na model (18) i model (19), svojstva ocijenjenih parametara ovisit će o tome koji je model dobro a koji nije dobro specificiran. Najprije će se razmotriti posljedice ispuštene važne eksplanatorne varijable, a zatim posljedice uključene nevažne varijable. Posljedice ispuštene varijable Pretpostavimo da je model (18) točan, a ocijenili smo model (19). To znači da smo

pogrešno pretpostavili da je 2=0.

Page 55: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

8

Kakve to posljedice ostavlja na odstupanja i ocjene parametara? Znamo da za točan model (18) vrijede klasične pretpostavke, no kod modela (19) utjecaji ispuštene varijable priklonit će se odstupanjima, tj. vrijedi relacija

uXv 22 (21)

Zbog toga neće biti zadovoljena druga pretpostavka klasičnog model, to znači da očekivana vrijednost odstupanja više neće biti jednaka nuli. Drugim riječima, ako je ispuštena važna varijabla iz modela i postoji korelacija između varijabli uključenih u modeli spuštenih iz modela, ocjena parametra biti će pristrana. Ona će biti i nekonzistentna i pristranost ne nestaje bez obzira koliko je velik uzorak. Varijanca parametra biti će manja nego kod točno specificiranog modela (18), no valja imati na umu da je varijanca pristrana. Posljedice suvišne varijable

Pretpostavimo da je model (19) točan, tj. 2=0, a ocijenili smo model (18). Posljedice na ocijenjeni model nisu tako teške kao u prethodnom slučaju. Uključivanje nevažne varijable ne mijenja potrebna svojstva odstupanja, tj. ona i dalje zadovoljavaju klasične pretpostavke. Ako je u model uključena nevažna varijable, ocjene parametara su nepristrane i konzistentne, ali i neefikasne jer su varijance parametara veće nego što bi bile da je model korektno specificiran. Zbog toga su t-vrijednosti i korigirani koeficijent determinacije manji nego što bi trebali biti, ali ne i koeficijent determinacije. U tablici 4 sažete su posljedice specifikacijske pogreške kod odabira varijabli.

Tablica 4: Posljedice specifikacijske pogreške kod odabira varijabli

POSLJEDICE NA OCIJENJENE PARAMETRE MODELA

ISPUŠTENA VARIJABLA UKLJUČENA NEVAŽNA

VARIJABLA

PRISTRANOST DA* NE VARIJANCA SMANJENA* POVEĆANA*

*uz uvjet da je korelacija među varijablama ≠ 0

3. TESTOVI SPECIFIKACIJSKIH POGREŠAKA Specifikacijske pogreške ostavljaju značajne posljedice na ocijenjeni model. Važan je problem njihovo utvrđivanje. Za utvrđivanje specifikacijskih pogrešaka postoje različiti testovi.

OTKRIVANJE NEVAŽNE VARIJABLE

Ukoliko nismo sigurni da je neka varijabla trebala biti uključena u mode, možemo to utvrditi ispitujući signifikantnost parametra uz varijablu, odnosno primijeniti t-test. Postoje specifikacijski kriteriji za utvrđivanje treba li varijablu uključiti u model, ti kriteriji su:

Page 56: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

9

1. Teorija – treba li teorijski varijabla biti u modelu? 2. t-test – je li ocijenjeni parametar signifikantno različit od nule? 3. Korigirani koeficijent determinacije – povećava li se kada se varijabla uključi u

model? 4. Pristranost – mijenjaju li se koeficijenti ostalih varijabli značajno kada se

varijabla doda u jednadžbu? Ako su odgovori na ova pitanja pozitivni, varijabla pripada modelu, ako su odgovori negativni varijabla se može isključiti iz modela. Ukoliko nismo sigurni da dvije varijable trebaju biti u modelu, npr. X2 i X3 u modelu (19), tada treba primijeniti parcijalni F-test uz hipotezu

0:2=3=0 (22)

Najprije je potrebno ocijeniti model (18), tj. kako se kaže regresiju bez ograničenja te izračunati njegov koeficijent determinacije, RUR2, a zatim ocijeniti model (19), regresiju s ograničenjem, te izračunati njegov koeficijent determinacije, RR2. Nakon toga se izračunava F vrijednost i testira se hipoteza (22):

1knR1

mRRF

2

UR

2

R

2

UR

(23)

gdje je m broj ograničenja (restrikcija) u ovom slučaju je 2 jer se odnosi na vrijednosti dva parametra, n je broj opažanja, k je broj regresora u modelu bez restrikcija. Ovdje je k=4. Ako izračunata F vrijednost nije statistički signifikantna, prihvaćamo nul hipotezu, a drugim riječima znači da prihvaćamo model (19). Otkrivanje nevažne varijable naizgled je jednostavan zadatak, međutim važno je znati da se kod testiranja model od kojeg krećemo uzima kao stvarni model i ne možemo t i F testom iterativno graditi model dodavajući i oduzimajući varijable. Ako krenemo s lošim modelom koji iterativno pospješujemo imat ćemo od početka lošu osnovu i pristranost ako su važne varijable ispuštene. Teorija mora niti osnova s kojom specificiramo model. OTKRIVANJE ISPUŠTENE VARIJABLE I NETOČNE FUNKCIJSKE VEZE

Postoji više razloga za otkrivanje ispuštene varijable i netočne funkcijske veze, neki od tih testova su:

Durbin-Watsonov test RESET test Wald test Hausman test

Durbin-Watsonov test Specifikacijska pogreška uzrok je neprave autokorelacije. Kako se utjecaji ispuštene varijable ili netočne funkcijske veze priklanjaju odstupanjima, ona više isu nezavisno distribuirana. Graf reziduala kod modela koji ima specifikacijsku pogrešku ima određeni oblik, pa se pomoću DW testa potvrđuje prisutnost autokorelacije.

Page 57: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

10

Ramseyev RESET test To je regresijski test specifikacijske pogreške, opći test kojim se utvrđuje hoće li se prilagođenost funkcije

ii110i uXY (24)

značajno poboljšati ako se u analitički oblik funkcije uvode varijable 432 Y i Y,Y . To je

polinom varijable Y koju dobivamo ocjenjivanjem modela (24). Kako polinom ima dobru moć prilagodbe, pomoći će nam da utvrdimo postoji li specifikacijska pogreška zbog pogrešno odabranog funkcijskog oblika. Ako nema takve pogreške,

onda bi parametri uz potencije Y , trebali biti jednaki nuli, što ćemo utvrditi pomoću F testa. RESET test provodi se u 3 koraka:

1. Pomoću metode najmanjih kvadrata ocijeni se funkcija (24).

2. Iz izračunate funkcije izračunaju se Y vrijednosti, zatim se računaju

vrijednosti 432 Y i Y,Y i dodaju modelu (24) kao dodatne eksplanatorne

varijable.

i

4

4

3

3

2

2i110i vYYYXY (25)

3. Uspoređuje se prilagodba modela (24) i (25) pomoću F testa

1UPnR1

NPRRF

2

N

2

S

2

(26)

gdje su RN2 i RS2 koeficijenti determinacije novog i starog modela, NP je broj novih nezavisnih varijabli, a UP ukupan broj nezavisnih varijabli u novom modelu. Ako je izračunata F vrijednost signifikantna, onda je model (24) loše specificiran. 4. PREDVIĐANJE

Jedan od osnovnih ciljeva regresijske analize jest predviđanje. Pod „prognostičkom“ vrijednosti varijable y na osnovi regresijskog modela podrazumijeva se njena procijenjena vrijednost za novu (stvarnu ili pretpostavljenu) vrijednost regresorske varijable na osnovi prošlih i sadašnjih informacija ugrađenih u model. S obzirom na porijeklo empirijskih vrijednosti varijabli uključenih u model, razlikuju se vremenski i prostorni regresijski modeli, zavisno o tome jesu li varijable uključene u model vremenske serije ili se vrijednosti pojedinih varijabli odnose na pojave mjerene na različitim mjestima u fiksnom trenutku. Ako se radi o vremenskom regresijskom modelu, prognostička će vrijednost biti procijenjena vrijednost zavisne varijable za buduću (opaženu ili pretpostavljenu) vrijednost nezavisne varijable. U slučaju prostornog modela „prognostička

Page 58: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

11

vrijednost“ znači procjenu zavisne varijable za pretpostavljenu ili stvarnu vrijednost nezavisne varijable u istom trenutku, ali u novoj točki prostora. Zadatak predviđanja je da se dođe do što bolje odnosno efikasne prognoze, te da se uoči priroda prognostičke pogreške, kako bi se mogle računati intervalne procjene buduće vrijednosti, te provesti odgovarajući statistički testovi. 4.1. PREDVIĐANJE EKONOMETRIJSKIM MODELOM

Pretpostavimo da je dana vrijednost objasnidbene varijable X0 i da je naš zadatak predvidjeti vrijednost od Y0. Budući da je Y0 slučajna varijabla čije su vrijednosti raspršene oko točke na regresijskoj liniji populacije koja odgovara vrijednosti X0, nikada nećemo znati njezinu vrijednost prije eksperimentiranja, čak ni onda kada znamo sve parametre populacije. Kada bi parametri populacije bili poznati, predviđač vrijednosti Y0 bila bi njezina sredina

00 XYE (27)

koja određuje točku na regresijskoj liniji populacije. U stvarnosti je E(Y0) nepoznata i mora se ocijeniti. Ocjenjivač je odgovarajuća točka na regresijskoj liniji uzorka:

00 XˆˆY (28)

Sada će se stvarna vrijednost 0Y razlikovati od predviđene vrijednosti Y0 zbog

slijedećih razloga: I. Vrijednost od Y0 neće biti jednaka E(Y0), tj. neće ležati na regresijskoj liniji

populacije zbog slučajnog odstupanja 0. Ova je greška svojstvena mehanizmu prema kojem se generiraju vrijednosti zavisne varijable i ne može se smanjiti.

II. Regresija uzorka neće biti jednaka regresijskoj liniji populacije zbog pogreške uzorkovanja. Ovu grešku možemo smanjiti povećanjem preciznosti ocjenjivanja regresijske linije populacije povećanjem veličine uzorka.

Razlika između stvarne vrijednosti slučajne varijable i predviđene vrijednosti slučajne varijable poznata je kao greška predviđanja. Ona je normalno distribuirana slučajna varijabla, a njezina je distribucija potpuno određena njezinom sredinom (koja je jednaka 0) i varijancom. Varijanca pogreške predviđanja sastoji se iz dva dijela:

Jednog koji je jednak varijanci odstupanja

Drugog koji je jednak varijanci predviđača 0Y oko njegove sredine

Na varijancu odstupanja se ne može utjecati, ali varijanca predviđanja se može smanjiti povećanjem veličine uzorka koji se koristi za ocjenjivanje regresijske linije populacije.

Page 59: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

12

200 YYE = 200 YEYE + 200 YYEE

ukupna varijanca pogreške predviđanja

2F

varijanca zbog slučajnog odstupanja

2

varijanca zbog pogreške

uzorkovanja

2

Y

Budući da nam je varijanca nepoznata, moramo ju ocijeniti pomoću ocjenjivača. To znači da će varijanca pogreške biti manja:

Što je veća veličina uzorka n

Što je veća disperzija objasnidbene varijable u uzorku (što je veća2'ix )

Što je manja udaljenost između X0 i sredine uzorka X Prva dva zaključka odražavaju činjenicu da je varijanca pogreške predviđanja manja što je ocjena regresijske linije populacije bolja. Treći zaključak znači da će predviđanje

biti bolje za vrijednosti od X koje su bliže vrijednosti X . Možemo odrediti i interval predviđanja za Y0 koji će s danom vjerojatnošću sadržavati vrijednost stvarnu vrijednost Y0:

F2/,2n00F2/,2n0 stYYstY (29)

Ako bi opažena vrijednost od Y0 pala van intervala predviđanja, postojali bi razlozi za sumnju u valjanost modela. 4.2. TESTIRANJE MOĆI PREDVIĐANJA REGRESIJSKOG MODELA

Neka statistika

2

2

0

00

XX

XX

n

11ˆ

YYt

(30)

Ima Studentovu t distribuciju sa n-2 stupnjeva slobode. Ako se umjesto Y0 koristi stvarno opažanje Y, koje nije iz uzorka čijim su korištenjem dobivene regresijske

ocjene za izračunavanje vrijednosti 0Y u istom razdoblju, može se temeljem statistike

iz izraza (30) testirati moć predviđanja modela. Kada je izračunata vrijednost statistike veća od tablične vrijednosti, može se zaključiti da je statistički značajna razlika između stvarne vrijednosti Y i predviđene

vrijednosti zavisne varijable 0Y na osnovi dane egzogene varijable X0 u periodu

predviđanja. Dakle, ostvarena vrijednost nije kompatibilna sa ocjenjenom relacijom.

Page 60: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

13

Ukoliko se raspolaže s parovima prognoza i ostvarenih vrijednosti za više vremenskih momenata, moć predviđanja modela može se ocijeniti i pomoću dijagrama u koji se unose dobivene promjene vrijednosti (Slika 4)

Slika 4: Dijagram testiranja moći predviđanja ekonometrijskog modela

Najpogodnija situacija – linija savršene prognoze – je skup točaka na pravcu pod

kutom od 45: ii YY . Točke u II i IV kvadrantu označavaju vrlo slabu moć

predviđanja ekonometrijskog modela. TESTIRANJE MOĆI PREDVIĐANJA MODELA IZDATAKA ZA IGRE NA SREĆU

Predočeni su regresijski rezultati ekonometrijskog modela izdataka za igre na sreću:

8 s.s.(0,0001) (0,0372) vrijednost p

8682,0r (7,2624) (2,4958) t

(0,0112) )0523,3(se

X814,06182,7Y

2

ii

(31)

Pretpostavimo da želimo odrediti prosječne izdatke za igre na sreću određene osobe sa danom razinom dohotka. Koji su očekivani izdaci za igre na sreću na toj razini dohotka? Pretpostavimo da X (raspoloživi dohodak) poprima vrijednost X0, gdje je X0 neka određena numerička vrijednost od X, recimo X0= 340. Pretpostavimo nadalje da

želimo ocijeniti )340XY(E 0 , odnosno prosječnu vrijednost izdataka za igre na

sreću na razini dohotka od 340. Neka je

0Y ocjenjivač od )XY(E 0 (32)

Kako je dobiven ocjenjivač iz gornjeg izraza?

Page 61: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

14

Pod pretpostavkom klasičnog linearnog regresijskog modela ocjenjivač se dobije jednostavnim uvrštavanjem dane vrijednosti X0 u regresijsku funkciju iz izraza (26):

35,2942

340814,06182,7Y 340X

(33)

Dakle, predviđena prosječna vrijednost izdataka za igre na sreću za osobu sa tjednim raspoloživim dohotkom od 340 novčanih jedinica iznosi 35 novčanih jedinica tjedno. Iako, ekonometrijska teorija pokazuje, da je pod pretpostavkom klasičnog modela,

0Y ocjenjivač stvarne prosječne vrijednosti, nije vjerojatno da će vrijednost dobivena

izrazom (33) biti jednaka ako se uzme u obzir bilo koji drugi uzorak. (Zašto?) Razlika između dobivenih vrijednosti zove se greška predviđanja. Potrebno je izračunati stoga, sredinu i varijancu ocjenjivača. Pod pretpostavkom klasičnog linearnog

modela dokazano je da je 0Y normalno distribuiran sa sredinom i varijancom kako

slijedi:

2

2

02

02I0

XX

XX

n

1 Var

X)XE(Y Sredina

(34)

gdje je

X = sredina od X u uzorku u povijesnoj regresiji

2

XX = suma kvadrata odstupanja opažanja od njihove sredine

2 = varijanca od ui n = veličina uzorka

Kako u praksi vrijednost od 2 nije poznata, zamjenjuje se ocjenjivačem

2n

2

i2 , te 0Y slijedi t distribuciju s (n-2) s.s. Može se tako koristiti t

distribucija za određivanje 100(1-)% intervala povjerenja za stvarnu srednju vrijednost Y koja odgovara vrijednosti X0:

1YsetXˆˆXYsetXˆˆP 0202102102021 (35)

Za primjer izdataka za igre na sreću najprije se računa varijanca od 340XY iz izraza

(35).

3728,1

51562

5,262340

10

14864,6Yvar

2

340X

(36)

Page 62: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

15

Stoga standardna greška iznosi:

1716,13728,1)Y(se 340X (37)

NAPOMENA: Iz izračuna iz prijašnjih tematskih jedinica poznato je: 5,262X , 51562XX2 i

4864,6ˆ 2

Rezultati sugeriraju da, za razinu dohotka od 340 novčanih jedinica, predviđena srednja vrijednost izdataka za igre na sreću, iznosi 35,2942 novčane jedinice, sa standardnom greškom od 1,1717 novčanih jedinica. Ukoliko se želi odrediti interval predviđanja za stvarnu srednju vrijednost izdataka za igre na sreću na razini dohotka od 340 novčanih jedinica upotrebljava se izraz (35):

9959,37)340XY(E5925,32

)1716,1(306,22942,35)340XY(E)1716,1(306,22942,35

(38)

NAPOMENA: Za 8 stupnjeva slobode, 5% dvostrana t vrijednost iznosi 2,306 (tablica t distribucije)

Rezultati sugeriraju da se očekuje da, na razini dohotka od 340 novčanih jedinica, srednja vrijednost izdataka za igre na sreću, iako brojčani ocjenjivač srednje vrijednosti izdataka za igre na sreću iznosi 35,2942 novčanih jedinica, leži u intervalu od 32 do 37 novčanih jedinica s vjerojatnošću od 95%. Stoga, s vjerojatnošću od 95%, greška predviđanja biti će između -2,7010 (32,5925-35,2945) i 2,7017 (37,9959-35,2942) novčanih jedinica. PREDVIĐANJE PRIHODA OD PRODAJE PROIZVODA U ZAVISNOSTI OD IZDATAKA ZA PROMIDŽBENE AKTIVNOSTI

Analizira se prihod od prodaje proizvoda (u 000 HRK) u zavisnosti o izdacima za promidžbene aktivnosti u trgovinama na malo (u 000 HRK). Podaci su dani u slijedećoj tablici. Tablica 5:Izdaci za promidžbene aktivnosti i prihodi od prodaje

Izdaci x Prihodi y

171 3212 190 4284 197 4145 200 4096 204 4632 224 4741 290 5321 374 6863 389 7173 423 8270 436 8300

Primjenom programskog paketa SPSS dobiveni su između ostalih i sljedeći rezultati.

Page 63: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

16

Tablica 6:rezultati regresijske analize programskom potporom SUMMARY

OUTPUT

Regression Statistics

Multiple R 0,98831

7

R Square 0,97677

1 Adjusted R

Square 0,97444

8 Standard

Error 326,421

3

Observations

12

Coeffici

ents Standard

Error t Stat P-value Lower 95%

Upper 95%

Lower 95,0%

Upper 95,0%

Intercept 968,999

3 257,0293 3,769995 0,003662 396,30

22 1541,6

96 396,302

2 1541,69

6

X Variable 1 16,1481

9 0,787487 20,50598 1,68E-09 14,393

56 17,902

82 14,3935

6 17,9028

2

RESIDUAL OUTPUT

Observation x y

Predicted Y Residuals y Lower prediction limit y Upper prediction limit y

1 171 3212 3730,34 -518,34 3416,861 4043,819

2 190 4284 4037,156 246,8444 3747,571 4326,74

3 197 4145 4150,193 -5,19295 3868,926 4431,46

4 200 4096 4198,638 -102,638 3920,846 4476,429

5 204 4632 4263,23 368,7697 3989,983 4536,478

6 224 4741 4586,194 154,8059 4333,96 4838,428

7 290 5321 5651,975 -330,975 5440,653 5863,297

8 374 6863 7008,423 -145,423 6764,883 7251,963

9 389 7173 7250,646 -77,6456 6992,769 7508,523

10 423 8270 7799,684 470,3159 7503,164 8096,205

11 436 8300 8009,611 290,3894 7696,566 8322,655

12 546 9435 9785,912 -350,912 9311,695 10260,13

13 670

11788,29

11112,09 12464,49

14 732

12789,48 12009,13 13569,82

Prvi korak u regresijskoj analizi je crtanje dijagrama rasipanja. Na horizontalnoj osi se ističe dio aritmetičkog mjerila koji obuhvaća opažene vrijednosti varijable x, a na vertikalnoj dio aritmetičkog mjerila koji obuhvaća opažene vrijednosti varijable y.

Page 64: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

17

Slika 5: Dijagram rasipanja

Dijagram rasipanja omogućuje uočavanje:

oblika veze među odabranim varijablama,

smjera povezanosti i

jakosti povezanosti. Odabran je model jednostavne linearne regresije. Varijable u modelu su: y= prihodi od prodaje, zavisna varijabla i x= izdaci za promidžbene aktivnosti, nezavisna varijabla. Na temelju dijagrama rasipanja zaključuje se da je veza između varijabli linearna (jer su točke raspoređene blizu nekog zamišljenog pravca), pozitivnog je smjera i jaka. Realno je dakle za pretpostaviti da se povezanost prodaje i izdataka za promidžbene aktivnosti može opisati modelom jednostavne linearne regresije:

xy 10

Kako bi se odredio procijenjeni model

xy 10ˆˆˆ

Potrebno je odrediti vrijednosti regresijskih koeficijenata. Za vrijednosti dane u tablici 5 dobivena je sljedeća procijenjena regresijska jednadžba:

xy 148,16999,968ˆ

Regresijski koeficijent 148,16ˆ1 pokazuje da će se na temelju procijenjenog modela,

za povećane izdataka u iznosu od 1000 kuna prihod u prosjeku povećati za 16,148 tisuća kuna. Konstantni član u modelu rijetko se interpretira i često nema suvislo značenje. Njegova uloga u modelu povezana je s jednadžbom regresijskog pravca. Naime, kada bi regresijski pravac bio definiran bez konstantnog člana,

xy 1ˆ ,

Geometrijski bi to značilo da pravac uvijek prolazi kroz ishodište, što je nerealna

pretpostavka. U konkretnom slučaju vrijednost 999,968ˆ0 teorijski označava

očekivanu vrijednost prihoda ako izdaci za promidžbene aktivnosti iznose 0 kuna.

Page 65: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

18

Pretpostavimo da želimo predvidjeti prihode od prodaje u slučaju da izdaci za promidžbene aktivnosti iznose 670 732 tisuća kuna. Primjenom programske potpore su za početni uzorak izračunate procijenjene ili regresijske vrijednosti, granice 95%-tnog intervala procjene, te rezidualna odstupanja, a za pretpostavljene vrijednosti od x dobivene su prognostičke vrijednosti prihoda od prodaje i granice 95%-tnog prognostičkog intervala. Dobivene vrijednosti dane su u tablici 5. Uz pretpostavku da će vrijednost izdataka za promidžbene aktivnosti iznositi 670 tisuća kuna, prognostička vrijednost prihoda izračunava se na način da se u procijenjenu regresijsku jednadžbu uvrsti vrijednost x=670:

29,11788670148,16999,968ˆ y

95%-tni prognostički interval prihoda je:

P{11112,9<y<12464,49}=0,95. Prognostički interval pokazuje, da će se u 95% slučajeva za pretpostavljenu vrijednost izdataka od x=670 tisuća kuna, stvarna vrijednost prihoda kretati između 11112,09 i 12464,49 tisuća kuna. Dijagram rasipanja, regresijski pravac i granice 95%-tnog intervala procjene prihoda dani su na sljedećoj slici. Slika 6: Dijagram rasipanja, regresijski pravac i granice 95%-tnog

intervala procjene prihoda

Page 66: 1. Kolokvij - DODATAK - fmtu.lumens5plus.com · fiksirana na konstantnoj vrijednosti od 10. ... upotrebljava metoda najmanjih kvadrata ... Slijedi tablica međurezultata za izračun

19

LITERATURA

1. Bahovec, V.; Erjavec, N. (2009.), „Uvod u ekonometrijsku analizu“, Sveučilište u Zagrebu,

Element, Zagreb. 2. Biljan-August, M,; Pivac, S.; Štambuk, A. (2007.), «Primjena statistike u ekonomiji»,

Ekonomski fakultet Sveučilišta u Rijeci, Rijeka. 3. Gujarati, D. (1992.), «Essentials of Econometrics», McGraw-Hill, New York. 4. Jovičić, M. (1989.), «Ekonometrijski metodi», Ekonomski fakultet, Beograd. 5. Jurun, E; Pivac, S.; Arnerić, J. (2006.), «Primijenjena ekonometrija 1», Sveučilište u Splitu,

Ekonomski fakultet, Split. 6. Kmenta, J. (1997.), «Počela ekonometrije», MATE, Zagreb. 7. Lovrić, LJ. (2005.), «Uvod u ekonometriju», Sveučilište u Rijeci, Ekonomski fakultet Rijeka. 8. Maddala, G. S. (1992.), «Introduction to Econometrics», Second Edition, Macmillian

Publishing Company, New York. 9. Šošić, I. (2004.), «Primijenjena statistika», Školska knjiga, Zagreb.