Osnovni pojmovi
vjerojatnosti
Predavanje 2
2
Normalna distribucija – N(m,2)
Karakterizira mnoge empirijske pojave
Koristimo ju u teoriji procjene
S njom su u vezi mnoge druge distribucije: t, c2, F i druge.
3
Normalna distribucija – N(m,2)
Funkcija gustoće vjerojatnosti:
2
2
1
2
1)(
m
x
exf
x
0
4
Normalna distribucija – N(m,2)
Može se pokazati da vrijedi:
E(X)=m mjera centralne tendencije
Var(X)=2 mjera disperzije
Simetričnost f(x)=f(-x) → a3 0
Zaobljenost a4 3
5
Mjere asimetrije
Simetrična Pozitivno
asimetrična
Negativno
asimetrična
MeMx 0xMeM 0 0MMex
6
standardizirana mjera smjera i veličine asimetrije.
potpuna mjera asimetrije.
)
3
1
3
3
a
N
xxN
ii 22
3a
Koeficijent asimetrije
7
)
4
1
4
4
a
N
xxN
ii
Mjera zaobljenosti
(koeficijent zaobljenosti)
34 a
8
Normalna distribucija
0,34 aif
ix
34 a
Zaobljenost modalnoh vrha distribucije
9
Normalna distribucija
Distribucija s vrhomzaobljenijim od normalne
0,34 a
0,34 a
if
ix
34 a
Zaobljenost modalnoh vrha distribucije
10
Normalna distribucija
Distribucija s vrhomzaobljenijim od normalne
- Distribucija s vrhomspuštenijim od normalne
0,34 a
0,34 a
0,34 a
if
ix
34 a
Zaobljenost modalnoh vrha distribucije
11
Normalna distribucija – N(m,2)
Određivanje vjerojatnosti:
b
a
dxxfaFbFbXaP )()()()(
a b
12
Standardizirana normalna distribucija
Z(0,1)
Standardizacija:
))1,0(N
XXEXZ
m
13
Standardizirana normalna distribucija
Z(0,1)
Funkcija gustoće vjerojatnosti:
2
2
1
2
1)(
z
ezf
z
0
14
Korištenje tablica – Z(0,1)
)()0( zpzZP
15
Normalna distribucija, X – N(m,2)
)
m
m
m
m
m
bZ
aP
bXaPbXaP
16
Normalna distribucija, X – N(m,2)
) ) 6826,011 ZPXP mm
) ) 9544,02222 ZPXP mm
) ) 9947,03333 ZPXP mm
17
Normalna distribucija – N(m,2)
Važno svojstvo:
Svaka linearna kombinacija normalno distribuiranih slučajnih varijabli je normalno distribuirana slučajna varijabla.
18
Normalna distribucija – N(m,2)
Specijalno:
ako su varijable X1~ N(m1,12) i X2~ N(m2,2
2)
tada je
je koeficijent linearne korelacije između varijabli X1 i X2.
a1 i a2 su proizvoljne konstante (realni brojevi).
)2,( 2121
2
2
2
2
2
1
2
122112211 mm aaaaaaNXaXa
19
Normalna distribucija – N(m,2)
Važnost normalne distribucije proizlazi iz centralnog graničnog teorema
Slučajni uzorak
Neka su X1, X2 ,..., Xn varijable koje tvore slučajni uzorak → X1, X2 ,..., Xn su i.i.d :
Nezavisne
Identično (jednako) distribuirane
20
Centralni granični teorem
Neka su X1, X2 ,..., Xn varijable koje tvore slučajni uzorak iz beskonačne populacije sa sredinom m i varijancom 2 (za svaki i=1,…,n).
Tada je za n distribucija vjerojatnosti varijable
, pri čemu je
standardizirana normalna distribucija, bez obzira na oblik distribucije populacije iz koje potječu.
n
XZ
/
m
n
XXXX n
21
21
Centralni granični teorem
.......suma nezavisnih jednako distribuiranih slučajnih varijabli koje imaju konačnu varijancupribližno normalno distribuirana.
Važnost normalne distribucije u empirijskim istraživanjima i primjenama VELIKA –
mnoge realne pojave mogu se opisati distribucijama s konačnim varijancama
22
Bivarijatna normalna distribucija
Zajednička normalna funkcija gustoće n-dimenzionalnog slučajnog vektora
X=(X1, X2 ,..., Xn)
)(1)(2
1
2/12/)2(
1)(
mm
xx
nexf
) )
)
nnn XE
XE
XE
X
X
X
E
m
m
m
m
2
1
2
1
2
1
2
21
2
2
212
121
2
1
),(),(
),(),(
),(),(
nnn
n
n
XXCovXXCov
XXCovXXCov
XXCovXXCov
23
Bivarijatna normalna distribucija
je determinanta matrice
određena s n+n(n+1)/2 parametra.
jiijjiijji njiXXCov ,,2,1,,),(
2
21
))((2)()()1(2
1
12),(
2
2
1
12
2
22
1
1
2
m
m
m
m
yxyx
eyxf
,im
,0i
1,1
24
Bivarijatna normalna distribucija
ovisi o 5 parametara
je koeficijent korelacije
2
21
))((2)()()1(2
1
12),(
2
2
1
12
2
22
1
1
2
m
m
m
m
yxyx
eyxf
1,1
25
Normalna distribucija – N(m,2)
Važno svojstvo:!!!!
vrijedi samo za normalno distribuirane slučajne varijable.
Ako su X i Y međusobno nekorelirane slučajne varijable (0 ), tada su i nezavisne, jer je
)()(),( yfxfyxf
26
Svojstva višedimenzionalne normalne distribucije:
1. Ako slučajni vektor (X,Y) ima bivarijatnu normalnu distribuciju, tada su komponente X i Y jednodimenzionalne normalne slučajne varijable, tj.
),( 2
11 mNX ),( 2
22 mNY
27
Svojstva višedimenzionalne normalne distribucije:
2. uvjetne distribucije vjerojatnosti komponenata X i Y , f(x|y) i f(y|x), također su normalno
distribuirane s parametrima:
)1()( )()(
)1()( )()(
22
21
1
22
22
12
2
11
m
m
m
m
xYVarxxYE
yXVaryyXE
28
Primjer: Bivarijatna normalna distribucija
Funkcija gustoće bivarijatne normalne distribucije s parametrima
)0,1,1,0,0(),,,,( 2
2
2
121 mm
29
Distribucije vjerojatnosti povezane s
normalnom distribucijom
Neka su X1, X2 ,..., Xn međusobno nezavisne standardizirane normalne slučajne varijable,
tj. Xi ~ N(0,1) za svaki
Tada:
ima Hi-kvadrat distribuciju s n stupnjeva
slobode i označava se, Z~ c2n)
Hi-kvadrat - c2
)(2
1
2 nXZn
i
i c
30
Hi-kvadrat - c2 distribucija
Specijalno, za međusobno nezavisne centriranenormalne slučajne varijable X1, X2 ,..., Xn
E(Xi)=0, Xi ~ N(0, 2) za svaki i=1,2,...,n
Varijabla
ima Hi-kvadrat distribuciju s n stupnjeva
slobode, Z~ c2n)
)(2
12
2
nX
Zn
i
i c
31
Hi-kvadrat - c2 distribucija
poprima samo pozitivne vrijednosti i
pozitivno je asimetrična, a3 0.
Očekivana vrijednost hi-kvadrat distribucije jednaka je broju stupnjeva slobode n (n>0), tj. za
Z~ c2n)
EZ) n Var(Z)=2nn
8 3 a
n
123 4 a
Hi-kvadrat - c2 distribucija
Poprima samo pozitivne vrijednosti i pozitivno je asimetrična, a3 0.
33
Hi-kvadrat - c2 distribucija
Svojstvo aditivnosti:
Ako su Z1 i Z2 nezavisne i imaju Hi-kvadrat distribuciju, tada :
)(
)( i )(
2
21
2
2
2
1
mnZZ
mZnZ
c
cc
34
Studentova - t-distribucija
Ako je X ~ N(0, 1) i Z~ c2 (n),
te ako su X i Y međusobno nezavisne slučajne varijable, tada slučajna varijabla:
ima t-distribuciju s n stupnjeva slobode i
označava se Z ~ t(n)
)(nt
n
Y
XZ
35
Studentova - t-distribucija
Svojstva:.... Z ~ t(n)
E(Z)=0 za n>1
za n>2 (u protivnom nije definirano)
a3 0 za n>3 i za n>4
2Var(Z)
n
n
4
63 4
na
36
Studentova - t-distribucija
simetrična poput normalne distribucije (a3 0 ),
Plosnatija od normalne (a4 3 ) i
ima izdužene “repove”
za n→∞...............................t(n) →N
37
F - distribucija
Ako su X ~ c2 (n) i Y ~ c2(m) međusobno
nezavisne slučajne varijable, tada slučajna varijabla:
ima F-distribuciju s n stupnjeva slobode u brojniku i m stupnjeva slobode u nazivniku,
tj. Z ~ F(n,m),
),(/
/nmF
mY
nXZ
F - distribucija
(n>2)
(n>4) 2E(Z)
n
n ) ) )42
22Var(Z)
2
nnm
nmn
Inferencijalna statistika
40
Inferencijalna statistika
skup statističkih metoda kojima se na osnovi prikupljenih mjerenja ili opažanja donose zaključci o populaciji, tj.
procjenjuju se nepoznati parametripopulacije i
testiraju statističke hipoteze.
41
Inferencijalna statistika
Pretpostavke:
skup podataka u populaciji, odnosno proces koji generira podatke, opisuje se distribucijom vjerojatnosti,
vjerojatnosna svojstva te distribucije moguće je opisati pomoću nepoznatih parametara
Npr; sredina, varijanca i općenito momenti višeg reda.
42
Inferencijalna statistika
Uzorak............podskup populacije
Uzorak od n podataka izabranih na slučajan način je slučajan uzorak veličine n.
Slučajni izbor je izbor kod kojeg se:
jedinice biraju neovisno jedna o drugoj, a
svaka jedinica ima unaprijed poznatu vjerojatnost izbora.
43
Slučajan uzorak
Slučajni uzorak kod kojeg svaka jedinica ima jednaku vjerojatnost izbora zove se jednostavni slučajni uzorak (simple random sample).
Slučajan način izbora jedinica u uzorak
osigurava reprezentativnost uzorka, te
omogućava primjenu teorije vjerojatnosti,
Može se kontrolirati pogreška učinjena procjenom
44
Slučajan uzorak
Uzorak od n opservacija vrijednosti jedne ili više varijabli, X1, X2,..., Xn, je
slučajni uzorak ako je n opservacija dobiveno nezavisno iz iste populacije.
45
Slučajan uzorak
Za uzorak se kaže da je nezavisan i jednako distribuiran uzorakopservacija (oznaka i.i.d.)
ako je zajednička funkcija gustoće uzorka (X1, X2,..., Xn):
);();();(...
);();();();,,,(
21
2211
21
n
nn
nxfxfxfdii
xfxfxftnezavisnosxxxf
46
Procjenjivanje parametara
Procjenjuje li se nepoznati parametar na temelju uzorka veličine n, odnosno na osnovi n podataka (x1, x2,..., xn), tada se slučajna varijabla
kojom se taj parametar procjenjuje zove procjenitelj (estimator) parametra .
),,,(ˆ21 nXXXf
47
Procjenjivanje parametara
Izborom konkretnog uzorka, varijable iz uzorka X1, X2,..., Xn poprimaju određene numeričke vrijednosti (x1, x2,..., xn),a
varijabla poprima vrijednost
Ta se vrijednost zove procjena parametra jednim brojem (point estimate).
),,,(ˆ21 nxxxf
48
Primjer 1: Procjena sredine populacije
Ako je m nepoznata sredina populacije, funkcija:
je procjenitelj od m.
Za konkretne vrijednosti iz uzorka, procjena jednim brojem nepoznate sredine osnovnog
skupa m je aritmetička sredina uzorka, .
n
XXXX n
21
x
49
Procjena sredine populacije - m
Distribucija procjenitelja
zove se sampling distribucija aritmetičkih sredina uzoraka.
X
50
Primjer:
X ~ N(m,2)
na osnovi jednostavnog slučajnog uzorka veličine n,
procjenjuje se sredina populacije m
tada je sampling distribucija procjenitelja od m također normalna distribucija (zašto?)
),(2
nNX
m
51
Očekivana vrijednost od
) )
) ) ) μ
XE
m
mmm
nn
XEXEXEn
XXXEnn
XXXE
n
n
n
11
1
21
21
21
Nepristran procjenitelj
52
Varijanca od
)
) ) )
n
σ
XVar
2
2
2
22
2
2
12
212
21
1
1
1
nn
XVarXVarXVarn
XXXVarn
n
XXXVar
n
nezavisne
n
n
53
Procjenjivanje parametara
Polazeći od sampling distribucije, moguće je osim procjene jednim brojem odrediti i intervalnu procjenu parametra , tj.
određen s 1 i 2 (granice) unutar kojeg će se uz određenu zadanu vjerojatnost (1-g) nalaziti stvarna vrijednost parametra
(1-g)· 100% - pouzdanost procjene.
) g 121P
54
Primjer:
Uz pouzdanost procjene(1-g)· 100%
nepoznata sredina m populacije nalaziti unutar intervala:
gdje je aritmetička sredina uzorka veličine n,
standardna devijacija populacije a
koeficijent pouzdanosti
odgovarajući g/2percentil N(0,1) distribucije
nzx
nzx
m
gg 2/2/
x
2/gz
55
Sampling distribucija
teorijska distribucija vjerojatnosti procjenitelja parametara
Izvire iz koncepta ponovljenih izbora slučajnih uzoraka iz dane populacije.
Različiti uzorci dovode do različitih vrijednosti procjena.
Procjenitelj je funkcija uzorka....procjenitelj je varijabla, koja se naziva sampling varijablom, zato što se mijenja od uzorka do uzorka.
56
Svojstva procjenitelja
Poželjna određena svojstva procjenitelja
Svojstva malog (konačnog) uzorka
nepristranost i efikasnost
Asimptotska svojstva (velikog uzorka)
asimptotska nepristranost i konzistentnost.
57
Nepristranost procjenitelja
je nepristran procjenitelj parametra ako je:
......čak i u malim uzorcima, procjene parametara u prosjeku su jednake stvarnim vrijednostima.
)ˆ(E
58
Nepristranost procjenitelja
ako bi vrijednost parametra θ izračunavali za svaki uzorak i
postupak ponavljali beskonačno mnogo puta
prosječna vrijednost svih tih procjena bila bi jednaka stvarnoj vrijednosti parametra θ.
59
Nepristranost procjenitelja
je pristran procjenitelj parametra ako je:
pristranost (bias)
)ˆ(E
)ˆ(EB
60
Procjenitelji parametra (s različitim varijancama)
61
Nepristranost procjenitelja
Međutim:...nepristranost poželjno svojstvo!!!....Ali ne pod svaku cijenu!
Ponekad bolje
pristrani procjenitelj s malom varijancom
s vrijednostima blizu
u odnnosu na nepristran procjeniteljems velikom varijancom
koji može za neke uzorke biti daleko od
62
Nepristranost procjenitelja
pored nepristranosti - poželjno svojstvo i mala varijanca.
kriterij pri izboru procjenitelja promatra se srednja kvadratna pogreška MSE (mean squared error)
kompromis između pristranosti i varijance
manja MSE – procjenitelj ''bolji''.
) )ˆ(ˆ)ˆ( 22
VarBEMSE
63
Primjer:
Procjenjuju se parametri populacije čija je distribucija normalna s parametrima m i 2, N(m,2), na osnovi jednostavnog slučajnog uzorka veličine n.
Dva procjenitelja parametra m su
Međutim, je nepristran procjenitelj (primjer 2), za razliku od procjenitelja koji je pristran. Dokažite!!
n
XXXX n
21
1
1
212
n
XXXX n
1X
2X
64
Primjer:
Pristranost procjenitelja
B →0 za n →∞
povećanjem uzorka n →∞, uzorak sve više
''približava'' populaciji.
2X
) mm
1
..................................................2n
nXE
) 01
1............................................2
mm
nXEB
65
Primjer:
Dva procjenitelja parametra 2 su
Povećanjem uzorka, pristranost se smanjuje
) ) )n
XXXXXX n
22
2
2
12
1ˆ
) ) )1
ˆ
22
2
2
12
2
n
XXXXXX n
) ,.....ˆ 22
1 E ) 222
21
..........ˆ
n
nE
) 01
1.............................................ˆ 222
2
n
EB n
66
Efikasnost procjenitelja
Svojstvo vezano za varijancu procjenitelja.
Nepristran procjenitelj je efikasan ako i samo ako u skupu svih nepristranih procjenitelja ima najmanju varijancu (MVUE - Minimum Variance Unbiased Estimator).
Kao kriterij ''kakvoće'' procjenitelja uzima se vrijednost MSE
67
Efikasnost procjenitelja
za dva procjenitelja i parametra (ne
nužno nepristrana)
Procjenitelj efikasniji od (u smislu najmanje srednje kvadratne pogreške) ako i samo ako je:
1 2
1 2
)ˆ()ˆ( 21 MSEMSE
68
Efikasnost procjenitelja
Ako se promatra samo skup linearnih nepristranih procjenitelja, procjenitelj:
je najbolji linearni nepristrani procjenitelj(BLUE), ako su konstante c1,c2,...,cn odabrane tako da je linearni procjenitelj g
nepristran (E(g) = ) i
ima najmanju varijancu (efikasan je).
i
n
i
inn XcXcXcXcg
1
2211
69
Procjenitelji parametra s različitim varijancama
i nepristrani procjenitelji, jer je
Procjenitelj efikasaniji je u odnosu na jer ima manju varijancu
1 2 ) ) 21ˆˆ EE
1 2
)ˆ()ˆ( 21 VarVar
70
Asimptotska nepristranost procjenitelja
Procjenitelj je asimptotski nepristran
procjenitelj parametra ako njegova
očekivana vrijednost teži pravoj vrijednosti parametra kad veličina uzorka neograničeno raste, tj.:
- procjenitelj na temelju uzorka veličine n
)ˆ(lim nn
E
n
71
Konzistentnost procjenitelja
Grubo govoreći, procjenitelj parametra je
konzistentan ako se povećanjem uzorka ''približava'' stvarnoj vrijednosti parametra
Formalno:
Niz procjenitelja je konzistentan niz ako za svaki proizvoljno mali pozitivni broj 0 vrijedi:
n
1ˆlim
nn
P
72
Konzistentnost procjenitelja
Formula:
vjerojatnost da procjena (izračunata na temelju uzorka veličine n) bude proizvoljno blizu
stvarne vrijednosti parametra teži prema 1
vjerojatnost sigurnog događaja).
po vjerojatnosti teži prema i zapisuje se:
n
1ˆlim
nn
P
n
np ˆlim P
nˆ
73
Konzistentnost procjenitelja
Dovoljan uvjet za konzistentnost procjenitelja je
da pristranost i varijanca procjenitelja teže nuli kad veličina uzorka raste
no taj uvjet nije nužan.
74
Testiranje statističkih hipoteza
Testiranje hipoteza polazi od pretpostavke da je distribucija vjerojatnosti slučajne varijable X poznata
Parametrijski testovi
Testiranje statističkih hipoteza o nepoznatom
parametru
Hipoteze H0 i H1
75
Testiranje statističkih hipoteza
Dvosmjerni-
H0 - jednostavna (simple, point hypothesis)
određuje samo jedna vrijednost parametra: H0: 0
H1 - složena (composite, interval hypothesis)
specificira se interval vrijednosti od H0: 0
Jednosmjerni
obje hipoteze složene.
76
Testiranje statističkih hipoteza
Postupak testiranja je pravilo odlučivanja
na osnovi prikupljenih informacija iz uzorka i
utvrđenih granica područja prihvaćanja, odnosno odbacivanja nulte hipoteze
odluka o prihvaćanju/ odbacivanju H0
kritične vrijednosti
odluka - na osnovi uzorka,
moguće dvije vrste pogrešaka: tipa I i tipa II.
77
) )lažnaHHprihvatitiP
istinitaHHodbacitiP
.............
.............
00
00
a
Testiranje statističkih hipoteza
78
) )lažnaHHprihvatitiP
istinitaHHodbacitiP
.............
.............
00
00
a
a, planske veličine
…….određuju se nacrtom testa
1- snaga testa
Testiranje statističkih hipoteza
79
Testiranje statističkih hipoteza
Pri testiranju
nastoji se minimizirati obje pogreške,
to je nemoguće istovremeno
pogreške tipa I, smatra se ''opasnijom''
u praktičnim primjenama, određuje se prije postupka testiranja.
80
Primjer : Dvosmjerni test o m
Hipoteze:
Ako je XN(m, 2) →
Ako je H0 istinita tj. H0: mm0
sampling distribucija je
za zadanu razinu signifikantnosti a,
01
00
:
:
mm
mm
H
H
),(2
nNX
m
),(2
0n
NX
m
81
Primjer : Dvosmjerni test o m
Kritične granice:
m0 je pretpostavljena vrijednost sredine osnovnog skupa, je standardna devijacija populacije, a za/2 je a/2-percentil N(0,1).
nzc
m a 201
nzc
m a 202
82
Primjer : Dvosmjerni test o m
Odluka:
se uspoređuje s kritičnim granicama.
ako je , tj.
H0 se prihvaća kao moguća uz danu razinu signifikantnosti a.
u protivnom, ako je ili
H0 se odbacuje.
x
21 cxc 21,ccx
2cx xc 1
83
Primjer : Dvosmjerni test o m
Alternativno:
ili
Odluka:
|z| ili |t| se uspoređuje s za/2 (ta/2)
ako je |z| <za/2 → H0 se prihvaća za a.
ako je |z| >za/2 → H0 se odbacuje za a.
)1,0(0 Nx
zx
m)1(0
nt
xt
x
m
84
Primjer : Dvosmjerni test o m
Empirijska razina značajnosti – p-vrijednost:
Najmanja razina značajnosti u odnosu na koju se H0 odbacuje
Odluka:
ako je p > a→ H0 se prihvaća za a.
ako je p < a → H0 se odbacuje za a.
x
xz
m0 )zZP2 p
85
Primjer :
Prema standardu, prosječna trajnost električnih žarulja od 75W iznosi 2000 sati s prosječnim odstupanjem 250 sati.
Iz serija žarulja izabran je slučajni uzorak od 64 žarulje. Ispitivanjem je ustanovljeno da je prosječna trajnost žarulja u uzorku 1935 sati.
Može li se prihvatiti pretpostavka da je uzorak izabran iz osnovnog skupa kojemu je aritmetička sredina prema standardu? Testirati na razini značajnosti od 5%.
86
Primjer:
96,105,0%5
1935250642000
025,02/
0
zz
xn
aa
m
08,2
64
250
2000193500
n
xxz
x
m
m
87
Primjer:
25,206125,3196,12000
75,193825,3196,12000
2
1
2/02
2/01
c
c
c
c
z
z
x
x
m
m
a
a
021 Hcxc
88
Primjer :
89
Primjer:
) )
1
22
H
p
a0,0376
)2,08ZP)zZP
vrijednost-
Model jednostavne
linearne regresije
90
Regresijska analiza
najčešde korištena metodologija u ekonometriji
bavi se opisivanjem ovisnosti jedne varijable o jednoj ili više drugih varijabli
Varijabla od primarnog interesa, čije se varijacije objašnjavaju pomodu varijacija drugih varijabli naziva se zavisnom (regresand) varijablom...Y
varijable kojima se objašnjavaju varijacije zavisne varijable nazivaju se nezavisnim (regresorskim) varijablama....X
91
),,,( 21 Kxxxfy
),,,( 21 Kxxxfy
92
Regresijska analiza
93
Regresijska analiza
Varijabla y Varijabla x (x1, x2,...,xk)
Zavisna
Varijabla s lijeve strane
Regresand
Endogena
Output
Nezavisna
Varijabla s desne strane
Regresorska
Egzogena
Input
)(xfy xxf 10)(
94
Regresijska analiza
Modelom jednostavne linearne regresije izražena je stohastička linearna veza između zavisne varijable y i nezavisne varijable x
Formalni izraz
iii
iii
iii
xy
xy
xy
cos
ln
10
10
210
95
Linearnost
odnosi na način na koji se parametri i greške relacije pojavljuju u regresijskoj jednadžbi
Ne odnosi se na odnos među varijablama
Primjer linearnih modela
iexy ii 1
0
iii xy lnlnln 10
96
Linearnost
Primjer nelinearnih modela
Linearizacija
Što je s modelima
exy
a
1 eyx
21a
nixy iii ,...,2,1 10
nnn
iii
xy
xy
xy
xy
10
10
22102
11101
Xy 97
Model jednostavne linearne regresije
n
i
y
y
y
y
y
2
1
n
i
x
x
x
x
X
1
1
1
1
2
1
1
0
n
i
2
1
98
Model jednostavne linearne regresije
99
Model jednostavne linearne regresije
n-opažanja.....uzorak veličine n
jedna realizacija svih mogudih uzoraka veličine n odabranih iz iste populacije
za svako opažanje xi postoji distribucija vjerojatnosti varijable i
pa prema tome postoji i distribucija vjerojatnosti zavisne varijable yi.
nixy iii ,...,2,1 10
100
Polazne pretpostavke modela jednostavne linearne regresije
1. Veza između y i x je linearna
2. Varijabla x je deterministička varijabla ili se alternativno pretpostavlja da su njene vrijednosti fiksne u ponovljenim mjerenjima (uzorcima).
matrica X jednaka za svaki novi uzorak
u svakom novom uzorku - samo nove vrijednosti od i y.
Pretpostavka uvedena kako bi se zanemario izvor varijacija u x (analiza veze između y i x).
101
Polazne pretpostavke modela jednostavne linearne regresije
3. Greške relacije u prosjeku ne utječu na zavisnu varijablu, tj.
E(i)=04. Zbog jednostavnosti - pretpostavka da je analizirani
uzorak izabran na slučajan način, te da su stoga bilo koje dvije slučajne varijable i međusobno nezavisne, a time su i nekorelirane, tj.
Cov(i , j )=E(i )=0 za svako i≠j, i,j=1,2,...n
102
Polazne pretpostavke modela jednostavne linearne regresije
5.Za svako i=1,2,...,n.
nepromjenjivosti ili homoskedastičnosti varijance
varijacije i ne ovise o xi , tj.
ne razlikuju se u različitim područjima vrijednosti nezavisne varijable.
),0(~ 2 Ni2)( iVar
Pretpostavke (1) – (3), bez pretpostavke o obliku distribucije grešaka relacije, nazivaju se Gauss Markovljevim uvjetima.
103
Pretpostavke – formalan zapis
104
Polazne pretpostavke modela jednostavne linearne regresije
Varijable yi su:
1. međusobno nekorelirane
2. normalne slučajne varijable
3. s jednakom varijancom i
4. uvjetnim očekivanjima koja za zadane vrijednosti nezavisne varijable (xi) leže na regresijskom pravcu
nixy iii ,...,2,1 10
105
Statistička povezanost varijabli x i y
106
Polazne pretpostavke modela jednostavne linearne regresije
107
Matrica varijanci i kovarijanci vektora
kvadratna matrica n-tog reda
nezavisnosti komponenata i→Cov(i, j) = E(ij)=0 za svako i≠j, i,j=1,2,...n
Var(i)= 2, i=1,...,n
2
2
2
00
0
000
)(
Var IVar 2)(