prosta linearna regresiona analiza

70
1 Regresiona i korelaciona analiza Regresiona i korelaciona analiza

Upload: -

Post on 03-Nov-2014

175 views

Category:

Documents


9 download

DESCRIPTION

Statistička kontrola kvaliteta

TRANSCRIPT

Page 1: Prosta Linearna Regresiona Analiza

1

Regresiona i korelaciona analizaRegresiona i korelaciona analiza

Page 2: Prosta Linearna Regresiona Analiza

2

Relacije između varijabliRelacije između varijabli

Reprezentuju neke fenomeneReprezentuju neke fenomene Matematički modeli su matematički izrazi tih fenomenaMatematički modeli su matematički izrazi tih fenomena

Gauss-Markoff Gauss-Markoff pretpostavka za linearnu regresijupretpostavka za linearnu regresiju Formula za izračunavanje koeficijenata u regresiji je Formula za izračunavanje koeficijenata u regresiji je BLUEBLUE

((BBest est LLinear inear UUnbiased nbiased EEstimators)stimators) Best LinearBest Linear – najefikasniji model sa najmanjom varijansom – najefikasniji model sa najmanjom varijansom UnbiasedUnbiased EstimatorsEstimators – očekivane vrednosti zavisne varijable – očekivane vrednosti zavisne varijable

iste ili vrlo bliske populacionim vrednostimaiste ili vrlo bliske populacionim vrednostima

Page 3: Prosta Linearna Regresiona Analiza

3

Regresiona analizaRegresiona analiza

Regresiona analizaRegresiona analiza se koristi da: se koristi da: objasni kakav efekat ima promena nezavisne objasni kakav efekat ima promena nezavisne

varijable na zavisnu varijabluvarijable na zavisnu varijablu predvidi vrednost zavisne varijable na osnovu predvidi vrednost zavisne varijable na osnovu

najmanje jedne nezavisne varijablenajmanje jedne nezavisne varijable

Zavisna varijabla:Zavisna varijabla: varijabla koju želimo da objasnimo varijabla koju želimo da objasnimo ili predvidimoili predvidimo

Nezavisna varijabla:Nezavisna varijabla: varijabla koju koristimo da varijabla koju koristimo da objasnimo zavisnu varijabluobjasnimo zavisnu varijablu

Page 4: Prosta Linearna Regresiona Analiza

4

Regresioni modeliRegresioni modeli

Izražavaju se jednačinom u kojoj je:Izražavaju se jednačinom u kojoj je: 1 numeri1 numeričkačka zavisnazavisna ( (odgovorodgovor) vari) varijjablablaa 1 1 ili više numeričkih ili kategoričkih nezavisnih ili više numeričkih ili kategoričkih nezavisnih

varijablivarijabli

Prosta linearna regresijaProsta linearna regresija samo jedna nezavisna varijabla xsamo jedna nezavisna varijabla x

relacija između x i y izražena je linearnom relacija između x i y izražena je linearnom funkcijomfunkcijom

Page 5: Prosta Linearna Regresiona Analiza

5

Prost linearni regresioni modelProst linearni regresioni model

• Relacija između varijabli je linearna funkcijaRelacija između varijabli je linearna funkcija• Prava linija najbolje “fituje” podatkePrava linija najbolje “fituje” podatke

ii10i xy

y intercept (konstanta)y intercept (konstanta)

nagibnagib

slučajna greškaslučajna greška

zavisna varijabla zavisna varijabla (odgovor)(odgovor)

nezavisna varijabla nezavisna varijabla (eksplanatorna)(eksplanatorna)

Page 6: Prosta Linearna Regresiona Analiza

6

Populacioni linearni regresioni modelPopulacioni linearni regresioni model

= = slučajna greškaslučajna greška

yy

x

i10xy x

dobijena vrednostdobijena vrednost

dobijena dobijena vrednostvrednost

ii10i xy

Page 7: Prosta Linearna Regresiona Analiza

7

Prost linearni regresioni modelProst linearni regresioni model

ii bxay

yyii - predviđena vrednost za zapažanje - predviđena vrednost za zapažanje ii

xxii - vrednost x za zapažanje - vrednost x za zapažanje ii

a - intercept za uzorak, koristi se za procenu populacionog a - intercept za uzorak, koristi se za procenu populacionog ββ00

b - nagib za uzorak, koristi se za procenu populacionog b - nagib za uzorak, koristi se za procenu populacionog ββ11

Page 8: Prosta Linearna Regresiona Analiza

8

Linearna jednačinaLinearna jednačina

© 1984-1994 T/Maker Co.

yyy = a + bxy = a + bx

a = y-intercepta = y-intercept

xx

promena u ypromena u y

promena u xpromena u x

b = nagibb = nagib

Page 9: Prosta Linearna Regresiona Analiza

9

Metoda najmanjih kvadrataMetoda najmanjih kvadrata

Kako povlačimo liniju između tačaka?Kako povlačimo liniju između tačaka? Kako procenjujemo koja linija najbolje obuhvata Kako procenjujemo koja linija najbolje obuhvata

podatke?podatke?

Metoda najmanjih kvadrataMetoda najmanjih kvadrata Najbolje slaganje (“fitovanje”) znači da jeNajbolje slaganje (“fitovanje”) znači da je razlika razlika između između

stvarne vrednosti y i izračunate vrednosti ystvarne vrednosti y i izračunate vrednosti y najmanjanajmanja Iz srednje vrednosti x možemo da izračunamo srednju Iz srednje vrednosti x možemo da izračunamo srednju

vrednost yvrednost y kada x odstupa od srednje vrednosti, možemo da očekujemo kada x odstupa od srednje vrednosti, možemo da očekujemo

i da y odstupa od svoje srednje vrednostii da y odstupa od svoje srednje vrednosti x “objašnjava” odstupanje y od srednje vrednostix “objašnjava” odstupanje y od srednje vrednosti

Page 10: Prosta Linearna Regresiona Analiza

10

Metoda najmanjih kvadrata – grafički prikazMetoda najmanjih kvadrata – grafički prikaz

24

23

22

21

n

1i

2i eeee e

Metoda najmanjih kvadrata minimizuje sumu kvadriranih razlika Metoda najmanjih kvadrata minimizuje sumu kvadriranih razlika (grešaka = e) između stvarnih i pretpostavljenih vrednosti y(grešaka = e) između stvarnih i pretpostavljenih vrednosti y

e2

yy

xx

e1 e3

e4

222 ebxay

bxay

Page 11: Prosta Linearna Regresiona Analiza

11

Koeficijenti u jednačini praveKoeficijenti u jednačini prave

xbya

xNx

yxNxyb

xbay

22

Regresiona jednačinaRegresiona jednačina

Nagib praveNagib prave

Odsečak na y-osiOdsečak na y-osi

Page 12: Prosta Linearna Regresiona Analiza

12

Interpretacija koeficijenataInterpretacija koeficijenata

b - nagibb - nagib

Daje promenu Daje promenu yy (kao umnožak) za 1 jedinicu povećanja (kao umnožak) za 1 jedinicu povećanja xx

PrimerPrimer:: Ako je b = 2, onda je očekivano Ako je b = 2, onda je očekivano yy dva puta dva puta veće za svaku 1 jedinicu povećanja u veće za svaku 1 jedinicu povećanja u xx

a - odsečak na y-osia - odsečak na y-osi

Prosečna vrednost y kada jeProsečna vrednost y kada je xx = 0 = 0

Page 13: Prosta Linearna Regresiona Analiza

13

Primer 1Primer 1

tt ((CC00)) uunnooššeennjjee vvooddee

((mmLL))

2244 448800

2288 660000

2299 775500

2299 881100

3333 996600

3366 11444400

3377 11444400

Page 14: Prosta Linearna Regresiona Analiza

14

Primer 1 – grafički prikazPrimer 1 – grafički prikaz

0

200

400

600

800

1000

1200

1400

1600

0 5 10 15 20 25 30 35 40

t

mL

Page 15: Prosta Linearna Regresiona Analiza

15

Primer 1Primer 1

tt ((00CC)) xx

vvooddaa ((mmLL)) yy

xx22 xxyy

2244 448800 557766 1111552200

2288 660000 778844 1166880000

2299 775500 884411 2211775500

2299 881100 884411 2233449900

3333 996600 11008899 3311668800

3366 11444400 11229966 5511884400

3377 11444400 11336699 5533228800

210360xy

6796x

714,9257

6480y

857,307

216x

2

Page 16: Prosta Linearna Regresiona Analiza

16

Primer 1Primer 1

-1528,03530,85779,5197-925,714xbya

5197,79)857,30(76796

714,925857,307210360

xNx

yxNxyb

222

y = - 1528,03 + 79,52xy = - 1528,03 + 79,52x

mL = - 1528,03 + 79,52 tmL = - 1528,03 + 79,52 t

Page 17: Prosta Linearna Regresiona Analiza

17

Evaluacija modelaEvaluacija modela

U kojoj meri model izražava relaciju između varijabliU kojoj meri model izražava relaciju između varijabli??

Približnost “najboljem slaganju”Približnost “najboljem slaganju”

Što su tačke bliže liniji to je slaganje boljeŠto su tačke bliže liniji to je slaganje bolje

Ispitivanje veličine varijacijeIspitivanje veličine varijacije

Značajnost izračunatih parametaraZnačajnost izračunatih parametara

Rezidualna analizaRezidualna analiza

bxay

Page 18: Prosta Linearna Regresiona Analiza

18

Mere varijacije u regresijiMere varijacije u regresiji

SSSSTT = = Ukupna varijacija (ukupna suma kvadrata)Ukupna varijacija (ukupna suma kvadrata)

mera za varijaciju vrednosti mera za varijaciju vrednosti yy oko njihove srednje oko njihove srednje vrednostivrednosti

ukupna varijacija oko regresione prave jednaka je ukupna varijacija oko regresione prave jednaka je sumi kvadrata razlika između sumi kvadrata razlika između vrednosti yvrednosti y u svakom u svakom paru i paru i srednje vrednosti ysrednje vrednosti y

odgovara ukupnoj sumi kvadrata u ANOVIodgovara ukupnoj sumi kvadrata u ANOVI

2i )y(y

Page 19: Prosta Linearna Regresiona Analiza

19

Mere varijacije u regresijiMere varijacije u regresiji

SSSSRR = = Varijacija za koju postoji objašnjenjeVarijacija za koju postoji objašnjenje

(r(regresionegresiona suma kvadrata)a suma kvadrata)

mera za varijaciju vezanu za relaciju između mera za varijaciju vezanu za relaciju između xx i i yy

objašnjiva varijacija jednaka je sumi kvadrata razlika između svake izračunate (iz jednačine) vrednosti y i srednje vrednosti y

odgovara sumi kvadrata između grupa u ANOVIodgovara sumi kvadrata između grupa u ANOVI

2i yy

Page 20: Prosta Linearna Regresiona Analiza

20

Mere varijacije u regresijiMere varijacije u regresiji

SSSSEE = = Varijacija za koju ne postoji objašnjenje Varijacija za koju ne postoji objašnjenje

(s(sumuma kvadrata greške)a kvadrata greške)

mera za varijaciju koja potiče od drugih faktoramera za varijaciju koja potiče od drugih faktora varijacija za koju ne postoji objašnjenjevarijacija za koju ne postoji objašnjenje Neobjašnjiva varijacija jednaka je sumi kvadrata Neobjašnjiva varijacija jednaka je sumi kvadrata

razlika između razlika između vrednosti yvrednosti y u svakom paru i u svakom paru i odgovarajuće odgovarajuće izračunateizračunate (iz jednačine) (iz jednačine) vrednosti yvrednosti y

odgovara sumi kvadrata unutar grupa u ANOVIodgovara sumi kvadrata unutar grupa u ANOVI

2i )y(y

Page 21: Prosta Linearna Regresiona Analiza

21

Mere varijacije u regresijiMere varijacije u regresiji

X

yy

xxxii

bxay

yyii

2iT )y(ySS

2iE )y(ySS

2R yySS

y

y

Page 22: Prosta Linearna Regresiona Analiza

22

Koeficijent determinacijeKoeficijent determinacije

2i

2

T

R2

)y(y

)yy

SK

SK

varijacijaukupna

varijacijaobjašnjivar

0 0 rr 22 11

procenat varijacije u procenat varijacije u yy koji je posledica varijacije u koji je posledica varijacije u xx

Page 23: Prosta Linearna Regresiona Analiza

23

rr22 - primeri - primeri

r2 = 0,81 r2 = 0,77

r2 = 0,42 r2 = 0,05

xx

yy

xx

yy

xx

yy

xx

yy

Page 24: Prosta Linearna Regresiona Analiza

24

Primer 1Primer 1

9412,0r

)yy(

)yy(r

2

2i

22

94% varijacije u 94% varijacije u yy (mL vode) potiče od varijacije u (mL vode) potiče od varijacije u xx (temperatura) (temperatura)

Page 25: Prosta Linearna Regresiona Analiza

25

Standardna greška regresione praveStandardna greška regresione prave

Mera za odstupanje dobijene vrednosti Mera za odstupanje dobijene vrednosti yy od izračunate od izračunate (iz jednačine) vrednosti y (iz jednačine) vrednosti y

Veličina greške utiče na:Veličina greške utiče na: tačnost predviđanjatačnost predviđanja značajnost parametaraznačajnost parametara

2N

xyb-yayS

2

yx

2N

)yy(

2N

SSS

2iE

yx

Page 26: Prosta Linearna Regresiona Analiza

26

Primer 1Primer 1

7N

210360xy

6877800y

6480y

52,79b

03,1528a

2

tt ((00CC))

xx mmLL yy

yy22 xxyy

2244 448800 223300440000 1111552200

2288 660000 336600000000 1166880000

2299 775500 556622550000 2211775500

2299 881100 665566110000 2233449900

3333 996600 992211660000 3311668800

3366 11444400 22007733660000 5511884400

3377 11444400 22007733660000 5533228800

59,101Syx

Page 27: Prosta Linearna Regresiona Analiza

27

Testiranje nagiba bTestiranje nagiba b

Da li postoji linearna relacija između Da li postoji linearna relacija između xx i i yy ?? HipotezeHipoteze

HH00: : ββ11 = = 00 ( (nema linearne relacijenema linearne relacije) )

HH11: : ββ11 00 ( (postoji linearna relacijapostoji linearna relacija))

b

1b22

yxb S

bt

xNx

SS

HH00 se prihvata ako je t se prihvata ako je tbb < t < tαα, N-2, N-2

zaključak: b = 0 (ne postoji linearna relacija)zaključak: b = 0 (ne postoji linearna relacija)

Page 28: Prosta Linearna Regresiona Analiza

28

Primer 1Primer 1

SSbb = 8,8787 = 8,8787 ttbb = 8, 956 = 8, 956 t t0,05; 50,05; 5 = 2,571 = 2,571 ttbb > t > t0,05; 50,05; 5

HH00 se ne prihvata se ne prihvata

Zaključak:Zaključak: postoji linearna relacija između spoljašnje postoji linearna relacija između spoljašnje temperature i zapremine vode koju čovek popijetemperature i zapremine vode koju čovek popije

Page 29: Prosta Linearna Regresiona Analiza

29

Testiranje odsečka aTestiranje odsečka a

Testira se ako postoji linearna relacija izmedju Testira se ako postoji linearna relacija izmedju xx i i yy HipotezeHipoteze

HH00: : ββ00 = 0= 0

HH11: : ββ00 ≠≠ 0 0

aa

22

2

xy,a

S

at

)xNx(N

xSS

HH00 se prihvata ako je t se prihvata ako je taa < t < tαα, N-2, N-2

zaključak:zaključak: a = 0 (nema sistematske greške)a = 0 (nema sistematske greške)

Page 30: Prosta Linearna Regresiona Analiza

30

Primer 1Primer 1

SSaa = 277,008 = 277,008 ttaa = 5,516 = 5,516 t t0,05; 50,05; 5 = 2,571 = 2,571 ttaa > t > t0,05; 50,05; 5

HH00 se ne prihvata se ne prihvata

Zaključak:Zaključak: odsečak na y-osi je značajno različit od 0 odsečak na y-osi je značajno različit od 0

Page 31: Prosta Linearna Regresiona Analiza

31

Intervali pouzdanosti za regresione koeficijente Intervali pouzdanosti za regresione koeficijente

Interval pouzdanosti za odsečak Interval pouzdanosti za odsečak aa za nivo značajnosti 95%: a za nivo značajnosti 95%: a ±± t t0,05; n-20,05; n-2(S(Saa) ) za nivo značajnosti 99%: za nivo značajnosti 99%: a a ±± t t0,01; n-20,01; n-2(S(Saa))

Primer 1: 95% IP za odsečak Primer 1: 95% IP za odsečak aa a = a = –– 1528,04 t 1528,04 t0,05; 50,05; 5 = 2,571 S = 2,571 Saa = 277,008 = 277,008 ––1528,04 1528,04 ±± 2,571 (277,008) = 2,571 (277,008) = ––1528,04 1528,04 ±± 712,19 712,19 95% IP: –2240,23 do –815,8595% IP: –2240,23 do –815,85

Primer 1: 99% IP za odsečak Primer 1: 99% IP za odsečak aa a = a = ––1528,04 t1528,04 t0,01; 50,01; 5 = 4,032 S = 4,032 Saa = 277,008 = 277,008 ––1528,04 1528,04 ±± 4,032 (277,008) = 4,032 (277,008) = ––1528,04 1528,04 ±± 1116,90 1116,90 99% IP: –2644,94 do –411,1499% IP: –2644,94 do –411,14

Page 32: Prosta Linearna Regresiona Analiza

32

Intervali pouzdanosti za regresione koeficijente Intervali pouzdanosti za regresione koeficijente

Interval pouzdanosti za nagib Interval pouzdanosti za nagib bb za nivo značajnosti 95%: b za nivo značajnosti 95%: b ±± t t0,05; n-20,05; n-2(S(Sbb)) za nivo značajnosti 99%: za nivo značajnosti 99%: b b ±± t t0,01; n-20,01; n-2 (S (Sbb))

Primer 1: 95% IP za nagib Primer 1: 95% IP za nagib bb b = 79,52 tb = 79,52 t0,05; 50,05; 5 = 2,571 S = 2,571 Sbb = 8,8903 = 8,8903 79,52 79,52 ±± 2,571 (8,8903) = 79,52 2,571 (8,8903) = 79,52 ±± 22,86 22,86 95% IP: 56,66 do 102,3895% IP: 56,66 do 102,38

Primer 1: 99% IP za nagib Primer 1: 99% IP za nagib bb b = 79,52 tb = 79,52 t0,01; 50,01; 5 = 4,032 S = 4,032 Sbb = 8,8903 = 8,8903 79,52 79,52 ±± 4,032 (8,8903) = 79,52 4,032 (8,8903) = 79,52 ±± 35,85 35,85 99% IP: 43,67 do 115,3799% IP: 43,67 do 115,37

Page 33: Prosta Linearna Regresiona Analiza

33

Rezidualna analizaRezidualna analiza

Uslovi za regresionu analizu:Uslovi za regresionu analizu: normalna raspodela greškenormalna raspodela greške konstantna varijansa greške za sve vrednosti x konstantna varijansa greške za sve vrednosti x

(homosedastičnost)(homosedastičnost) greške su nezavisne jedna od drugegreške su nezavisne jedna od druge

Odstupanje od ovih uslova se ispituje rezidualnom Odstupanje od ovih uslova se ispituje rezidualnom analizomanalizom

Rezidualna analizaRezidualna analiza: izračunavanje razlike između : izračunavanje razlike između dobijenih vrednosti dobijenih vrednosti yy i izračunatih (iz jednačine) i izračunatih (iz jednačine) vrednosti vrednosti yy

Page 34: Prosta Linearna Regresiona Analiza

34

Uslovi za regresionu analizuUslovi za regresionu analizu

• normalna raspodela greškenormalna raspodela greške• konstantna varijansa greške za sve vrednosti x konstantna varijansa greške za sve vrednosti x (homosedastičnost)(homosedastičnost)

Page 35: Prosta Linearna Regresiona Analiza

35

Primer 1 - rezidualiPrimer 1 - reziduali

t0C mL dobijeni mL izračunati reziduali

24 480 380,4 99,6

28 600 698,5 -98,5

29 750 778,0 -28,0

29 810 778,0 32,0

33 960 1096,1 -136,1

36 1440 1334,7 105,3

37 1440 1414,2 25,8

Page 36: Prosta Linearna Regresiona Analiza

36

Primer 1 - rezidualiPrimer 1 - reziduali

t Residual Plot

-150

-100

-50

0

50

100

150

0 5 10 15 20 25 30 35 40

t

Res

idua

ls

Page 37: Prosta Linearna Regresiona Analiza

37

Rezidualna analiza za homosedastičnostRezidualna analiza za homosedastičnostre

zidu

ali

Nekonstantna varijansa Konstantna varijansa

x x

Y

x x

Y

rezi

dual

i

Page 38: Prosta Linearna Regresiona Analiza

38

Predviđanja uz pomoć regresione analizePredviđanja uz pomoć regresione analize

Vrste predviđanjaVrste predviđanja Predviđanje jedne vrednosti (u jednoj tački)Predviđanje jedne vrednosti (u jednoj tački) Predviđanje intervalaPredviđanje intervala

Šta se predviđaŠta se predviđa Populacioni prosečni odgovorPopulacioni prosečni odgovor ( (μμyxyx) ) za datoza dato xx

Tačka na populacionoj regresionoj linijiTačka na populacionoj regresionoj liniji Individualni odgovorIndividualni odgovor ( (yy) ) za datoza dato xx

Page 39: Prosta Linearna Regresiona Analiza

39

Primer 1 – predviđanje yPrimer 1 – predviđanje y

y = - 1528,03 + 79,52x, r = 0,970 y = - 1528,03 + 79,52x, r = 0,970

mL = - 1528,03 + 79,52 mL = - 1528,03 + 79,52 tt00CC

mL = - 1528,03 + 79,52 x mL = - 1528,03 + 79,52 x 404000CC = = 1652,81652,8

mL = - 1528,03 + 79,52 x mL = - 1528,03 + 79,52 x 202000CC= = 62,4 (??)62,4 (??)

mL = - 1528,03 + 79,52 x mL = - 1528,03 + 79,52 x 101000CC = = -732,8 (??)-732,8 (??)

Predviđanje samo za raspon vrednosti x iz kojih je Predviđanje samo za raspon vrednosti x iz kojih je izračunata regresiona jednačina!izračunata regresiona jednačina!

Page 40: Prosta Linearna Regresiona Analiza

40

Predviđanje yPredviđanje y

22

2p

yx2n,2/)x(nx

)xx(

n

1Sty

IntervalInterval predikcije predikcije IntervalInterval pouzdanosti pouzdanosti

Za predviđanje Za predviđanje jednejedne vrednosti y za dato xvrednosti y za dato x

Za predviđanje populacione Za predviđanje populacione prosečne vrednostiprosečne vrednosti y za dato x y za dato x

Interval pouzdanostiInterval pouzdanosti za y je uži od za y je uži od intervala predikcijeintervala predikcije za y za istu za y za istu datu vrednost x, jer je manja greška u predviđanju datu vrednost x, jer je manja greška u predviđanju prosečne prosečne vrednostivrednosti od greške u predviđanju od greške u predviđanju jedne vrednostijedne vrednosti

22

2p

yx2n,2/)x(nx

)xx(

n

11Sty

Page 41: Prosta Linearna Regresiona Analiza

41

Interval pouzdanosti za yInterval pouzdanosti za y

t - 29t - 2900C y = 778 mL (izračunato)C y = 778 mL (izračunato) 95% Interval pouzdanosti 95% Interval pouzdanosti tt0,05, 50,05, 5 = 2,571 = 2,571

mL44,885mL56,670

44,107778)857,30(76796

)857,3029(

7

159,101571,2778

2

2

mL49,946mL51,609

49,168778)857,30(76796

)857,3029(

7

159,101032,4778

2

2

t - 29t - 2900C y = 778 mL (izračunato)C y = 778 mL (izračunato) 99% Interval pouzdanosti 99% Interval pouzdanosti tt0,01, 50,01, 5 = 4,032 = 4,032

Page 42: Prosta Linearna Regresiona Analiza

42

Interval predikcije za yInterval predikcije za y

t - 29t - 2900C y = 778 mL (izračunato)C y = 778 mL (izračunato) 95% Interval predikcije 95% Interval predikcije tt0,05, 50,05, 5 = 2,571 = 2,571

mL42,1060mL58,495

42,282778)857,30(76796

)857,3029(

7

1159,101571,2778

2

2

mL91,1220mL09,335

91,442778)857,30(76796

)857,3029(

7

1159,101032,4778

2

2

t - 29t - 2900C y = 778 mL (izračunato)C y = 778 mL (izračunato) 99% Interval predikcije 99% Interval predikcije tt0,01, 50,01, 5 = 4,032 = 4,032

Page 43: Prosta Linearna Regresiona Analiza

43

Interval pouzdanosti vs. interval predikcijeInterval pouzdanosti vs. interval predikcije

y

x

Interval predikcije za Interval predikcije za jednojedno y, y, za datoza dato x xpp

xp

y = by = b00 + b + b11xx

x

Interval Interval pouzdanosti za pouzdanosti za prosečnoprosečno y, y, za za datodato x xpp

Page 44: Prosta Linearna Regresiona Analiza

44

Korelacioni modeliKorelacioni modeli

Daju odgovor na pitanje “Koliko je jaka linearna relacija Daju odgovor na pitanje “Koliko je jaka linearna relacija između dve varijable”između dve varijable”?’?’

Izražavaju se koeficijentom korelacijeIzražavaju se koeficijentom korelacije Populacioni koeficijent korelacije se označava saPopulacioni koeficijent korelacije se označava sa (rho) (rho) Vrednosti se kreću od Vrednosti se kreću od -1 to +1 -1 to +1 Izražava stepen asocijacijeIzražava stepen asocijacije

Koriste se uglavnom za razumevanje relacijaKoriste se uglavnom za razumevanje relacija

Page 45: Prosta Linearna Regresiona Analiza

45

Koeficijent korelacijeKoeficijent korelacije

Pearson Pearson – ov koeficijent korelacije– ov koeficijent korelacije::

2222 yNyxNx

yxNxy

ijedeterminac tkoeficijenr

Page 46: Prosta Linearna Regresiona Analiza

46

Vrednosti koeficijenta korelacijeVrednosti koeficijenta korelacije

potpuna negativna potpuna negativna korelacijakorelacija

-1.0-1.0 +1.0+1.000

potpuna pozitivna potpuna pozitivna korelacijakorelacija

povećanje stepena povećanje stepena negativne korelacijenegativne korelacije

--00.5.5 ++00.5.5

nema korelacijenema korelacije

povećanje stepena povećanje stepena pozitivne korelacijepozitivne korelacije

Page 47: Prosta Linearna Regresiona Analiza

47

Koeficijent korelacijeKoeficijent korelacije

r = 0,8r = 0,8 r = 0,4r = 0,4

r = -0,8r = -0,8 r = -0,4r = -0,4 r = 1,0r = 1,0

r = 0,0r = 0,0

Page 48: Prosta Linearna Regresiona Analiza

48

Tumačenje veličine koeficijenata korelacijeTumačenje veličine koeficijenata korelacije

do 0,20do 0,20 neznatna korelacija, gotovo ne postoji neznatna korelacija, gotovo ne postoji povezanost između varijablipovezanost između varijabli

od 0,20 do 0,40od 0,20 do 0,40 niska korelacija, postoji mala povezanost niska korelacija, postoji mala povezanost između varijabliizmeđu varijabli

od 0,40 do 0,70od 0,40 do 0,70 umjerena korelacija, bitna povezanost između umjerena korelacija, bitna povezanost između varijablivarijabli

od 0,70 do 0,90od 0,70 do 0,90 visoka korelacija, izrazita povezanost između visoka korelacija, izrazita povezanost između varijablivarijabli

od 0,90 do 1,00od 0,90 do 1,00 veoma visoka korelacija, veoma uska veoma visoka korelacija, veoma uska povezanost između varijablipovezanost između varijabli

Page 49: Prosta Linearna Regresiona Analiza

49

Testiranje koeficijenta korelacijeTestiranje koeficijenta korelacije

Testira se da li postoji linearna korelacija između dve Testira se da li postoji linearna korelacija između dve varijablevarijable

HHipotezeipoteze HH00: : ρρ = 0 (= 0 (nema korelacijenema korelacije) )

HH11: : ρρ 0 ( 0 (postoji korelacijapostoji korelacija))

Izraz za izračunavanjeIzraz za izračunavanje

2r1

2Nrt

HH00 se prihvata ako je t < t se prihvata ako je t < tαα, N-2, N-2

zaključak:zaključak: nema korelacijenema korelacije

Page 50: Prosta Linearna Regresiona Analiza

50

Primer 1Primer 1

rr22 = 0,9412 = 0,9412 r = 0,9702r = 0,9702

t = 8,95t = 8,95 tt0,05; 50,05; 5 = 2,571 = 2,571 t > tt > t0,05; 50,05; 5

HH00 se ne prihvata se ne prihvata

Zaključak: postoji značajna korelacijaZaključak: postoji značajna korelacija

Page 51: Prosta Linearna Regresiona Analiza

51

Linearna regresija u MS-Excel-uLinearna regresija u MS-Excel-u

Tools, Data Analysis, RegressionTools, Data Analysis, Regression Input Y-rangeInput Y-range: obeležiti zavisnu promenljivu: obeležiti zavisnu promenljivu Input X-rangeInput X-range: obeležiti nezavisnu promenljivu: obeležiti nezavisnu promenljivu LabelsLabels: označiti: označiti Confidence LevelConfidence Level: 95% (ili 99%): 95% (ili 99%) označiti polje označiti polje Output range Output range i postaviti kursor na polje u Worksheetu i postaviti kursor na polje u Worksheetu

gde treba da se pojavi izveštajgde treba da se pojavi izveštaj ResidualsResiduals: označiti: označiti Residuals PlotsResiduals Plots: označiti: označiti Line Fit PlotsLine Fit Plots: označiti: označiti OKOK

Page 52: Prosta Linearna Regresiona Analiza

52

Primer 1 - u MS-Excel-uPrimer 1 - u MS-Excel-uSUMMARY OUTPUT

Regression StatisticsMultiple R 0,97014R Square 0,94118Adjusted R Square 0,92942Standard Error 101,698Observations 7

ANOVAdf SS MS F Significance F

Regression 1 827458,76 827458,76 80,005429 0,0002911Residual 5 51712,66376 10342,533Total 6 879171,4286

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%Intercept -1528,034934 277,0080568 -5,516 0,0026802 -2240,11 -815,96temp 79,5197 8,8903 8,945 0,0002911 56,67 102,37

Page 53: Prosta Linearna Regresiona Analiza

53

Interpretacija ANOVA rezultataInterpretacija ANOVA rezultata

F test testira nultu hipotezu da regresija ne objašnjava F test testira nultu hipotezu da regresija ne objašnjava značajnu proporciju varijacije u značajnu proporciju varijacije u yy

Stepeni slobode za F-test su 1 i n-2Stepeni slobode za F-test su 1 i n-2 U ovom primeru F = 80,1 sa 1 i 5 stepena slobodeU ovom primeru F = 80,1 sa 1 i 5 stepena slobode

t-test za b=0 je identičan F-testu za rt-test za b=0 je identičan F-testu za r22 = 0 = 0 vrednost vrednost tt za b = 0 je jednaka kvadratnom korenu iz F za b = 0 je jednaka kvadratnom korenu iz F

Page 54: Prosta Linearna Regresiona Analiza

54

Linearna regresija u SPSS-uLinearna regresija u SPSS-u

Podaci se unose u dve kolone (nezavisna i zavisna promenljiva)Podaci se unose u dve kolone (nezavisna i zavisna promenljiva) Analyze, Regression, LinearAnalyze, Regression, Linear DependentDependent : mL : mL IndependentIndependent: t: t Statistics: Statistics:

Regression coefficients: Regression coefficients: označitioznačiti Estimates i Estimates i Confidence intervalsConfidence intervals

označitioznačiti Model Fit Model Fit ContinueContinue OKOK

Page 55: Prosta Linearna Regresiona Analiza

55

Primer 1 - u SPSS-uPrimer 1 - u SPSS-u

Variables Entered/Removedb

Ta , EnterModel1

VariablesEntered

VariablesRemoved Method

All requested variables entered.a.

Dependent Variable: MLb.

Model Summaryb

,970a ,941 ,929 101,70Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Predictors: (Constant), Ta.

Dependent Variable: MLb.

Page 56: Prosta Linearna Regresiona Analiza

56

Primer 1 - u SPSS-uPrimer 1 - u SPSS-u

ANOVAb

827458,8 1 827458,765 80,005 ,000a

51712,664 5 10342,533

879171,4 6

Regression

Residual

Total

Model1

Sum ofSquares df Mean Square F Sig.

Predictors: (Constant), Ta.

Dependent Variable: MLb.

Coefficientsa

-1528,035 277,008 -5,516 ,003 -2240,096 -815,974

79,520 8,890 ,970 8,945 ,000 56,667 102,372

(Constant)

T

Model1

B Std. Error

UnstandardizedCoefficients

Beta

Standardized

Coefficients

t Sig. Lower Bound Upper Bound

95% Confidence Interval for B

Dependent Variable: MLa.

y = - 1528,03 + 79,52x, r = 0,970 y = - 1528,03 + 79,52x, r = 0,970

Page 57: Prosta Linearna Regresiona Analiza

57

Primer 1 - u SPSS-uPrimer 1 - u SPSS-u

Residuals Statisticsa

380,44 1414,19 925,71 371,36 7

-136,11 105,33 1,14E-13 92,84 7

-1,468 1,315 ,000 1,000 7

-1,338 1,036 ,000 ,913 7

Predicted Value

Residual

Std. Predicted Value

Std. Residual

Minimum Maximum Mean Std. Deviation N

Dependent Variable: MLa.

Page 58: Prosta Linearna Regresiona Analiza

58

Primer 1 - Grafik u SPSSPrimer 1 - Grafik u SPSS

GraphsGraphs Scatter – Simple – DefineScatter – Simple – Define Y-axis: mLY-axis: mL X-axis: tX-axis: t OKOK Kliknuti na sliku 2 puta, da se otvori Chart EditorKliknuti na sliku 2 puta, da se otvori Chart Editor U Chart Editoru otvoriti Chart – Options – označiti Fit Line: Total, U Chart Editoru otvoriti Chart – Options – označiti Fit Line: Total,

OKOK Zatvoriti Chart EditorZatvoriti Chart Editor

Page 59: Prosta Linearna Regresiona Analiza

59

Primer 1 - Grafik u SPSSPrimer 1 - Grafik u SPSS

T

383634323028262422

ML

1600

1400

1200

1000

800

600

400

Page 60: Prosta Linearna Regresiona Analiza

60

Primer 2 – vežba na časuPrimer 2 – vežba na času

This dataset stems from a study concerning the preservation of ascorbic acid in This dataset stems from a study concerning the preservation of ascorbic acid in vegetables during drying and storing. The amount of acid preserved is the vegetables during drying and storing. The amount of acid preserved is the response (dependent) variable, while the percentage dry matter is the response (dependent) variable, while the percentage dry matter is the explanatory (independent) variable. explanatory (independent) variable.

% suve materije

% sačuvanog vit C

% suve materije

% sačuvanog vit C

10,0 66,7 10,0 70,9

10.2 77,2 8,9 74,0

11.2 83,8 8,9 58,6

11.2 67,9 9,2 80,6

10,0 88,9 7,8 69,4

10,7 69,0 10,1 76,0

10,3 69,8 9,0 66,4

12,9 86,0 8,2 50,9

11,8 79,9 9,5 61,9

14,9 88,2 10,8 65,2

12,5 74,2 11,1 77,2

12,3 83,1 11,2 89,6

Page 61: Prosta Linearna Regresiona Analiza

61

Primer 2 – Izveštaj u MS ExceluPrimer 2 – Izveštaj u MS Excelu

SUMMARY OUTPUT

Regression StatisticsMultiple R 0,618229R Square 0,382207Adjusted R Square0,354125Standard Error8,052384Observations 24

ANOVAdf SS MS F Significance F

Regression 1 882,5254 882,5254 13,611 0,00128Residual 22 1426,5 64,84089Total 23 2309,025

CoefficientsStandard Error t Stat P-value Lower 95%Upper 95%Lower 95,0%Upper 95,0%Intercept 33,4819 11,0983 3,0168 0,0063 10,4653 56,4984 10,46535 56,49844% suve materije 3,8458 1,0424 3,6893 0,0013 1,6839 6,0077 1,683931 6,007677

% suve materije Line Fit Plot

0

50

100

0,00 10,00 20,00

% suve materije

% sačuvanog vit C

Predicted %sačuvanog vit C

Page 62: Prosta Linearna Regresiona Analiza

62

Primer 2 – Grafički prikazPrimer 2 – Grafički prikaz

0

10

20

30

40

50

60

70

80

90

100

0 2 4 6 8 10 12 14 16

% suve materije

% s

aču

vano

g vi

t C

% sačuvanog vit C Linear (% sačuvanog vit C)

Page 63: Prosta Linearna Regresiona Analiza

63

RezidualiReziduali% suve materije % dobijen % izračunat Residuals

10,0 66,7 71,94 -5,24

10,2 77,2 72,71 4,49

11,2 83,8 76,55 7,25

11,2 67,9 76,55 -8,65

10,0 88,9 71,94 16,96

10,7 69 74,63 -5,63

10,3 69,8 73,09 -3,29

12,9 86 83,09 2,91

11,8 79,9 78,86 1,04

14,9 88,2 90,78 -2,58

12,5 74,2 81,55 -7,35

12,3 83,1 80,79 2,31

10,0 70,9 71,94 -1,04

8,9 74 67,71 6,29

8,9 58,6 67,71 -9,11

9,2 80,6 68,86 11,74

7,8 69,4 63,48 5,92

10,1 76 72,32 3,68

9,0 66,4 68,09 -1,69

8,2 50,9 65,02 -14,12

9,5 61,9 70,02 -8,12

10,8 65,2 75,02 -9,82

11,1 77,2 76,17 1,03

11,2 89,6 76,55 13,05

Page 64: Prosta Linearna Regresiona Analiza

64

Primer 2 - RezidualiPrimer 2 - Reziduali

Residuals

-20

-15

-10

-5

0

5

10

15

20

0 2 4 6 8 10 12 14 16

% suve materije

Page 65: Prosta Linearna Regresiona Analiza

65

Primena regresione analize u analiticiPrimena regresione analize u analitici

Regresiona analiza se u analitici primenjuje u sledećim Regresiona analiza se u analitici primenjuje u sledećim slučajevimaslučajevima

Za izračunavanje jednačine standardne kriveZa izračunavanje jednačine standardne krive Za procenu tačnosti metoda i poređenje metodaZa procenu tačnosti metoda i poređenje metoda Za procenu tačnosti metoda na osnovu metode Za procenu tačnosti metoda na osnovu metode

standardnog dodatka (“recovery”)standardnog dodatka (“recovery”)

Page 66: Prosta Linearna Regresiona Analiza

66

Primena regresione analize u analiticiPrimena regresione analize u analitici

Stupnjevi u primeni regresione i korelacione analize:Stupnjevi u primeni regresione i korelacione analize:

1.1. Izračunavanje koeficijenta korelacije rIzračunavanje koeficijenta korelacije r

za standardnu krivu r za standardnu krivu r 0,99 0,99

r2 = 0,98 = 98%

za tačnost i poredjenje metoda r za tačnost i poredjenje metoda r 0,9 0,9

r2 = 0,81 = 81%

Page 67: Prosta Linearna Regresiona Analiza

67

Primena regresione analize u analiticiPrimena regresione analize u analitici

2.2. Izračunavanje jednačine praveIzračunavanje jednačine prave Odsečak a – sistematska greškaOdsečak a – sistematska greška Nagib b – sistematska (% greška)Nagib b – sistematska (% greška)

3.3. Testiranje koeficijenataTestiranje koeficijenata Za standardnu krivu:Za standardnu krivu: testiranje odsečka a testiranje odsečka a Za poredjenje metoda:Za poredjenje metoda: testiranje odsečka a i testiranje odsečka a i

nagiba bnagiba b Za “recovery” test:Za “recovery” test: testiranje nagiba b testiranje nagiba b

Page 68: Prosta Linearna Regresiona Analiza

68

Tačnost metode – primer 3Tačnost metode – primer 3

r = 0,99995r = 0,99995

b = 1,037b = 1,037 a = -4,221a = -4,221

SSyxyx = 1,0486 = 1,0486

Page 69: Prosta Linearna Regresiona Analiza

69

Tačnost metode – testiranje grešakaTačnost metode – testiranje grešaka

Testiranje značajnosti odsečka a (sistematske greške)Testiranje značajnosti odsečka a (sistematske greške) HH00: a = 0: a = 0 HH11: a : a 0 0

SSaa = 0,976 t = 0,976 taa = 4,324 = 4,324

tt0,05, 40,05, 4 = 2,776 = 2,776 ttaa > t > t0,050,05

Značajnost odsečka a: Značajnost odsečka a:

Prihvata se HPrihvata se H11: a : a 0 0

Zaključak: postoji negativna sistematska greška od Zaključak: postoji negativna sistematska greška od 4,22 mmol/L4,22 mmol/L

Page 70: Prosta Linearna Regresiona Analiza

70

Tačnost metode – testiranje grešakaTačnost metode – testiranje grešaka

Testiranje značajnosti nagiba b (proporcionalne Testiranje značajnosti nagiba b (proporcionalne greške)greške)

HH00: b = 1: b = 1 H H11: b : b 1 1

SSbb = 0,005 t = 0,005 tb b = 7,43= 7,43

tt0,05, 40,05, 4 = 2,776 = 2,776 t tbb> t> t0,050,05

Značajnost nagiba b: Značajnost nagiba b:

Prihvata se HPrihvata se H11: b : b 1 1

Zaključak: postoji procentualna greška od 3,7% Zaključak: postoji procentualna greška od 3,7%

(b =1 ,037 = 103,7%)(b =1 ,037 = 103,7%)