korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5. predavanje: logistična regresija

54
Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5. predavanje: logistična regresija

Upload: billie

Post on 04-Feb-2016

94 views

Category:

Documents


0 download

DESCRIPTION

Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5. predavanje: logistična regresija. Kaj vpliva na multiplo korelacijo?. korelacije prediktorjev s kriterijem ( ) korelacije med prediktorji ( ), vplivne to čke ( / ), napaka merjenja ( ), - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Korelacijske metode

psihologija (1.st.) – 2. letnik

2011/12

5. predavanje:logistična regresija

Page 2: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Kaj vpliva na multiplo korelacijo?

• korelacije prediktorjev s kriterijem ()• korelacije med prediktorji (),• vplivne točke (/),• napaka merjenja (),• variabilnost OV v vzorcu ().

Stabilnost (SE) modela odvisna od:• korelacij med prediktorji (),• velikosti vzorca (),• vplivnih točk ().

Page 3: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

REGRESIJSKE PREDPOSTAVKE:

1. Naključno vzorčenje

2. Linearnost

3. Homoscedastičnost

4. Normalnost rezidualov

5. (popolna zanesljivost)

Page 4: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Kaj navajamo pri poročanju?

• Regresijski koeficienti• Standardne napake• Intervali zaupanja• Beta koeficienti• (Popravljeni koeficient) multiple korelacije in determinacije• F test za multiplo korelacijo• (standardna napaka napovedi)• Pri postopnem vključevanju še spremembo pojasnjene

variance.

Page 5: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Slide 5

Vsote kvadratov

Page 6: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Slide 6

Povzetek

• SST

– Skupna variabilnost (variabilnost med dejanskimi rezultati in sredino).

• SSR

– Residualna variabilnost/variabilnost napake (Error) (variabilnost med regresijskim modelom in dejanskimi razultati).

• SSM – variabilnost modela (razlika v variabilnosti med modelom

in sredino).

Page 7: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Slide 7

Testiranje modela: ANOVA

• Če model daje boljšo napoved kot uporaba sredine (srednje vrednosti glede na Y), je pričakovati, da bo SSM mnogo večji kot SSR

SSRError in Model

SSMImprovement Due to the Model

SSTTotal Variance In The Data

Page 8: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Slide 8

• Srednja kvadrirana napaka:– Vsote kvadratov so skupne vrednosti– Lahko jih izrazimo kot povprečja– Imenujemo jih „srednji kvadrati“ – MS

R

M

MSMSF

Testiranje modela: ANOVA

Slide 8

Testiranje modela: R in R2

• R: korelacija med opazovanimi vrednostmi na kriteriju in vrednostmi, napovedanimi z modelom

• R2: Delež variance, pojasnjene s strani postavljenega regresijskega modela (kvadriran Pearsonov koeficient korelacije

• Adj. R2: ocena R2 v populaciji („shrinkage“).

T

M

SSSSR 2

Page 9: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Regresijske metode:

• Hierarhična:– Znani napovedniki (glede na predhodne razskave ali teoretične

predpostavke) so najprej vključevani v regresijski model– Zatem so v ločenem koraku/bloku vključeni novi (manj znani/neznani)

napovedniki – Raziskovalec določa vrstni red, v katerem so spremenljivke vključevane v

model – Je najboljša metoda:

• Temelji na preverjanju teorije• Lahko vidiš edinstven napovedni vpliv nove spremenljivke na izid ker so

znani napovedniki v modelu konstantni/kontrolirani• You can see the unique predictive influence of a new variable on the

outcome because known predictors are held constant in the model.– A slabo:

• Zanaša se na to, da raziskovalec ve, kaj počne

Page 10: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

• Vsi napovedniki so vključeni simultano/naenkrat• Dobljeni rezultat je odvisen od spremenljivk, ki jih vključimo v

model (lahko so razmeroma naključne)– Zato je pomembno imeti dobre teoretske razloge za vključitev

posameznih spremenljivk kot napovednike

Direktna („Forced“):

Stopenjska („Stepwise“):

• Napovedniki so vključeni v model po matematičnem kriteriju (glede na njihove semi-parcialne korelacije z izidom/kriterijem)

• Računalnik izbere spremenljivke v različnih korakih (korak 1: SPSS pogleda za napovednikom, ki zmore pojasniti največ variance v kriterijski spremenljivki)

• Problem te metode: temelji le na matematičnem kriteriju (izbor spremenljivk v posameznem koraku je odvisen tudi le od majhnih razlik v semi-parcialnih korelacijah

• Bi morala biti uporabljana le v eksploratorne namene…

Page 11: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Semi-parcialna korelacija:• Parcialna korelacija:

– Meri odnos med dvema spremenljivkama, pri čemer nadzira učinek tretje spremenljivke na obe

• Semi-parcialna korelacija:– Meri odnos med dvema spremenljivkama, pri čemer nadzira učinek

tretje spremenljivke zgolj na eno od obeh– Meri edinstven prispevek prediktorja k pojasnitvi variance kriterija

Parcialna korelacija Semi-parcialna korelacija

Page 12: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Generalizacija:

• Pri regresiji upamo, da bomo lahko posploševali z vzorčne ocene napovedi na celotno populacijo

• Za to mora biti zadoščeno vrsti predpostavk• Nespoštovanje teh predpostavk nam preprečuje posploševanje na

ciljno populacijo

Page 13: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Osnovne predpostavke:• Tip spremenljivk: Kriterij (izid) mora biti kontinuiran, Napovedniki so

lahko kontinuirani ali dihotomni/kategorični• Neničelna varianca: Napovedniki ne smejo imeti ničelne variance• Linearnost: Odnos, ki ga modeliramo, je (naj bo) v realnosti linearen• Neodvisnost: Vse vrednosti na kriteriju/izidu moramo dobiti na

različnih osebah

Zahtevnejše predpostavke: • Čim manjše multikolinearnost: Napovedniki ne smejo biti visoko med

seboj korelirani• Homoscedastičnost: Za vsako vrednost na napovedniku bi morala biti

varianca napake konstantna• Neodvisne napake: Za vsak par izmerjenih vrednosti bi morale biti

napake nekorelirane• Napake bi morale biti normalno porazdeljene

Page 14: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Kako napovedovati dihotomno spremenljivko?(npr. uspešnost terapije, zaključek šolanja, pravilna rešitev naloge, strinjanje z določeno trditvijo…)

Uporaba linearne regresije neustrezna:• kršene predpostavke linearnosti, normalnosti in

homoscedastičnosti (Var odvisna od p)• napovedane vrednosti izven možnega razpona• neustrezne ocene parametrov in ocene učinkov

Page 15: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Diskriminantna analiza (DA): “poiščemo obteženo vsoto napovednikov (enega: => ANOVA, več => MANOVA), ki maksimizira razlike med skupinama”

-> EN DISKRIMINATOR: Skušajmo napovedati spol osebe na podlagi merjene višine: = VERJETNOST (natančnost klasifikacije)

Page 16: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

DA z dvema diskriminatorjema

Page 17: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

DA:• Diskriminantna funkcija z dvema ali več napovedniki je linearna enačba

teh faktorjev, ki je v vlogi separatorja (kriterija) med dvema skupinama• Površina pod sečiščem distribucij je področje napačne klasifikacije

• Povezana z multivariatno analizo variance (MANOVA).• Odvisna spremenljivka ima lahko poljubno št. vrednosti.• Zelo občutljiva na predpostavke!

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

-3 -2 -1 0 1 2 3 4

Obtežena vsota napovednikov

Skupina 0

Skupina 1

Page 18: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

• DA se trudi: maksimizirati SS med skupinami v razmerju do SS znotraj skupin

• Cilj DA: ne izločiti ene same spremenljivke za ločevanje med skupinami, ampak čim manjše število spremenljvk (lahko tudi latentnih), ki bodo omogočale čimvečjo verjetnost napovedovanja

• Postopno vključevanje: na vsakem koraku upošteva vse spremenljivke in izbere tisto, ki najbolje ločuje osebke glede na članstvo v skupini

• (ta je vključena v model in program nadaljuje z naslednjim korakom).

Page 19: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Če imamo dihotomno ali kako drugače kategorično spremenljivko (ordinalnega tipa) kot napovednik, lahko uporabimo klasično regresijsko analizo („…there is nothing in the regression model that requires regressor variables to be continuous – they can be discrete or categorical…“)

Slika odnosa med porodno težo in spola - ilustracija regresije na binarno spremenljivko

Prilagojena premica gre skozi povprečno porodno težo za 34 novorojenčic (0 – 3,24 kg) in povprečno porodno težo 31 novorojenčkov (1 – 3,43 kg); nagib premice (0,19 kg) je razlika v povprečni teži.

Page 20: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Če imamo dihotomno kriterijsko spremenljivko, pa imamo težavo…

- za par z $ 25.000 reg.linija da verjetnost 0,38;- za par z $ 41.000 pa 1,13; - zaslužek $ 14.000 da verjetnost obiska -0,13 (!?)

Page 21: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Nameni logistične regresije – Binarna– Multinomialna

• Teorija, ki stoji za LR– Ocenjevanje modela– Ocenjevanje napovednikov

Napovedovanje z niza spremenljivk na kategorično (nominalno) spremenljivko.

Kdaj in zakaj• Ko želim napovedati izid, ki je kategorična spremenljivka, na osnovi

ene ali več kategoričnih ali kontinuiranih napovednikov• Uporabimo jo, ker kategorično izid (kriterij) ne zadovolji predpostavki

linearnosti v normalni regresiji

Primeri• Napovedovanje izida terapije – uspešno oziroma neuspešno.• Napovedovanje uspeha v šoli – izdela razred oziroma ne izdela razreda.• Napovedovanje bolezni na delovnem mestu – zboli oziroma ne zboli.• Napovedovanje študijske odločitve – humanistična, družboslovna, naravoslovna.

Page 22: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Prednosti pred DA: vrednosti izven obsega 0 do 1, manj zahtevni pogoji uporabe

Prednosti pred MR: vrednosti izven dosega 0 do 1, kršitev homoscedastičnosti

Prednosti sicer:

• ne domneva linearnega odnosa med neodvisnimi in odvisno spremenljivko,

• ne predvideva homoscedastičnosti,

• napake niso nujno razporejene normalno,

• neodvisne spremenljivke niso nujno intervalne,

• neodvisne spremenljivke niso nujno neomejene.

Page 23: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Pogoji uporabe:• smiselno kodiranje (vrednost odvisne spremenljivke, ki nas najbolj

zanima, kodiramo z najvišjo številko),• vključitev relevantnih spremenljivk v model,• izključitev nerelevantrnih spremenljivk,• neodvisne meritve,• majhna napaka merjenja na neodvisnih spremenljivkah,• brez manjkajočih vrednosti,• linearen odnos med logit transformacijo neodvisnih in odvisne

spremenljivke,• odsotnost interakcij (lahko uvedemo novo spremenljivko),• čim nižja multikolinearnost neodvisnih spremenljivk,• odsotnost vplivnih točk,• velik vzorec,• v vsakem pogoju vsaj 2 posameznika, v vsaj 80% pogojev vsaj 5

posameznikov.

Page 24: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Z enim napovednikom:

• Izid– Napovedujemo verjetnost pojavitve določenega izida

• a in b– Je mogoče gledati nanju na enak način kot pri multipli

regresiji– Enačba normalne (enostavne) regresije je del enačbe

logistične regresije!

)11(11)(

iXbaeYP

Z več napovedniki:

• Izid – Še vedno napovedujemo verjetnost pojavitve določenega izida

• Razlike– Enačba multiple regresije je del enačbe logistične regresije!– Ta del enačbe se razširi tako, da vključi dodatne napovednike

)...2211(11)(

inXnbXbXbaeYP

Page 25: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Preverjanje verjetnosti določenega dogodka v dveh skupinah, ki ju določa dvojiška spremenljivka X.

Na posamezni proučevani enoti se dogodek zgodi ali pa ne zgodi, možna izida sta torej le dva. Preprost primer (2x2):- ali je delež obolelih za določeno boleznijo med kadilci in nekadilci enak (izid: oseba

zboli/ne zboli, oseba pa je kadilec ali nekadilec.)

Verjetnostna porazdelitev za slučajno spremenljivko, ki opisuje tak izid, je binomska porazdelitev.

Ničelna domneva pravi, da je verjetnost proučevanega dogodka v prvi in v drugiskupini enaka. Verjetnosti označimo p1 in p2.H0: p1 = p2 = p

Prvo skupino predstavlja vzorec velikosti n1 , drugo vzorec velikosti n2 . Podatkezapišemo v obliki tabele, ki ima dve vrstici in dva stolpca.

Vrstica - izid: dogodek D se zgodi ali ne zgodi: D oz. neD . V stolpce pa skupino 1 in skupino 2, označimo jo x=1 in x=2.

V celicah tabele je število enot, ki spadajo v posamično kategorijo.

Page 26: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Izid x=1 x=2D a cDne b dSkupaj a+b=n1 c+d=n2

Iz prvega vzorca dobimo oceno za verjetnost p1 , označimo jo ; iz drugega vzorca oceno za verjetnost p2, označimo jo :

Oceno za skupno verjetnost p , označimo jo , izračunamo takole:

Pripadajoča testna statistika je zapisana v obliki:

�̂�1=𝑎

𝑎+𝑏❑�̂�2=

𝑐𝑐+𝑑❑

�̂�𝑠𝑘=𝑎+𝑐

𝑎+𝑏+𝑐+𝑑❑

𝑧=�̂�1− �̂�2

√�̂�𝑠𝑘�̂�𝑠𝑘( 1𝑛1

+ 1𝑛2

)

=1-

Page 27: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

𝑧=0 , 5699 −0,4839

√0 , 5355 ×0 , 4645( 193

+ 162 )

=1,052

Izid Zdravilo A Zdravilo B SkupajOzdravi 53 30 83Ne ozdravi 40 32 72Skupaj 93 62 155

�̂�𝐴=5393

=0,5699𝑜𝑧 . 56,9 %❑

�̂�B=3062

=0,4839𝑜𝑧 . 48,4 %❑

�̂�𝑠𝑘=83

155=0,5355𝑜𝑧 . 53,6 %

Kritične vrednosti pri 5 % stopnji gotovosto sta ± 1,96 → se ne zavrne H0

(p = 2P(Z>1,052)=0,293 (p=0,293))

Page 28: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Zanima nas, kako trajanje terapije z zdravilom A ali zdravilom B vpliva na uspešnost zdravljenja. Trajanje terapije je številska spremenljivka z dovolj veliko zalogo vrednosti (zvezna spremenljivka). Poleg tega nas lahko zanima, kako se na zdravljenje z zdravilom A in B odzivajo moški in kako ženske. (Y=uspešnost zdravljenja; X1=zdravilo, X2=spol, X3=trajanje terapije.

obeti (odds) in razmerje obetov (odds ratio); verjetnosti za posamezne dogodke:

Izid x=1 x=2D p1 P2Dne q1 q2

Skupaj 1 1

Obeti za dogodek D v skupini x=1: p1/q1=p1/(1-p1);

Obeti za dogodek D v skupini x=2: p2/q2=p2/(1-p2);

Iz obetov izračunamo njihovo razmerje (referenčna skupina – vsebinsko vprašanje!):

x=1: Ψ2|1=(p2/q2)/p1/q1)=p2q1/p1q2

x=2: Ψ1|2=(p1/q1)/p2/q2)=p1q2/p2q1=1/Ψ2|1

Page 29: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Izid x=1 x=2D a cDne b dSkupaj a+b=n1 c+d=n2

Ocena za obete za dogodek D v x=1 je: a/b Ψ2|1=(c/d)/a/b)=cb/ad

Ocena za obete za dogodek D v x=2 je: c/d Ψ1|2=(a/b)/c/d)=ad/bc

Teorija pove, da je statistika ln asimptotično porazdeljena po normalni porazdelitvi, vzorčna varianca za ln pa je:

var(ln) = 1/a +1/b +1/c +1/d

H0 pa postavimo takole: razmerje obetov je 1; Ψ = 1H1 : Ψ ≠ 1

𝑧=ln ψ̂

√var ( ln ψ̂ )

Page 30: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Obet = p(1) : p(0)

Npr.: PISA – pričakovana naravoslovna kariera pri 30. in naravoslovna kariera staršev

Starši naravoslovc

i - ne

Starši naravoslovc

i – da Število

Naravoslovec pri 30.l. - ne

Število 3725 896 4621

% znotraj vrstice 80,6% 19,4% 100,0%

% znotraj stolpca 73,5% 66,9% 72,1%

Naravoslovec pri 30.l - da

Število 1346 443 1789

% znotraj vrstice 75,2% 24,8% 100,0%

% znotraj stolpca 26,5% 33,1% 27,9%

Število 5071 1339 6410

% znotraj vrstice 79,1% 20,9% 100,0%

% znotraj stolpca 100,0% 100,0% 100,0%

Obeti in razmerje obetov:

Razmerje obetov (odds ratio, OR): 0,49/0,36 = 1,37

OR enako v obe smeri.OR p(1|starši nar.) / p(1|starši nenar.) = 0,33/0,27 = 1,25 !

Obeti za otroke ostalih:1346:3725 = 0,36

Obeti za otroke naravoslovcev:443:896 = 0,49

Page 31: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Model logistične regresije:

linearni odnos preko pretvorbe odvisne spremenljivke (tatransformacija se imenuje ‘logit’ in je opredeljena kot logaritem obetov za dogodek, ki nas zanima):

p(Y) …zvezna spremenljivka med 0 in 1 (verjetnost)obeti (odds): p/(1-p) …zvezna sprem. med 0 in

logit(Y) = ln[p/(1-p)] …zvezna sprem. med - in

Napovedujemo logit:

P

jPiPi Xb aY

1

)logit(

)()(

bXabXa

bXa

ee

eYp

1

1

11

-3 -2 -1 0 1 2 3

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

a+bX

p(Y

=1

)

Page 32: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija
Page 33: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Pomen parametrov pri LR:

• b ni niti Y niti p! (vendar lahko smiselna primerjava p za različne Xi)

• b je logit (pri nespremenjenih preostalih napovednikih)

• exp(b) = OR za Xi in Xi+1(pri konstantnih preostalih napoved.)

Zakaj? Obet =p/(1-p) = exp(a+bXi)=exp(a)×[exp(b)]Xi

Pri katerem X je p = 0,5? Obet = 1 logit = ln(1) = 0 = a+bX X = -a/b

Ocenjevanje parametrov: metoda največjega verjetja (maximum likelihood)

Page 34: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Ocenjevanje modela

• Log-likelihood ocena– Analogna vsoti kvadratov redzidualov v multipli

regresiji– Je indikator, koliko je nepojasnjene informacije

potem, ko smo model prilagodili.– Velike vrednosti kažejo na slabo prileganje

statističnih modelov

N

1 i

1ln1ln likelihoodlog iiii YPYYPY

Page 35: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Ocena sprememb v modelu / modelih

• Možno je izračunati log-verjetje za različne modele in jih med seboj primerjati tako, da gledamo razlike med njihovimi log-verjetji.

)()(22 BaselineLLNewLL

baselinenew kkdf

Page 36: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Slide 36

Ocenjevanje napovednikov: Waldov indeks

• Enak t-statistiki v regresiji• Preverja ničelno hipotezo, da b = 0• Je pristranski, kadar je b velik.• Raje pogledati statistike razmerja verjetij

bSEbWald

Page 37: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Slide 37

Ocenjevanje napovednikov: razmerje obetov oz. Exp(b)

• Oceni spremembo v obetih, ki je posledica spremembe pri napovedniku za eno enoto– OR > 1: Napovednik , Verjetnost pojave dogodka .– OR < 1: Napovednik , Verjetnost pojave dogodka .

predictorthe in change unit a beforeOdds predictorthe in change unit a afterOdds bExp )(

x=1: Ψ2|1=(p2/q2)/p1/q1)=p2q1/p1q2

Izid x=1 x=2D p1 P2Dne q1 q2

Skupaj 1 1

Page 38: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Prileganje modela in natančnost napovedovanja:

Funkcija verjetja

(višja vrednost boljše prileganje, vendar zelo majhne vrednosti)

-2lnV (-2log-likelihood): odstopanje podatkov od modela

Razlika med dvema gnezdenima modeloma v -2lnV = devianca ~ 2 (df = razlika v številu parametrov)

Uporaba deviance: vključevanje napovednikov.

Velikost učinka/ov:

Mere, analogne R2 (% zmanjšanja -2lnV)

N

iiXpV

1

)(

Page 39: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Model Summary

Step-2 Log

likelihoodCox & Snell R Square

Nagelkerke R Square

1 7551,961a ,022 ,032

Classification Tablea¸1

Observed

Predicted

Self science-relat. car. at 30

% CorrectNo Yes

Step 1

Self science-related career at 30

No 4690 17 99,6

Yes 1804 5 ,3

Overall Percentage 72,1

a. The cut value is ,500

Variables in the Equation

B S.E. Wald df Sig. Exp(B)

95% C.I.for EXP(B)

Lower Upper

Step 1a

intscie ,373 ,032 135,01 1 ,000 1,453 1,364 1,547

Constant -,984 ,028 1204,4 1 ,000 ,374

a. Variable(s) entered on step 1: intscie.

Primer:PISA – naravoslovna kariera in interes za učenje naravoslovja

Page 40: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Povzetek

• Skupno prileganje (overall fit) končnega modela je prikazan z −2 log-likelihood statistiko– Če je pomembnost hi-kvadrata manj kot .05, potem imam model

pomembno prileganje podatkom

• Preglej tabelo Variables in the equation, da vidiš, katere spremenljivke pomembno napovedujejo izid

• Uporabi razmerje obetov, Exp(b), za interpretacijo– OR > 1, potem se ob naraščanju napovednika obeti, da se izid

pojavi, povečujejo.

– OR < 1, potem se ob naraščanju napovednika obeti, da se izid pojavi, zmanjšujejo.

– Interval zaupanja OR ne sme iti preko 1!

• Preglej tabelo labelled Variables not in the equation, da vidiš, katere spremenljivke ne napovedujejo izida pomembno

Page 41: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Pomembni predpostavki:

• Neodvisno vzorčenje.• Linearnost odnosa med X in logit(Y).

Preverjanje: npr. z delitvijo v razrede.

Preveriti tudi, da -2lnV < št. parametrov, sicer lahko prenizke SE

Page 42: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Priporočena dodatna literatura:

Košmelj, K. (2001). Osnove logistične regresije. Dostopno na:http://stari.bf.uni-lj.si/statistika/logisticna_regresija_1.pdf

http://stari.bf.uni-lj.si/statistika/logisticna_regresija_2.pdf

Field, A. (2009). Discovering statistics using SPSS (3rd ed.). London: Sage. Poglavje 8.

Page 43: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Logistična regresija

Primer:

Kakšna je verjetnost, da boste zaključili podiplomski študij? ]:-]

Spremenljivke:

• Aktivnost - aktivnost, v katero je (bil) vključen posameznik (šport, glasbilo, jezik).

• Opravil – Posameznik je oziroma ni zaključil študija.

• Energija - dosežek na lestvici energija na BFO,

• Čustv_s - dosežek na lestvici čustvena stabilnost na BFO,

• Vestnost - dosežek na lestvici vestnost na BFO,

• Sprejemlj - dosežek na lestvici sprejemljivost na BFO,

• Odprtost - dosežek na lestvici odprtost na BFO,

• RPM - dosežek na testu inteligentnosti.

Page 44: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Logistična regresija

Analyze – Regression – Binary Logistic… ali Multinomial Logistic…

Page 45: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Logistična regresija

Pogovorno okno binarne logistične regresije…

Page 46: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Logistična regresija

Pogovorno okno Categorical…

Page 47: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Logistična regresija

Pogovorno okno Save New Variables…

Page 48: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Logistična regresija

Pogovorno okno Options…

Page 49: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Logistična regresija

Izpis…

Case Processing Summary

79 100,0

0 ,0

79 100,0

0 ,0

79 100,0

Unweighted Casesa

Included in Analysis

Missing Cases

Total

Selected Cases

Unselected Cases

Total

N Percent

If weight is in effect, see class ification table for the totalnumber of cases.

a.

Dependent Variable Encoding

0

1

Original Valueni zaključil

je zaključil

Internal Value

Categorical Variables Codings

30 1,000 ,000

25 ,000 1,000

24 ,000 ,000

Šport

Učenje glasbila

Učenje jezika

Aktivnost, v katero jevključen posameznik

Frequency (1) (2)

Parameter coding

Page 50: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Logistična regresija

Izpis…

Classification Tablea,b

0 28 ,0

0 51 100,0

64,6

Observedni zaključil

je zaključil

Posameznik je oziromani zaključil š tudija

Overall Percentage

Step 0ni zaključil je zaključil

Posameznik je oziromani zaključil š tudija Percentage

Correct

Predicted

Constant is included in the model.a.

The cut value is ,500b.

Page 51: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Logistična regresija

Izpis…

Variables in the Equation

,600 ,235 6,499 1 ,011 1,821ConstantStep 0B S.E. Wald df Sig. Exp(B)

Variables not in the Equation

1,359 2 ,507

1,316 1 ,251

,189 1 ,663

1,052 1 ,305

,725 1 ,395

1,305 1 ,253

,345 1 ,557

,394 1 ,530

14,831 1 ,000

21,489 8 ,006

Aktivnost

Aktivnost(1)

Aktivnost(2)

Energija

Čustv_s

Vestnost

Sprejemlj

Odprtost

RPM

Variables

Overall Statistics

Step0

Score df Sig.

Page 52: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Logistična regresija

Izpis…

Omnibus Tests of Model Coefficients

28,303 8 ,000

28,303 8 ,000

28,303 8 ,000

Step

Block

Model

Step 1Chi-square df Sig.

Model Summary

74,420a ,301 ,414Step1

-2 Loglikelihood

Cox & SnellR Square

NagelkerkeR Square

Estimation terminated at i teration number 6 becauseparameter estimates changed by less than ,001.

a.

Page 53: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Logistična regresija

Izpis…

Classification Tablea

16 12 57,1

6 45 88,2

77,2

Observedni zaključil

je zaključil

Posameznik je oziromani zaključil š tudija

Overall Percentage

Step 1ni zaključil je zaključil

Posameznik je oziromani zaključil š tudija Percentage

Correct

Predicted

The cut value is ,500a.

Page 54: Korelacijske metode psihologija (1.st.) – 2. letnik 2011/12 5.  predavanje: logistična regresija

Logistična regresija

Izpis…

Variables in the Equation

1,141 2 ,565

-,899 ,844 1,135 1 ,287 ,407

-,341 ,945 ,130 1 ,719 ,711

,068 ,033 4,279 1 ,039 1,070

,036 ,032 1,268 1 ,260 1,036

,034 ,047 ,510 1 ,475 1,034

,064 ,053 1,461 1 ,227 1,067

-,026 ,045 ,337 1 ,562 ,974

,200 ,061 10,684 1 ,001 1,221

-29,949 8,913 11,290 1 ,001 ,000

Aktivnost

Aktivnost(1)

Aktivnost(2)

Energija

Čustv_s

Vestnost

Sprejemlj

Odprtost

RPM

Constant

Step1

a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on s tep 1: Aktivnost, Energija, Čustv_s, Vestnost, Sprejemlj, Odprtost,RPM.

a.