multivariabilna logistična regresija s ponovitvijo ... · multivariabilna logistična regresija s...

41
Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno farmacijo Univerza v Ljubljani- Fakulteta za farmacijo

Upload: others

Post on 22-Sep-2019

19 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Multivariabilna logistična regresija s ponovitvijo linearne regresije

doc. dr. Mitja Kos, mag. farm.

Katedra za socialno farmacijo

Univerza v Ljubljani- Fakulteta za farmacijo

Page 2: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Analiza povezanosti

Regresija: Statistična analiza povezanosti dveh spremenljivk pri

čemer je ena odvisna druga pa neodvisna spremenljivka (njene vrednosti lahko sami izbiramo). Opazovani pojav= odvisna spremenljivka Napovedni dejavnik= neodvisna spremenljivka Npr. Učinek=f(koncentracije), regresijski koeficienti b

Korelacija: Statistična analiza povezanosti dveh spremenljivk, ki

sta obe naključni (njihove vrednosti ne moremo vnaprej izbirati) in odvisni (na obe delujejo biološki in drugi dejavniki variabilnosti) Skušamo kvantificirati stopnjo povezanosti dveh

spremenljivk. Npr. Pearsonov korelacijski koeficient R, determinacijski koeficient R2

Pri praktičnem delu ni ostre meje med obema metodama.

Page 3: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Analiza povezanosti

Statistični modeli:

Univariabilni:

en napovedni dejavnik

Povezava kot pomembna pokaže: zaradi dejanske povezanosti napovednega

dejavnika s pojavom

lahko tudi zaradi povezanosti z nekim drugim napovednim dejavnikom.

Multivariabilni:

več napovednih dejavnikov

Page 4: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Linearna regresija

Preprosta LR: matematični model= premica

za vsak posamezni y

b0 in b1 sta parametera modela.

e je napaka N(0, se2)

Pričakovana vrednost (povprečen y)

ebb 1x 0 y

x

y

1b1x 0 E(y) bb

Page 5: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

E(y)

x

Naklon b1je pozitiven

Regresijska premica

Odsekb0

Pozitiven linearni odnos

Page 6: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

E(y)

x

Naklon b1je negativen

Regresijska premicaOdsekb0

Negativen linearni odnos

Page 7: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

E(y)

x

Naklon b1je 0

Regresijska premicaOdsek

b0

Ni povezave

Page 8: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Metoda najmanjših kvadratov

yi = ocena i-te vrednosti odvisne spremenljivke

yi = opažena i-ta vrednosti odvisne spremenljivke

^

2

ˆmin ii yy

Page 9: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

ix

)(yy

Page 10: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

xy 10 bb

iy

iy

ix

),( yx

X

y

Page 11: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

xy 10 bb

iy

iy

ix

ie

),( yx

X

y

)ˆ()ˆ()( yyyyyy iiii

rezidual, ostanek (napaka)

regresija

222

ˆˆiiii yyyyyy

Page 12: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

y = b0 + b1x1 + b2x2 + . . . + bpxp + e

b0, b1, b2, . . . , bp so parametri.

Standardizirani parametri (xi zi)

e je napaka, ki je slučajna spremenljivka.

Multipli regresijski model

Page 13: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Metoda najmanjših kvadratov

Kriterij

Določitev koeficientov

Kompleksna algebra. Uporaba statističnih programskih paketov.

Interpretacija koeficientov

2

ˆmin ii yy

k

kx

yb

kk xbxbxbayE ...)( 2211

Page 14: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

E(y)

x

Naklon b1je 0

Regresijska premicaOdsek

b0

Ni povezave

Page 15: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Pri enostavni linearni regresiji nas Fand t test vodita k istim sklepom.

V multipli regresiji uporabimo F in ttest za različna namena.

Statistično sklepanje

Page 16: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

F test

Pomembnost modela kot celote.

Test for overall significance.

Hipotezi:H0: b1 = b2 = . . . = bp = 0

Ha: Najmanj eden izmed parametrov ni enak 0

Page 17: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

t test

Če je izid F testa za model kot celota značilen, uporabimo t teste za ugotavljanje značilnosti vplivov posameznih neodvisnih spremenljivk.

Za vsako neodvisno spremenljivko izvedemo en t test.

Vsak t test imenujemo tudi test posamične značilnosti (test for individual significance).

Hipotezi:H0: bi = 0Ha: bi ≠ 0

Page 18: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Koeficient determinacije

Multipli koeficient determinacije R2

Kako dobro model opisuje podatke?

Page 19: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Primer:Vpliv kajenja na pljučno funkcijo

Z raziskavo želimo opredeliti vpliv kajenja na pljučno funkcijo. Naključno smo izbrali 1000 ljudi obeh spolov in spremljali pljučno funkcijo (parameter FEV), poleg tega smo beležili še njihovo starost in telesno višino. Za analizo rezultatov raziskave smo uporabili metodo multiple regresije. Neodvisne spremenljivke v analizi so bile:

starost [leta]telesna višina [cm] spol (0 = ženski, 1 = moški)kajenje (0 = nekadilec, 1 = kadilec)Odvisna spremenljivka pa je bila FEV [liter].

Page 20: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Model Summary

.497a .247 .243 .25269

Model

1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Predictors: (Constant), kajenje, t. v išina (cm), starost(leta), spol

a.

ANOVAb

20.786 4 5.196 81.383 .000a

63.533 995 .064

84.319 999

Regression

Residual

Total

Model

1

Sum ofSquares df Mean Square F Sig.

Predictors: (Constant), kajenje, t . v išina (cm), starost (leta), spola.

Dependent Variable: FEV (l)b.

Coefficientsa

2.666 .118 22.568 .000

-1.9E-03 .001 -.063 -2.296 .022

-5.6E-04 .001 -.024 -.844 .399

.219 .017 .376 13.208 .000

-.275 .023 -.327 -11.857 .000

(Constant)

starost (leta)

t. v išina (cm)

spol

kajenje

Model

1

B Std. Error

UnstandardizedCoeff icients

Beta

StandardizedCoeff icients

t Sig.

Dependent Variable: FEV (l)a.

Primer:Vpliv kajenja na pljučno funkcijo

Page 21: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno
Page 22: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno
Page 23: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Tveganje, obeti ter razmerja

Izid

Spol Smrt Preživetje Skupaj

Moški n11=1364 n12=367 n1+=1731

Ženski n21=126 n22=344 n2+=470

Skupaj n+1=1490 n+2=711 n=2201

Page 24: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Tveganje, obeti ter razmerja

2

1

p

pRR

2

2

1

1

1

1

p

p

p

p

1

2

1

2

2

1

2

2

1

1

1

1

1

1

1

1

p

pRR

p

p

p

p

p

p

p

p

Relativno tveganje

ang. Relative Risk

Razmerje obetov

ang. Odds Ratio

Povezava med razmerjem obetov ter relativnim tveganjem:

Page 25: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Tveganje, obeti ter razmerja

2112

2211

22

21

21

11

nn

nn

n

n

n

n

m 2112

2211

222

221

112

111

2

2

1

1

/

/

/

/

1

1

nn

nn

nn

nn

nn

nn

p

p

p

p

79,01731

1364

1

111

n

np

Izid

Spol Smrt Preživetje Skupaj

Moški n11=1364 n12=367 n1+=1731

Ženski n21=126 n22=344 n2+=470

Skupaj n+1=1490 n+2=711 n=2201

Page 26: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Preprosta logistična regresija

Opazovani pojav= binarna spremenljivka 0/1

Kako uporabiti linearni model za opisovanje odnosa?

Page 27: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Preprosta logistična regresija

Vrednost binarne spremenljivke zapisati kot:

Verjetnost, da zavzame vrednost 1 pri danem X: π (x)- populacija

p(x)- vzorec

Zavzame le vrednosti med 0 in 1- preozek razpon

Razmerje verjetnosti, da dogodek zgodi in da se ne zgodi:

Zavzame vrednosti med 0 in + neskončnostjo

)(1

)(

xp

xp

Page 28: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Preprosta logistična regresija

Logaritmiranje=> med – in + neskončnostjo

itxp

xplog

)(1

)(ln

itbxax

xlog

)(1

)(ln

itbxa

xp

xplog

)(1

)(ln

Ocena parametrov iz vzorca:Populacija:

bxa

bxa

e

exp

1)(

Verjetnost, da dogodek

zgodil pri danem X

Page 29: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Pomen regresijskega koef. b

Lin. regresija:

Log. regresija:

Binarni X (0/1) => x=0, x+1=1.

Obet da bo y=1:

Logaritmiranje:

)()1( xx yyb

)()1( loglog xx ititb

)0(1

)0(0

p

pOx

)1(1

)1(1

p

pOx

)0(1

)0(lnlog 0

p

pit x

)1(1

)1(lnlog 1

p

pit x

itbxaxp

xplog

)(1

)(ln

Page 30: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Pomen regresijskega koef. b

Log. razmerja

obetov:

)0()1( loglogln ititbRO

)0(1

)0(0

p

pOx

)1(1

)1(1

p

pOx

)0(1

)0(

)1(1

)1(

0

1

p

p

p

p

O

ORO

x

x

)0(log)1(log

)0(1

)0(

)1(1

)1(

lnln itit

p

p

p

p

RO

beRO

Page 31: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Ocenjevanje b v vzorcu

p(x)? =>b in a ?

Lin. regresija: metoda najmanjših kvadratov ostankov.

Log. regresija: metoda največjega verjetja (maximum likelihood method). Funkcija največjega verjetja

Oz. logaritem funkcije verjetja (“log likelihood”):

Nelinearna funkcija parametrov modela a in b.

Iteracijska metoda, več ocen parametrov. Nove ocene, dokler še zveča funkcijo največjega verjetja. Lokalna/globalna točka največjega verjetja. Start?

itbxaxp

xplog

)(1

)(ln

Page 32: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Ocenjevanje b v populaciji

Vzorčna porazdelitev b- ja: normalna porazdelitev = > interval zaupanja:

Vzorčna ocena razmerja obetov: nenormalna, nesimetrična porazdelitev

Interval zaupanja za RO iz b (spodnjo/zgornjo mejo):

)(* bSEzbb

bSEzbe

*

Page 33: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Multipla logistična regresija

Matematični model:

b(k): sprememba v logitu, ki spremlja spremembo X(k) za 1 enoto, medtem ko se ostale sprem. ne spreminjajo.

Regresijski koef. b = logaritem razmerja obetov

Razmerje obetov= antilogaritem b:

Metoda največjega verjetja

kk

kk

xbxbxba

xbxbxba

e

exp

...

...

2211

2211

1)(

be

Page 34: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Testiranje pomembnosti modela kot celote

Ali se log verjetja modela s spremenljivkami X statistično značilno poveča v primerjavi z log verjetja modela brez njih.

G- statistika- test razmerja dveh verjetij:

Porazdeljuje po hi- kvadrat, df: k-1

k: št. vseh spremenljivk v modelu

V SPSS-u: “Omnibus test”

0

.ln2verjetje

verjetjeG XSPREM

Page 35: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Vrednotenje prileganja modela

Nagelkerkejev R^2

Test hi- kvadrat

Hosmer- Lemeshov test: Oba primerjata opazovano število enot,

pri katerem se je opazovani dogodek zgodil, s pričakovanim številom, ki temelji na enačbi logistične regresije.

Page 36: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Testiranje pomembnosti b

Ho: b=0, Ha: b≠ 0

Testi: Z:

Waldova statistika:

G- statistika:

bSE

bz

0

2

2

bSE

b

G- statistika:

Model, ki

vključuje X, pove

več o Y.

0

ln2verjetje

verjetjeG x

Page 37: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Napovedni dejavniki nenamenske uporabe zdravil

Characteristics that predict physicians’ awareness of their off-label prescribing. Logistic regression model with statistically significant predictors.

Page 38: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Opisne sprem.v regresiji

Opisne sprem. dve vrednosti => kodiranje 0/1

Linearna regresija: Enačbi za pričakovani povprečni vrednosti Y:

Podobno analogija tudi za log. regresijo

abayx

0*10 1111* babay

x

Page 39: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Farmakometrika

Slepe spremenljivke (“dummy var.”)

Opisne sprem. >2 vrednosti

Podobno kot pri binarni sprem.?!

Nove sprem.: vrednosti 0/1

Page 40: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Preprosto kodiranje

Primerjalna kategorija (nima svoje SS)

b(ss): razlika med aritm. sredino Y pri opazovani kategoriji in aritm. sredino primerjalna kategorije oz. konstanto a

Za nominalne opisne sprem. z več kategorijami

Page 41: Multivariabilna logistična regresija s ponovitvijo ... · Multivariabilna logistična regresija s ponovitvijo linearne regresije doc. dr. Mitja Kos, mag. farm. Katedra za socialno

Sekvenčno kodiranje:

Osnovna kategorija (nima svoje SS)

Ni več vedno primerjalna

b(ss): razlika med aritm. sredino Y pri opazovani kategoriji in aritm. sredino prejšnje kategorije

Za opisne sprem. ordinalnega tipa