analiza podataka o preživljavanju (vremena do nastajanja ... · pdf filemortalitetne tablice...

52
Analiza podataka o preživljavanju (vremena do nastajanja izabranog događaja - ishoda) Jelena Marinković

Upload: phamdang

Post on 19-Mar-2018

234 views

Category:

Documents


9 download

TRANSCRIPT

Page 1: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Analiza podataka o preživljavanju (vremena do nastajanja izabranog događaja - ishoda)

Jelena Marinković

Page 2: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Pregled

n  Šta je analiza preživljavanja? n  Terminologija i struktura podataka. n  Funkcije gustine verovatnoća,

preživljavanja i hazarda. n  Statističke metode analize

preživljavanja. n  Kaplan-Meierov metod i log-rank test

Page 3: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Primer analize preživljavanja, 1669.

Christiaan Huygens je 1669. godine ovom funkcijom izračunao koliko će osoba na svakih 100 osoba doživeti 86 godina. Izvor: Howard Wainer- STATISTICAL GRAPHICS: Mapping the Pathways of Science. Annual Review of Psychology. Vol. 52: 305-335

Page 4: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Primer analize preživljavanja, 1669 (2)

Kog oblika je ova funkcija?

Kolika je bila šansa osobe da preživi više od 20 godina? Više od 36? Ovo je analiza preživljavanja!

Pokušavamo da procenimo funkciju—samo što ishod može biti bilo koji binarni događaj, a ne samo smrt.

Page 5: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Analiza preživljavanja - koreni

n  Edmund Halley , 17-ti vek n  Akturijalna analiza, tablice

preživljavanja, “life-table” analiza n  Mortalitetne tablice i očekivano trajanje života

Page 6: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Šta je analiza preživljavanja?

n  Statističke metode za analizu longitudinalnih podataka o pojavljivanju događaja od interesa.

n  Događaji uključuju: smrti, povrede, razboljevanje, oporavak, tranziciju ka vrednostima ispod ili iznad zadatog praga važnih kontinuiranih varijabli (npr. broj CD4).

n  Adekvatna za analizu podataka iz randomizovanih kliničkih ogleda ili kohorti.

Page 7: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Randomizovani klinički ogled (RKO)

Ciljana populacija

Intervencija

Kontrole

Bolest

Bez bolesti

Bolest

Bez bolesti

VREME

Randomizacija

Bez bolesti, kohorta ispitanika pod rizikom

Page 8: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Ciljana populacija

Tretman

Kontrole

Izlečeni

Neizlečeni

Izlečeni

Neizlečeni

VREME

Randomizacija

Populacija pacijenata

Randomizovani klinički ogled (RKO)

Page 9: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Ciljana populacija

Tretman

Kontrole

Mrtav

Živ

Mrtav

Živ

VREME

Randomizacija

Populacija pacijenata

Randomizovani klinički ogled (RKO)

Page 10: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Kohortna studija (prospektivna/retrospektivna)

Ciljana populacija

Ekspozicija

Bez ekspozicije

Bolest

Bez bolesti

Bolest

Bez bolesti

VREME

Kohorta isptanika bez bolesti

Page 11: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Primeri analize preživljavanja u medicini

Page 12: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

RKO: Women’s Health Initiative (JAMA, 2001)

Hormoni

Placebo Kumulativna incidencija

Page 13: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Retrospektivna kohortna studija: Decembar 2003 BMJ: Aspirin, ibuprofen, and mortality after myocardial infarction: retrospective cohort study

Page 14: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

¡  Ocena vremena-do-događaja (time-to-event) za grupu ispitanika, na primer vreme do reinfarkta grupe pacijenata sa IM.

¡  Poređenje vremena-do-događaja između dve ili više grupa ispitanika, na primer tretirani vs. placebo pacijenti sa IM u randomizovanom kliničkom ogledu.

¡  Procena povezanosti kovarijati sa vremenom-do-događaja , na primer: da li su telesna masa, insulinska rezistencija ili holesterol povezani sa vremenom preživljavanja pacijenata sa IM?

Primedba: očekivano vreme-do-događaja = 1/incidencija

Ciljevi analize preživljavanja

Page 15: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Zašto koristiti analizu preživljavanja?

1. Zašto ne porediti prosečno vreme-do-događaja između dve grupe primenom t-testa ili linearne regresije?

-- ignorisanje cenzorisanja!!!!!! 2. Zašto ne porediti proporcije događaja

u grupama primenom ukrštenog odnosa (odds ratio) ili logističke regresije?

--ignorisanje vremena!!!!!

Page 16: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Analiza preživljavanja: Termini

n  Vreme-do-događaja: Vreme od ulaska u studiju do nastupanja specifičnog ishoda

n  Cenzorisanje: Ispitanik je cenzorisan kada je ili izgubljen za praćenje, isključen iz studije ili ako je studija završena pre nego što je razvio događaj od interesa.

Page 17: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Struktura podataka: analiza preživljavanja

Ishod je dvodimenzionalan, dve varijable: n  Vremenska varijabla: ti = vreme do

kada je osoba bez događaja ili vreme nastupanja događaja

n  Cenzorska varijabla: ci =1 ako je nastupio događaj; ci =0 nema događaja do vremena ti

Page 18: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Desno cenzorisanje (T>t)

Uobičajeni primeri n  Završetak istraživanja n  Smrt usled nekog drugog razloga koji nije

događaj od interesa n  Izgubljen za praćenje

Znamo da je osoba preživela bar do vremena t.

Page 19: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Izbor početka merenja vremena.

Page 20: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Desno cenzorisanje!

Page 21: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Ishodna varijabla

n  Binarni ishod i vreme do njegove realizacije.

n  Da li su svi umrli ili ne? n  Ako nisu, imamo cenzorisane podatke. n  Da li su svi ušli u studiju u isto vreme? n  Ako nisu imamo progresivno

cenzorisane podatke.

Page 22: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Raspodele preživljavanja

n  Ti - vreme do nastupanja događaja je slučajna varijabla sa odgovarajućom raspodelom verovatnoća

n  Različite metode za analizu preživljavanja određene su tipom raspodele za Ti.

Page 23: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Primer…

Podsetimo se ovog grafika.

Da li liči na normalnu ili eksponencijalnu raspodelu?

Page 24: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Funkcije vremena preživljavanja

n  Funkcija gustine verovatnoća f(t) n  Funkcija preživljavanja S(t)

¡  P(osoba preživi duže od t) ¡  ocena je = broj pacijenata koji preživi

duže od t / ukupan broj pacijenata n  Funkcija hazarda H(t)

Page 25: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Funkcija gustine verovatnoća:f(t)

Ljudski vek - Ti će malo verovatno slediti normalnu raspodelu. Zašto?

Ljudi imaju najveću verovatnoću umiranja u 70-tim i 80-tim godinama;

ALI umaju manju šansu umiranja u 90 i 100, jer mali broj ljudi živi dovoljno dugo da bi umro u ovim godinama.

Page 26: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Funkcija gustine verovatnoća: f(t)

Verovatnoća neuspeha u određenom vremenu t (od svih mogućih vremena t).

tttTtPtf

t Δ

Δ+<≤=

⎯→⎯Δ

)(lim)(0

Page 27: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Funkcija preživljavanja: 1-F(t)

Cilj analize preživljavanja je da oceni i poredi preživljavanje različitih grupa ispitanika.

Preživljavanje se ocenjuje / opisuje kumulativnom funkcijom preživljavanja:

)(1)(1)( tFtTPtS −=≤−=

Primer: Ako je t=100 godina, S(t=100) = verovatnoća preživljavanja iznad 100 godina.

F(t) je KF od f(t), i “zanimljivija” je od f(t).

Page 28: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Kumulativno preživljavanje

Podsetiti se fgv:

Page 29: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Kumulativno preživljavanje

P(T>80)

P(T>20)

Page 30: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Funkcija hazarda

GODINE Stopa hazarda je trenutna stopa incidencije.

Page 31: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Funkcija hazarda

ttTttTtPth

t Δ

≥Δ+<≤=

⎯→⎯Δ

)/(lim)(0

Rečima: verovatnoća da ako se preživi do t, već u sledećem trenutku događaj će se desiti.

h(t) = f (t)S(t)

Page 32: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Hazard vs gustina veroavtnoća

Ideja je: n  Pri rođenju postoji određena verovatnoća

umiranja u bilo kojim godinama; to je gustina verovatnoća ¡  Primer: žena koja se danas rodi, ima recimo 1% šansu da će umreti u 80-toj godini.

n  Međutim, ako osoba preživi već neko vreme, verovatnoće umiranja će se stalno menjati ¡  Primer: žena koja danas ima 79 godina, ima 5% šanse da će umreti u 80-toj godini.

Page 33: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Metode I

n  Određivanje funkcija: ¡  Kaplan - Meier-ova metoda ¡  Tablice preživljavanja

n  Poređenje funkcija: ¡  Logrank test ¡  Mantel-Haenszel-ov tes ¡  Gehanov Generalizovani Wilcoxon-ov test

Page 34: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Metode II n  Identifikacija faktora rizika povezanih

sa binomnim ishodima: ¡  Linearna diskriminaciona funkcija ¡  Logistički regresioni metod

n  Identifikacija prognostičkih faktora povezanih sa vremenom preživljavanja: ¡  Cox-ov proporcionalni hazardni regresioni

model ¡  Parametarske regresione metode

Page 35: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Kaplan - Meierova metoda i Logrank test

Page 36: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Početak studije Kraj studije à Vreme u mes. à

Subjekat B

Subjekat A

Subjekat C

Subjekat D

Subjekat E

Kaplan-Meier / neparametarska ocena funkcije preživljavanja

1. subjekat E umro je u 4 mesecu

X

Page 37: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

100%

à Vreme u mes. à

Odgovarajuća Kaplan-Meierova kriva

Verovatnoća preživljavanja do 4 meseca je 100% = 5/5

Frakcija koja je preživela ovu smrt = 4/5

Subjekat E umire u 4 mesecu

Page 38: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Početak studije Kraj studije à Vreme u mes. à

Subjekat B

Subjekat A

Subjekat C

Subjekat D

Subjekat E

Podaci o preživljavanju 2. subjekt A isključen posle 6 meseci

1. subjekt E umire u 4 mesecu

X

3. subjekt C umire u 7 mesecu

X

Page 39: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

100%

à Vreme u mes. à

Odgovarajuća Kaplan-Meierova kriva

subjekat C umire 7 mes.

Frakcija koja preživi ovu smrt = 2/3

Page 40: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Početak studije Kraj studije à Vreme u mes. à

Subjekt B

Subjekat A

Subjekt C

Subjekt D

Subjekt E

Podaci o preživljavanju 2. subjekt A isključen posle 6 mes.

4. Subjekti B i D preživljavaju ceo jednogodišnji period

1. subjekt E umire u 4 mesecu

X

3. subjekt C umire u 7 mes. X

Page 41: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

100%

à Vreme u mes. à

Odgovarajuća Kaplan-Meierova kriva

Ocena preživljavanja = P(preživi interval 1/u riziku do prvog događaja 1) * P(preživi interval 2/u riziku do drugog događaja 2) = 4/5 * 2/3= .5333

Page 42: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Metod ocenjivanja je “product limit method”

n  Verovatnoća preživljavanja cele godine, uračunavajući cenzorisane je

= (4/5) (2/3) = 53% n  Verovatnoća preživljavanja, a da nema

cenzorisanih bila bi jednostavna = (3/5) = 60%

Page 43: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Kaplan-Meierova kriva

Time (months) to conception or censoring in 38 sub-fertile women after laparoscopy and hydrotubation

Conceived

Did not conceive

1

2

1

3

1

4

1

7

1

7

1

8

2

8

2

9

2

9

2

9

2

11

3

24

3

24

3

 

4

 

4

 

4

 

6

 

6

 

9

 

9

 

9

 

10

 

13

 

16

 

Page 44: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Pažnja!

n  Ocene preživljavanja postaju nepouzdane pri kraju studija kada je broj osoba pod rizikom da se desi događaj mali.

Page 45: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

WHI i rak dojke

Mali brojevi

Page 46: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Poređenje 2 grupe

Koristi se log-rank test / nulta hipoteza o nepostojanju značajnih razlika između dve funkcije preživljavanja

Page 47: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Kaplan-Meier: primer

Istraživači su randomizovali 44 pacijenta sa aktivnim hroničnim hepatitisom u grupe koje su primale ili prednisolon ili su bile bez ikakvog tretmana, a potom su poredili njihove funkcije preživljavanja.

Primer iz BMJ 1998;317:468-469 ( 15 August )

Page 48: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Prednisolon (n=22) Kontrole (n=22) 2

2

6

3

12

4

54

7

56 *

10

68

22

89

28

96

29

96

32

125*

37

128*

40

131*

41

140*

54

141*

61

143

63

145*

71

146

127*

148*

140*

162*

146*

168

158*

173*

167*

181* 182*

BMJ 1998;317:468-469 ( 15 August ) *=cenzorisani

Vremena preživljavanja (meseci) 44 pacijenta sa hroničnim aktivnim hepatitisom randomizovani u grupe na prednisolonu ili bez tretmana.

Page 49: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Kaplan-Meier: primer

Da li su ove dve krive značajno različite?

Pogrešna konvergencija na kraju studije. Posledica je 6 kontrola koje su preživele dovoljno dugo i 3 događaja u grupi sa tretmanom kada je veličina uzorka mala.

Veliki pad na kraju krive posledica je malog broja preostalih pacijenata. t.j., samo je 2/3 (66%) preživelo ovaj pad.

Page 50: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Log-rank test

Test of Equality over Strata

Pr > Test Chi-Square DF Chi-Square

Log-Rank 4.6599 1 0.0309 Wilcoxon 6.5435 1 0.0105 -2Log(LR) 5.4096 1 0.0200

Likelihood Ratio test nije u ovom slučaju idealan jer pretpostavlja eksponencijalnu raspodelu (konstantni hazard).

Wilcoxon je samo verzija log-rank testa koja uključuje težinu stratuma po njihovoj veličini (dajući veću težinu ranijem vremenu).

Log-rank test ima najveću moć.

Grupe se značajno različito ponašaju.

Page 51: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Još jedan grafik …

log(-log(S(t))=

log(kumulativnog hazarda)

Ako su krive grupa paralelne, onda su pretpostavke o proporcionalnosti hazarda ispunjene.

Neophodne pretpostavke za računanje Hazardnog Odnosa.

Page 52: Analiza podataka o preživljavanju (vremena do nastajanja ... · PDF fileMortalitetne tablice i očekivano trajanje života . Šta je analiza preživljavanja? ! Statističke metode

Ograničenja Kaplan-Meierove metode

•  Uglavnom deskriptivan •  Nema kontrole kovarijata •  Zahteva kategorijalne prediktore •  Nema mogućnosti uključenja varijabli

koje su vremenski zavisne •  Daje zaključak samo o značajnosti

razlike a ne i tome koliko je velika ta razlika