analiza podataka o preživljavanju (vremena do nastajanja ... · pdf filemortalitetne tablice...

Post on 19-Mar-2018

234 Views

Category:

Documents

9 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Analiza podataka o preživljavanju (vremena do nastajanja izabranog događaja - ishoda)

Jelena Marinković

Pregled

n  Šta je analiza preživljavanja? n  Terminologija i struktura podataka. n  Funkcije gustine verovatnoća,

preživljavanja i hazarda. n  Statističke metode analize

preživljavanja. n  Kaplan-Meierov metod i log-rank test

Primer analize preživljavanja, 1669.

Christiaan Huygens je 1669. godine ovom funkcijom izračunao koliko će osoba na svakih 100 osoba doživeti 86 godina. Izvor: Howard Wainer- STATISTICAL GRAPHICS: Mapping the Pathways of Science. Annual Review of Psychology. Vol. 52: 305-335

Primer analize preživljavanja, 1669 (2)

Kog oblika je ova funkcija?

Kolika je bila šansa osobe da preživi više od 20 godina? Više od 36? Ovo je analiza preživljavanja!

Pokušavamo da procenimo funkciju—samo što ishod može biti bilo koji binarni događaj, a ne samo smrt.

Analiza preživljavanja - koreni

n  Edmund Halley , 17-ti vek n  Akturijalna analiza, tablice

preživljavanja, “life-table” analiza n  Mortalitetne tablice i očekivano trajanje života

Šta je analiza preživljavanja?

n  Statističke metode za analizu longitudinalnih podataka o pojavljivanju događaja od interesa.

n  Događaji uključuju: smrti, povrede, razboljevanje, oporavak, tranziciju ka vrednostima ispod ili iznad zadatog praga važnih kontinuiranih varijabli (npr. broj CD4).

n  Adekvatna za analizu podataka iz randomizovanih kliničkih ogleda ili kohorti.

Randomizovani klinički ogled (RKO)

Ciljana populacija

Intervencija

Kontrole

Bolest

Bez bolesti

Bolest

Bez bolesti

VREME

Randomizacija

Bez bolesti, kohorta ispitanika pod rizikom

Ciljana populacija

Tretman

Kontrole

Izlečeni

Neizlečeni

Izlečeni

Neizlečeni

VREME

Randomizacija

Populacija pacijenata

Randomizovani klinički ogled (RKO)

Ciljana populacija

Tretman

Kontrole

Mrtav

Živ

Mrtav

Živ

VREME

Randomizacija

Populacija pacijenata

Randomizovani klinički ogled (RKO)

Kohortna studija (prospektivna/retrospektivna)

Ciljana populacija

Ekspozicija

Bez ekspozicije

Bolest

Bez bolesti

Bolest

Bez bolesti

VREME

Kohorta isptanika bez bolesti

Primeri analize preživljavanja u medicini

RKO: Women’s Health Initiative (JAMA, 2001)

Hormoni

Placebo Kumulativna incidencija

Retrospektivna kohortna studija: Decembar 2003 BMJ: Aspirin, ibuprofen, and mortality after myocardial infarction: retrospective cohort study

¡  Ocena vremena-do-događaja (time-to-event) za grupu ispitanika, na primer vreme do reinfarkta grupe pacijenata sa IM.

¡  Poređenje vremena-do-događaja između dve ili više grupa ispitanika, na primer tretirani vs. placebo pacijenti sa IM u randomizovanom kliničkom ogledu.

¡  Procena povezanosti kovarijati sa vremenom-do-događaja , na primer: da li su telesna masa, insulinska rezistencija ili holesterol povezani sa vremenom preživljavanja pacijenata sa IM?

Primedba: očekivano vreme-do-događaja = 1/incidencija

Ciljevi analize preživljavanja

Zašto koristiti analizu preživljavanja?

1. Zašto ne porediti prosečno vreme-do-događaja između dve grupe primenom t-testa ili linearne regresije?

-- ignorisanje cenzorisanja!!!!!! 2. Zašto ne porediti proporcije događaja

u grupama primenom ukrštenog odnosa (odds ratio) ili logističke regresije?

--ignorisanje vremena!!!!!

Analiza preživljavanja: Termini

n  Vreme-do-događaja: Vreme od ulaska u studiju do nastupanja specifičnog ishoda

n  Cenzorisanje: Ispitanik je cenzorisan kada je ili izgubljen za praćenje, isključen iz studije ili ako je studija završena pre nego što je razvio događaj od interesa.

Struktura podataka: analiza preživljavanja

Ishod je dvodimenzionalan, dve varijable: n  Vremenska varijabla: ti = vreme do

kada je osoba bez događaja ili vreme nastupanja događaja

n  Cenzorska varijabla: ci =1 ako je nastupio događaj; ci =0 nema događaja do vremena ti

Desno cenzorisanje (T>t)

Uobičajeni primeri n  Završetak istraživanja n  Smrt usled nekog drugog razloga koji nije

događaj od interesa n  Izgubljen za praćenje

Znamo da je osoba preživela bar do vremena t.

Izbor početka merenja vremena.

Desno cenzorisanje!

Ishodna varijabla

n  Binarni ishod i vreme do njegove realizacije.

n  Da li su svi umrli ili ne? n  Ako nisu, imamo cenzorisane podatke. n  Da li su svi ušli u studiju u isto vreme? n  Ako nisu imamo progresivno

cenzorisane podatke.

Raspodele preživljavanja

n  Ti - vreme do nastupanja događaja je slučajna varijabla sa odgovarajućom raspodelom verovatnoća

n  Različite metode za analizu preživljavanja određene su tipom raspodele za Ti.

Primer…

Podsetimo se ovog grafika.

Da li liči na normalnu ili eksponencijalnu raspodelu?

Funkcije vremena preživljavanja

n  Funkcija gustine verovatnoća f(t) n  Funkcija preživljavanja S(t)

¡  P(osoba preživi duže od t) ¡  ocena je = broj pacijenata koji preživi

duže od t / ukupan broj pacijenata n  Funkcija hazarda H(t)

Funkcija gustine verovatnoća:f(t)

Ljudski vek - Ti će malo verovatno slediti normalnu raspodelu. Zašto?

Ljudi imaju najveću verovatnoću umiranja u 70-tim i 80-tim godinama;

ALI umaju manju šansu umiranja u 90 i 100, jer mali broj ljudi živi dovoljno dugo da bi umro u ovim godinama.

Funkcija gustine verovatnoća: f(t)

Verovatnoća neuspeha u određenom vremenu t (od svih mogućih vremena t).

tttTtPtf

t Δ

Δ+<≤=

⎯→⎯Δ

)(lim)(0

Funkcija preživljavanja: 1-F(t)

Cilj analize preživljavanja je da oceni i poredi preživljavanje različitih grupa ispitanika.

Preživljavanje se ocenjuje / opisuje kumulativnom funkcijom preživljavanja:

)(1)(1)( tFtTPtS −=≤−=

Primer: Ako je t=100 godina, S(t=100) = verovatnoća preživljavanja iznad 100 godina.

F(t) je KF od f(t), i “zanimljivija” je od f(t).

Kumulativno preživljavanje

Podsetiti se fgv:

Kumulativno preživljavanje

P(T>80)

P(T>20)

Funkcija hazarda

GODINE Stopa hazarda je trenutna stopa incidencije.

Funkcija hazarda

ttTttTtPth

t Δ

≥Δ+<≤=

⎯→⎯Δ

)/(lim)(0

Rečima: verovatnoća da ako se preživi do t, već u sledećem trenutku događaj će se desiti.

h(t) = f (t)S(t)

Hazard vs gustina veroavtnoća

Ideja je: n  Pri rođenju postoji određena verovatnoća

umiranja u bilo kojim godinama; to je gustina verovatnoća ¡  Primer: žena koja se danas rodi, ima recimo 1% šansu da će umreti u 80-toj godini.

n  Međutim, ako osoba preživi već neko vreme, verovatnoće umiranja će se stalno menjati ¡  Primer: žena koja danas ima 79 godina, ima 5% šanse da će umreti u 80-toj godini.

Metode I

n  Određivanje funkcija: ¡  Kaplan - Meier-ova metoda ¡  Tablice preživljavanja

n  Poređenje funkcija: ¡  Logrank test ¡  Mantel-Haenszel-ov tes ¡  Gehanov Generalizovani Wilcoxon-ov test

Metode II n  Identifikacija faktora rizika povezanih

sa binomnim ishodima: ¡  Linearna diskriminaciona funkcija ¡  Logistički regresioni metod

n  Identifikacija prognostičkih faktora povezanih sa vremenom preživljavanja: ¡  Cox-ov proporcionalni hazardni regresioni

model ¡  Parametarske regresione metode

Kaplan - Meierova metoda i Logrank test

Početak studije Kraj studije à Vreme u mes. à

Subjekat B

Subjekat A

Subjekat C

Subjekat D

Subjekat E

Kaplan-Meier / neparametarska ocena funkcije preživljavanja

1. subjekat E umro je u 4 mesecu

X

100%

à Vreme u mes. à

Odgovarajuća Kaplan-Meierova kriva

Verovatnoća preživljavanja do 4 meseca je 100% = 5/5

Frakcija koja je preživela ovu smrt = 4/5

Subjekat E umire u 4 mesecu

Početak studije Kraj studije à Vreme u mes. à

Subjekat B

Subjekat A

Subjekat C

Subjekat D

Subjekat E

Podaci o preživljavanju 2. subjekt A isključen posle 6 meseci

1. subjekt E umire u 4 mesecu

X

3. subjekt C umire u 7 mesecu

X

100%

à Vreme u mes. à

Odgovarajuća Kaplan-Meierova kriva

subjekat C umire 7 mes.

Frakcija koja preživi ovu smrt = 2/3

Početak studije Kraj studije à Vreme u mes. à

Subjekt B

Subjekat A

Subjekt C

Subjekt D

Subjekt E

Podaci o preživljavanju 2. subjekt A isključen posle 6 mes.

4. Subjekti B i D preživljavaju ceo jednogodišnji period

1. subjekt E umire u 4 mesecu

X

3. subjekt C umire u 7 mes. X

100%

à Vreme u mes. à

Odgovarajuća Kaplan-Meierova kriva

Ocena preživljavanja = P(preživi interval 1/u riziku do prvog događaja 1) * P(preživi interval 2/u riziku do drugog događaja 2) = 4/5 * 2/3= .5333

Metod ocenjivanja je “product limit method”

n  Verovatnoća preživljavanja cele godine, uračunavajući cenzorisane je

= (4/5) (2/3) = 53% n  Verovatnoća preživljavanja, a da nema

cenzorisanih bila bi jednostavna = (3/5) = 60%

Kaplan-Meierova kriva

Time (months) to conception or censoring in 38 sub-fertile women after laparoscopy and hydrotubation

Conceived

Did not conceive

1

2

1

3

1

4

1

7

1

7

1

8

2

8

2

9

2

9

2

9

2

11

3

24

3

24

3

 

4

 

4

 

4

 

6

 

6

 

9

 

9

 

9

 

10

 

13

 

16

 

Pažnja!

n  Ocene preživljavanja postaju nepouzdane pri kraju studija kada je broj osoba pod rizikom da se desi događaj mali.

WHI i rak dojke

Mali brojevi

Poređenje 2 grupe

Koristi se log-rank test / nulta hipoteza o nepostojanju značajnih razlika između dve funkcije preživljavanja

Kaplan-Meier: primer

Istraživači su randomizovali 44 pacijenta sa aktivnim hroničnim hepatitisom u grupe koje su primale ili prednisolon ili su bile bez ikakvog tretmana, a potom su poredili njihove funkcije preživljavanja.

Primer iz BMJ 1998;317:468-469 ( 15 August )

Prednisolon (n=22) Kontrole (n=22) 2

2

6

3

12

4

54

7

56 *

10

68

22

89

28

96

29

96

32

125*

37

128*

40

131*

41

140*

54

141*

61

143

63

145*

71

146

127*

148*

140*

162*

146*

168

158*

173*

167*

181* 182*

BMJ 1998;317:468-469 ( 15 August ) *=cenzorisani

Vremena preživljavanja (meseci) 44 pacijenta sa hroničnim aktivnim hepatitisom randomizovani u grupe na prednisolonu ili bez tretmana.

Kaplan-Meier: primer

Da li su ove dve krive značajno različite?

Pogrešna konvergencija na kraju studije. Posledica je 6 kontrola koje su preživele dovoljno dugo i 3 događaja u grupi sa tretmanom kada je veličina uzorka mala.

Veliki pad na kraju krive posledica je malog broja preostalih pacijenata. t.j., samo je 2/3 (66%) preživelo ovaj pad.

Log-rank test

Test of Equality over Strata

Pr > Test Chi-Square DF Chi-Square

Log-Rank 4.6599 1 0.0309 Wilcoxon 6.5435 1 0.0105 -2Log(LR) 5.4096 1 0.0200

Likelihood Ratio test nije u ovom slučaju idealan jer pretpostavlja eksponencijalnu raspodelu (konstantni hazard).

Wilcoxon je samo verzija log-rank testa koja uključuje težinu stratuma po njihovoj veličini (dajući veću težinu ranijem vremenu).

Log-rank test ima najveću moć.

Grupe se značajno različito ponašaju.

Još jedan grafik …

log(-log(S(t))=

log(kumulativnog hazarda)

Ako su krive grupa paralelne, onda su pretpostavke o proporcionalnosti hazarda ispunjene.

Neophodne pretpostavke za računanje Hazardnog Odnosa.

Ograničenja Kaplan-Meierove metode

•  Uglavnom deskriptivan •  Nema kontrole kovarijata •  Zahteva kategorijalne prediktore •  Nema mogućnosti uključenja varijabli

koje su vremenski zavisne •  Daje zaključak samo o značajnosti

razlike a ne i tome koliko je velika ta razlika

top related