analiza podataka o preživljavanju (vremena do nastajanja ... · pdf filemortalitetne tablice...
TRANSCRIPT
Analiza podataka o preživljavanju (vremena do nastajanja izabranog događaja - ishoda)
Jelena Marinković
Pregled
n Šta je analiza preživljavanja? n Terminologija i struktura podataka. n Funkcije gustine verovatnoća,
preživljavanja i hazarda. n Statističke metode analize
preživljavanja. n Kaplan-Meierov metod i log-rank test
Primer analize preživljavanja, 1669.
Christiaan Huygens je 1669. godine ovom funkcijom izračunao koliko će osoba na svakih 100 osoba doživeti 86 godina. Izvor: Howard Wainer- STATISTICAL GRAPHICS: Mapping the Pathways of Science. Annual Review of Psychology. Vol. 52: 305-335
Primer analize preživljavanja, 1669 (2)
Kog oblika je ova funkcija?
Kolika je bila šansa osobe da preživi više od 20 godina? Više od 36? Ovo je analiza preživljavanja!
Pokušavamo da procenimo funkciju—samo što ishod može biti bilo koji binarni događaj, a ne samo smrt.
Analiza preživljavanja - koreni
n Edmund Halley , 17-ti vek n Akturijalna analiza, tablice
preživljavanja, “life-table” analiza n Mortalitetne tablice i očekivano trajanje života
Šta je analiza preživljavanja?
n Statističke metode za analizu longitudinalnih podataka o pojavljivanju događaja od interesa.
n Događaji uključuju: smrti, povrede, razboljevanje, oporavak, tranziciju ka vrednostima ispod ili iznad zadatog praga važnih kontinuiranih varijabli (npr. broj CD4).
n Adekvatna za analizu podataka iz randomizovanih kliničkih ogleda ili kohorti.
Randomizovani klinički ogled (RKO)
Ciljana populacija
Intervencija
Kontrole
Bolest
Bez bolesti
Bolest
Bez bolesti
VREME
Randomizacija
Bez bolesti, kohorta ispitanika pod rizikom
Ciljana populacija
Tretman
Kontrole
Izlečeni
Neizlečeni
Izlečeni
Neizlečeni
VREME
Randomizacija
Populacija pacijenata
Randomizovani klinički ogled (RKO)
Ciljana populacija
Tretman
Kontrole
Mrtav
Živ
Mrtav
Živ
VREME
Randomizacija
Populacija pacijenata
Randomizovani klinički ogled (RKO)
Kohortna studija (prospektivna/retrospektivna)
Ciljana populacija
Ekspozicija
Bez ekspozicije
Bolest
Bez bolesti
Bolest
Bez bolesti
VREME
Kohorta isptanika bez bolesti
Primeri analize preživljavanja u medicini
RKO: Women’s Health Initiative (JAMA, 2001)
Hormoni
Placebo Kumulativna incidencija
Retrospektivna kohortna studija: Decembar 2003 BMJ: Aspirin, ibuprofen, and mortality after myocardial infarction: retrospective cohort study
¡ Ocena vremena-do-događaja (time-to-event) za grupu ispitanika, na primer vreme do reinfarkta grupe pacijenata sa IM.
¡ Poređenje vremena-do-događaja između dve ili više grupa ispitanika, na primer tretirani vs. placebo pacijenti sa IM u randomizovanom kliničkom ogledu.
¡ Procena povezanosti kovarijati sa vremenom-do-događaja , na primer: da li su telesna masa, insulinska rezistencija ili holesterol povezani sa vremenom preživljavanja pacijenata sa IM?
Primedba: očekivano vreme-do-događaja = 1/incidencija
Ciljevi analize preživljavanja
Zašto koristiti analizu preživljavanja?
1. Zašto ne porediti prosečno vreme-do-događaja između dve grupe primenom t-testa ili linearne regresije?
-- ignorisanje cenzorisanja!!!!!! 2. Zašto ne porediti proporcije događaja
u grupama primenom ukrštenog odnosa (odds ratio) ili logističke regresije?
--ignorisanje vremena!!!!!
Analiza preživljavanja: Termini
n Vreme-do-događaja: Vreme od ulaska u studiju do nastupanja specifičnog ishoda
n Cenzorisanje: Ispitanik je cenzorisan kada je ili izgubljen za praćenje, isključen iz studije ili ako je studija završena pre nego što je razvio događaj od interesa.
Struktura podataka: analiza preživljavanja
Ishod je dvodimenzionalan, dve varijable: n Vremenska varijabla: ti = vreme do
kada je osoba bez događaja ili vreme nastupanja događaja
n Cenzorska varijabla: ci =1 ako je nastupio događaj; ci =0 nema događaja do vremena ti
Desno cenzorisanje (T>t)
Uobičajeni primeri n Završetak istraživanja n Smrt usled nekog drugog razloga koji nije
događaj od interesa n Izgubljen za praćenje
Znamo da je osoba preživela bar do vremena t.
Izbor početka merenja vremena.
Desno cenzorisanje!
Ishodna varijabla
n Binarni ishod i vreme do njegove realizacije.
n Da li su svi umrli ili ne? n Ako nisu, imamo cenzorisane podatke. n Da li su svi ušli u studiju u isto vreme? n Ako nisu imamo progresivno
cenzorisane podatke.
Raspodele preživljavanja
n Ti - vreme do nastupanja događaja je slučajna varijabla sa odgovarajućom raspodelom verovatnoća
n Različite metode za analizu preživljavanja određene su tipom raspodele za Ti.
Primer…
Podsetimo se ovog grafika.
Da li liči na normalnu ili eksponencijalnu raspodelu?
Funkcije vremena preživljavanja
n Funkcija gustine verovatnoća f(t) n Funkcija preživljavanja S(t)
¡ P(osoba preživi duže od t) ¡ ocena je = broj pacijenata koji preživi
duže od t / ukupan broj pacijenata n Funkcija hazarda H(t)
Funkcija gustine verovatnoća:f(t)
Ljudski vek - Ti će malo verovatno slediti normalnu raspodelu. Zašto?
Ljudi imaju najveću verovatnoću umiranja u 70-tim i 80-tim godinama;
ALI umaju manju šansu umiranja u 90 i 100, jer mali broj ljudi živi dovoljno dugo da bi umro u ovim godinama.
Funkcija gustine verovatnoća: f(t)
Verovatnoća neuspeha u određenom vremenu t (od svih mogućih vremena t).
tttTtPtf
t Δ
Δ+<≤=
⎯→⎯Δ
)(lim)(0
Funkcija preživljavanja: 1-F(t)
Cilj analize preživljavanja je da oceni i poredi preživljavanje različitih grupa ispitanika.
Preživljavanje se ocenjuje / opisuje kumulativnom funkcijom preživljavanja:
)(1)(1)( tFtTPtS −=≤−=
Primer: Ako je t=100 godina, S(t=100) = verovatnoća preživljavanja iznad 100 godina.
F(t) je KF od f(t), i “zanimljivija” je od f(t).
Kumulativno preživljavanje
Podsetiti se fgv:
Kumulativno preživljavanje
P(T>80)
P(T>20)
Funkcija hazarda
GODINE Stopa hazarda je trenutna stopa incidencije.
Funkcija hazarda
ttTttTtPth
t Δ
≥Δ+<≤=
⎯→⎯Δ
)/(lim)(0
Rečima: verovatnoća da ako se preživi do t, već u sledećem trenutku događaj će se desiti.
h(t) = f (t)S(t)
Hazard vs gustina veroavtnoća
Ideja je: n Pri rođenju postoji određena verovatnoća
umiranja u bilo kojim godinama; to je gustina verovatnoća ¡ Primer: žena koja se danas rodi, ima recimo 1% šansu da će umreti u 80-toj godini.
n Međutim, ako osoba preživi već neko vreme, verovatnoće umiranja će se stalno menjati ¡ Primer: žena koja danas ima 79 godina, ima 5% šanse da će umreti u 80-toj godini.
Metode I
n Određivanje funkcija: ¡ Kaplan - Meier-ova metoda ¡ Tablice preživljavanja
n Poređenje funkcija: ¡ Logrank test ¡ Mantel-Haenszel-ov tes ¡ Gehanov Generalizovani Wilcoxon-ov test
Metode II n Identifikacija faktora rizika povezanih
sa binomnim ishodima: ¡ Linearna diskriminaciona funkcija ¡ Logistički regresioni metod
n Identifikacija prognostičkih faktora povezanih sa vremenom preživljavanja: ¡ Cox-ov proporcionalni hazardni regresioni
model ¡ Parametarske regresione metode
Kaplan - Meierova metoda i Logrank test
Početak studije Kraj studije à Vreme u mes. à
Subjekat B
Subjekat A
Subjekat C
Subjekat D
Subjekat E
Kaplan-Meier / neparametarska ocena funkcije preživljavanja
1. subjekat E umro je u 4 mesecu
X
100%
à Vreme u mes. à
Odgovarajuća Kaplan-Meierova kriva
Verovatnoća preživljavanja do 4 meseca je 100% = 5/5
Frakcija koja je preživela ovu smrt = 4/5
Subjekat E umire u 4 mesecu
Početak studije Kraj studije à Vreme u mes. à
Subjekat B
Subjekat A
Subjekat C
Subjekat D
Subjekat E
Podaci o preživljavanju 2. subjekt A isključen posle 6 meseci
1. subjekt E umire u 4 mesecu
X
3. subjekt C umire u 7 mesecu
X
100%
à Vreme u mes. à
Odgovarajuća Kaplan-Meierova kriva
subjekat C umire 7 mes.
Frakcija koja preživi ovu smrt = 2/3
Početak studije Kraj studije à Vreme u mes. à
Subjekt B
Subjekat A
Subjekt C
Subjekt D
Subjekt E
Podaci o preživljavanju 2. subjekt A isključen posle 6 mes.
4. Subjekti B i D preživljavaju ceo jednogodišnji period
1. subjekt E umire u 4 mesecu
X
3. subjekt C umire u 7 mes. X
100%
à Vreme u mes. à
Odgovarajuća Kaplan-Meierova kriva
Ocena preživljavanja = P(preživi interval 1/u riziku do prvog događaja 1) * P(preživi interval 2/u riziku do drugog događaja 2) = 4/5 * 2/3= .5333
Metod ocenjivanja je “product limit method”
n Verovatnoća preživljavanja cele godine, uračunavajući cenzorisane je
= (4/5) (2/3) = 53% n Verovatnoća preživljavanja, a da nema
cenzorisanih bila bi jednostavna = (3/5) = 60%
Kaplan-Meierova kriva
Time (months) to conception or censoring in 38 sub-fertile women after laparoscopy and hydrotubation
Conceived
Did not conceive
1
2
1
3
1
4
1
7
1
7
1
8
2
8
2
9
2
9
2
9
2
11
3
24
3
24
3
4
4
4
6
6
9
9
9
10
13
16
Pažnja!
n Ocene preživljavanja postaju nepouzdane pri kraju studija kada je broj osoba pod rizikom da se desi događaj mali.
WHI i rak dojke
Mali brojevi
Poređenje 2 grupe
Koristi se log-rank test / nulta hipoteza o nepostojanju značajnih razlika između dve funkcije preživljavanja
Kaplan-Meier: primer
Istraživači su randomizovali 44 pacijenta sa aktivnim hroničnim hepatitisom u grupe koje su primale ili prednisolon ili su bile bez ikakvog tretmana, a potom su poredili njihove funkcije preživljavanja.
Primer iz BMJ 1998;317:468-469 ( 15 August )
Prednisolon (n=22) Kontrole (n=22) 2
2
6
3
12
4
54
7
56 *
10
68
22
89
28
96
29
96
32
125*
37
128*
40
131*
41
140*
54
141*
61
143
63
145*
71
146
127*
148*
140*
162*
146*
168
158*
173*
167*
181* 182*
BMJ 1998;317:468-469 ( 15 August ) *=cenzorisani
Vremena preživljavanja (meseci) 44 pacijenta sa hroničnim aktivnim hepatitisom randomizovani u grupe na prednisolonu ili bez tretmana.
Kaplan-Meier: primer
Da li su ove dve krive značajno različite?
Pogrešna konvergencija na kraju studije. Posledica je 6 kontrola koje su preživele dovoljno dugo i 3 događaja u grupi sa tretmanom kada je veličina uzorka mala.
Veliki pad na kraju krive posledica je malog broja preostalih pacijenata. t.j., samo je 2/3 (66%) preživelo ovaj pad.
Log-rank test
Test of Equality over Strata
Pr > Test Chi-Square DF Chi-Square
Log-Rank 4.6599 1 0.0309 Wilcoxon 6.5435 1 0.0105 -2Log(LR) 5.4096 1 0.0200
Likelihood Ratio test nije u ovom slučaju idealan jer pretpostavlja eksponencijalnu raspodelu (konstantni hazard).
Wilcoxon je samo verzija log-rank testa koja uključuje težinu stratuma po njihovoj veličini (dajući veću težinu ranijem vremenu).
Log-rank test ima najveću moć.
Grupe se značajno različito ponašaju.
Još jedan grafik …
log(-log(S(t))=
log(kumulativnog hazarda)
Ako su krive grupa paralelne, onda su pretpostavke o proporcionalnosti hazarda ispunjene.
Neophodne pretpostavke za računanje Hazardnog Odnosa.
Ograničenja Kaplan-Meierove metode
• Uglavnom deskriptivan • Nema kontrole kovarijata • Zahteva kategorijalne prediktore • Nema mogućnosti uključenja varijabli
koje su vremenski zavisne • Daje zaključak samo o značajnosti
razlike a ne i tome koliko je velika ta razlika