statistische analyse eines multivariaten continuation ... · hintergrund werkzeuge bivariates crm...
Post on 13-Aug-2019
219 Views
Preview:
TRANSCRIPT
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Statistische Analyse eines multivariatenContinuation Ratio-Models mit
StandardwerkzeugenEin Regressionsmodell für korrelierte ordinale Daten
Jürgen Wellmann
Institut für Epidemiologie und Sozialmedizin, Universität Münster
20. November 2009
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
HintergrundAltersabhängige MakuladegenerationMünsteraner Altern- und Retina Studie (MARS)
Die »Werkzeuge«Alternating Logistic RegressionContinuation Ratio Modell (CRM)
Ein bivariates CRMEin Beispiel aus MARSVersuch einer Simulation
ErweiterungenMehr als zwei Beobachtungen pro ClusterWiederholte Cluster
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Altersabhängige Makuladegeneration (AMD)
• Degenerative Erkrankung der Netzhaut, insbesondere derMakula (Gelber Fleck)
• Häu�ge Ursache von Einschränkungen der Sehfähigkeit inhöherem Alter (in industrialisierten Ländern)
• Wird in verschiedene Stadien eingeteilt, etwa gesund,Frühform, Spätform
• Verlauf der Erkrankung: Verschlechterung von Stadium zuStadium oder Stillstand, aber (unbehandelt) keineVerbesserung
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Abbildung: Healthy retina
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Abbildung: Early ARM with drusen
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Abbildung: Late ARM (choroidal neovascularization)
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Abbildung: Late ARM (geographic atrophy)
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Abbildung: Range of vision of an AMD patient
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Münsteraner Altern- und Retina Studie (MARS)
Ziel Risikofaktoren für Fortschreiten der AMDidenti�zieren
Ort Münster und Umgebung
Teilnmehmer 1,063 Probanden zu Anfang, 58�82 Jahre alt
• Überwiegend Patienten aus Augenarztpraxen mitAnzeichen von AMD
• etwa 20% gesunde Probanden• Ausschlusskriterium: Engwinkelglaukom
Principal investigators Prof. Dr. Hense (Uni Münster), Prof. Dr.Pauleikho� (St. Franziskus-Hospital Münster)
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Erhebungen bei MARS
MARS 1 Juni 2001 � Nov. 2003, n = 1 063MARS 2 Nov. 2003 � Juni 2006, n = 828MARS 3 Feb. 2008 � Ende 2009, n = 425+
Wiederholte Erhebungen an denselben ProbandenUnter anderem Befundung des AMD-Status
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Alternating Logistic Regression (ALR)
Regressionsansatz für korrelierte binäre Zielvariablen aus demBereich �Generalized Estimation Equation� (GEE)Verwendet zwei Regressionsmodelle
• Generalisiertes Lineares Modell (GLM) für E�ekt von festenEin�ussgröÿen auf Zielvariable
• Modell für Odds Ratios innerhalb der Cluster(entspricht der �working correlation matrix� bei GEE)
[Carey et al., 1993]
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Notation für ALRBinäre Zielvariablen Yij (j-te Beobachtung aus Cluster i,i = 1, . . . , m, j = 1, . . . , ni), Cluster unabhängig
• Ein�ussvariablen xij, Parametervektor β, Linkfunktion g(etwa g(u) = ln(u/1−u) = logit(u) → logistische Regression).
• Ein�ussvariablen zijk, Parametervektor α
ORi(j,k) =Pr(Yij = 0, Yik = 0) Pr(Yij = 1, Yik = 1)Pr(Yij = 1, Yik = 0) Pr(Yij = 0, Yik = 1)
Modellgleichungen ALR
g(Pr(Yij = 1)) = x′ijβ, j = 1, . . . , ni
ln(
ORi(j,k)
)= z′ijkα, j, k = 1, . . . , ni, j < k,
i = 1, . . . , m
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Unabhängige ordinale Beobachtungen
[Moers, 1999]
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Continuation Ratio Model (CRM)
Modell für ordinale Zufallsvariable YDiskrete Überlebenszeiten Hazardrate von Y ist
h(s) = Pr(Y = s | Y ≥ s).Cox [1972]:
h(s)1− h(s)
=h0(s)
1− h0(s)exp(x′β)
mit �baseline hazard� h0(s).Continuation Ratio model (Forward) Continuation Ratio
c(s) = 1− h(s) = Pr(Y > s | Y ≥ s)Modell
logit(c(s)) = βs + x′β
oder mit anderer Linkfunktion g
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Likelihood für CRM
Ausprägungen von Y sind s = 1, . . . , C + 1.c(s) = Pr(Y ≥ s + 1 | Y ≥ s), s = 1, . . . , C, c(C + 1) := 0
Pr(Y = s) = Pr(Y ≥ 1, . . . , Y ≥ s, Y < s + 1)
Satz von der totalen Wahrscheinlichkeit
= Pr(Y ≥ 1) Pr(Y ≥ 2 | Y ≥ 1) Pr(Y ≥ 3 | Y ≥ 2, Y ≥ 1)× · · · × Pr(Y ≥ s | Y ≥ s− 1, . . . , Y ≥ 1)Pr(Y < s + 1 | Y ≥ s, . . . , Y ≥ 1)
= (1− c(s))s−1
∏t=1
c(t), s = 1, . . . , C + 1.
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Berechnung des ML-Schätzers für CRM mittels »dataexpansion«
Seien Y1, . . . , Ym unabhängige ordinale ZVen.
• Für Analyse mit CRM erstelle von jeder Beobachtung (Yi, xi)Kopien mit bedingt unabhängigen Hilfsvariablen
Wi(s) =
{1, Yi > s0, Yi = s
, s = 1, . . . , min{C, Yi}
als binären Zielvariablen und identischen Ein�ussvariablen.
• Wende darauf GLM für unabhängige binäre Variablen an,wobei �Stadium� s weitere, kategorielle Ein�ussvariable ist(sorgt für Parameter βs).
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Data expansion für Zielvariable mit vier Kategorien
Stadium Yi
s 1 2 3 4
Wi(1) 1 0 1 1 1Wi(2) 2 0 1 1Wi(3) 3 0 1
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Zwei Beobachtungen pro Cluster
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Odds Ratios für mehrere ordinale Zufallsvariablen
Outcomes Yij ∈ {1, . . . , C + 1}, i = 1, . . . , m, j = 1, . . . , ni
ORi(j,k)(s, t) =Pr(Yij = s, Yik = t) Pr(Yij > s, Yik > t)Pr(Yij > s, Yik = t) Pr(Yij = s, Yik > t)
i = 1, . . . , m, j, k = 1, . . . , ni, j < k, s, t = 1, . . . , C
�Clayton-Oakes cross-product ratios� [Heagerty and Zeger, 2000]
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Beispiel aus MARSVerteilung der AMD-Stadien nach Auge
linkes rechtes Auge
Auge gesund früh spät Summe
gesund 181 73 5 259früh 47 302 79 428spät 10 87 89 186
Summe 238 462 173 873
OR(1, 1) =181(302 + 79 + 87 + 89)
(47 + 10)(73 + 5)≈ 22,7
OR(1, 2) =73(79 + 89)(302 + 87)5
≈ 6,3
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Beispiel Mars, Odds Ratios
rechts, t
�roh� CRM+ALR
links, s 1 2 1 2
1 22,7 6,3 22,7 3,9(95% KI) (15,5�33,2) (2,5�15,9) (15,5�33,2) (2,7�5,6)
2 2,2 3,9 1,7 3,9(95% KI) (1,1�4,4) (2,7�5,8) (1,2�2,3) (2,6�5,8)
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
SAS-Code
PROC GENMOD DATA=crm DESCENDING;
CLASS id seite stage;
MODEL worse = seite stage seite*stage / DIST=BIN;
REPEATED SUBJECT=id / WITHINSUBJECT=seite*stage
LOGOR=ZREP( (1 2) 0 0 0 0, /* Links >1, Links >2 */
(1 3) 1 0 0 0, /* Links >1, Rechts>1 */
(1 4) 0 1 0 0, /* Links >1, Rechts>2 */
(2 3) 0 0 1 0, /* Links >2, Rechts>1 */
(2 4) 0 0 0 1, /* Links >2, Rechts>2 */
(3 4) 0 0 0 0); /* Rechts>1, Rechts>2 */
RUN;
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Daten simulieren
• Vierfeldertafel: Aus Randhäu�gkeiten und Odds Ratio lassensich die einzelnen W.-keiten berechnen (Dale, 1986)
• �Random Walk� Starte mit gesundem Augenpaar,
• Generiere Indikator für �Verschlechterung links� und�Verschlechterung rechts� anhand der W.-keiten einerVierfeldertafel (s. o.) mit continuation ratios (alsRandwahrscheinlichkeiten) und Odds Ratio aus Modell.
• Generiere weitere Verschlechterungen, wenn zugelassen
• Stopp, wenn keine Verschlechterung mehr zugelassen
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Beispiel für Simulationslauf
• Berechne Pr(Yi1 = 1, Yi2 = 1), Pr(Yi1 = 1, Yi2 > 1),Pr(Yi1 > 1, Yi2 = 1), Pr(Yi1 > 1, Yi2 > 1).
Erzeuge Wi1(1) und Wi2(1), etwa Wi1(1) = 0 undWi2(1) = 1. Damit liegt Yi1 = 1 fest.
• Brauche
Pr(Yi2 = 2 | Yi2 ≥ 2, Yi1 = 1) =Pr(Yi2 = 2, Yi1 = 1)
Pr(Yi1 = 1)
Pr(Yi2 > 2 | Yi2 ≥ 2, Yi1 = 1) =Pr(Yi2 > 2, Yi1 = 1)
Pr(Yi1 = 1)
Entscheide damit, ob weitere Verschlechterung von Yi2möglich ist
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Mehr als zwei Beobachtungen pro Cluster
[Moers, 1999]
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
»Map data«
• Psychologisches Experiment mit m = 89 Kindern
• Versuchsaufbau: Eine Reihe von �Verstecken�, in einem istein Spielzeug. Alle Verstecke sind auf Karte eingezeichnet,inklusive Lage des Spielzeugs
• Exposition: 43 Kinder erhalten auf Kopf stehende Karte, 46korrekte Karte
• Outcome Y = s, Kind �ndet Spielzeug bei Versuchs ∈ {1, 2, 3}; Y = 4: Nicht erfolgreich in drei Versuchen
• ni = 10 Durchgänge pro Kind
• Frage: Ändert sich Erfolg mit Anzahl der Durchgänge?
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Modell für log-Odds-Ratios, identisch für alle (j, k)
γi(j,k)(s, t) = ln(
ORi(j,k)(s, t))
j, k 1 2 3
s, t 1 2 3 1 2 3 1 2 3
1 • 0 0 γ(1, 1) γ(1, 2) γ(1, 3) γ(1, 1) γ(1, 2) γ(1, 3)1 2 • 0 γ(2, 1) γ(2, 2) γ(2, 3) γ(2, 1) γ(2, 2) γ(2, 3)
3 • γ(3, 1) γ(3, 2) γ(3, 3) γ(3, 1) γ(3, 2) γ(3, 3)
1 • 0 0 γ(1, 1) γ(1, 2) γ(1, 3)2 2 • 0 γ(2, 1) γ(2, 2) γ(2, 3)
3 • γ(3, 1) γ(3, 2) γ(3, 3)
1 • 0 03 2 • 0
3 •
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
SAS-Code für Z-MatrixSei n = maxi ni der Umfang des gröÿten Clusters
DATA zrep;
ARRAY z {〈C〉,〈C〉} z11 - zCC;
DO j=1 TO 〈n〉; DO s=1 TO 〈C〉;DO k=j TO 〈n〉; DO t=1 TO 〈C〉;
IF (t>s OR k>j) THEN DO;
DO u = 1 TO 〈C〉; DO v = 1 TO 〈C〉;IF k>j THEN z{u,v}=(u=s)*(v=t);
ELSE z{u,v}=0;
END; END;
OUTPUT;
END;
END; END;
END; END;
RUN;
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Modellierung der map data
Modell für Outcome• Unterschiedliche Intercepts für Stadium• Quadratische Funktion von j = Nummer desDurchgangs
• Jeweils andere Parameter für Karte richtig herumund auf Kopf
Modelle für Odds Ratios1. γ(s, t) ≡ α2. γ(s, t) = α1 + α2
|s−t|3. γ(s, t) = γ(t, s)
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Ergebnisse Modell 1
Heagerty/Zeger CRM-ALR
Schätzer StdErr Schätzer StdErr
r0.c1 0.219 0.163 0.219 0.164r0.c2 -0.283 0.194 -0.315 0.194r0.c3 -0.993 0.243 -1.131 0.239r0.trial 0.028 0.019 0.027 0.020r0.trial2 -0.010 0.010 -0.010 0.010r1.c1 -0.849 0.189 -0.859 0.190r1.c2 -0.923 0.171 -0.848 0.186r1.c3 -1.242 0.190 -1.186 0.205r1.trial 0.157 0.037 0.157 0.034r1.trial2 -0.004 0.011 -0.042 0.011Alpha1 0.577 0.123 0.583 0.133
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Ergebnisse Modell 2
Heagerty/Zeger CRM-ALR
Schätzer StdErr Schätzer StdErr
r0.c1 0.219 0.163 0.218 0.164r0.c2 -0.282 0.194 -0.324 0.194r0.c3 -0.992 0.243 -1.134 0.241r0.trial 0.027 0.019 0.025 0.020r0.trial2 -0.010 0.010 -0.010 0.010r1.c1 -0.850 0.189 -0.863 0.191r1.c2 -0.923 0.171 -0.859 0.187r1.c3 -1.242 0.190 -1.195 0.207r1.trial 0.155 0.036 0.152 0.033r1.trial2 -0.044 0.011 -0.041 0.011Alpha1 0.547 0.132 0.525 0.138Alpha2 0.067 0.110 0.130 0.113
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Ergebnisse Modell 3Heagerty/Zeger CRM-ALR
Schätzer StdErr Schätzer StdErr
r0.c1 0.224 0.163 0.225 0.164r0.c2 -0.278 0.194 -0.341 0.192r0.c3 -0.990 0.243 -1.102 0.217r0.trial 0.030 0.019 0.029 0.020r0.trial2 -0.010 0.010 -0.010 0.009r1.c1 -0.842 0.189 -0.844 0.190r1.c2 -0.992 0.171 -0.872 0.183r1.c3 -1.242 0.190 -1.180 0.194r1.trial 0.158 0.036 0.158 0.034r1.trial2 -0.004 0.011 -0.043 0.011Alpha1 0.759 0.165 0.795 0.169Alpha2 0.560 0.139 0.554 0.146Alpha3 0.449 0.163 0.432 0.171Alpha4 0.328 0.173 0.356 0.177Alpha5 0.597 0.167 0.616 0.170Alpha6 0.044 0.274 0.172 0.248
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Wiederholte Erhebungen an Probanden (Augenpaaren)
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Ausblick
• MARS erhebt Cluster (Augenpaare) drei mal
• Modelliere serielle Korrelation durch Markow-Modell: Statuszur letzten Ergebung ist Ein�ussvariable für aktuelle ErhebungErste Ergebung liefert somit keine Outcomes
• Da AMD irreversibel, fange Reiher der Indikatorvariablen fürVerschlechterung immer erst bei Stadium der letzten Erhebungan
• ALR-Teil wie bisher
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
Diskussion
• Modell interessant, da continuation ratios interpretierbar,besonders bei irreversibler Erkrankung
• Modell erweiterbar mit Wechselwirkungen Stadium ∗Ein�ussvariablen
• Programmierung mit Standardsoftware scheint praktikableApproximation an Heagerty and Zeger [2000] zu sein.
• Genaueres noch unklar
HINTERGRUND WERKZEUGE BIVARIATES CRM ERWEITERUNGEN LITERATUR
V. Carey, S. L. Zeger, and P. Diggle. Modelling multivariate binarydata with alternating logistic regressions. Biometrika, 80(3):517�526, 1993.
D. R. Cox. Regression models and life-tables (with discussion). J R
Statist Soc B, 34(2):187�220, 1972.
P. J. Heagerty and S. L. Zeger. Multivariate continuation ratiomodels: Connections and caveats. Biometrics, 56(3):719�732,Sept. 2000. doi: 10.1111/j.0006-341X.2000.00719.x.
W. Moers. Die 131/2 Leben des Käpt'n Blaubär. Eichborn Verlag,Frankfurt a.M., 1999. ISBN 3-8218-2969-9.
top related