コホート研究 isseing333

29
東京大学医学系研究科 博士課程 倉橋一成

Upload: issei-kurahashi

Post on 03-Jul-2015

1.955 views

Category:

Business


0 download

TRANSCRIPT

Page 1: コホート研究 isseing333

東京大学医学系研究科

博士課程 倉橋一成

Page 2: コホート研究 isseing333

曝露◦ 興味のある疾患に関係してそうな因子

曝露効果の指標◦ リスク比,リスク差,オッズ比◦ 発症率比,発症率差

疾病頻度の指標◦ 有病(Prevalence),発生(Incidence)

集団◦ リスク集団(At Risk)◦ 閉じた集団,固定した集団,開いた集団

東京大学 医学系研究科 2

Page 3: コホート研究 isseing333

リスク集団(Population At Risk)◦ まだ興味のある疾病に罹患しておらず,将来その疾病に罹患する可能性のある人たち

閉じた集団(Closed Population)◦ 転出について閉じており,死亡によってのみ減少

固定した集団(Fixed Population)◦ あるイベントにより固定され,以降増える事がない

開いた集団(Open Population)◦ 出生,転入,死亡,転出などにより変化する

東京大学 医学系研究科 3

Page 4: コホート研究 isseing333

リスク集団であるコホートを対象とする◦ コホート:閉じておりかつ固定した集団

◦ At Risk,Closed and Fixed Population 研究開始時に定義した集団を前向きに追跡◦ Perspective Study

曝露効果の指標◦ リスク差,リスク比

◦ 発症率比,発症率差

東京大学 医学系研究科 4

Page 5: コホート研究 isseing333

東京大学 医学系研究科 5

研究終了研究開始

曝露あり群

曝露なし群

Page 6: コホート研究 isseing333

東京大学 医学系研究科 6

+ -+ A C N1- B D N2

発症曝露 合計

確率モデル: ,◦ 独立な二項分布を仮定

リスクの最尤推定量

( )1 1~ ,A Bi N P ( )2 2~ ,B Bi N P

1 1ˆ ,P A N= 2 2P̂ B N=

Page 7: コホート研究 isseing333

二項分布の最尤推定量を求める

東京大学 医学系研究科 7

( ),Bi N P から,実現値 が得られた場合の尤度はr

( )1 N rrN rL C P P −= − であり,対数尤度は

( ) ( )log log log 1N rl C r P N r P= + + − − である.

このときスコア関数は1

l r N rP P P∂ −

= −∂ −

となる.

よって最尤推定量は 0ˆ ˆ1r N rP P

−− =

−を解いて, P̂ r N= となる.

Page 8: コホート研究 isseing333

リスク差: リスク比:

◦ 最尤推定量をそのまま使う

これらの指標の信頼区間を計算したい◦ 誤差(分散)を評価する

◦ デルタ法

東京大学 医学系研究科 8

1 2

A BN N

− 1 2

2 1

A N ANB N BN

=

Page 9: コホート研究 isseing333

確率変数の関数の漸近分散はデルタ法で求める

東京大学 医学系研究科 9

確率変数 の関数 の漸近分散を知りたい.X ( )T X[ ] ,E X µ= [ ] 2V X σ= とする.

( )T X を の周りでテイラー展開すると,X µ=

( ) ( ) ( ) ( ) ( ) ( )2

2!X

T X T X T Tµ

µ µ µ µ−

′ ′′= + − + +

( ) ( ) ( )T X Tµ µ µ′≈ + −

となるので, ( ) ( ) ,E T X T µ≈ ( ) ( )2 2V T X T µ σ′≈ である.

Page 10: コホート研究 isseing333

リスク差(RD)はデルタ法を使わなくても求められる

リスク比(RR)はデルタ法を使う◦ 確率変数を最尤推定量に置き換える

東京大学 医学系研究科 10

( ) ( )1 1 2 21 2 3 3

1 2 1 2

ˆ ˆ ˆ ˆ1 1ˆ ˆ ˆ ˆ ˆ

P P P P AC BDV RD V P PN N N N

− − = − = + = +

( ) 1 21 2 2 2

1 2 1 21 2

ˆ ˆ ˆ ˆ 1 1 1 1ˆ ˆ ˆ ˆ ˆlog log logˆ ˆ ˆ ˆ

V P V P C DV RR V P PAN BN A N B NE P E P

= − = + = + = − + −

Page 11: コホート研究 isseing333

生起確率の最尤推定量の期待値は

◦ 不偏推定量になっている

生起確率の最尤推定量の分散は

◦ Fisher情報量の逆数

◦ クラメル・ラオの不等式より最小分散を満たす

◦ 一様最小分散不偏推定量(UMVUE)

東京大学 医学系研究科 11

[ ]ˆE P E R N NP N P = = =

[ ] ( ) ( )2ˆ 1 1V P V R N NP P N P P N = = − = −

Page 12: コホート研究 isseing333

Fisher情報量とは◦ 定義:スコア関数を二乗して期待値をとる

以下のものと等しい◦ スコア関数を微分してマイナスを付けて期待値をとる

◦ スコア関数の分散

証明はスコア関数の期待値が0であることを利用

東京大学 医学系研究科 12

( ) ( )( ) ( )( )

2

2

,, log ,

,L X

E l X E L X EL X

θθ θ

θ θ θ ′ ∂ ∂′′− = − = − ∂ ∂

( ){ } ( ) ( )( ){ }

( )( )

( )( ) ( ){ }

2 22

2

, , , , ,,

, ,,

L X L X L X L X L XE E E E l X

L X L XL X

θ θ θ θ θθ

θ θθ

′ ′′+ ′ ′′ = = + =

Page 13: コホート研究 isseing333

疑似データ

曝露あり2.5万人,曝露なし6万人を追跡

東京大学 医学系研究科 13

+ -+ 200 24800 25000- 300 59700 60000

発症曝露 合計

リスク差: 2200 300 0.3 1025000 60000

−− = × リスク比:200 60000 1.6300 25000

⋅=

Page 14: コホート研究 isseing333

漸近分散を計算する

漸近分散から信頼区間を求める

東京大学 医学系研究科 14

リスク差の漸近分散:( ) ( )

73 3

200 24800 300 59700 4 1025000 60000

−⋅ ⋅+ = ×

対数リスク比の漸近分散: 31 1 1 1 8.28 10200 25000 300 60000

−− + − = ×

リスク差の95%信頼区間: ( )3 70.3 10 1.96 4 10 1.76,4.24− −× ± × × =

リスク比の95%信頼区間: ( )31.96 8.28 101.6 1.34,1.91e−± × ×× =

Page 15: コホート研究 isseing333

東京大学 医学系研究科 15

data data; input exposure ivent weight; cards;

1 1 200

1 0 24800

0 1 300

0 0 59700

;

run;

proc freq data=data order=data;

tables exposure*ivent/ nocol nopercent relrisk riskdiff measures;

weight weight; run;

Page 16: コホート研究 isseing333

東京大学 医学系研究科 16

The FREQ Procedure

Table of exposure by ivent

exposure ivent

Frequency|

Row Pct | 1| 0| Total

---------+--------+--------+

1 | 200 | 24800 | 25000

| 0.80 | 99.20 |

---------+--------+--------+

0 | 300 | 59700 | 60000

| 0.50 | 99.50 |

---------+--------+--------+

Total 500 84500 85000

Page 17: コホート研究 isseing333

東京大学 医学系研究科 17

Column 1 Risk Estimates

(Asymptotic) 95% (Exact) 95%

Risk ASE Confidence Limits Confidence Limits

-----------------------------------------------------------------------------

Row 1 0.0080 0.0006 0.0069 0.0091 0.0069 0.0092

Row 2 0.0050 0.0003 0.0044 0.0056 0.0045 0.0056

Total 0.0059 0.0003 0.0054 0.0064 0.0054 0.0064

Difference 0.0030 0.0006 0.0018 0.0042

Estimates of the Relative Risk (Row1/Row2)

Type of Study Value 95% Confidence Limits

-----------------------------------------------------------------

Case-Control (Odds Ratio) 1.6048 1.3411 1.9204

Cohort (Col1 Risk) 1.6000 1.3387 1.9123

Cohort (Col2 Risk) 0.9970 0.9957 0.9982

Page 18: コホート研究 isseing333

ランダム化研究◦ 因果的解釈

曝露を受けると発症者が「リスク差」人増える

曝露を受けるとリスクが「リスク比」倍になる

コホート研究◦ 記述的解釈

曝露を受けた群は「リスク差」人多い

曝露を受けた群は「リスク比」倍多い

東京大学 医学系研究科 18

Page 19: コホート研究 isseing333

The goal of all research is to obtain valid evidence regarding the hypothesis under study. Ideally, we would want the quality of evidence from nonexperimental research to be as high as that obtainable from a well designed experiment, had one been possible. (Rothman and Greenlad, 1998)

全ての研究のゴールは、仮設に対するもっともな証拠を得ることである。我々は非実験研究と正しく計画された実験研究の証拠が同等の質であることを望んでいる。

東京大学 医学系研究科 19

Page 20: コホート研究 isseing333

古典的に言われいる必要条件◦ Yの原因になっている

◦ 比較群の間で分布が異なっている

◦ X、Y間の中間変数ではない

DAG (directed acyclic graph)理論からの定義◦ XとYがconditional d-separationである場合に条件付ける変数

d-separation: X-Y間にopen passが存在しない状況

open pass: X-Y間にcolliderが存在しないパス

collider: Xからの矢印とYからの矢印が向かい合っている変数

東京大学 医学系研究科 20

Page 21: コホート研究 isseing333

東京大学 医学系研究科 21

X Y

Z

Z: colliderClosed passUnconditional d-separation

X Y

ZW

Z: confounderOpen passconditional d-separation

Page 22: コホート研究 isseing333

交絡を調整しなくてはならない◦ Simpsonのパラドックス(Simpson, 1951)

東京大学 医学系研究科 22

生存 死亡 合計

非治療 6 6 12治療 20 20 40 ⇒リスク比: 1

男性 女性

生存 死亡 合計

非治療 4 3 7治療 8 5 13

生存 死亡 合計

非治療 2 3 5治療 12 15 27

⇒リスク比: 0.897 ⇒リスク比: 0.926

Page 23: コホート研究 isseing333

どの結果を信じるか?◦ 全体の結果

◦ 層別した結果

◦ 両方

◦ わからない

DAGを描いて交絡変数を調整できている結果を信じる◦ 実験研究に近い、因果関係を表しているだろう

東京大学 医学系研究科 23

Page 24: コホート研究 isseing333

交絡変数で層に分ける

各層の結果を要約した指標を求める

要約指標を曝露の効果と考える◦ サブグループ解析とは異なる

層ごとに解析し、各層での推定値を求める

東京大学 医学系研究科 24

Page 25: コホート研究 isseing333

交絡変数がカテゴリカル

第k層の分割表

これがK個出てくる

東京大学 医学系研究科 25

発症 非発症 合計

暴露 Xk nk-Xk nk非暴露 Yk mk-Yk mk合計 Nk

Page 26: コホート研究 isseing333

各層で不偏な推定関数(Uk)を考える◦ リスク差: E[(P1k-P0k)-δ]=0◦ リスク比: E[P1k-φP0k ]=0◦ オッズ比:E[P1k(1-P0k)-ΨP0k(1-P1k)]=0

各層の推定関数の重み付け和を推定方程式とする◦ ∑kWMHkUk=0◦ WMHk=(nkmk/Nk)

MH推定量、漸近分散◦ リスク差:Sato分散

◦ リスク比:Greenland and Robins 1985◦ オッズ比:RBG分散

東京大学 医学系研究科 26

Page 27: コホート研究 isseing333

交絡変数が連続量

変数が多い、カテゴリが多い◦ 層別すると層の人数が減り、推定できない

モデルを仮定したロジスティック回帰を行う◦ オッズに対するモデル

◦ 乗法モデル(ロジットスケールで加法モデル)

◦ オッズが説明変数の指数関数的に増加

かなり仮定が厳しい

東京大学 医学系研究科 27

Page 28: コホート研究 isseing333

オッズは指数関数的に増加する?◦ 連続変数のまま

オッズは階段状に変化する?◦ カテゴリ分けする

変化は定式化できない?◦ スプライン回帰

東京大学 医学系研究科 28

Page 29: コホート研究 isseing333

分割表で2群に分けている◦ 曝露群では常に一定の曝露を受けていると仮定

◦ 実際は時間と共に変わっているはず

曝露カテゴリに分ける

時間依存性共変量としてモデル化

東京大学 医学系研究科 29