薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information ›...

102
部会資料 薬剤疫学研究入門 そのデザインと解析 -製薬企業の臨床開発部門で働く生物統計家のために- 平成 22 10 医薬品評価委員会 統計・DM 部会 発行 医薬出版センター

Upload: others

Post on 25-May-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

部会資料

薬剤疫学研究入門 そのデザインと解析

-製薬企業の臨床開発部門で働く生物統計家のために-

平成 22 年 10 月

日 本 製 薬 工 業 協 会

医薬品評価委員会 統計・DM 部会

発行 医薬出版センター

Page 2: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

目次

はじめに ............................................................................................................................................... 1

1. 研究仮説と研究デザイン ................................................................................................................. 2

1.1 薬剤疫学研究の流れ ...................................................................................................................... 2 1.2 コホート研究 ............................................................................................................................... 3

1.2.1 研究デザイン ........................................................................................................................ 3 1.2.2 疾病発生および曝露効果の指標とその推定 ......................................................................... 4 1.2.3 コホート研究の特徴 ............................................................................................................. 5

1.3 ケース・コントロール研究 .......................................................................................................... 7 1.3.1 研究デザイン ........................................................................................................................ 7 1.3.2 曝露効果の指標とその推定 .................................................................................................. 7 1.3.3 サンプリング方式と曝露効果の指標 .................................................................................... 8 1.3.4 ケース・コントロール研究の特徴とコホート研究との比較 ............................................. 13

1.4 ネステッド・ケース・コントロール研究 .................................................................................. 15 1.4.1 研究デザイン ...................................................................................................................... 15 1.4.2 曝露効果の指標とその推定 ................................................................................................ 15 1.4.3 ネステッド・ケース・コントロール研究の特徴 ............................................................... 15 1.4.4. ネステッド・ケース・コントロール研究とサンプリング .................................................. 16

1.4.4.1 ハザード比を効果の指標としたコホート研究 .............................................................................. 16 1.4.4.2 ネステッド・ケース・コントロール研究におけるサンプリング ................................................. 17 1.4.4.3 条件付ロジスティック回帰との関係 ............................................................................................ 19 1.4.4.4 その他の注意点 ............................................................................................................................ 22

1.5 ケース・コホート研究 ............................................................................................................... 24 1.5.1 研究デザイン ...................................................................................................................... 24 1.5.2 曝露効果の指標とその推定 ................................................................................................ 24

1.6 ケース・クロスオーバー研究 ..................................................................................................... 26

2. 統計モデルと解析 .......................................................................................................................... 29

2.1 反応の指標 .................................................................................................................................. 29 2.1.1 リスク(発生割合) ............................................................................................................. 29 2.1.2 発生率(Incidence rate) ................................................................................................... 29 2.1.3 ハザードと発生率 ................................................................................................................. 30 2.1.4 比例ハザードモデル .............................................................................................................. 31

2.2 交絡と効果の修飾 ........................................................................................................................ 33 2.2.1 交絡 ...................................................................................................................................... 33

2.2.1.1 交絡の必要条件 ............................................................................................................................ 33 2.2.1.2 因果グラフを用いた交絡の分析 ................................................................................................... 35

2.2.2 効果の修飾 ............................................................................................................................ 41 2.3 調整解析 ....................................................................................................................................... 43

2.3.1 層別解析による調整 ............................................................................................................. 43 2.3.1.1 層でプールしたリスクの推定値 ................................................................................................... 43 2.3.1.2 層でプールした発生率の推定値 .................................................................................................... 45

2.3.2 回帰モデルによる調整 ......................................................................................................... 46 2.3.2.1 発生割合での回帰モデルによる調整 ............................................................................................ 46 2.3.2.2 発生率での回帰モデルによる調整 ................................................................................................ 47

2.3.3 変数選択 ............................................................................................................................... 49 2.4 標準化 .......................................................................................................................................... 50

2.4.1 標準化とは ........................................................................................................................... 50 2.4.2 標準化の考え方 .................................................................................................................... 50

Page 3: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

2.4.3 標準化の計算 ........................................................................................................................ 51 2.4.4 標準集団の選び方 ................................................................................................................ 52 2.4.5 標準化リスク比と標準化リスク差 ....................................................................................... 54

2.4.5.1 標準化リスク比 ............................................................................................................................ 54 2.4.5.2 標準化リスク差 ............................................................................................................................ 54

2.4.6 ロジスティックモデルを用いた標準化 ................................................................................ 55 2.4.7 標準化と調整解析 ................................................................................................................ 56

2.5 マッチング .................................................................................................................................. 58 2.5.1 マッチングの種類 ................................................................................................................. 58 2.5.2 コホート研究,ケース・コントロール研究におけるマッチング ........................................ 61

2.5.2.1 コホート研究 ................................................................................................................................ 61 2.5.2.2 ケース・コントロール研究 .......................................................................................................... 62

2.5.3 条件付ロジスティック・モデル ........................................................................................... 64 2.5.4 カウンターマッチング(counter matching) .................................................................... 65

2.5.4.1 さまざまなサンプリング方式 ....................................................................................................... 66 2.5.4.2 1 対 1 マッチングの場合 ............................................................................................................... 67

2.6 傾向スコアとその利用 ................................................................................................................ 70 2.6.1 はじめに ............................................................................................................................... 70 2.6.2 バランススコアとしての傾向スコア ................................................................................... 70 2.6.3 傾向スコアとランダム化比較試験 ........................................................................................ 72 2.6.4 傾向スコアを用いた解析 ...................................................................................................... 74

2.6.4.1 層別解析 ....................................................................................................................................... 74 2.6.4.2 回帰分析 ....................................................................................................................................... 74 2.6.4.3 マッチング ................................................................................................................................... 76 2.6.4.4 重み付け ....................................................................................................................................... 77

2.6.5 傾向スコアを用いた解析の前提 ............................................................................................ 78 2.6.6 傾向スコアの推定 ................................................................................................................ 80 2.6.7 傾向スコアを用いた解析の事例 ............................................................................................ 81

2.6.7.1 傾向スコアを使ったマッチングによるコホートの選択 ............................................................... 81 2.6.7.2 傾向スコアによる重み付け解析 ................................................................................................... 82 2.6.7.3 既存の調整法との関係 ................................................................................................................. 84

2.6.8 傾向スコアとケース・コントロール研究 ............................................................................ 85 2.6.9 傾向スコアの活用上の留意点 ............................................................................................... 85

2.7 サンプルサイズ ........................................................................................................................... 87 2.8 競合リスク .................................................................................................................................. 90

3. 薬剤疫学研究のプロトコール ........................................................................................................ 91

3.1 全体の構成 .................................................................................................................................. 91 3.2 表紙 ............................................................................................................................................. 91 3.3 要旨 ............................................................................................................................................. 92 3.4 研究実施計画 ............................................................................................................................. 93 3.5 参考資料 ...................................................................................................................................... 96

Page 4: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

1

はじめに 2005 年に ICH-E2E が公表され,医薬品の安全性の確保のために国内の市販後調査にも疫学的手法

を用いた観察研究の実施の必要性が認識されてきている。また,当局から市販後に対照群をもっ

た製造販売後調査の実施を求められたことのある企業もあるとも聞く。 1990 年代後半から始まった臨床試験のグローバル化,標準化において,臨床担当者と統計家が協

力して治験実施計画書を作成し,科学的・倫理的に妥当な試験デザインを立案し,世界同時開発

に貢献できるような臨床試験結果を生み出すことに成功したように,この市販後調査の分野でも,

市販後調査担当者と統計家の協力が,医薬品の安全性確保のために必須である。現在多くの製薬

企業において臨床開発の分野に複数の試験統計家を配置するまでに生物統計家の役割は拡大して

きたが,市販後調査の分野には疫学を修め,疫学的手法に基づく観察研究の立案・解析に専任で

きる生物統計家はわずかである。現在,企業において科学的な疫学デザインに基づく観察研究を

立案・解析できる生物統計家を早急に養成することが,ICH-E2E の求める科学的根拠に基づいた

医薬品の安全の確認,安全性対策の構築に不可欠である。 本タスクフォースはこのような要請の中,生物統計家としての基本的教育を受け,臨床試験の立

案・解析・報告に携わっている企業の医薬品開発部門で働く生物統計家のために,必要な薬剤疫

学の理論的背景を解説し,科学的な薬剤疫学研究の立案・解析が出来るような入門書を作成する

ことを意図して開始された。多くの企業で働く生物統計家が本書を入門書として,それぞれの職

場において医薬品の安全性の確認に必要な科学的疫学研究の立案に貢献し,わが国の医薬品の安

全性確保対策が推進され,薬害事件のような不幸な事態を回避できるように貢献することを望み

ます。

Page 5: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

2

1. 研究仮説と研究デザイン

1.1 薬剤疫学研究の流れ

薬剤疫学は,疫学分野のうち,特に薬剤の有効性・安全性に関する研究分野であり,医薬品の開

発から市販後まで幅広い範囲を網羅している。薬剤の安全性に関する何らかの情報を安全性シグ

ナルと呼ぶことにすると,医薬品の承認後に着目した場合,安全性シグナルの検出にはじまり,

その補強,評価・確認など,得られる情報の信憑性の度合いに応じて,いくつかの段階がある。

それぞれの段階に応じてそれぞれの調査・研究目的が定まりそれに対応した研究デザインが選択

される。 安全性シグナルを検出する段階では,自発報告などのケースレポートの個別評価やそのケースを

データベース化しケースシリーズとしてデータマイニング手法を応用したシグナル検出手法など

が行われる。安全性のシグナルの補強の段階では,その事象がどのくらい起こるのか(量的評価)

をおおまかに調査する横断研究,小規模なケースコントロール研究などが行われる。その後検出

されたシグナルが薬剤によるものかどうかを評価・確認する段階に至り,コホート研究やケース

コントロール研究が行われ,必要な場合はランダム化臨床試験が行われる(図 1.1.1)。 本解説書では,安全性のシグナルを検出する段階から始まる一連の医薬品の安全性確認の流れの

うち,安全性のシグナルを検出する段階,その後の安全性シグナルの補強の段階は対象とせず,

主に安全性の評価・確認段階の研究デザインを対象とした。

図 1.1.1 潜在的リスクを強化し,特定されたリスクを検証する薬剤疫学研究デザインと期待されるエビ

デンスの重み 本解説書では,企業の臨床部門で働く統計家になじみの深いランダム化並行群間比較試験との対

比からコホート研究の解説から初め,ケース・コントロール研究がコホート研究の対照群を一定

の条件でサンプリングしたもので,サンプリング方式を理解することでコホート研究と同じ文脈

で理解することが可能であることを解説し,大規模データベースの出現によって発展してきた

近の新たなケース・コントロール研究デザインをいくつか解説する。 後にクロスオーバー試験

と対応して考えられるケース・クロスオーバー研究を解説する。

Page 6: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

3

1.2 コホート研究

1.2.1 研究デザイン コホート研究とは,コホート(cohort)とよばれる個人の集まりを,ある一定期間追跡する研究の

総称であり,縦断研究(longitudinal study)ともよばれる。例えば,ランダム化臨床試験は,患者

を対象にして複数の治療法をランダムに割り当て,コホート間で治療法という特定の条件のみが

異なる状況を意図的に作り出した“介入”によるコホート研究である。これに対し,疫学研究の

多くでは介入を行わない(あるいは行えない)ため,コホート間で研究対象とする特定の条件以

外に違いが生じる可能性がある。したがって,特定の条件以外の違いについて,計画時に可能な

限り均一化するよう工夫すること,あるいは解析時にこうした条件の違いを適切に考慮すること

が重要となる。 図 1.2.1 は,ある薬剤の曝露を受けた(a)~(e)のメンバーからなる曝露コホートと,薬剤の曝露を

受けていない(f)~(j)のメンバーからなる非曝露コホートを設定して追跡し,ある特定の疾病の発

生を観察したコホート研究の概念図である。疫学研究においてコホートの追跡は長期に亘る場合

が多く,追跡途中で観察が継続できなくなる場合(観察中止)もある。このような打ち切りデー

タ(censored data)の取り扱いについては,計画時及び解析時に充分注意する必要がある。

(a)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(i)

(j)

曝露

非曝露

観察開始 観察終了

疾病発生

観察打ち切り(リスク集団からの離脱)

調査の方向

図 1.2.1 コホート研究

図 1.2.1 では,追跡対象者であるコホートメンバーは,(a)~(e),(f)~(j)に固定されていた。このよ

うに,開始後に他のメンバーがコホートに加わることがない場合を,閉鎖コホート(closed cohort)とよぶ。閉鎖コホートでは,コホートメンバーが設定されて追跡が開始されたら,コホートに誰

かが新規に加わることはない。したがって,疾病の発症や打ち切りによって追跡不能となること

で,コホートメンバーは次第に減少していくのみである。これに対して, 初に設定された以外

のメンバーが,調査の途中からコホートに加わる場合を開放コホート(open cohort,dynamic cohort)とよぶ。開放コホートでは,閉鎖コホートの場合と同様な理由からコホートから「流出」してい

くメンバーがいる一方で,時間の経過とともにあらたにコホートに「流入」してくる新規のメン

バーもいる。このため,コホートメンバーが減少する場合もあれば,増加する場合もある。 コホートメンバーの基本的な要件は,研究対象としている疾病を発症するリスクを持っているこ

とである。そのため,コホートメンバーは,リスク集団(population at risk)ともよばれる。当然

のことながら,何の疾病を研究対象とするかによってリスク集団は異なることになる。リスクを

Page 7: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

4

持っている状態,すなわち「at risk」な状態とは,以下の 3 つの条件を満たす場合である[11]。 (1) 研究開始時に,研究対象としている疾病にかかっていない (2) 将来その疾病にかかる可能性がある (3) 積極的な追跡を受けている

1 度しか起こらない疾病(例えば死亡,根治不可能な疾病,治癒後に免疫を獲得する疾病)では,

疾病が起こればリスク集団から直ちに除かれることになる。反対に何度も起きる疾病では,疾病

罹患中はリスク集団から除かれ,治癒後に再びリスク集団に戻ることになる。このような場合は,

リスク集団に含まれるということが動的な過程となり,コホートメンバーが固定されている場合

であっても開放コホートとなる。

1.2.2 疾病発生および曝露効果の指標とその推定

今, 1N 人からなる曝露コホートと, 0N 人からなる非曝露コホートを追跡したコホート研究を

行った結果,それぞれ a 人,b 人に疾病の発生が確認されたとしよう。このコホート研究の結果

は,表 1.2.1 のように纏められる。なお,以降では時間の単位を年としたが,必要に応じて単位を

月や日にしてもよい。

表 1.2.1 コホート研究の結果 曝露群 非曝露群

疾病発生数 a b 非疾病発生数 aNc 1 bNd 0

リスク人口 1N 0N

リスク人時間 1T 0T

曝露群,非曝露群において,コホートの追跡対象者の総数 01, NN をリスク人口とよび,コホー

トメンバーがリスクに曝されている全期間,すなわち総追跡期間 01, TT をリスク人時間とよぶ。

コホート研究において,曝露の作用は,その結果生じる疾病の発生に先駆けて作用することを

前提としており,疾病を「発生(incidence)」で捉えることになる。このとき疾病発生の指標とし

ては,「割合(proportion)」と「率(rate)」が用いられる。

疾病発生割合(incidence proportion)はリスクともよばれ,例えば曝露コホートのリスク 1R は

11 N

aR

と求められる。当然のことながら,リスクを求めるためには追跡対象者数が固定されていなけれ

ばならないため,開放コホートでは求めることができない。また,追跡期間がメンバーによって

異なる場合や,打ち切りが生じる場合も,何らかの取り決めを行えば計算はできるかもしれない

が,適切な疾病発生の指標とはなりえない。 疾病発生率(incidence rate,以下単に発生率)は,人時間(person-time)単位当りの疾病発生数

を表しており,例えば曝露コホートの発生率 1I は

11 T

aI

と求められる。ここで発生率の単位は任意であり,実際の追跡期間とは無関係である。例えば,

リスク人時間には,人年(person-year),人月(person-month),人日(person-day)等が用いられ

Page 8: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

5

る。先に述べたように,コホートの追跡では打ち切りデータ(censored data)が生じる可能性があ

るが,発生率はこれを適切に考慮した疾病発生の指標である。疾病発生率は,各追跡対象者の追

跡期間が分かれば良いので,閉鎖コホート,開放コホートのどちらの場合でも求めることが可能

である。 コホート研究の主たる目的は,特定の条件のみが異なる複数のコホートの比較である。例えば,

曝露コホートと非曝露コホートを比較した場合には,その曝露効果を推定することが目的となる。

曝露効果の指標には,疾病発生のそれぞれの指標に対して,絶対的な評価指標である「差」と,

相対的な評価指標である「比」がある。 表 1.2.2 に,リスク及び発生率に対する曝露効果の指標の推定値とその分散を示した。なお,こ

れらの数理的な側面については第 2 章で述べる。

表 1.2.2 コホート研究における曝露効果の指標

疾病発生の

指標 曝露効果 の測り方

曝露効果の推定値

曝露効果の推定値の分散

リスク 差

01 N

b

N

aRD

30

031

1

N

bNb

N

aNaRDV

01

/N

b

N

aRR

01

1111log

NbNaRRV

発生率 差

01 T

b

T

aID

20

21 T

b

T

aIDV

01

/T

b

T

aIR

baIRV

11log

介入を伴わないコホート研究では,慎重に計画したとしても,結果として曝露以外の違いを完

全に均一化することは難しい。そこで疫学研究で曝露効果を推定する場合,表 1.2.2 に示した調整

しない曝露効果の推定(すなわち「粗の曝露効果」)に対して,結果に影響を与える重要な因子に

よる層別解析など,調整した推定を行うことが多い。これら調整解析については,第 2 章で述べ

る。

1.2.3 コホート研究の特徴 コホート研究は,調査の方向が時間的に未来に向かっているため,このような研究は前向き研

究とよばれる。前向き研究に基づく結果は強固なエビデンスを与えるが,非常に多くの時間やコ

ストがかかるという問題を内包している。実際にコホート研究では,多くのコホートメンバーを

追跡して情報を得る必要があるが,疾病の発生が稀である場合,実際に疾病を発症するのはごく

少数のメンバーであり,疾病の充分な発生数を観測するまでには非常に長い時間とコストをかけ

て,コホートの追跡を続けなければならない。そこで,コホート研究の様々な効率化の方法が提

案されており,次節以降で述べるケース・コントロール研究,及びその改良であるネステッド・

ケース・コントロール研究,ケース・コホート研究,ケース・クロスオーバー研究は,全てコホ

ート研究の効率的改善を目指した研究デザインとして位置付けられる。 後ろ向きコホート研究(historical cohort study,retrospective cohort study)もまた,コホート研究

の問題点を解決するために提案された研究デザインである。後ろ向きコホート研究は,記録され

た情報に基づいて時間を遡ってコホートを設定し,あたかも通常のコホート研究のように曝露状

況と疾病発生状況を調査する研究である。後ろ向きコホート研究は一般的に低コストであり,疾

病の発生を待つ必要がないので,迅速に結果を出すことが可能である。例えば,データベースを

Page 9: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

6

用いて後ろ向きコホート研究を実施することが考えられるが,既に収集されている情報のみしか

用いることができないので,重要な情報が収集されていない場合,適切な評価を行うことができ

ない可能性もある。 コホート研究で設定したコホートを用いて,横断研究(cross-sectional study)を行う場合がある。

横断研究とは,あるコホートメンバーについて,ある 1 時点で病気にかかっているかどうか(有

病状況)と,リスク要因への曝露を受けているかどうか(曝露状況)を同時に調査する研究であ

る。したがって,横断研究では,疾病を特定の期間の「発生」ではなく,特定の時点の「有病

(prevalence)」で捉えることになり,その指標として「有病率」が用いられる。横断研究では全

ての情報が 1 時点で得られており,調査対象を継続的・経時的に追跡する必要がないため,比較

的簡便に,短期間に調査を実施することができる。ただし横断研究では,曝露と疾病の時間的な

順序が必ずしも明確でない。すなわち,曝露の有無によって疾病の発生状況が異なっていたのか,

それとも疾病の有無によって曝露状況が異なっていたのか,因果の向きを明らかにすることがで

きない(例えば,日常の運動の量と風邪の有無の関係を横断研究で調べた場合,両者に関連性が

あったとしても,運動をしたことで風邪をひかなかったのか,風邪をひかなかったから運動がで

きたのかを区別することができない)。

Page 10: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

7

1.3 ケース・コントロール研究

1.3.1 研究デザイン ケース・コントロール研究(case-control study)は,疾病の発生が稀な場合に広く用いられ,サ

ンプリングの考え方を用いることで,より効率的にコホート研究と同等の情報を得ることを目指

した研究である。 ケース・コントロール研究は,以下の手順で行われる。 (1) ケース(疾病を発生した症例)を同定する (2) ケースが発生してくる元のリスク集団からコントロールをサンプリングする (3) ケース及びコントロールについて,曝露状況を過去に遡って調査する

図 1.2.1 のコホート研究に対応して,ケース・コントロール研究の概念図を示すと図 1.3.1 のよ

うになる。ケース・コントロール研究は,発生,非発生という結果を先に捉え,その原因となっ

た曝露・非曝露を過去に遡って調査する。 ケースの同定には後ろ向きにする方法と、これから発生するケースを待つ前向きな同定法があ

る。後ろ向きケース・コントロール研究では,疾病の発生を待つ必要がないので,時間やコスト

がかからないメリットがある。 コントロールの選択における「ケースが発生してくる元のリスク集団」とは,仮にコホート研

究を行った場合の仮想的コホートであり,コントロールは,曝露状態とは無関係に選択されてい

なければならない。コントロールは、仮想的なコホートのうち疾病を発生していない症例からサ

ンプリングする場合と、疾病の発生の有無にかかわらず仮想的コホートからサンプリングする場

合がある。また,コントロールを選択する場合,ケースとコントロールの間で曝露以外の違いを

可能な限り均一化するため,マッチングとよばれるサンプリング手法が用いられることもある。

このデザインと解析方法の詳細については,第 2 章で述べる。

図 1.3.1 ケース・コントロール研究

1.3.2 曝露効果の指標とその推定

今, 1M 人のケースと, 0M 人のコントロールを選択し,ケース・コントロール研究を行って曝露

Page 11: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

8

状況を調査した結果,ケースでは a 人に曝露が確認され,コントロールでは c 人に曝露が確認さ

れたとしよう。このケース・コントロール研究の結果は,表 1.3.1 のように纏められる。

表 1.3.1 ケース・コントロール研究の結果

曝露 非曝露 合計

ケース a b ba

コントロール c d dc

1.2 節のコホート研究では,曝露群と非曝露群のコホートを設定して疾病発生を観察していた。

これは,表 1.3.1 において各列の合計である ca と db を固定して,疾病の発生 ba, を観察し

ていたことに他ならない。これに対してケース・コントロール研究では,結果であるケースに基

づいてコントロールの選択を行っており,これは各行の合計である baM 1 と dcM 0 を

固定していることを意味する。したがって,ケース・コントロール研究では,列の合計には分母

としての意味はないため,疾病発生割合を推定することはできない。そこで,ケース・コントロ

ール研究における曝露効果の指標には,オッズ比OR

bc

adOR

が用いられる。デルタ法を用いて対数オッズ比 ORlog の近似的な分散,

dcba

ORV1111

log

によりオッズ比の信頼区間を構成することが可能である。

1.3.3 サンプリング方式と曝露効果の指標 以上のように,オッズ比の計算自体は単純である。しかし,オッズ比が具体的にどのような曝

露効果の指標を表わしているかは,コントロールをどのようにサンプリングしたかによって異な

る。今,表 1.3.1 で示したケース・コントロール研究の結果が,表 1.3.2 に示す仮想的なコホート

研究から得られた結果の一部であったとしよう。ただし,閉鎖コホートを想定し,観察期間中に

曝露状況が変化することはなく,また疾病発生(初発のみ考慮)もしくは事前に設定された追跡

期間の終了時まで全例を追跡したうえで,このようなデータが得られたとしよう。

表 1.3.2 ケース・コントロール研究の元になった仮想的なコホート研究 曝露群 非曝露群

ケース A B 非ケース ANC 1 BND 0

リスク人口 1N 0N

リスク人時間 1T 0T

まず,ケース ba, は,仮想的なコホートのケース BA, からサンプリング確率 01, ff によって抽

出されたとしよう。通常,ケースについては全例の情報を収集することが多いので,多くの場合

101 ff であるが,もっと一般的な場合も考慮して,このように想定する。すると,サンプリ

ングによって得られるケースの数 ba, の期待値は以下のようになる。

Page 12: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

9

0

1

fBb

fAa

次に,コントロール dc, を以下の 3 つのサンプリング方式によって選択した場合について考え

よう。

(1) コントロール dc, を観察開始時のリスク人口 01, NN から,それぞれサンプリング確率 01,hh に

よって選択する

(2) コントロール dc, を観察終了時の非ケース DC, から,それぞれサンプリング確率 01,hh によ

って選択する

(3) コントロール dc, を観察終了時のリスク人時間 01,TT から,それぞれサンプリング確率 01,hhによって選択する

サンプリング方式 (1) まず,(1)のサンプリング方式では,コントロールを,ケース,非ケースを問わず観察開始時の

リスク人口全体からサンプリングする。この場合,サンプリングによって得られるコントロール

数 dc, の期待値は

00

11

hNd

hNc

ここで仮に,ケースもコントロールも曝露の有無によらず同じ確率でサンプリングされたと仮

定すると hhhfff 0101 , となる。逆に,「曝露と無関係なサンプリング」とは,この条件

が成立するようにサンプリングを行うことに他ならない。 さて,この条件を満たすようなサンプリング方式のもとでは,オッズ比が以下の関係を満たす。

RR

NB

NA

hNBf

hNAf

bc

adOR

0

1

1

0

/

/

すなわち,(1)のサンプリング方式によってコントロールを選択すると,オッズ比を通じて,リ

スク比を知ることができる。つまり,このようなサンプリング方式から得られたオッズ比は,リ

スク比と一致性を持つ。このような関係が成立する理由は,もちろん

0

1

N

N

d

c

となるように,言い換えれば,コントロールが観察開始時のリスク人口と比例的にサンプリング

されているからである。このように考えると,ケース・コントロール研究におけるコントロール

は,観察開始時のリスク人口の比の代用品,あるいは「分母」の比のコピーとして機能している

ことがわかる。また,上のオッズ比の計算過程から,サンプリングが曝露と無関係でない場合,

つまり 01 ff もしくは 01 hh の場合には,サンプリング確率に関するこれらの項が分母・分子

で打ち消されることなく残存するため,結果的にリスク比の推定にバイアスが生じることもわか

る。 サンプリング方式 (2) 次に,(2)のサンプリング方式について考えてみよう。疫学の教科書では,この観察終了時の非

ケースからのサンプリングをケースコントロール研究の標準的なサンプリング方式として紹介し

ていることが少なくない。この場合,サンプリングによって得られるコントロール数 dc, の期待

Page 13: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

10

値は

000

111

hBNhDd

hANhCc

となる。ここで,コントロールが曝露と無関係にサンプリングされ( hhh 01 ),かつ BA, が,

01, NN と比較してそれぞれ相対的に十分に小さい場合,すなわち曝露群,非曝露群ともに疾病発

生割合が十分に小さい場合,近似的に

0000

1111

NBhNhBNd

NAhNhANc

と表すことができる。したがって,先と同様の議論により,ケース・コントロール研究における

オッズ比は,仮想的なコホート研究におけるリスク比の良い近似となることが分かる。この「疾

病発生割合が十分に小さい」ことは,「稀な疾病の仮定(rare disease assumption)」とよばれ,非ケ

ースのみからコントロールをサンプリングする場合には重要な仮定となる。ケース・コントロー

ル研究は,多くの場合,疾患が稀な場合に実施されることが多いので,そのような場合には,こ

の仮定は自動的に満たされていると考えて良いだろう。 ここで,リスク比は,閉鎖コホートでのみ推定可能であることにあらためて注意してまとめると,

非ケースからコントロールをサンプリングするケース・コントロール研究におけるオッズ比は,

以下の 4 つの条件を満たす場合には,仮想的なコホート研究のリスク比の近似として解釈できる[12]。 ・ 閉鎖コホート ・ ケースが曝露と無関係に,あるいは曝露の有無によらず等しい確率で,サンプリングされて

いる (f1=f0) ・ コントロールが観察開始時のリスク人口と比例的に,曝露と無関係にサンプリングされてい

る (h1=h0) ・ 「稀な疾病の仮定」が成り立つ (N1>>A and N0>>B) サンプリング方式 (3)

後に(3)の場合について考えてみよう。リスク人時間からサンプリングする,というのは,人

を単位としてではなく,人時間を単位としてサンプリングを行うということである。具体的には,

例えば,コホートメンバーA さんの観察期間が B さんより 2 倍長い場合,A さんの方が B さんよ

り 2 倍高い確率で選択されなければならない。このように,コホートメンバーの各人に対して,

その観察終了までの人時間に比例したサンプリングが行われたとする。この方式でコントロール

を,リスク人時間 01,TT からサンプリング確率 01,hh によって選択すると,このサンプリングで得

られるコントロール数 dc, の期待値は

00

11

hTd

hTc

となる。再び,ケースとコントロール,いずれのサンプリング確率についても,曝露の有無によ

らず等しいことを仮定してオッズ比を計算すると IR

TB

TA

hTBf

hTAf

bc

adOR

0

1

1

0

/

/

Page 14: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

11

したがって,(3)のサンプリング方式によってコントロールを選択すると,オッズ比を通じて,

発生率比を知ることができる。つまり,このサンプリング方式によって得られたオッズ比は,発

生率比と一致性を持つ。また,この場合,コントロールが,リスク人口ではなく,リスク人時間

という「分母」の代用品として機能していることがわかる。 なお,発生率比については,開放コホートでも推定可能であったことを思い出すと,ケース・

コントロール研究におけるオッズ比は,以下の 3 つの条件を満たす場合には,仮想的なコホート

研究における発生率比として解釈できる[10,12]。

・ 閉鎖コホート・開放コホート,いずれでもよい ・ ケースが曝露と無関係に,あるいは曝露群によらず等しい確率で,サンプリングされている

(f1=f0) ・ コントロールが観察終了時の人時間と比例的に,曝露と無関係にサンプリングされている

(h1=h0)

その他のサンプリング方式への拡張 なお,ケース・コントロール研究から,オッズ比を通じて発生率比を知りたい場合,サンプリ

ング方式に関してさらにいくつかのヴァリエーションが考えられる。例えば,以下のサンプリン

グ方式を用いた場合にも,得られたオッズ比は発生率比と一致性を持つ。

(4) コントロール dc, を,ケース発生時 t のリスク人口(あるいは非ケース)N1(t),N0(t)から,曝露

の有無によらず,かつ時点 t によらず等しいサンプリング確率で選択する(h=h(t)) このサンプリング方式が,実質的に (3) のサンプリング方式と同等であることを手短に確認し

ておこう。ケースが発生した時点 t ごとに,常にサンプリング確率 h でコントロールを選択したと

すると,時点ごとに得られるコントロール数の期待値は曝露群で thN1 ,また非曝露群で thN0

となる。このようなサンプリングを観察開始時( 0t )から終了時( Tt )まで行って足し合

わせたとすると,コントロール数の合計は,曝露群で概ね

T

dttNhc0 1

また非曝露群で

T

dttNhd0 0

程度であろうと見積もることができる。すると結局,期待されるコントロール数の比は

T

T

T

T

dttN

dttN

dttNh

dttNh

d

c

0 0

0 1

0 0

0 1

となるが,この右辺は,後述するようにリスク人時間の比,つまり0

1

T

Tに他ならない。つまり,コ

ントロール数の比を求めることで発生率の分母の比0

1

T

Tを推定していることになる。こうして,(4)

のサンプリング方式を用いた場合にも,コントロール数の比から人時間という「分母」の比に関

する情報が得られることがわかる。

Page 15: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

12

とはいえ,ケースが発生するたびに,同時点のリスク人口から等確率でサンプリングするため

には,リアルタイムにリスク人口の大きさを把握する必要があり,実際には非現実的である。そ

こで,時点ごとのサンプリング確率は異なってもかまわないから,とにかく曝露と無関係なサン

プリングをケースが発生するたびに行う,という以下のサンプリング方式が考えられる。

(4b) コントロール dc, を,ケース発生時 t のリスク人口(あるいは非ケース)N1(t),N0(t)から,曝露

の有無によらず等しいサンプリング確率で選択する (h1(t)=h0(t)) この(4b)の仮定が(4)と異なるのは,サンプリング確率が,時点によらず一定ではなく,時点 t

の関数になっている点である。ただしこのサンプリング確率 h(t)は曝露とは無関係である。そし

て実はこれが,後述するネステッド・ケース・コントロール研究における標準的なサンプリング

方式である。ただし,この方法を用いた場合,表 1.3: 1 で示したようなセル度数から単純にオッ

ズ比を求めても,それが発生率比と一致するとは限らない。というのは,(4)のサンプリング方式

における,時点ごとのサンプリング確率を,定数 h から時間の関数 th に変えると,期待される

コントロール数の比は

T

T

dttNth

dttNth

d

c

0 0

0 1

となる。この場合,サンプリング確率の部分が分母・分子で打ち消しあうとは限らないため,上

式の右辺が無条件にリスク人時間の比0

1

T

Tと一致することはありえない。後述するように(4b)のよ

うなサンプリング方式を用いた場合には,サンプリングを時点ごとに異なる確率で行ったことを

解析時に適切に考慮する必要がある。

以上で概観したように,データさえ入手すれば簡単に計算できるオッズ比ではあるが,得られ

たオッズ比が具体的にどのような曝露効果の指標を表わしているかは,その研究で採用されたサ

ンプリング方式によって異なってくる。このことは,ケース・コントロール研究におけるサンプ

リングの重要性を示唆するものであり,言い換えれば,ケース・コントロール研究の妥当性がサ

ンプリングの妥当性に大きく依存することを示している。 コントロール群の比が発生率の分母の比と一致する条件 コントロール群の曝露・非曝露の比はオッズ比の分母相当部分(偽分母)の比であるが,これが

発生率の分母の比0

1

T

Tと一致するには次の式が満たされるときとなる(必要十分条件)。

T

T

T

T

dttN

dttN

dttNth

dttNth

0 0

0 1

0 0

0 1

これを,分母をはらって T で微分して,整理すると

Tdt

TN

TN

tN

tNthTh

00

1

0

1 0

という式が得られる。観察期間終了時(T)よらず普遍的に両者が一致する条件を求めようとする

Page 16: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

13

と,上の関係がすべての T について成り立つことが必要であり,それはすなわち被積分関数があ

らゆるところで 0 になる場合であるので,

0 thTh または

0

0

1

0

1

TN

TN

tN

tN(a.e.)

という関係が恒等的に(任意の T やtについて)成立するという条件が得られる。この一つ目の

式が,サンプリング確率が時間によらず一定であることを(つまり(4)の条件)示し,二番目の式

が曝露が安定であること(曝露群と非曝露群のリスク人口の比が時点によらず一定であること)

を示している。すなわちこの 2 つの条件のいずれかが成立すれば,時点ごとのサンプリングによ

って,租オッズ比を計算しただけで(マッチングもしないで)発生率比とオッズ比が一致するこ

とがわかる。このあたりの考察は,Greenland & Thomas (1982)を参照されたい。 新薬が市場に投入された直後となどは曝露は急激に変化してゆくので後者の曝露の安定性に関す

る条件はなりたちにくい。また,前者のような全時点で等確率のサンプリングの条件を満たすた

めに時間マッチングによるサンプリングと時点での層別解析というアイディアにつながって行く。

1.3.4 ケース・コントロール研究の特徴とコホート研究との比較 表 1.3.3 に,コホート研究とケース・コントロール研究の比較を示す。この 2 つの研究は,互い

の長所が互いの短所になっているという関係を持っている。

表 1.3.3 コホート研究とケース・コントロール研究の比較 コホート研究 ケース・コントロール研究

調査方法 母集団における分母(リスク人口,

リスク人時間)を全て数え上げる

母集団からのサンプリング

曝露効果 の指標

差,比ともに計算可能 比のみ計算可能

コスト 大 小 調査対象 複数の疾病について検討可能 複数の曝露について検討可能 バイアス 比較的小さい 様々なバイアスの可能性

ケース・コントロール研究を実施する際,デザインの性質上,バイアスについてより慎重に検

討し,その対応策を吟味しておかなければならない。例えば,リスク要因に関する情報を過去に

遡って調べるため,曝露・非曝露などの情報が不正確になるときに生じる情報バイアス

(information bias)や,個々の曝露分布の代表性を満たさずにケースやコントロールを選択するこ

とによって生じる選択バイアス(selection bias)が知られている。これらを含めたケース・コント

ロール研究における問題点の詳細は,様々な観点から議論されている(佐藤 2007, ロスマンの疫

学 X 章 2002)。 次節以降で取り上げるネステッド・ケース・コントロール研究,ケース・コホート研究は,コ

ホート研究の枠組みの中で,ケース・コントロール研究を考えた研究デザインであり,コホート

研究とケース・コントロール研究のそれぞれの長所を生かしたものとして提案されたものである。 コホート研究では,1 つの疾病だけでなく複数の疾病の発生を調査し,ある 1 つの曝露要因の

曝露効果を評価することが可能である。一方で,ケース・コントロール研究では,1 つの疾病に

対して複数の曝露要因を調査し,それぞれの曝露効果を評価することが可能である。ただし,臨

床研究と同様に,疫学研究においてもサンプルサイズ設計はなされるべきであり,副次的な疾病

や曝露要因について評価を行う場合,充分なサンプルが確保されているかどうかを研究開始前に

吟味しておく必要がある。 また,コホート研究では,リスク比だけでなく,リスク差も推定することが可能であるが,ケ

ース・コントロール研究では,リスク比のみが推定可能となる。これは,サンプリング方式(1)で

Page 17: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

14

解説したように,ケースとコントロールのサンプリング確率が曝露の有無によらず一定の場合,

分子,分母で数学的に消去できてオッズ比がリスク比とみなせるためであり,リスク差の場合は

このような数学的な条件を構成できないためである。

Page 18: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

15

1.4 ネステッド・ケース・コントロール研究

1.4.1 研究デザイン 近年,カルテなどの診療記録やレセプトなどの会計情報が電子化され,それらをデータベース

化して薬剤疫学研究に二次利用できるようになってきている。これらのデータベースは数万例か

ら数千万例規模の大規模データベースとなり,より効率的にコホート研究を実施するためにコン

トロールのサンプリングというケース・コントロール研究の基本的考え方を発展させて,ネステ

ッド・ケース・コントロール研究(nested case-control study)という研究デザインが提案されてい

る。ネステッド・ケース・コントロール研究は後述するように,一定の条件下でオッズ比を観察

することでハザード比を直接推定できるなどの便利な特性があるので,大規模データベース研究

に広く用いられるようになってきている。ネステッド・ケース・コントロール研究は,シンセテ

ィック・ケース・コントロール研究(synthetic case-control study),コホート内ケース・コントロー

ル研究(case-control within a cohort)ともよばれる。 ネステッド・ケース・コントロール研究は,以下の手順で行われる。 (1) 曝露・非曝露の状況が調査可能なコホートを設定する (2) コホートを追跡し,ケースの発生を観察する (3) コホート内にケースが発生した場合,コホートから適切なコントロールを選択する (4) ケースとコントロールの曝露情報を含めた共変量情報を調査する

ネステッド・ケース・コントロール研究において,コントロールの選択方法は様々であるが,

ランダムサンプリングや密度に基づいたサンプリング(人・時間サンプリング)が代表的なもの

として知られている。コホートメンバーがケースとなった時点で,同じリスク人時間のリスク集

団から 1 人またはそれ以上のコントロールをランダムに選択する研究を密度ケース・コントロー

ル研究(density case-control study)とよび,このマッチングの方法は時点マッチングとよばれる。

閉鎖コホートの場合,時点マッチングはケースが発生した日のリスク集団からのサンプリングに

なる。このとき,ある人がコントロールとして選択される確率は,母集団における人時間への寄

与に比例している。また,ケース及び一度コントロールとして選択された人も,コントロールと

して選ばれる。

1.4.2 曝露効果の指標とその推定 伝統的なケース・コントロール研究では,コントロールとは非ケースと考えられていたが,ネ

ステッド・ケース・コントロール研究及び後述のケース・コホート研究では,コントロールをそ

のようには捉えず,コントロールをケースからもサンプリングすることを許容している。したが

って,ネステッド・コントロール研究における曝露効果の指標には,ケース及びコントロールが

曝露と無関係にサンプリングされていれば,リスク比や発生率比を知るために,オッズ比を用い

ることが出来る。このとき,「稀な疾病の仮定」は必要ないことに注意しておく。 オッズ比の推定において,マッチングを行った場合にこれを考慮した解析を行わないと,パラ

メータや標準誤差の推定に影響を及ぼすことが知られている。時点マッチングを行った場合も同

様であり,ネステッド・ケース・コントロール研究における解析,すなわち曝露効果の推定では,

マッチングを行ったコホート研究やケース・コントロール研究と同様に,条件付きロジスティッ

ク回帰モデルを用いる必要がある[7,8,10]。条件付きロジスティック回帰モデルによる曝露効果の

推定法についての詳細は,2.5 節のマッチングで述べる。

1.4.3 ネステッド・ケース・コントロール研究の特徴 ネステッド・ケース・コントロール研究は,コホートを追跡してケースを前向きに捉え,コン

トロールの選択は,ケースの発生後に行う研究デザインである。このようにケースを前向きに捉

Page 19: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

16

えるため,ケースの発生を待つ必要があり時間がかかる問題点はある。しかしながら,コホート

が明確化されていることに加え,曝露情報をはじめとした様々な情報が前向きに収集されており,

1.3.4 節で述べた選択バイアスや情報バイアスなどケース・コントロール研究におけるバイアスの

問題点を可能な限り回避することが可能である。 また,ネステッド・ケース・コントロール研究において,必要な情報を取得するのは,全コホ

ートメンバーの一部(ケースおよびコントロールとして選択されたコホートメンバーのみ)で良

いため,コホート研究に比較して低コストである。例えば,試料測定のコストが高い場合,試料

を凍結保存し,ケースやコントロールとして選択された場合だけ解凍することにより,測定のコ

ストを軽減できる。あるいは調査項目が多い場合でも,ケースやコントロールとして選択された

場合だけデータベース化することにより,その作業量を軽減できるメリットもある。

1.4.4. ネステッド・ケース・コントロール研究とサンプリング この節では,これまでのネステッド・ケース・コントロール研究で概観した内容について,や

や詳しく述べてみたい。

1.4.4.1 ハザード比を効果の指標としたコホート研究 時点マッチングを行い,ケース発生と同時点のリスク集合からコントロールをサンプリングする

ネステッド・ケース・コントロール研究(コホート内ケース・コントロール研究)を行うことで,

実質的にはハザード比を推定することができる。直観的には,時点マッチングを行うことで,時

間とともに変化するかもしれないベースライン・ハザード(非曝露群でのイベント発生の速度)

の影響を「調整」した上で,曝露によりハザードが何倍増加するかを調べることができる。この

ことを見るために,まずコホート研究でどのようにハザード比が推定されるかをあらためて整理

しておこう。

コホート研究では,たとえば時点 t で at risk であるコホートメンバー全員,つまり tN 人分の

曝露や共変量の情報がすべて利用可能である。この tN 人のコホートメンバーの集合,すなわち

時点 t におけるリスク集合を tR と表わそう。また非曝露時のベースライン・ハザード t0 が,

曝露により exp 倍になる,という比例ハザードモデル

ii xtt exp0  ,ただし tRi

を考えよう。ただし,添字 i はリスク集合 tR に含まれる i さんを表わす。また, ix は i さんの曝

露状況を表わす変数で,i さんが非曝露群に含まれるときは 0,曝露群に含まれるときは 1 という

値を取るものとする。すなわち,i さんの時点 t におけるハザード ti  は,i さんが非曝露群に含

まれるときは t0 ,また曝露群に含まれるときは exp0 t となる。両者の比 exp がハザ

ード比であり,このコホート研究で調べたい効果の指標である。コホート研究の場合,ハザード

比を Cox 回帰により推定することができるが,その際,以下で略述するように部分尤度というも

のを考え,関心があるパラメータ を推定する。

まず,時点 t におけるリスク集合 tR に属するコホート・メンバーのうち,短い時間間隔

ttt , の間に,特に i さんでイベントが生じる確率,言いかえると i さんではイベントが生じ,

それ以外のメンバーではイベントが生じない確率は

tttttt iitRj

ji

    \

1

ただし,リスク集合 tR から i さんを除いた集合(差集合)を itR \ と略記した。また,左辺を tに関して展開した際の 2 次以上の項を除くことにより右辺を導いた。生存時間解析でよく現れる

この種の計算を考える際,積積分(product integration)という「忘れられた演算」を導入すると便

Page 20: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

17

利であることが知られている(Gill and Johansen 1990)。しかし,もっと直観的に,時間間隔 t が

十分に小さいとき上式の総積部分はほぼ 1 に等しいはずだ,と考えてもよいだろう。

また,同様に考えると tR に属する( i さんも含む)誰かひとりでイベントが生じる確率は

tRjj

tRj jtRkkj tttttt    

\

1

したがって, tR に属する誰かひとりでイベントが生じたという条件の下で,特に i さんでイベ

ントが生じる条件付確率を tRiP で表わすことにすると

tRjj

i

tRjj

i

t

t

tt

tttRiP

このような条件付確率を,イベントが発生するたびに掛け合わせることで部分尤度が構成される。

イベントが発生した順序を添字の k で表わすことにして,たとえば k 番目のイベントが発生した

時点を kt ,またこの時点でのリスク集合を ktR ,さらにこの時点でイベントを発生した人を ki さ

ん(もちろん kk tRi ),などと表わすことにすると,部分尤度は

k

tRjj

i

kkk

k

k

t

ttRiPPL

 

と表わされる。比例ハザードモデルの下では,さらに

k

tRjj

i

ktRj

j

i

k

k

k

k

x

x

xt

xtPL

exp

exp

exp

exp

0

0

 

 

と変形でき,ベースライン・ハザード t0 が分母・分子で打ち消しあう。 の推定は,部分尤度

の対数を で微分して得られる推定方程式

0exp

exp

log

ktRj

j

tRjjj

i

k

k

k x

xx

xPL

に基づいて行うので,ベースライン・ハザード t0 が の推定に寄与することはない。

1.4.4.2 ネステッド・ケース・コントロール研究におけるサンプリング 以上の計算をふりかえってみると,ある時点 t で at risk であったコホート・メンバーたちの集合,

すなわちリスク集合 tR を考え,このうち i さんで実際にイベントが生じたときの条件付確率(リ

スク集合 tR のいずれか 1 人でイベントが生じたという条件の下で実際に i さんでイベントが生

じる確率)

tRjj

i

t

ttRiP

を考える,という部分が本質的であった。ネステッド・ケース・コントロール研究では,リスク

Page 21: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

18

集合 tR に含まれる全員の情報を調べるのではなく,このうちの一部をサンプリングすることに

よって得られる部分リスク集合 tr の情報を調べる。このようなサンプリングを,リスク集合の

サンプリングという意味で risk set sampling と呼ぶ。サンプリングによって得られる部分リスク集

合 tr には,時点 t で実際にイベントを生じた i さんに加え,情報源となるリスク集合 tR からサ

ンプリングされたコントロールたちも含まれる。

次に,あるサンプリング方式にしたがったときに,部分リスク集合 tr が得られるサンプリン

グ確率を考えよう。たとえば i さんを除く非ケース 1tN 人の中から,非復元抽出により 3 人の

コントロールをランダムにサンプリングする,というサンプリング方式を考えてみよう。この場

合,i さんを含む 4 人の部分リスク集合 tr が得られることになるが,このような部分リスク集合

が得られる確率を itr と表わすことにすると

31

1

Citr

tN

となる。この確率は,実質的にはコントロール 3 人がサンプリングされる確率だが,イベントを

生じた i さんを所与として,残り 3 人のサンプリングを通じて結果的に部分リスク集合 tr をサン

プリングしている,と考えている。

このようなサンプリング確率を導入すると,時点 t におけるリスク集合 tR に属するコホー

ト・メンバーのうち,短い時間間隔 ttt , の間に,特に i さんでイベントが生じ,かつ i さん

を含む部分リスク集合 tr が得られる確率を

itrtti  

と表わすことができる。以上の例では i さんを含む 4 人の部分リスク集合 tr は全部で 31CtN 通

りあり,そのそれぞれが確率 31

1

CtN

で実現しうる。そこで,サンプリングによって実現する可

能性がある部分リスク集合 tr をすべて列挙して,これらをあらためて集合としてまとめたもの

(部分リスク集合の集合)を t と表わすことにしよう。この t の要素は,すべて i さんを含

み,残り 3 人を 1tN 人から選ぶ場合の数だけ,つまり 31CtN 通りだけある。したがって,上

でみた「短い時間間隔 ttt , の間に,特に i さんでイベントが生じ,かつ i さんを含む部分リ

スク集合 tr が得られる確率」を,すべての(実現する可能性がある)部分リスク集合 tr にわ

たって足しあわせると

ttC

ttCitrtt itN

itNttr

i

   

3131

1

となり,結局,コホート研究の場合の同様な確率(短い時間間隔 ttt , の間に,特に i さんで

イベントが生じる確率)が得られる。つまり,コホート内ケース・コントロール研究では,コホ

ート研究で観察されるであろう情報の一部分が,サンプリングによって部分的に観察されている

のだと考えることができる。言い換えると,確率 tti   の,やや薄くなったコピーが

itrtti   である,と考えると理解しやすいかもしれない。

同様に考えると,サンプリングによって部分リスク集合 tr が得られ,かつそこに属する( i さ

Page 22: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

19

んも含む)誰かひとりでイベントが生じる確率は

jtrtttrj

j

 

となる。こうして,サンプリングされた部分リスク集合 tr に属する誰かひとりでイベントが生

じたという条件の下で,特に i さんでイベントが生じる条件付確率として

trjj

i

trjj

i

t

t

jtrtt

itrtttriP

という関係が得られ,これを時点ごとに掛け合わせたものが部分尤度となる。すなわち,以上の

ようなサンプリング方式では,誰にイベントが生じてもサンプリング確率は変わらないので,分

母・分子のサンプリング確率が打ち消しあう。こうして,結果的に,単にリスク集合を tR から trに変えただけ,という上式のような条件付確率が得られるのである。 これ以降の議論は,コホート研究の場合とまったく同様であり,イベントが発生するたびに上

式の条件付確率を計算して掛け合わせていくと部分尤度が得られる。比例ハザードモデルの下で

は,ベースライン・ハザード t0 が部分尤度の分母・分子で打ち消しあうので,サンプリング確

率もそうだったが,ベースライン・ハザードも の推定に寄与することはない。

また,以上のように定式化すると,コホート研究は,リスク集合 tR に含まれる全員を確率 1

で常にサンプリングする,という特別なコホート内ケース・コントロール研究であると言うこと

もできる。 これ以外のサンプリングの考えかたに付いては,「2.5.4.1 節 さまざまなサンプリング方式」に

記載したので参照いただきたい。

1.4.4.3 条件付ロジスティック回帰との関係 以上,もっぱら比例ハザードモデルを中心に議論を進めてきた。しかし,マッチングを行うケー

ス・コントロール研究の標準的な解析方法としては条件付ロジスティック回帰も重要である。実

は,比例ハザードモデルで想定しているような連続的な時間を,いくつかの時間間隔に分けて「離

散化」した場合のモデルとして,条件付ロジスティック回帰を考えることができ,両者の間には

密接な関係がある。言い換えると,「離散化」の程度がさほど粗くなければ,両者は,近似的には

同じモデルだと考えられるのである。以下では,こうした観点から両者の関連付けを行ってみよ

う。 とりあえず閉鎖コホートを想定して,i さんの曝露状況はイベントの発生まで時間によらず一定

だと仮定しよう。また,i さんのハザードを ti  とする。このとき,i さんがある時間 t までにイ

ベントを生じない確率,つまり i さんが時間 t までイベント・フリーである確率は

t

ii dsstS0

exp

と表せる。したがって,ある時間間隔 ut, の間に i さんでイベントが生じる確率は

u

t ii

iii dss

tS

uStSut exp1,

同様な計算を, i さんが曝露を受けなかった場合のハザード t0  を用いて行うと

Page 23: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

20

u

tdssut 00 exp1,

となる。さて,ロジスティックモデルとは,これらの確率のオッズの間に

i

i

i xut

ut

ut

ut

exp,1

,

,1

,

0

0

という関係を想定した比例オッズモデルと同値である。実際

ut

utut

,1

,log,

0

0

とおくと,この比例オッズモデルは

i

i

i xutut

ut

,,1

,log

と書ける。これが,条件付ロジスティック回帰のモデル式であり, ut, の部分が関心のない(時

間間隔の)関数である。後にみるように,ちょうど比例ハザードモデルにおいてベースライン・

ハザードがそうであったように,条件付ロジスティック回帰では,この ut, の部分,あるいは

ベースライン・オッズに相当する量 ut,exp が尤度の分母・分子で打ち消しあう。

さて,比例オッズモデルの i や 0 のところを,先に導いたハザード ti  や t0  との関係式を

用いて書き直すと

iu

t

u

t

u

t i

u

t i

xdss

dss

dss

dss

exp

exp

exp1

exp

exp1

0

0

これを変形すれば

iu

t

u

t i

u

t

u

t i

xdss

dss

dss

dss

exp

exp

exp

exp1

exp1

00

ここで両辺のu を上から t に近づけると(左辺には L’Hopital の定理を使って分母・分子をu で

微分してから極限を取ると)

i

i xt

t

exp0

となり,比例ハザードモデル

ii xtt exp0

が得られる。結局,時間間隔 ut, を十分に細かくとれば,条件付ロジスティック回帰のモデルは

比例ハザードモデルと一致することになる。

Page 24: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

21

ところで,条件付ロジスティック回帰のモデル式を変形すると

i

ii xut

xutut

,exp1

,exp,

となる。したがって,時間間隔 ut, の間に at risk であったリスク集合 utR , から,あるサンプリ

ング確率 iutr , でサンプリングされた部分リスク集合 utr , に属する i さんでイベントが生

じる確率,より正確には i さんではイベントが生じ,それ以外のメンバーではイベントが生じない

確率は

,exp1

,exp,

,exp1

,exp1

,exp1

,exp,

,1, ,

,

\,

\,

utrjj

i

iutrj j

j

i

i

iutrjji

xuta

xutaiutr

xuta

xuta

xuta

xutaiutr

ututiutr

また,部分リスク集合 utr , に属する誰かひとりでイベントが生じる確率は,上の確率を部分リ

スク集合に含まれる全員について足し合わせたものになるので

utrjutrk

k

j

xuta

xutajutr

,,

,exp1

,exp,

ここで,サンプリング確率 jutr , は,時間間隔 ut, によって変化するかもしれないが,ある

時間間隔の中でコントロールが選択される確率は,イベントを生じた j さんが誰であっても等し

い,すなわち jutr , は ut, には依存するが j には依存しないとする。この場合,いったん時

間間隔 ut, を固定すると,その中では jutr , は定数となるので,部分リスク集合 utr , に属

する誰かひとりでイベントが生じたという条件のもとで,実際に i さんでイベントが生じる確率は

utrjj

i

utrjj

i

x

x

xuta

xutautriP

,,

exp

exp

,exp

,exp,

となる。こうして,条件付ロジスティック回帰モデルのもとでも,条件付確率の分母・分子でサ

ンプリング確率の項が打ち消しあい,またベースライン・オッズに相当する量 ut,exp も打

ち消しあう。したがって,上の条件付確率を,すべての時間間隔にわたって掛け合わせることで,

比例ハザードモデルを想定した場合と同様な推定方程式が導かれる。 なお,以上では,ベースライン・オッズに相当する量

ut

utut

,1

,,exp

0

0

が時間間隔 ut, ごとに変化することを想定した。その一方で,曝露によるイベント発生割合のオ

Page 25: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

22

ッズの増加,すなわちオッズ比 exp は一定であると仮定した。もっと一般的な状況を考えると,

たとえば性別や年齢層,といった離散的な共変量で定義される部分集団ごとに,ベースライン・

オッズ,すなわち非曝露時のイベント発生確率のオッズが異なることを想定し,その一方で曝露

によるオッズの増加は一定だという仮定を置いて条件付ロジスティック回帰をあてはめることが

できる。このような共変量の組み合わせによって定義される共変量を,あらためて z で表わせば,

たとえば i さんの共変量の値 iz によって,ベースライン・オッズ

i

ii z

zz

0

0

1exp

は異なるが,オッズ比 exp は一定というモデル,すなわち

i

i

i

ii

ii xz

z

z

z

exp11 0

0

もしくは

ii

ii

ii xzz

z

1

log

というモデルを考えることになる。

これ以降の議論も,時間間隔 ut, によって定義される時間間隔ごとのリスク集合に関する内容

を,共変量 z に関する内容に置き換えるだけで,ほぼ同様である。たとえば,イベントを生じた iさんが属する部分リスク集合 izR の中から,サンプリング確率 izr i にしたがって部分リス

ク集合 izr を構成し

ii zrjj

i

zrjji

iii x

x

xza

xzazriP

exp

exp

exp

exp

という条件付確率を考える。このような条件付確率をイベントが発生した人が属する部分リスク

集合ごとに計算して掛け合わせていくと条件付きロジスティック回帰に関する尤度が得られ,オ

ッズ比 exp に関する推定を行うことができる。

1.4.4.4 その他の注意点

以上では i さんの曝露状況 ix が,観察開始時からイベント発生,もしくは観察終了時まで一定で

あると仮定した。しかし薬剤によっては,曝露状況が時間とともに変化することもある。このよ

うな場合,あくまでも観察開始時の曝露状況を i さんの曝露状況とみなす,といった ITT 的な扱

いも可能である。また,以上の議論が ix を時間の関数,すなわち時間依存性共変量 txi とみなし

ても本質的に変わらないことから,i さんがケースもしくはコントロールとなった,その時点の曝

露状況を用いて解析することも可能である。ただし,この場合,こうした曝露状況の変化が,そ

れまでの曝露状況の履歴やその他の共変量の履歴などとは無関係であり,しかも非曝露時のハザ

ードは観察開始時からの経過時間のみの関数 t0 で,曝露時のハザードはその exp 倍,とい

ったかなり強い仮定を置くことにはなる。 しかし,曝露状況の変化が,たとえばそれまでの有効性や安全性の履歴に依存している場合,

以上の仮定はおそらく不適切である。しかも,ケース・コントロール研究の場合,曝露状況や有

効性,安全性等の経時的な変化を,そもそも積極的に調べてはいない。したがって,このような

Page 26: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

23

状況下では,コホート研究によって十分な情報を収集するほかないと考えられるが,それでも複

雑な解析が必要となることが知られている。 また,以上では打ち切りについても,まったく考慮しなかった。打ち切りの発生が,イベント

の発生と「独立」であれば(どのような意味で「独立」かは何通りかの定義が考えられるが),全

尤度を打ち切り発生に関する尤度と,イベント発生に関する尤度の積に分解することができ,か

つ打ち切り発生に関する尤度が関心のあるパラメータ と無関係になる。このため,イベント発

生に関する尤度(すなわち部分尤度)だけを用いて の推定を行えばいいのだった。しかし,打

ち切りが曝露状況や共変量の履歴の影響を様々に受けながら発生している場合,もはや打ち切り

の発生がイベントの発生と無関係とはいえない。このような場合も,関係する要因(とその履歴)

どうしの影響を考慮したさらに複雑な解析が必要となることが知られている。こうした問題は,

ランダム化比較試験の場合にも当然起こりうるが,コホート試験で,例えばマッチングや傾向ス

コアを用いた解析によって,ベースライン時の曝露状況に関して交絡調整を行ったとしても生じ

うる問題である。

Page 27: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

24

1.5 ケース・コホート研究

1.5.1 研究デザイン ネステッド・ケース・コントロール研究は,コホート研究と同様に複数の疾病について調べる

ことが可能である。ただし,それぞれのケースの発生において,別々にコントロールを選択する

必要がある。この問題を解決したデザインとして,ケース・コホート研究(case-cohort study)が

提案されている。 ケース・コホート研究は,以下の手順で行われる。 (1) 曝露・非曝露の状況が調査可能なコホートを設定する (2) コホートからサブコホートを選択し,サブコホートメンバーの曝露情報を含めた共変量情

報を調査する (3) コホートを追跡し,ケースの発生を観察する (4) ケースの曝露情報を含めた共変量情報を調査する

図 1.5.1 ケース・コホート研究

図 1.5.1 は,観察開始時の全コホートメンバーから,サブコホートとして予めランダムにコント

ロールを選択しておき,コホートを追跡するケース・コホート研究の概念図である。 ケース・コホート研究では, 初に選択されたコントロールを用いて,複数の疾病に対する曝

露効果の評価を行うことができる。ケースは全てのケースを用いても良いし,全ケースからのラ

ンダムサンプルを用いても良い。このとき,あるコホートメンバーがコントロールとして選択さ

れる確率は同じである。

1.5.2 曝露効果の指標とその推定

今,研究開始時のコホートから,ランダムに fe 人のサブコホートを設定し,ケース・コホ

ート研究を行った結果,曝露・非曝露の人数はそれぞれ,ケースでは a 人,b 人となり,非ケー

スでは c 人, d 人となったとしよう。このとき,コントロールは,ケースが発生する前にサブコ

ホートとして選択されるので,当然のことながら後にケースになるメンバーも含まれる。そこで,

曝露のあったケース a 人のうち,サブコホートに入っていないケースは 1a 人,サブコホートのケ

ースは 0a 人であったとする。同様に,非曝露であったb 人についても,それぞれ 1b , 0b 人であっ

Page 28: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

25

たとする。このケース・コホート研究の結果は,表 1.5.1 のように纏められる。

表 1.5.1 ケース・コホート研究の結果 曝露 非曝露

疾病発生数(ケース) a b サブコホートに入ってい

ないケース 1a 1b

サブコホートのケース 0a 0b

非疾病発生数(非ケース) c d サブコホート e f

コントロールとしてサブコホートが用いられるので,1.3.3 節で示したサンプリングの考え方よ

り,ケース・コホート研究における曝露効果は,オッズ比OR で表され,

be

afOR

と求められる。このとき、サブコホートのサンプリングが曝露と無関係に行われていれば、オッ

ズ比はリスク比の推定値となり、ネステッド・コントロール研究と同様に,「稀な疾病の仮定」は

必要ないことに注意しておく。対数オッズ比 ORlog の近似的な分散,

feba

ba

baORV

1121

11log 00

によりオッズ比の信頼区間を構成することが可能である。全コホートを観察したとき

bbaa 00 , となり, ORV log は 1.2.2 節で示したコホート研究における対数リスク比の分散

に等しくなる。一方,サブコホートにケースが含まれていなければ 000 ba となり, ORV logは 1.3.2 節で示したケース・コントロール研究の対数オッズ比の分散に等しくなる[3,7]。

Page 29: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

26

1.6 ケース・クロスオーバー研究 ケース・クロスオーバー研究は,対象とするイベントが発現したケースだけの情報を使ったコホ

ート研究であり,臨床試験で行われるクロスオーバー試験と同様な仮定の上に成り立つ試験デザ

インである(Maclure 1991)。即ち曝露がイベントの発生に及ぼす影響が,投薬後の一定の期間に

限定され,かつ,その一定期間を除く期間においてはイベントの発生状況が変わらないと仮定で

きる状況で適応される。 例えば,重症喘息患者が 1 日 2 回のテオフィリン投与を受け,投与後 2 時間以内に心筋梗塞のイ

ベントを起こすかどうかをケース・クロスオーバー研究により調べたとする。この場合,テオフ

ィリン投与が心筋梗塞のイベント発現に及ぼす影響は投与後 2 時間以内に限られ,投与前はもち

ろん,投与後も 2 時間を過ぎれば影響はなく,かつ心筋梗塞の発生状況は,投与前に相当する期

間でも,また投与後 2 時間を過ぎた期間でも特に変化はない(持ち越しに相当する作用はない)

と仮定できたとする。 さて,ある人が 1 日 2 回のテオフィリン投薬を受けた日に心筋梗塞の発生が認められたとして,

この人のテオフィリン投薬の前後 24 時間を観察したとする。この場合,24 時間の観察期間のう

ち,1 日 2 回あるテオフィリンの投薬後 2 時間以内の時間帯,すなわち計 4 時間がテオフィリン

への曝露期間となり,残りの 20 時間が非曝露期間となる。心筋梗塞の発生は,これら 2 つの時間

帯のいずれで生じたかによって曝露時,もしくは非曝露時のイベントとしてカウントされること

になるので,各患者に対して表 1.6.1 の左右いずれかのデータが得られることになる。 表 1.6.1 ケース・クロスオーバー研究の結果 投与後 2 時間以内

の発現例 それ以外の時間帯

での発現例 曝露時 非曝露時 曝露時 非曝露時

心筋梗塞 1 0 0 1

Pearson-hours 4 20 4 20

発生率 ∞ 0

このデータは,同一患者から得られたデータであるから,患者の持っている遺伝的特徴や生活習

慣等の特徴は,曝露あるいは非曝露の場合で完全に一致している。したがって,上記の仮定が成

り立つとき,この結果は,テオフィリンへの曝露(ただし 2 時間以内)と心筋梗塞発現との関係

を直接的に示したものとみなすことができる。そこで,この 1 例ごとのデータを独立した観察と

して,それらを併合することにより,テオフィリンへの曝露と心筋梗塞との関係を推定すること

が出来る。こうして 100 例のケース・クロスオーバー研究を,サンプルサイズが 1 例の 100 個の

レトロスペクティブ・コホート研究をプールした研究とみなして解析することができる。

Page 30: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

27

ここで独立の観察事象を併合した Mantel-Haenszel 発生率比(IRMH)は,以下の式で表される(2.3.1.2節参照)。

曝露時 非曝露時 Total

心筋梗塞 A1i A0i M1i

Person-hours T1i T0i T+i

iii

iiiMH TTA

TTAIR

/

/

10

01

投与後 2 時間以内を曝露時,それ以外の時間帯を非曝露時とした上記のテオフリンの例では,A1i

と A0i は 0 か 1 なので,2 時間以内に発現したケース数の合計を AA i1 ,それ以外の時間帯に

発現したケース数の合計を BA i0 とした場合,IRMHは

B

A

B

AIRMH 4

20

24/4

24/20

となる。因みに,IRMHの対数分散は以下の式で求められるので

i

ii

i

ii

iiiiMH

T

TA

T

TA

TTTMIRVar

1001

2011 /

)][ln(

対数分散は

AB

BA

AB

BA

BA

BAIRVar MH

2

22

24/)204(

24/)204)((

24

4

24

20)24/204)((

)][ln(

で表される。 したがって IRMHの 95%信頼区間は

ABBAB

AIRMH )(96.1

4

20lnexp : of CI %95

となる。 テオフィリンの例では 1 日 2 回の投薬としたが,実際には頓服薬のように投薬が不定期な場合も

ある。このような場合にも,適切な方法で曝露・非曝露の期間や時間帯を設定することができれ

ば,同様な方法でリスク比を推定することが出来る。以下の表はケース・クロスオーバー研究デ

ザインを提案した Malcolm Maclure がその論文に載せた解析例で,セックスと心筋梗塞の発現の

関係を検討したものである。表 1.6.2 は,心筋梗塞を発症した 10 例の患者に対して, 後にセッ

クスをしてから心筋梗塞発現までの時間と,心筋梗塞発症前 1 年間のセックスの頻度について調

査した結果を示したものである。ここでセックスと心筋梗塞が関連するとしても 1 時間以内でそ

の後は関連がないと仮定して,サンプルサイズ 1 例のコホート研究を 10 回おこなったと考える。

具体的には,1 年を 345.25 日×24 時間として曝露,非曝露の人時間を求め,上記の式に結果を代

入して IRMHの推定値と信頼区間を求める。

Page 31: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

28

表 1.6.2 10 例の心筋梗塞を発症した患者のデータ(Maclure 1991 より一部改変)

患者 心筋梗塞発現

までの時間 セックスの頻度 A1i A0i T1i T0i 1 5min. 1/year 1 0 1 8,765 2 90min. 2/week 0 1 104 8,662 3 2days 2/month 0 1 24 8,742 4 3days 1/week 0 1 52 8,714 5 7days 2/week 0 1 104 8,662 6 11days 3/month 0 1 36 8,730 7 14days 2/month 0 1 24 8,742 8 21days 2/month 0 1 24 8,742 9 35days 2/month 0 1 24 8,742

10 20years 0/year 0 1 0 8,766

IRMH=22.4 95%信頼区間 3.2~157.9 ケース・クロスオーバー研究の場合,曝露がイベントの発生に及ぼす影響が投与後の一定の期間

に限定されると考えたが,曝露効果が投与後いつまでも続くと仮定できる場合も曝露の前後を比

較することで同様な検討を行うことが出来る。これらのデザインは,ワクチンの領域で適応され

ておりセルフコントロール・ケースシリーズデザイン(Self-controlled case-series design)と呼ばれる。 【参考文献】 Armitage P. and Colton T. Encyclopedia of Biostatistics. New York: John Wiley & Sons, 1992. Rothman KJ, Greenland S., Lash TL. Modern Epidemiology. Third edition. Lippincott Williams &

Wilkins, 2008. Sato T. Risk Ratio Estimation in Case-Cohort Studies. Environmental Health Perspectives 1994: 53-56. 折笠秀樹. 臨床研究デザイン. 真興交易, 1995. 厚生労働省医薬食品局審査管理課長通知. 医療用医薬品の製造販売後調査等の実施方法に関

するガイドライン. 2005.10.27 [http://www.it-asso.com/gxp/regulations/yakusyokushinnsahatsu-1027001.htm (accessed 2010.5.14)].

佐藤俊哉. 疫学研究における生物統計手法. 日本統計学会誌 1993; 22: 493-513.

佐藤俊哉. 日本計量生物学会チュートリアルセミナー資料 2007.

丹後俊郎他. ロジスティック回帰分析 -SAS を利用した統計解析の実際-. 朝倉書店, 1996. 日本製薬工業協会. ファーマコビジランス解説書. 医薬出版センター, 2007. 宮原英夫, 丹後俊郎. 医学統計学ハンドブック. 朝倉書店, 1995. Rothman KJ. Epidemiology: An Introduction. Oxford University Press, 2002. [矢野栄二, 橋本英樹監

訳. ロスマンの疫学. 篠原出版新社, 2004.] Greenland S, Thomas D. On the need for the rare disease assumption in case-control studies. Am. J.

Epidemiol. 1982; 116(3): 543-553. Gill RD and Johansen SA. Survey of product integration with a view toward application in survival

analsysis. Annals of Statistics 1990; 18: 1501-1555. Malcolm Maclure. The case-crossover design: a method for studying transient effects on the risk of

acute events. Am. J. Epidemiol. 1991; 133(2): 144-153.

Page 32: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

29

2. 統計モデルと解析

2.1 反応の指標

2.1.1 リスク(発生割合) 1000 人からなる集団を観察したところ 10 人に標的有害事象(標的有害事象)が観察されたとき,

10/1000=0.01 という計算によってリスク(発生割合)を求める。ごく自然な計算に思えるが,こ

のようにして計算された発生割合が,有害事象の発生という反応の妥当な指標になるためには,

1000 人の観察期間が等しいことが必要である。また,設定された観察期間の医学的な妥当性も重

要である。例えば,ある期間を過ぎるとその有害事象が発生する可能性は極めて低くなるといっ

た具合に,投与後のある一定の期間に発現が集中するような有害事象の要約には適したリスク指

標であると言えよう。一方,長期投与が想定される薬剤に関して,ある一定の期間を過ぎてもな

お持続的に発生の可能性があるといった有害事象について調べる場合は,観察期間が長いほど発

現件数も増加する。このような場合,どの程度の観察期間のデータから計算された割合か,とい

った情報がないと,そもそも結果の解釈ができない。したがって,持続的に発生する,もしくは

at risk な状態が持続する事象に対して発生割合をリスク指標として用いる妥当性は低いであろう。 発生割合の信頼区間,発生割合の比,差の信頼区間の算出は良く知られており,発生割合の比較

には Fisher の直接確率検定も利用できる。SAS では Proc FREQ でいずれも算出できる。

2.1.2 発生率(Incidence rate) 通常の観察研究では,全ての患者の観察期間が等しいという仮定は成り立たないので,標的有害

事象が発生する可能性がある(at risk な)期間の合計を分母に,また発生件数を分子とした比,

すなわち発生率を算出する。この場合,分母は,標的有害事象が発生しなかった症例では観察期

間を,標的有害事象が発生した症例の場合は発生するまでの期間を合計する。標的事象の発生数

を A,観察人時間を T とすると発生率(I)は

T

AI

となる。この発生率は,人時間あたりの発生数となり,発生速度と解釈できる。速度であるから

には単位があり,時間の単位を年にとれば発生率の単位は 1/年(あるいは人/人年)となり,また

1/月や,100 人年あたり(人/100 人年,%/年)といった単位を用いることもある。通常の臨床試験

で使用されている「発生率」は上述した「発生割合」であり,用語の誤用と言うべきであろう。 発生率は,ハザードが時間によらず一定という仮定が成り立つときにハザードの推定値となる。

つまり,12 人を 1 ヶ月観察する観察と,1 人を 1 年(12 ヶ月)観察する場合で,ある有害事象の

発生数が同じとみなせる場合である。この仮定が成り立つ場合,発生数はポアソン分布(Poisson distribution)に従う。まず,人時間 T を所与として,T あたりの期待発生数がλ(したがって単位

人時間あたりの期待発生数,すなわち期待発生率はT

)の時,人時間 T だけ観察した際の発生数

A の出現確率は次のポアソン分布で表せる。

!)( :ondistributiPoisson

A

eAprob

A

また期待値と,分散は

)(

)(

AVar

AE

である。したがって,観察された発生率(T

AI )の期待値と,分散は

Page 33: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

30

2/)(

/)(

TIVar

TIE

となる。観察された発生数 A はボアソン分布のパラメータλの推定値とみなせるので,発生率の

95%信頼区間は

296.1 : of CI %95

T

A

T

AI

で表される。 2 群の場合

Exposed Unexposed Total

Cases A1 A0 M1

Person-time T1 T0 T 発生率比(IR)を

00

11

/

/

TA

TAIR

で表すときに,発生率比(IR)の対数分散は

01

11)][ln(

AAIRVar

で求められるので,発生率比(IR)の 95%信頼区間は

0100

11 1196.1

/

/lnexp : of CI %95

AATA

TAIR

となる。

2.1.3 ハザードと発生率 前節では発生率が妥当な指標となるためには,時間によらずイベントの発生速度が一定であると

いう仮定が必要であるとした。ここでは,発生率の性質をさらに検討して,ハザードが時間によ

らす一定の場合に,発生率はハザードの推定値と考えられるということを示す。

まず,時間 T=t でイベントを発生していないコホートメンバーの人数を tN で表わそう。簡単の

ため閉鎖コホートを考え,打ち切りなども考慮しないことにすると,生存時間関数に相当する,

時間 t でイベントを発生していない人の割合を 0N

tNtS と表わすことができる。ハザードの天

下り的な定義は成書にゆずることにして,ここでは「瞬間的な発生率」という観点からハザード

を導いてみよう。たとえば,ある短い時間間隔 ttt , における発生率を考えると,まず分母

である人時間は, tN 人が全員 t という時間だけ at risk であると考えて ttN と概算できる。

また,分子に相当するイベント発生数は,この時間間隔での tN の変化,この場合は人数の減少

分に相当するので ttNtN となる。すると,この短い時間間隔での発生率を

t

tNttN

tNttN

ttNtN

1

と見積もることができる。ここで時間間隔 t を 0 に近づけて,分母・分子を定数 0N で割って

やると,自然に

Page 34: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

31

tSdt

tdStN

dt

tdNt

と,よく見かけるハザードの定義式を導くことができる。以上の計算の過程をふりかえると,人-時間を分母とした通常の意味での発生率を,時間間隔を細かく区切って計算した極限がハザード

に他ならない。

ところで,いったんハザードを定義すると,たとえば短い時間間隔 ttt , におけるイベント

発生確率を

tttN

ttNtN

≒ ,

また,イベント発生数を

tttNttNtN ≒

などと見積もることができる。この期待発生数を,期間を通じて積分したものが全観察期間での

合計イベント数となるので,たとえば時間T までの期待イベント数を

dtttNAT

0

と求めることができる。また,時間T までの総人-時間は ttN を全観察期間にわたって積分し

たものだから

dttNPTT

0

したがって,ハザードを用いて発生率を表現すると

dttN

dtttN

PT

AI T

T

0

0

となる。この式から,各時点 t におけるコホートサイズ tN を重みとした,ハザードの重み付き

時間平均(時間を通じての平均)が発生率に他ならない,と解釈できる。もちろん,ハザードも

コホートサイズも時間の関数である以上,どの時点T までの時間平均を取るかによって発生率の

値は異なる可能性がある。しかし,時間にともなうハザードの変化がさほど大きなものでなけれ

ば,発生率をハザードの近似値として解釈することができよう。実際,上の式でハザードが時間

によらず一定であると仮定すると( t と仮定すると)

dttN

dttN

PT

AI T

T

0

0

となり,ハザードと発生率は同じものであることがわかる。

2.1.4 比例ハザードモデル 特定の共変量(曝露の有無,や背景等のベースライン値)がハザードに及ぼす影響を調べたいこ

とがある。例えば,ある要因を持つ集団では,そうでない集団と比較して,イベント発生の速度

が増加,もしくは減少するのではないか,といったことを検討したい場合である。

まず,p 個の共変量の組み合わせを列ベクトル pi zzzz ,,,,1 で表わし(右肩の´は転置を

Page 35: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

32

意味する),共変量の値が z となる人のハザードを zt, で表わそう。このとき,共変量がある特

定の値を取る場合,例えば共変量ベクトルが z=0 となる場合を基準として,共変量がもっと別の

値を取る場合にハザードが何倍増加するか,をモデル化することが多い。代表的なものとして,

共変量ベクトルが z=0 となる場合のハザード(基準ハザード)を t0 として

ztzt exp, 0

というモデルを考え,これを Cox の比例ハザードモデルと呼ぶ。ただし, は

pi ,,,,1 という行ベクトルであり,要素 i は共変量の要素 iz が 1 単位変化したとき

に,基準ハザードが iexp 倍に変化することを表現している回帰係数である。言い換えると,

このモデルでは,観察された共変量でハザードがモデル化できること,またある背景 az を持つ

患者集団と別の背景 bz を持つ患者集団とのハザード比が時間 t を通じて一定であること,すな

わち

定数

)(exp)exp()(

)exp()(

),(

),(

0

0 babt

at

bt

at

であることを,ともに仮定している。 さらに,層(h)ごとに基準ハザードが異なるものの,共変量ベクトル z のハザードへの寄与 は層

間で一定であるようなモデル

)exp()(),( 0 ztzt hh

を仮定することもできる。例えば,性別や年齢層によって定義される層 h ごとに基準ハザード

th0 は異なるが,曝露 z によって基準ハザードが何倍に増加するかは時間によらず一定,とい

ったモデルである。同じ検討を 初のモデルで行おうとすると,性別や年齢層の影響を具体的に

モデル化する必要があり,例えば性と年齢の交互作用が疑われる場合は交互作用項をモデルに含

める必要がある。また,性や年齢の影響が,時間を通じて一定(基準ハザードに対して定数倍に

なる)といった強い仮定も必要である。一方,後者のモデルが仮定しているのは,性別と年齢層

の組み合わせによって何かしら基準ハザードに違いがあるかもしれない,といったことである。

したがって,例えば層ごとの基準ハザードが比例的でない場合(時間の経過とともにハザード関

数が交差する場合等)も包含しており,具体的に th0 が h のどのような関数になっているかを

定める必要がない。その意味で,後者の方がより柔軟なモデルであると言えよう。 【参考文献】 佐藤俊哉. 16 章 疫学 In: 医学統計ハンドブック. 朝倉書店, 1995. Rothman KJ. Epidemiology: An Introduction. Oxford University Press, 2002. [矢野栄二, 橋本英樹監

訳. ロスマンの疫学. 篠原出版新社, 2004.] Rothman KJ, Greenland S., Lash TL. Modern Epidemiology. Third edition. Lippincott Williams &

Wilkins, 2008. Fleiss JL, Levin B, Paik MC. Statistical methods for rate and proportions. third edition. John Wiley &

Sons, 2003.

Page 36: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

33

2.2 交絡と効果の修飾 交絡と効果の修飾(または交互作用)は,両方とも薬剤の暴露と結果に加えて第 3 の変数が介在

する現象で混乱しやすいがこの 2 つの現象を区別することは非常に重要である。研究を行うもの

が現象をどうとらえるかで異なった結果が導かれ,またそれを制御するには異なった戦略が取ら

れるからである。

2.2.1 交絡 ランダム化臨床試験では,患者が持つ特性(疾患の重症度,併用薬,年齢・性別などの背景情報)

とは無関係に,薬剤が患者に無作為に割り付けられる。そのため平均的には(ランダム化臨床試

験を何度も繰り返した平均として),ランダム化臨床試験の結果は偏りがない結果を導くことがで

きる。一方観察研究においては,薬剤の投薬は,重症例には積極的に強い薬が投薬されるなどの

患者が持つ特性に応じて投薬が行われる。そのため,治療薬投薬群は効果が低いというような一

見矛盾した結果が得られることが往々にしてある。この例は,処方理由による交絡(confounding by the reason for prescription)あるいは適応バイアス,チャンネリング,重篤度による交絡などと呼ば

れるもので,薬剤疫学研究においてもっとも重要な交絡の一つである。 観察研究は,交絡との戦いと言っても過言ではなく,交絡要因の影響を結果から取り除くために

さまざまな研究デザイン上の工夫や解析上の工夫を行う必要がある。そのため一般的に観察研究

の研究デザインと解析方法はランダム化臨床試験よりも複雑なものとなる。観察研究におけるデ

ザインや解析は 2.3 節以降に詳しく記述したが,ここでは交絡の定義から交絡の調整法の基本的

原理を解説する。

2.2.1.1 交絡の必要条件 以下の表は,脳卒中の再発に対する抗血小板薬の予防効果を調べるために行われたコホート研究

の仮想例である。全体の結果をみるとリスク比は 1.0 であり,抗血小板薬の投与により脳卒中再

発のリスクは変わらないことが示されている.一方,この結果を喫煙の有無別にみると,いずれ

の場合においてもリスク比は 0.67 であり,抗血小板薬の投与は脳卒中の再発を予防することが示

されている。

表 2.2.1 抗血小板薬投与による脳卒中の再発予防の結果

脳卒中の再発 全体 喫煙なし 喫煙あり

あり なし 合計 あり なし 合計 あり なし 合計

薬剤投与あり 50 50 100 10 30 40 40 20 60

薬剤投与なし 50 50 100 30 50 80 20 0 20

リスク比 1.0 0.67 0.67

このような一見矛盾した現象は,疫学者の間では交絡(confounding)として,また統計家の間で

もシンプソンのパラドックスとして知られていた。この現象を,純粋に統計的にとらえると,薬

剤投与の有無(X)と,脳卒中の再発の有無(Y)という 2 つの要因の関連性,あるいは相関が,

喫煙の有無という要因(Z)で条件付けた場合とそうでない場合とでは異なる,ということだが,

データによっては無論そのようなこともあるだろう。実際,無条件に YXZYX ,Pr,Pr が成

り立つわけではないことは,統計的には自明であろう。にもかかわらず,この現象が「パラドッ

クス」として感じられるのは,この薬剤が喫煙のある人にも,ない人にも効果があるのなら,当

然,それらをあわせた集団全体でも効果があるはずだ,と考えるからである。そしてこの判断の

うちには,純粋に統計的とは言いがたい,因果的な判断が既に含まれている。このため,どのよ

Page 37: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

34

うな場合には層別した結果が妥当か,といった論理を,因果的な推論を交えず,関連性や相関,

あるいは条件付独立といった統計的な概念のみを用いて構築することは不可能であることが知ら

れている。すぐ後で見るように,まったく同じ内容のデータであったとしても,ある場合は交絡

であるが,また別の場合には交絡とは考えられない,といったケースがあり,純粋にデータの構

造のみから交絡の有無を判別することはできないからである。この点については Judea Pearl が名

高い『統計的因果推論-モデル・推論・推測-』の中で「第 6 章 Simpson のパラドックス・交絡・

併合可能性」という章をあて,歴史的な経緯も含め縦横に論じているので,関心のある方はぜひ

一読してほしい。 厳密な形での交絡(もしくは交絡がないこと)の定義,あるいは必要十分条件を与えることは

難しいので,以下では,まず通常の疫学の教科書などで述べられている交絡要因の必要条件を与

えよう。すなわち 1. 交絡要因は,対象としている疾患のリスク要因でなければならない 2. 交絡要因は,曝露と関係していなければならない そして,さらに 3. 交絡要因は,曝露―疾患間の因果連鎖の中間変数であってはならない が付け加えられて,交絡要因の必要条件とされている。ここで,あえて必要条件と呼ぶ理由は,

交絡が生じている場合には,その原因となる要因(交絡要因)が以上の条件を満たすが,逆にあ

る要因が以上の条件をすべて満たしていたとしても,例えば要因相互の影響がたまたま打ち消し

あうなどして,交絡が生じていない場合もありうるからである。 この交絡要因の必要条件から喫煙の有無で層別した上記の表を見ると 1. 過去の試験等から,喫煙は脳卒中再発のリスク要因であることが知られている 2. ランダム化比較試験ではないので薬剤投与と喫煙とが無関係であるとは考えられず,一般的

に脳卒中発症後,予防薬を継続投与する人は健康意識が高く,喫煙をやめる傾向があると推

定される 3. 喫煙は曝露と再発の中間変数ではない(少なくとも,薬剤投与のせいで喫煙が促されるとい

った因果関係は考えにくい) と,交絡要因の必要条件を満たしているので,喫煙を交絡要因と考えることは妥当であり,全体

での抗血小板薬の投与による脳卒中の再発を示すリスク比 1.0 は喫煙による交絡を受けており信

用できない。従って後述するような,交絡要因により調整したリスク比の推定値を用いるのが妥

当である。 一方,上記の表の結果が喫煙ではなく,腰痛の有無での層別結果であった場合はどうであろうか。

腰痛の場合 1. 過去の試験等から腰痛が脳卒中の再発を促すとは考えにくい 2. ランダム化比較試験ではないので薬剤投与と腰痛とが無関係になることは期待できないが,

一般的に脳卒中発症後,予防薬を継続投与する人と腰痛の有無に関連があるとは考えにくい 3. 腰痛は曝露と再発の中間変数ではない と交絡要因の必要条件を満たさない。この場合,腰痛を交絡要因と考えるよりは,層別結果は単

なる偶然と考えるべきであろう。従って,全体での抗血小板薬の投与による脳卒中の再発を示す

リスク比 1.0 が妥当であると考えてよいであろう。 以上,2 つの例で,データの構造は同一であったが,一方(喫煙)は交絡要因であると考えられ,

Page 38: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

35

他方(腰痛)はそうでなかった。あえて,このような例をあげたのは交絡の有無の解釈を純粋に

データのみから導くことができないことを示したかったからである。交絡の有無は試験から得ら

れたデータのみから判断できるものではなく,それぞれの要因が何に影響を及ぼしうるか,また

どのような要因の影響を受ける可能性があるか,といった外部的・医学的な知識に基づき判断さ

れるべきものである。

2.2.1.2 因果グラフを用いた交絡の分析

2.2.1.2.1 因果グラフと確率分布の対応 前節で,やや直観的に導入した交絡に関する議論を,因果グラフの考え方を用いて少し深めてみ

よう。ただし,他の箇所では特に言及しない内容も含まれているので,初読の際には本節をとば

し,必要に応じて参照してもよい。また紙幅の都合で詳細な説明を割愛した話題も少なくない。

本節の内容の数理的な側面については,先に紹介した『統計的因果推論-モデル・推論・推測-』

を参照してほしい。また,様々な因果グラフの事例や,その疫学への応用については Modern Epidemioloty 3rd edition の Capter 12. Causal Diagrams に詳しい紹介がある。 さて,ある要因 X が別の要因 Y に影響を及ぼす,という因果関係を,グラフィカルに

X→Y

と,矢線を用いて表現することにしよう。ここで原因に相当する X を Y の「親」,逆に Y を X の

「子」と呼ぶ。また,互いに因果的な影響関係がなく,統計的に独立な要因は,矢線で結ばない。 比較的簡単な因果グラフの例として,以下を考えよう。

ここで,X を曝露の有無,Y をある有害事象の発生の有無,また Z を,この有害事象の発生に関

与するリスク要因の集合としよう。ただし議論を簡単にするため Z を構成するリスク要因はすべ

て離散的なカテゴリー変数とする。するとこれは,ランダム化比較試験を行った場合に得られる

であろう因果グラフと同値である。というのは,まず曝露の有無とリスク要因とが矢線で結ばれ

ていないので,互いに独立である。つまり,このグラフは,あるリスク要因を持つ人ほど曝露を

受けやすいといった影響関係がない状況を表現している。 さて,因果グラフの理論では,このようなグラフを以下のように確率分布と結びつける。まず,

上の X や Z のように,親を持たない要因(矢線の根元に位置し,他の要因から矢線が入らない要

因)は,他のすべての要因と独立に,自分自身の分布 )Pr(X や )Pr(Z にしたがうと考える。また,

他の要因から矢線が入る Y のような要因は ZXY ,Pr というように

その親に相当する要因子となる要因 Pr

という条件付確率にしたがうと考える。そして 後に,グラフ上の要因すべての同時分布を,以

上のように定義された確率の積によって表現する。例えば,上の因果グラフに対応する同時分布

ZXZXYZYX PrPr,Pr,,Pr

Page 39: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

36

と表わされる。このようにして,様々な要因の因果関係のネットワークに対するグラフィカルな

表現として因果グラフがあり,それに対応して,分布の詳細は特定しないまでも,同時分布が存

在する,と考えるのである。

2.2.1.2.2 介入と do(X=x)を用いた計算 因果グラフの理論では,介入という行動を,確率変数の値を強制的に固定することとして,も

っと言えば,介入の対象となる要因の親の影響を強制的に除去することとして捉える。先のラン

ダム化比較試験の例を考えると,X の値,つまり曝露の有無を強制的にある値 x に固定する操作,

あるいは行動を xXdo ,あるいは xXset で表わし,この介入により,同時分布

ZXZXYZYX PrPr,Pr,,Pr

がどのような変化を受けるかを,介入の効果(この場合は曝露を強制的な介入として行った場合

の効果)として捉えようということである。まず,因果グラフを用いて考えると,ある要因の値

を固定するということは,その要因の親の状況に関係なく,つまり介入の対象となる要因に入る

矢線をすべて切断した上で,介入の対象となる要因の値をある値に固定するということである。

同じことを確率分布を用いて考えると,介入の対象となる要因に入る矢線を除くということは

Pr その要因の親 介入の対象となる要因

という条件付確率の部分を除去することであり,計算上は,介入前の同時分布の式を,この形の

条件付確率で割ってやればよい。そこで,介入前の同時分布 XZZY ,,,,Pr 21 に対して,介入

xXdo を行った後の同時分布を

の親に相当する要因XxX

xXZZYxXdoZZY

Pr

,,,,Pr,,,Pr 21

21

と定める。ただし「X の親に相当する要因」がない場合,つまり X 自身が独立した親になってい

る場合は, xX Pr で割ることにする。

さっそくランダム化比較試験の例で,この計算を行ってみよう。先に示した同時分布に対し,

曝露の有無を固定するという介入 xXdo を行うと,介入後の Y と Z の同時分布は以下のよう

になる。

ZZxXY

xX

xXZZxXYxXdoZY Pr,Pr

Pr

PrPr,Pr,Pr

この例では,X の親に相当する要因はないので,たんに X 自身の確率で割ればよい。さて,わた

したちが知りたいのは,曝露という介入によって有害事象の発生 Y がどのような影響を受けるか

ということなので,関心がない変数 Z について和を取ってやると

xXYxXzZY

zZzZxX

zZxXYzZ

zZxX

zZxXY

zZzZxXYxXdozZYxXdoY

z

zz

zz

Pr,Pr

PrPrPr

,,PrPr

,Pr

,,Pr

Pr,Pr,PrPr

となる。何のことはない,X の値ごとに Y の分布 xXY Pr を調べれば,介入後の Y の分布

xXdoY Pr を知ることができる,という結果である。ある意味あたりまえのことではあるが,

ランダム化によって治療や曝露 X と,Z のようなリスク要因との関係を強制的に独立な状態にで

Page 40: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

37

きる場合は,たんに観察されたデータを X の値間で比較すれば,Y に対する介入の効果を知るこ

とができる。実際,式変形の過程をあらためて観察してみると,まず層別解析に相当する内容,

すなわち Z の値で定義される層ごとに X と Y の関係をみた zZxXY ,Pr という部分を,そ

の層別要因の分布 ZPr で重み付けて併合した

z

zZzZxXY Pr,Pr

という式が現れる。その後,X と Z が独立であるという条件,すなわち ZXZX PrPr,Pr と

いう関係により,この式が簡略化され xXY Pr と変形される。言い換えると,X と Z が独立で

あるからこそ,この式にたどり着くわけで,独立でない場合は,層別解析の式より先に進むこと

はできない。こうして,ランダム化により X と Z を独立な状態にしたことの重要性が,式の上か

らも確認できる。 関連して,因果グラフとともにこの xXdo を用いた算法を導入することで「交絡がないこ

と(非交絡)」を

xXYxXdoY PrPr

と定義することができる(必要十分条件)。左辺が,いま考えたような理想的な状況,つまりラン

ダム化によって曝露とリスク要因とが独立である状況をつくり出した場合にしか知りえない,い

わば仮想的な量であるのに対し,右辺は,実際のデータから観察可能な現実的な量である。理想

的な実験でなら知りうるかもしれない因果的な量を,実際に観察可能な量を通じて知りうるかど

うかを識別可能性(identifiability)の問題と呼ぶが,以上の例は,ランダム化比較試験により,曝

露を介入として行った場合の効果が識別可能であることを示している。観察研究における解析の

も主要な目的は,得られた情報を適切に用いて,観察可能な右辺のような量から,いかに左辺

のような量を識別するかにあると言えよう。また,関連して,どのような条件が整えば,そのよ

うな量が識別可能となるかも重要である。その方法をさらに調べてみよう。

Page 41: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

38

2.2.1.2.3 第 3 の要因が関係する場合 まず,これまでに導入した方法を,一見よく似た以下の 3 つの因果グラフに対して適応すると,

どうなるだろうか。

① ② ③

ここで,①は Z が X と Y の共通原因である場合,②は Z が X と Y の中間要因である場合,そして

③は Z が X と Y の共通結果である場合である。それぞれの場合に対して,まず同時分布を求め,

先に示した xXdo に関する計算規則を適応することにより,以下の結果を得る。

① の場合: z

zZxXzZYxXdoY Pr,PrPr

② の場合: xXYxXdoY PrPr

③ の場合: xXYxXdoY PrPr

②と③の場合は非交絡の条件「 xXYxXdoY PrPr 」を満たしているので交絡は生

じていない。したがって,要因 Z を無視して解析を行ってもなんら問題がない。ところが,①に

ついては,X と Z が互いに独立ではないので,これ以上式を単純化することができず,一般に左

辺が xXY Pr と一致することはない。つまり,まさに交絡が生じている状況である。①の場合

の右辺を見ると,前節でもみたように,いわゆる層別解析を表現した式になっている。あらため

て確認すると,結果 Y に影響を及ぼすリスク要因 Z(Z→Y)が,ある薬剤の使用の有無といった

曝露状況にも影響を及ぼしている(Z→X)場合には,単純に集団全体で曝露と結果の関係

xXY Pr を調べても,曝露を介入として行った場合の効果(あらためて「曝露効果」と呼ぼう)

xXdoY Pr を知ることはできず,こうした要因 Z で層別した結果 xXzZY ,Pr を調べ

ることにより,はじめて曝露効果を知ることができる,ということである。つまり,要因相互の

関係が①のようになっている場合は層別解析の結果こそが曝露効果 xXdoY Pr を正しく反

映しており,層を併合した単純集計の結果 xXY Pr にはバイアスが生じている。

一方,②や③の場合に層別解析を行うと,いったいどうなるであろうか。この場合も,

z

zZxXzZY Pr,Pr という計算を行うことになるが,②や③の場合,因果グラフから

明らかなように X と Z とは互いに独立ではないので,この式が xXY Pr と一致することはな

い。つまり,Z が中間変数や共通結果である場合に層別すると,かえってバイアスのある結果が

得られる。前節で紹介した交絡要因の必要条件に「曝露―疾患間の因果連鎖の中間変数であって

はならない」という条件が含まれていたが,いまみたように,②における要因 Z はまさに X と Yの中間に位置する中間変数であり,確かに交絡要因ではない。また「対象としている疾患のリス

ク要因でなければならない」という条件もあったが,③のような状況の場合,Z が原因で Y が生

じているわけではなく,その逆なので,このような要因 Z はもちろんリスク要因ではない。まと

Page 42: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

39

めると,曝露と結果以外の第 3 の要因を考慮した場合,層別による交絡調整が有効なのは①のよ

うな場合だけであり,②や③のような条件を満たす Z で層別すると,かえってバイアスが生じる。 このように考えていくと,先に与えた交絡要因の必要条件は,それが必要条件に過ぎないとい

う限界はあるにしても,どのような要因に注意を払うべきかというガイドラインを与えていると

いう意味で実用的である。 後に,本節で紹介した因果グラフと関連した話題をいくつか補足しておこう。 まず,②のグラフは,サロゲート・エンドポイントやバイオ・マーカーの役割を考える際に示

唆的である。すなわち,ある要因 Z が代替エンドポイントに相当する役割を担っている場合,そ

れを因果グラフで表わすと②のような状況になっていることだろう。ここで Z を経由する効果を

間接効果,また Z を介さず直接 Y に至る経路を直接効果と呼んで区別することがある。そして両

者をあわせた効果を総合効果と呼ぶ。以上で議論してきた xXdoY Pr は,この総合効果であ

った。 また,③のグラフは,選択バイアスについて考える際に示唆的である。このグラフが成立して

いる場合に Z に相当する要因で層別解析を行うとバイアスが生じるということは,Z のある特定

の層を選択して X が Y に及ぼす効果を調べてもやはりバイアスが生じるということである。選択

バイアスと交絡はもともと概念として区別が曖昧であり,まったく同じ事例が教科書によって,

選択バイアスとして紹介されていることもあれば,交絡として紹介されていることもある。そこ

で近年,因果グラフを用いて選択バイアスと交絡を構造的に区別しようという提案がある(Hernan et al.(2004))。

2.2.1.2.4 関連する,やや発展的な話題 以上では,曝露 X と結果 Y 以外の要因が Z のみ,という単純な場合を例にして説明を試みた。し

かし,現実には,もっと複雑な因果連鎖が生じているに違いない。複数の要因がさまざまに曝露

や結果に,あるいは双方に影響を及ぼしている場合であっても,要因相互の影響をある程度明示

的に因果グラフで表現することができれば,どのような要因の集合を調整に用いるのが適切か,

逆に用いるべきでないか,を分析することができる。こうした分析のツールとして,バックドア

基準,また有向分離(d-separation)という概念を用いた基準などが知られており,その詳細につ

いては本節の冒頭で紹介した教科書等を参照してほしい。 なお,ありうる誤解を避けるために,あえて追記しておくと,何もすべての交絡要因をもれな

く観察しなければ交絡調整ができない,というわけではない。例えば,データが得られなかった,

あるいは現在の知識ではわからない未知の交絡要因 U があったとしても,それが観察された交絡

要因 Z を介してのみ,曝露 X や結果 Y に影響を及ぼしている,という下図のような状況を考えて

みよう。

この例のように,未知の要因 U から直接 X や Y に向かう矢線がなければ,別に U を観察する必要

はなく,Z のみを調べて交絡調整をすれば十分である。例えば,心筋梗塞の発症を運命的に決定

づける未知の遺伝子が存在したとしても,その遺伝子(U)が喫煙のような生活習慣や,いくつ

Page 43: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

40

かの前兆となる疾患や,臨床検査値等(いずれも Z)を通じて治療の選択(X)や心筋梗塞の発症

(Y)に影響を及ぼす,という場合は,別にこの遺伝子について調べなくても,治療と心筋梗塞と

の関係を評価することが可能だろう。 また,以上では「交絡がないこと」を, xXdo という算法を導入して定義したが,また別

の表現として,潜在反応変数を用いる場合がある。例えば,ある患者が,曝露を受けた場合(X=1)

の結果を 1Y ,また曝露を受けなかった場合(X=0)の結果を 0Y と表わす。実際には,これらの一

方しか観察されないので,その意味で潜在的反応と呼ばれる。このような概念を導入した上で,

例えば

XY0

という条件を考える。これは,実際に患者が受けた曝露の有無と,曝露を受けなかった場合の潜

在反応 0Y が独立という意味の式である。いま Y が有害事象の有無を表わしている(1=あり,0=

なし)として,いったん上の条件式を機械的に翻訳すると,有害事象の発生について以下の関係

が成り立つ。

1Pr01Pr11Pr 000 YXYXY

すなわち,曝露群でも非曝露群でも,曝露を受けなかった場合のリスクは同じ,ということであ

る。言い換えると,どちらかの群に限って非曝露時に有害事象が発生しやすい人が多く分布する

ことはない,という意味だと解釈できる。つまり,実際には曝露群だった人たちを,仮に非曝露

の状態に置いて結果を観察したとしても,それは実際に非曝露群だった人たちで観察された結果

と大差ないだろう,ということである。まったく同様に

XY1

という条件を考えると,今度は,実際には非曝露群だった人たちを,仮に曝露の状態に置いて結

果を観察したとしても,たぶん実際に曝露群だった人たちの結果と大差はないだろう,という意

味になる。もし,以上の 2 つがともに成立するなら,つまり

XYY 01,

が成り立つなら,結局,曝露群と非曝露群を機械的に入れ替えても,少なくともこの有害事象の

発生状況については,何ら区別がつかない集団だということになる。その意味で,2 つの集団は

交換可能(exchagable)である,と言ったりする。また,集団全体でこのような条件が成立するの

は,それこそランダム化を行ったような場合に限られるだろうから,例えば要因 Z で層別すれば,

各層内ではこうした条件が成り立つようにできる,という条件を

ZXYY 01,

と表わす。この条件が成り立つ場合,少なくとも要因 Z を適切に考慮している限り,曝露時及び

非曝露時の有害事象の発生状況が集団間で異なることはないので,つまりは交絡がない状態にな

っているはずである。この条件は,治療群や曝露群等の「強い意味での無視可能性」とか「未測

定の交絡要因がないこと」等と呼ばれ「交絡がないこと」の別の表現になっている。ただし,「未

測定の交絡要因がないこと」の方は,先に述べたように,本当にすべての交絡要因を測定する必

要があるということではなく,上の条件が成立するのに十分な情報があればよい(どれくらいな

ら十分かは不問に付すとして)という意味である。

Page 44: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

41

2.2.2 効果の修飾 結果に影響を与える要因があり,その要因の有無,あるいは水準によって曝露と結果の関係,す

なわち効果指標の大きさが異なるときに効果の修飾(effect modification)があるという。例えば前

述の表 2.2.1 は,喫煙の有無によりリスク比に違いがないので交絡はあるが効果の修飾はない例で

ある。一方,次の表 2.2.2 は,「喫煙なし」の場合に「喫煙あり」の場合よりもリスク比が低く,

すなわち薬剤の予防効果が高い。したがって,これは交絡があり,かつ効果の修飾が認められる

例である。

表 2.2.2 抗血小板薬投与による脳卒中の再発予防の結果

脳卒中の再発 全体 喫煙なし 喫煙あり

あり なし 合計 あり なし 合計 あり なし 合計

薬剤投与あり 50 50 100 5 35 40 45 15 60

薬剤投与なし 50 50 100 30 50 80 20 0 20

リスク比 1.0 0.33 0.75

なお,以上ではリスク比について考えたが,同じ表でリスク差を考えると,「喫煙なし」でも「喫

煙あり」でも,リスク差(投与あり-投与なし)は-25%である。つまり,喫煙の有無によりリス

ク差には違いがないので効果の修飾はないことになる。このように効果の修飾という概念は,リ

スク指標によって内容が異なるので,その意味で「効果指標の修飾」と呼ぶ方が適切だという意

見がある。 効果の修飾は,統計的には治療とある要因との交互作用を意味する。例えば,ある要因の有無に

よらずリスク差が等しいということは,リスク(発生割合)に対する治療の影響も,その要因の

影響も加法的であるということに他ならない。また,リスク比について効果の修飾がないという

ことは,対数スケールで考えた場合に,治療とその要因との交互作用がないということに他なら

ない。したがって,効果指標の修飾に関して検討する際には,一般に,交互作用の解析に用いる

ものと同様な方法を用いることができる。 例えば,後述する層別解析では,交絡要因(やその組み合わせ)によって定義される複数の層間

で治療効果が等しいこと,すなわちリスク差やリスク比に関して効果の修飾がないことを想定し

て,層間の共通効果を推定することになる。しかし,それに先立って各層ごとのリスク差やリス

ク比を求め,そもそも効果の修飾がないと仮定することが妥当なのかどうか,予備的に検討する

ことも重要である。また,効果の修飾やその影響について積極的に調べたい場合には,交互作用

項を含めたモデルを用いて解析したり,層ごとに分けて個々に検討する場合もあるだろう。一般

に,交互作用に関する検定は検出力が低いので,得られたデータのみに基づいて機械的に交互作

用の有無を検討することには限界がある。この場合も,外部的・医学的な知識に基づいて,また

試験の目的も考慮して方針を考えるべきであろう。 ところで,効果の修飾がある場合,あるいは修飾があると考えた方が自然な場合,ある集団に対

する平均的な効果をどのように考えたらいいだろう。ある要因の有無や水準によらず効果が一定

ということであれば,層別によって交絡を除去して推定した共通効果を,その集団における平均

的な効果と考えて差し支えないだろう。しかし,要因の有無や水準によって効果が異なる場合は,

その要因を持つ患者が集団のなかにどの程度含まれているか,すなわち集団内でのその要因の分

布に依存して集団全体での効果が異なるはずである。 上の例の場合,喫煙者が多く含まれる集団では,薬剤投与による脳卒中の再発予防効果は相対的

に小さいであろうと考えられる。一方,集団全体で喫煙者が占める割合は 40%であった。仮にこ

の集団で,無作為化比較試験を行ったとすると,投与群でも非投与群でもおそらく喫煙者が占め

Page 45: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

42

る割合は概ね 40%となるだろう。喫煙の有無以外に効果を修飾する要因がなかったとしたら,は

たしてこの比較試験から得られるリスク比はどの程度になると考えられるだろうか。また,少し

視点をかえて,実際に薬剤の投与を受けた集団で比較試験を行ってリスク比を調べたとしたら,

どうなるだろうか。上の例では,薬剤の投与を受けている患者の中で,喫煙者が占める割合は 60%ときわめて高かった。したがって,集団全体を対象として比較試験を行った場合と比較すると,

薬剤の投与を受けていた集団で比較試験を行った場合のリスク比の方が小さくなると予測される

が,具体的にはどのように見積もればよいだろう。このような観点からリスク指標を推定する方

法を標準化と呼ぶ。具体的な計算方法は 2.4 節に示したが,標準化では,比較したい集団におけ

る交絡要因の分布を,関心がある集団の分布と一致させることで,そのような要因分布を持つ集

団での効果の大きさを推定する。すると,仮に効果の修飾があったとしても,少なくともそのよ

うな要因分布を持つ集団で(交絡を除去した上で)効果の指標を調べたとしたら,この程度の大

きさになるであろうという推定値を得ることができる。標準化においては,どのような集団の要

因分布を参照するかが重要であり,参照する,もしくは基準とする集団のことを基準集団と呼ぶ。

上の例では,集団全体を基準集団とした場合と,薬剤の投与を受けた集団(曝露集団)を基準集

団とした場合を取り上げたが,もちろん非曝露集団を基準集団とした標準化も考えられる。標準

化を行う場合にはどのような集団に対する推定値を求めたいのかを,研究の目的を考慮して十分

に検討する必要がある。 【参考文献】 Pearl J. Causality: Models, Reasoning, and Inference. Cambridge Univ. Press, 2001 [黒木学. 統計的

因果推論 -モデル・推論・推測-. 共立出版, 2009]. Glymour MM, Greenland S. Chapter 12 Causal Diagrams. In: Rothman KJ, Greenland S., Lash TL.

Modern Epidemiology. Third edition. Lippincott Williams & Wilkins, 2008. Hernan MA., Diaz SH., Robins JM. A Structural Approach to Selection Bias. Epidemiology 2004;

15(5): 615-625. 佐藤俊哉. 疫学試験における交絡と効果の修飾. 統計数理 1994; 42(1): 83-101.

Page 46: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

43

2.3 調整解析 観察研究では,ランダムに治療方法を定めるわけではないので,ほとんど常に交絡が生じている

と考えるのが自然である。そのため,観察研究の解析では,何らかの方法で交絡を調整した治療

効果の推定が必要である。ランダム化臨床試験では,治療をランダムに割り付けることにより,

いわば平均的に交絡が生じない状況を作り出しているため,調整解析を主解析とすることはまれ

である。しかし,観察研究では,むしろ層別や回帰モデルなどを使った調整解析が主解析となる。 以下,2.3 節では,とりあえず効果の修飾はない,もしくはあったとしても大きなものではないと

仮定して,Mantel-Haenszel の方法などの層別解析や,回帰モデルを用いた解析による交絡調整に

ついて述べよう。

2.3.1 層別解析による調整 層別とは,交絡要因によりデータをクロス集計することである。例えば,性別(男女 2 要因),重

症度(軽度,中等症,重症の 3 要因),年齢(~50 歳,50~60 歳,60 歳~の 3 要因)で層別する

場合には,2×3×3=18 個の層に分けることになる。交絡要因が年齢のように連続変数の場合には

適当な幅を取ってカテゴリー化するが,その際,個々のカテゴリーの内では交絡要因の及ぼす影

響に違いがないという前提が必要である。 層別により交絡の調整をする場合,層ごとの効果の大きさが層によらず共通であるという仮定に

基づいて結果を要約する。実際には,各層ごとに発生割合の比が一定であるとして,層ごとの比

を,何らかの基準でもとめた重みを用いて平均することにより,層を通じた共通効果の大きさを

推定する。この際,通常はもっとも情報を与える層が も重い重みを持つようにされている。重

み付けの方法にはいろいろ知られているが,ここでは,層ごとの例数が少ない,いわゆるスパー

スな状態になっても妥当な調整値を与えることが知られているMantel-Haenszel型の重みを使った

推定値を紹介する。

2.3.1.1 層でプールしたリスクの推定値 層 i での曝露群ごとの Event 数,非発生数と観察例数を以下のように与える。

層別 i 曝露の有無

Yes No Total

Event 発生数 A1i A0i M1i

非発生数 B1i B0i

観察例数 N1i N0i N+i このとき,層を通じて,曝露群間の発生割合の比が一定であると仮定する。Mantel-Haenszel 型の

重み WMHiを

iiiiMH NNNW /01 で与えたとき,発生割合の比 RRMHは,以下の式で求められる。

iiii

iiii

iiMHi

iiMHi

MH NNA

NNA

RW

RWRR

/

/

10

01

0

1

また RRMHの対数分散は以下の式で求められる。

Page 47: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

44

i i

ii

i i

ii

iiiiiiii

MH

N

NA

N

NA

NAANNNMRRVar

1001

012

011 )//()][ln(

さらに,95%信頼区間は

exp[ln(RRMH)±1.96×Var{ln(RRMH)}1/2]

で得られる。

一方,発現割合の差 RDMHは,以下の式で求められ

iiii

iiiiii

iMHi

iiiMHi

MH NNN

NNANA

W

RRWRD

/

/)()(

01

100101

RDMHの分散は以下の式で求められる

20

20

00

12

1

112

)1()1()][

iMHi

i ii

ii

ii

iiMHi

MH

W

NN

BA

NN

BAW

RDVar

95%信頼区間は

RDMH±1.96×Var(RDMH)1/2

で得られる。これらの発生割合の差と比の推定値は,閉じたコホート研究のデータの交絡の調整

に使われる。 一方,層を通じて,オッズ比が一定であると仮定するとき,オッズ比 ORMH は,以下の式で求め

られる。

iiii

iiii

iiiiiMHi

iiiiiMHi

iiiMHi

iiiMHi

MH NBA

NBA

NBNAW

NBNAW

PPW

PPWOR

/

/

)/)(/(

)/)(/(

)1(

)1(

10

01

1100

0011

10

01

ORMHの分散は若干複雑で

iiii

iiii

iiii

iiii

NBAQ

NBAP

NBAH

NBAG

/)(

/)(

/

/

10

01

10

01

としたときに以下の式で対数分散が求められる

22

22

)(

2

)][ln(

ii

iii

ii

ii

iiiii

ii

iii

MH

H

QH

HG

PHQG

G

PGORVar

Page 48: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

45

95%信頼区間は

exp[ln(ORMH)±1.96×Var{ln(ORMH)}1/2]

で得られる。このオッズ比の推定値は,コホート研究,ケース・コントロール研究,横断試験の

データの交絡の調整に使われる。

2.3.1.2 層でプールした発生率の推定値 層 i での曝露群ごとのイベント数とリスク人時間を次のように与える。

層別 i 曝露の有無

Yes No Total

Event 発生数 A1i A0i M1i

Person-hours T1i T0i T+i このとき層を通じて,曝露間の発生率の比が一定であると仮定し,Mantel-Haenszel 型の重み WMHi

iiiiMH TTTW /01 で与えたとき,発生率比 IRMHは,以下の式で求められる。

iiii

iiii

iiMHi

iiMHi

MH TTA

TTA

IW

IWIR

/

/

10

01

0

1

IRMHの対数分散は以下の式で求められる。

i

ii

i

ii

iiiiMH

T

TA

T

TA

TTTMIRVar

1001

2011 /

)][ln(

95%信頼区間は

exp[ln(IRMH)±1.96×Var{ln(IRMH)}1/2]

で得られる。 一方,発生率の差 IDMHは,以下の式で求められ

iiii

iiiiii

iMHi

iiiMHi

MH TTT

TTATA

W

IIWID

/

/)()(

01

100101

IDMHの分散は以下の式で求められる

2

00112 )//(

][

iMHi

iiiiiMHi

MH

W

TITIWIDVar

95%信頼区間は

IDMH±1.96×Var(IDMH)1/2

Page 49: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

46

で得られる。

これらの Mantel-Haenszel 推定量は,スパース(層あたりの症例数が少ない)なデータにおいても

妥当な推定値を与えるとされている。

2.3.2 回帰モデルによる調整

2.3.2.1 発生割合での回帰モデルによる調整 反応の指標が発生割合の場合は,回帰モデルとして Logistic モデルが用いられることが多い。変

数 X で曝露の有無を表わすことにして(例えば X=1 の場合は曝露群,X=0 の場合は非曝露群),

X=x となる集団における期待発生割合を R(x)とする。このとき,以下のモデルを Logistic モデル

と呼ぶ。

)exp(1

)exp(

)expit()(

x

x

xxR

この Logistic モデルは,X=x となる集団における期待オッズを O(x)とするとき,

)exp(

)exp(1

1)exp(1

)exp(

)exp(1

)exp(1

)exp(1

)exp(

)(1

)()(

x

x

x

x

x

xx

x

xR

xRxO

となり,期待オッズの指数関数モデルと等しくなる。そのため,期待オッズの対数はαと βの線型モデルで現され

xxO ln

オッズの対数を,発生割合のロジットと呼ぶ。

xxOxR

xRxR

ln

1lnlogit

説明変数として x1,x2,x3の 3 つを考えた場合には,

332211321321 ,,ln,,logit xxxxxxOxxxR

となり,説明変数と回帰係数を,列ベクトル 321 xxxx 及び 321 で表すと

xxOxR lnlogit

と表される。ここで, 初の変数 x1 が曝露の有無を表わし(曝露ありの場合 1,なしの場合 0),残り 2 つが交絡変数を表わすとすると

曝露群 : 33221321 ,,1logit xxxxxR

非曝露群: 3322321 0,,0logit xxxxxR

したがって曝露群と非曝露群のロジットの差は回帰係数β1で表され,ロジットとオッズ比の関係

から

Page 50: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

47

1321321 ,,0logit ,,1logit xxxRxxxR

1

321

321321321 ,,0

,,1ln,,0ln,,1ln

xxxO

xxxOxxxOxxxO

1

321

321 exp,,0

,,1

xxxO

xxxO

よって,回帰係数β1の真数が交絡因子 x2と x3で調整したリスクのオッズ比の推定値となる。

2.3.2.2 発生率での回帰モデルによる調整 Y を観察された単位人時間あたりのケースの数とするとき,回帰モデルは

E(Y|X=x)

X=x となるサブ集団における単位人時間あたりの平均的ケースの数で現される。この期待発生率

を I(x)とするとき,次のような線型モデルを考える。

I(x)=E(Y|X=x)=α+xβ

この線型モデルでは,期待発生率 I(x)が負になる可能性を含むので,多くのモデルでは次のよう

な指数関数モデルを考える。

I(x)=E(Y|X=x)=exp(α+xβ)

T(X)を共変量 X で現される期待人時間とし,両辺に掛けるとこの指数関数モデルは

I(x)T(x)=exp(α+xβ)T(x)

A(x)=exp(α+xβ)T(x)

A(x)=exp(α+xβ)T(x)

とイベント発生数 A(x)を現す関数となる。イベント発生数 A(x)はポアソン分布に従うの(2.1.2 節

参照)で発生率にはポアソン回帰モデルが適応される。以下の対数ポアソンモデルに Fiting が行

われる。

ln(A(x))= ln(T(x)) +α+xβ

ポアソン回帰では,観察単位あたりの総観察数の対数 ln(T(x))の係数を 1 に固定する必要がある。

このような変数をオフセット(offset)変数と呼ぶ。 ポアソン回帰モデルが得られたときに,曝露の変数を X,交絡変数を行列 Z として,X が 2 値変

数で X=1 のとき曝露あり,X=0 のときに曝露無しとすると,曝露の回帰係数をβ1とするとき

曝露: ln(A(X=1,Z))= ln(T(1,z)) +α+β1+zβ

非曝露: ln(A(X=0,Z))= ln(T(0,z)) +α+ 0 +zβ

曝露の回帰係数をβ1は曝露と非曝露の差であらわされ,以下のようにして

ln(A(X=1,Z))- ln(T(1,z))- ln(A(X=0,Z))+ ln(T(0,z))=β1

ln(A(X=1,Z)/ T(1,z))-ln(A(X=0,Z)/ T(0,z))= β1

ln(I(X=1,Z)-ln(I(X=0,Z))= β1

ln(I(X=1,Z)/I(X=0,Z))= β1

Page 51: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

48

I(X=1,Z)/I(X=0,Z)=exp(β1)

回帰係数β1の真数が交絡因子 Z で調整したリスクの発生率比の推定値となる。 ポアソン回帰は通常の臨床試験で使われることが少ないので,以下に SAS の porc genmod を

用いたポアソン回帰の例を示す。 Dataset : Data equip; input sex $ age severity drug event obsday; logrisk=log(obsday); cards; F 65 1 0 2 253 M 60 4 1 0 200 F 70 2 1 1 152 M 61 3 0 0 222 F 55 4 1 0 90 M 45 2 0 3 42 F 35 1 1 1 125 ; run; proc genmod data = equip; class sex severity; model event = sex age severity drug

/ dist=poisson offset=logrisk ; run; ここで

event: イベントの発現数を示す変数 sex age severity: 調整する共変量の変数 drug: 曝露変数 dist=poisson: ポアソン回帰の指定 offset=logrisk: 対数リスク変数, Log(T(x))に対応する変数

データに過分散があるときは,推定値にバイアスは含まれないが,標準誤差の過小評価をもた

らす。過分散があれば,goodness-of-fit のカイ二乗値がその自由度よりも大きくなるので,そ

の比をみて過分散の判断を行う。Genmod では“Criteria For Assessing Goodness Of Fit”の

Value/DF にその比が出力される。Genmod はデータに過分散が認められるときの指定も用意さ

れており,model ステートメントのオプションで pscale(あるいは scale=pearson)と指定する

と,Pearson Chi-square と自由度の比で調整した SE と信頼区間を算出し,dscale(あるいは

scale=deviance)と指定すると,Deviance と自由度の比で調整したものを出力する。また,過

分散のあるポアソンデータに適応される負の二項分布での回帰(dist=negbin)も出来る。

Page 52: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

49

2.3.3 変数選択 曝露が疾病の発症原因であるかどうかを検討する際に,全ての交絡要因で調整した効果の推定値

は仮定した曝露,交絡要因,疾病発症間の関係(回帰モデルであれば回帰モデル)が正しいとき

にバイアスが入らないが,必要以上の変数を入れると不必要に効果の推定値の分散が大きくなっ

てしまう。逆に重要な交絡要因を調整しそこなうと推定値にバイアスが入る。そのため,どの交

絡変数を調整すべきで,どの交絡変数を調整すべきでないかという,古典的な変数選択のジレン

マに直面する。交絡要因で調整するとは,層別解析であれば層別変数に加えること,回帰モデル

を用いた場合はモデルに加えることを表す。 通常の統計パッケージに含まれる変数選択に検定を用いる方法は, 終的に得られたモデルに下

向きのバイアスを与え,狭すぎる信頼区間を与える傾向がある。また,推定値の変化による選択

法(change-in-point-estimate)なども,検定による方法よりもましであるという保証はない。 交絡の定義で述べたように,交絡要因はデータからは判定することが出来ないので,試験実施前,

あるいは解析実施前までに得られた背景情報により交絡要因と考えられる要因を特定して観察し

解析に含めるべき,つまりバイアスが入るよりは推定精度が下がるほうがましというのが,この

問題に対する現実的解答であろう。 【参考文献】 Greenland S., Rothman KJ. Chapter 15 Introduction to stratified analysis. In: Rothman KJ, Greenland

S., Lash TL. Modern Epidemiology. Third edition. Lippincott Williams & Wilkins, 2008. Fleiss JL, Levin B, Paik MC. Chapter 10 Combining evidence from fourfold tables. In: Statistical

methods for rate and proportions. third edition. John Wiley & Sons, 2003. Rothman KJ. Epidemiology: An Introduction. Oxford University Press, 2002. [矢野栄二, 橋本英樹監

訳. ロスマンの疫学. 篠原出版新社, 2004.] Allison PD. Chapter 9 Poisson regression. In: Logistic regression using SAS system. SAS inst., 1999. Zenlterman D. Chapter 5 Poisson regression. In: Advanced log-linerar models using SAS. SAS inst.,

2002. Stokes ME, Davis CS,Koch GG. Chapter 12 Poisson regression. In: 2nd edition. Categorical data

analysis using the SAS system. SAS inst., 2000. Greenland S. Chapter 20 Introduction to regression models. In: Rothman KJ, Greenland S., Lash TL.

Modern Epidemiology. Third edition. Lippincott Williams & Wilkins, 2008. Greenland S. Chapter 21 Introduction to regression modeling. In: Rothman KJ, Greenland S., Lash TL.

Modern Epidemiology. Third edition. Lippincott Williams & Wilkins, 2008.

Page 53: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

50

2.4 標準化

2.4.1 標準化とは 「標準化」という用語にはなじみがない人でも,「調整死亡率」,「訂正死亡率」といった用語を

新聞等で見かけたことがあるかもしれない。死亡状況の地域比較を行う場合,地域の特性に応じ

て「過疎化の影響により老人人口の割合が高い地域」,「生産者人口の多い地域」など年齢の分布

に違いが生じる。年齢は死亡の非常に強いリスク要因であり,かつ地域によって年齢の分布が異

なっているので,年齢は地域間の死亡状況を比較する際に交絡要因となっている。従って,死亡

率の地域比較を行う際には年齢分布が異なることによる影響(交絡)を除去する必要がある。具

体的には,ある特定の年齢分布を持つ集団(日本では昭和 60 年の 5 歳刻みの年齢分布,いわゆる

「基準人口」もしくは「昭和 60 年モデル人口」)を基準集団として,仮に各地域の年齢分布がこ

の基準集団の年齢分布と同じだったとしたら死亡率はどうなるか,という調整を行う。これが,

いわゆる年齢調整死亡率を求める際の「標準化」の考え方であるが,同様な方法を無作為化が行

われない薬剤疫学研究にも当てはめることができる。

2.4.2 標準化の考え方 表 2.4.1 は喫煙の有無と心血管系障害の発生について全体及び各年齢層における喫煙の有無毎の

心血管系障害発症数とその割合を検討した結果である(佐藤(1994)を参照)。

表 2.4.1 全体及び各層における喫煙の有無毎の心血管系障害の発症数とその割合 心血管系障害 全体 65 歳未満 65 歳以上

あり 標本数 あり 標本数 あり 標本数 喫煙 62(0.56) 110 10(0.25) 40 52(0.74) 70 非喫煙 23(0.21) 110 4(0.07) 60 19(0.38) 50

リスク比 2.70 3.75 1.95 リスク差 0.355 0.183 0.363 オッズ比 4.89 4.67 4.71

この例では,喫煙と非喫煙間のリスク比、リスク差に関して、65 歳以上は 65 歳未満に比べ約 2

倍程度異なっている。また,同じ喫煙者の集団の中で比較すると,65 歳以上の集団では 65 歳未

満と比較して心血管系障害のリスクが高く,このことは非喫煙者の集団の中で比較しても同様で

ある。つまり,このデータは,喫煙の有無だけでなく,年齢によっても心血管系障害のリスクが

高くなり,しかも両者の影響が,差で見ても比で見ても独立ではなく,効果指標の修飾が疑われ

る。さらに,この例では,65 歳以上が占める割合が,喫煙者でより高いので,喫煙が心血管系障

害に及ぼす影響を検討する上で,交絡も生じている。 交絡を除去する上で,年齢によって層別することも考えられるが,この例では,年齢層によっ

てリスク比やリスク差が異なるようなので,層を通じた共通効果を想定するのは不適切かもしれ

ない。このような場合,層ごとに結果を提示する以外に,どのような要約の方法があるだろうか。 ひとつの試みとして,そもそもどのような集団における効果を知りたいのか,を再考してみよ

う。例えば,上の例の場合,高齢者が多く含まれる集団を調べるほど,結果的にリスク比(リス

ク差)がより小さい(より大きい)結果が得られるであろう。では,もっと具体的に,どの程度

の割合で高齢者が含まれる集団における効果を知りたいのだろうか。 いま仮に,研究の目的が,現在喫煙者である人たちの集団を,禁煙等により仮に全員非喫煙者

にできたとしたら,心血管系障害のリスクをどの程度下げることができるか,というものだった

としよう。この場合,関心がある集団は現在の喫煙者たちである。上のデータを見ると,そのよ

うな集団では高齢者が 110 人中 70 人と過半数を占めている。したがって,これと同様な年齢構成

を持つ集団ではリスク差はどうなるか,またリスク比はどうなるか,と考えるのが自然であろう。

一方,現在非喫煙者である人たちが,仮に全員喫煙者になったとしたらどの程度のリスク増が懸

Page 54: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

51

念されるか,という目的の研究なら,逆に非喫煙者の集団に関心があるわけだから,この場合は

高齢者の割合が 50/110 であるような,つまり非高齢者がやや多いという集団での効果を調べるこ

とに意味があるだろう。 このように考えていくと,以下のような方法を取れば,関心がある集団におけるリスク指標を

得ることができそうである。 ・ まず,どのような集団における効果を調べるかを定める(例えば喫煙者の集団) ・ 調べたい集団における,交絡要因の分布を調べる(例えば年齢の分布) ・ 比較の対照となる集団(例えば非喫煙者の集団)の交絡要因の分布を,調べたい集団のそれ

にそろえた上で効果の指標を求める これが,標準化と呼ばれる方法の基本的な考え方であり,調べたい集団,あるいは交絡要因の

分布をそろえる際に基準とする集団のことを標準集団と呼ぶ。また,ある要因を考慮した標準化

により得られた効果の指標を,その要因で「調整した」指標とか「調整済の」指標,などと呼ぶ。

例えば,年齢と性を考慮してリスク比を求めた場合は「性・年齢で調整したリスク比」,「性・年

齢調整済リスク比」などと呼ぶ。

2.4.3 標準化の計算 具体的な計算方法を示すため,表 2.4.1 と対応させる形で,セル度数や割合を表 2.4.2 のように表

わすことにする。すなわち,まず E と U で,それぞれ人の集団としての喫煙グループと非喫煙グ

ループを表わす。また,喫煙グループのイベント数を ja ,非曝露群のイベント数を jb で,さらに

標本数と発生割合をそれぞれ ijN 及び ijIP で表わす。ただし,添え字の i はグループ(1=喫煙グル

ープ,0=非喫煙グループ)を, j は年齢層(1=64 歳未満,2=65 歳以上)を表わし,特に j につい

て合計を取った場合は,添え字なしとする。 また,以下では喫煙グループ(E)を標準集団とした場合の標準化を考えることにして,記号

E[U]で喫煙グループが喫煙を行わなかった場合を表わすことにした。このような状態を実際に観

察することはできないので,何らかの方法で,このような場合のイベント数や発生割合を見積も

る必要がある。この,現実には観察できないイベント数や発生割合を「*」を付して示した。

表 2.4.2 全体及び各層における喫煙の有無毎の心血管系障害の発症数とその割合(一般的記

載) 心血管

系障害 全体 65 歳未満 65 歳以上

あり 標本数 あり 標本数 あり 標本数 E a(IP1) N1 a1(IP11) N11 a2(IP12) N12 E[U] a*(IP0*) N1 a1*(IP01*) N11 a2*(IP02*) N12 U b(IP0) N0 b1(IP01) N01 b2(IP02) N02 E:喫煙グループ U:非喫煙グループ

E[U]:喫煙グループが喫煙を行わなかった場合(実際には観察できない)

仮に喫煙グループが喫煙を行わなかった場合の合計イベント発生数 *a が分かったとしよう。する

と,喫煙グループを標準集団として,この集団が喫煙を行った場合と非喫煙の場合とでリスク比

を計算すると IP1/IP0*=(a/N1)/(a*/N1)=a/a*

となる。このリスク比は,「喫煙グループが,喫煙を行ったことによる心血管系障害発生の比例的

(相対的)な増加」という意味を持つ。さて,ではどのように *a を求めればいいだろうか。 年齢による交絡がなければ IP0= IP0*であるから b/N0=a*/N1,すなわち a*=N1(b/N0)である。よっ

Page 55: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

52

て,IP1/IP0*=a/a*=a/(N1(b/N0))=(a/N1)/(b/N0)(=IP1/IP0)となり,喫煙グループのリスクを非喫煙グル

ープのそれで割った単純なリスク比から,喫煙グループを標準集団とした場合のリスク比を知る

ことができる。 一方,年齢による交絡がある場合は,IP0 IP0*であるため,観測不可能な a*を別な情報から求

めなければならない。ここで交絡要因として考慮すべき要因は年齢のみであり,年齢で層別する

ことにより,それぞれの層の中では交絡がないことを仮定しよう。層内では交絡がないので,IP01*=

IP01かつ IP02*= IP02であり,したがって a1*=N11IP01*= N11IP01=N11(b1/N01)。同様に a2*= N12(b2/N02)

である。さらに,a*= a1*+ a2*であることに留意すると,喫煙グループを標準集団とした,年齢調

整済のリスク比は

0221201111*2

*1

* // NbNNbN

a

aa

a

a

a

となる。この計算の過程を振り返ってみると ・ 喫煙を行わなかった場合のリスクとしては,実際に非喫煙グループで観察されたリスクの推

定値 011 Nb や 022 Nb をそのまま用いている

・ ただし,年齢については,実際に非喫煙グループで観察された度数分布(65 歳未満 01N ,65

歳以上 02N )ではなく,喫煙グループのそれ(65 歳未満 11N ,65 歳以上 12N )を用いている

また,このリスク比は「喫煙グループで実際に観察された疾病発生数(observed)」と「喫煙グル

ープが喫煙を行わなかった場合に期待される疾病発生数(expected)」の比になっており,これは

古くから知られている「観察発生数/期待発生数」である SMR(Standardized Morbidity / Mortality Ratio)に他ならない。分母の「期待発生数」はあくまでも「曝露グループが曝露を受けなかった場

合」の期待値であり,帰無仮説(曝露の効果はない)のもとでの期待値でない点に注意する必要

がある。なお、表 2.4.1 の事例では、喫煙グループを標準集団とした年齢調整済リスク比は

12.250/197060/440

62

となる。

2.4.4 標準集団の選び方 「標準化」という名称は「適切な標準集団(standard or reference population)を定め,曝露グループと

非曝露グループの交絡要因の分布が標準集団の交絡要因の分布と同じだと仮定した場合に期待さ

れる疾病発生数の比較を行う」ことに由来する。上記事例での標準集団は喫煙グループであった。 標準集団として用いる集団は,どんな集団でも良いというわけではなく,仮説(言いたいこと)

に応じて選択しなければならない。そこで,以下では例を変え,禁煙による肺がんの予防効果を

調べるために禁煙者グループと喫煙者グループを比較する観察研究を考えよう。ここでは以下の

3 つの仮説を考える。 1)自発的に喫煙を止めた禁煙者のグループでは,禁煙により肺がんの死亡が減る。 2)(禁煙できなかった)喫煙者のグループでは,強制的な禁煙により肺がんの死亡が減る 3)禁煙するかどうかをランダム化した介入試験を実施した場合,禁煙により肺がんの死亡が減

る。 まず,1)の場合は,禁煙者のグループにおける禁煙の効果,言い換えると人の集団としては

現在,禁煙者の集団に属する人たちが,禁煙した場合としなかった場合とで肺がんの死亡の程度

が異なるかどうか,を調べたい。したがって,この場合の標準集団は禁煙者のグループとすべき

Page 56: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

53

である。また,2)の場合は,喫煙者のグループにおける禁煙の効果を知りたいわけだから,喫煙

者のグループを標準集団とすべきであろう。また,3)の場合は,調査の段階で結果的に禁煙者

であったり喫煙者であったりする人たち全員を対象としてランダム化を行うことになるだろうか

ら,この場合の標準集団は,禁煙者と喫煙者を合わせた集団全体とすべきでであろう。それぞれ

の場合に対応する計算方法を整理するため,表 2.4.3 のような構造のデータを考えよう。

表 2.4.3 禁煙と肺がんによる死亡の関係 曝露 全体 層 k

死亡数 症例数 死亡数 症例数

E a N1 ak N1k

U b N0 bk N0k

E:禁煙グループ U:喫煙グループ

さらに,交絡要因で層別した第 k 層における標準集団 R の交絡要因の度数を rkとしよう。前節で

概観したように,標準化は,第 k 層における禁煙グループと喫煙グループの交絡要因の分布が,

標準集団のそれと等しいと仮定した場合に期待される死亡数

k k

kkER N

arE

1][ ,及び

k k

kkUR N

brE

0][

に基づいて行う。ただし,R[E]は「標準集団 R が禁煙を行った場合」,R[U]は「標準集団 R が喫煙

を行った場合」を指す。すなわち,リスクについては,実際に禁煙グループや喫煙グループで観

察された層ごとのリスクk

k

N

a

1

,及びk

k

N

b

0

をそのまま用いる一方で,交絡要因の分布については標

準集団の度数分布 rkを用いるのだった。 以下で,仮説 1)~ 3)に対応する期待死亡数,及びそれらの比(標準化リスク比)

URERR EESRR の解釈を順に示しておこう。

1)の仮説の場合 禁煙グループ E を標準集団とするので, kk Nr 1 として期待死亡数を求めると

Ek

kk k

kkER Oa

N

aNE

11][ ,

k k

kkUR N

bNE

01][

RSRR は禁煙グループが禁煙した場合の死亡発生の比例的な増加を表す。

2)の仮説の場合 喫煙グループ U を標準集団とするので, kk Nr 0 として期待死亡数を求めると

k k

kkER N

aNE

10][ ,

kU

kk

k

kkUR Ob

N

bNE

00][

RSRR は喫煙グループが禁煙した場合の死亡発生の比例的な増加を表す。

Page 57: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

54

3)の仮説の場合 禁煙グループと喫煙グループを合わせた全体 P を標準集団とするので, kkkk NNNr 01 とし

て期待死亡数を求めると

k k

kkPR N

aNE

1][ ,

k k

kkPR N

bNE

0][

RSRR はグループ全体が禁煙した場合の死亡発生の比例的な増加を表す。

2.4.5 標準化リスク比と標準化リスク差

2.4.5.1 標準化リスク比

標準化リスク比( RSRR )は既に述べたとおりである。ここでは,前節の記法を用いて真の標準

化リスク比の 95%信頼区間の算出方法を示す。

まず, RSRRlog の近似的な分散の推定値は,

2

02

2

12

logUR

kkkURkkUR

ER

kkkERkkER

RE

NErE

E

NErE

SRRV

で与えられる(Rothman(1986),佐藤(1994))。ここで, kkkkER NarE 1 , kkkkUR NbrE 0

である。これより,真の RSRR の 95%信頼区間は

RR SRRVSRR log96.1exp

となる。

なお、表 2.4.1 の事例において、喫煙グループを標準集団と考えた時の ESRR (SMR)とその 95%

信頼区間は、 ESRR =2.12、 ESRRV log =0.0380、95%信頼区間(1.47,3.05)である。

非喫煙グループを標準集団と考えた時の USRR (SMR)とその 95%信頼区間は USRR =2.27、

USRRV log =0.0380、95%信頼区間(1.55,3.32)である(佐藤(1994)を参照)。

2.4.5.2 標準化リスク差 標準化リスク比では曝露を受けたことによる疾病発生の相対的な増加を調べることができたが,

疾病発生の絶対的な増加を調べる際に標準化リスク差は使用される。曝露グループと非曝露グル

ープの交絡要因の分布が標準集団と同じ場合の疾病発生割合は,前節の記法を用いると rE ER ,

rE UR であるから(ただし, k

krr ),標準化リスク差とその近似的な分散の推定値は

r

EESRD URER

R

k k

kURkkUR

k

kERkkERR N

ErE

N

ErE

rSRDV

012

1

Page 58: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

55

で与えられる(Rothman(1986),佐藤(1994))。これより真の RSRD の 95%信頼区間は

RR SRDVSRD 96.1

となる。

なお、表 2.4.1 の事例において、喫煙グループを標準集団と考えた時の ESRD とその 95%信頼区

間は、 ESRD =0.298、 ESRDV =0.00377、95%信頼区間(0.177,0.418)である(佐藤(1994)を

参照)。

2.4.6 ロジスティックモデルを用いた標準化 2.4.4 節で示した標準化の方法は疾病発生割合に仮定を置かない,ノンパラメトリックな標準化で

あった。もし,データに対して何らかのモデルが当てはまる場合には,当てはめたモデルの元で

計算される期待疾病発生数を用いて標準化を行うことができる。ここではロジスティックモデル

を用いた標準化リスク比,標準化リスク差の推定方法を述べる。 観察されたデータに以下のロジスティックモデルがよく当てはまったとする。

i

i

i zγz

z '

,1

,log

iii

ii xxr

xr

ただし,添え字の i は被験者を表わし, ix は i さんの曝露の有無(1:曝露あり,0:曝露なし),

iz は i さんの交絡変数の組,また ir は,そのような曝露状況・交絡変数を持つ i さんが観察期間中

に疾病を発生するリスクを表す。上式では曝露 x と交絡変数 zとの交互作用に関する項を明示し

ていないが,必要に応じて,zの中には交互作用項も含まれていると考えて差し支えない。また,

以下では特に言及していないが,交互作用項をモデルに含める場合には,例えば推定された回帰

係数を用いて予測値を計算する際などに,交互作用項を適切に考慮する必要がある。

さて,ロジスティックモデルに含まれる回帰係数 '',, γβ の 尤推定値を '',, cb ba と

し,その分散共分散行列の推定値を bV とする。こうして推定された回帰係数を用いると,被験者

i さんが曝露を受けた場合と受けなかった場合のリスクの予測値を(実際に i さんがいずれの群に

属するかに関わらず),それぞれ

i

iiiii ba

bazxrP

zc

zc'

'

1 exp1

exp,1

, i

iiiii a

azxrP

zc

zc'

'

0 exp1

exp,0

などと計算することができる。こうして被験者ごとに求めた,曝露時と非曝露時のリスクの予測

値を用いることで,調べたい標準集団における期待平均リスクを求めることができる。以下に,

2.4.4 節の仮説に対応する期待平均リスクを,それぞれ示す。

仮説1)曝露グループ(E)を標準集団とした場合の,曝露時と非曝露時の期待平均リスクは,曝

露グループに属する 1N 人の被験者たちの,曝露時,及び非曝露時のリスクの予測値の

算術平均として以下のように求めることができる:

E

iE PN

IP 11

11

, E

iE PN

IP 01

01

この 1N の被験者たちにおける共変量 zの分布は,もちろん曝露群のそれと等しい。

仮説 2)非曝露グループ(U)を標準集団とした場合の,曝露時と非曝露時の期待平均リスクは,

非曝露グループに属する群 0N 人の被験者たちの,曝露時,及び非曝露時のリスクの予

Page 59: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

56

測値の算術平均として以下のように求めることができる:

U

iU PN

IP 10

11

, U

iU PN

IP 00

01

この 0N の被験者たちにおける共変量 zの分布は,非曝露群のそれに等しい。

仮説 3)対象者全員(P)を標準集団とした場合の,曝露時と非曝露時の期待平均リスクは,全部

で 10 NNN 人いる被験者たちの,曝露時,及び非曝露時のリスクの予測値の算術平

均として以下のように求めることができる:

P

iP PN

IP 111

, P

iP PN

IP 001

この N の被験者たちにおける共変量 zの分布は,対象者全員のそれに等しい。

これらの期待平均リスクを用いて,ロジスティックモデルでスムージングした標準化リスク比の

推定値 RRR IPIPSRR 01* や,標準化リスク差の推定値 RRR IPIPSRD 01

* 等を求めることができる。

また,*log RSRR , *

RSRD の近似的な分散の推定値は

RRRSRRV RVR b'*log , RRESRDV DVD b

'*

である。ただし,

E

i

i

i

EiR

i

i

i

Ri

R PP 02

0'

0'

012

1'

1'

1 exp1

exp1

exp1

exp1x

xb

xbx

xb

xbR ,

Ri

i

ii

i

i

RR N 02

0'

0'

12

1'

1'

exp1

exp

exp1

exp1x

xb

xbx

xb

xbD ,

'',1,1 zx 1i , '',0,1 zx 0i

また, RN は標準集団 R に対応して NNNNR ,, 01 である。

なお、表 2.4.1 の事例において、65 歳未満,65 歳以上間ではリスク比、リスク差は異なってい

たが、オッズ比は 4.67,4.71 とほぼ等しいのでロジスティックモデルを用いた標準化を行う。ロ

ジスティックモデルを用いた結果は

zx

zx

zx

r

r16.255.164.2

1log

,

,

である。ただし、 x 1:喫煙、0:非喫煙, z 1:65 歳以上,0:65 歳未満である。

この時、喫煙グループを標準集団と考えた時の*

RSRR (SMR*)、 *ESRD は、

*RSRR =2.12、

*ESRD =0.297 であり、95%信頼区間はそれぞれ(1.48,3.01)、(0.178,0.417)である(佐藤(1994)

を参照)。

2.4.7 標準化と調整解析 標準化による方法も調整解析(Mantel-Haenszel の方法などの層別解析や回帰モデルによる調整)

も層別の結果について加重平均を取る点では同じである。異なる点は,例えば Mantel-Haenszel の方法による調整解析おいては,各層のデータ数に応じて重みが決まるのに対し,標準化では特定

Page 60: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

57

の標準集団において各層が占める重みが,そのまま他の集団でも重みとして用いられる。また,

調整解析においては効果の修飾がない(交絡因子と曝露の間での量的な交互作用がない),つまり

評価の対象となる効果は層を通じて一定であるという前提が必要であった。一方,標準化では,

仮に層ごとに効果が異なったとしても,ある特定の標準集団の層の構成に合わせることで,その

ような構成を持つ集団での効果はどのようなものかを単一の値に要約する。このため,標準化は,

効果の修飾があっても利用可能であり,また得られた値の解釈も容易である。ただし,どのよう

な集団での効果か,言い換えれば交絡因子がどのように分布している集団での効果を調べている

のか,を常に念頭に置いて利用する必要がある。 【参考文献】 佐藤俊哉. 疫学試験における交絡と効果の修飾. 統計数理 1994; 42(1): 83-101. Rothman KJ. Epidemiology: An Introduction. Oxford University Press, 2002. [矢野栄二, 橋本英樹監

訳. ロスマンの疫学. 篠原出版新社, 2004.]

Page 61: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

58

2.5 マッチング 交絡を防ぐ方法の 1 つにマッチング(Matching)と呼ばれるサンプリング方法がある。マッチン

グは研究グループ(Index series)と比較グループ(Reference group)を外的因子(交絡因子)に関

して比較可能にする方法である。コホート研究とケース・コントロール研究については,研究グ

ループと比較グループは表 2.5.1 のようになる。

表 2.5.1 主な薬剤疫学研究デザインでの研究グループと比較グループ

研究グループ 比較グループ

コホート研究 曝露群 非曝露群

ケース・コントロール研究 ケース コントロール

2.5.1 マッチングの種類 マッチングは大きく個別マッチング(individual matching)と頻度マッチング(frequency matching)

に分けられる。大まかな分類を表 2.5.2 に示す。

表 2.5.2 マッチングの分類

名称

個別マッチング ペアマッチング(pair matching)

頻度マッチング カリパーマッチング(caliper matching) カテゴリーマッチング(category matching)

個別マッチングはマッチングに用いた因子に関して研究グループのある対象者と比較グループ

の個々の対象者(1 人以上)を同定する方法である。図 2.5.1 にケース・コントロール研究におけ

るペアマッチングの事例を示す。ただし,以下では,色によって曝露の有無を表わし,例えば黒

(●,■)は曝露ありの状態を,また白(○,□)は曝露無しの状態を指す。また,図形の形に

よってマッチングに用いる要因を表わし,例えば性でマッチングする場合なら,丸(○,●)は

男性を,四角(□,■)は女性を表わす,といった具合である。

Page 62: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

59

図 2.5.1 ケース・コントロール研究におけるペアマッチング事例 (藤井(2008)より)

この事例ではケースが●と曝露ありの男性だったので,コントロールとして男性を対象として

サンプリングしたところ,曝露なしの男性○が抽出されたわけだが,もちろん曝露ありの男性●

が抽出される可能性もあった。 一方,頻度マッチングでは,マッチングに用いる要因の分布が,研究グループのそれと同じに

なるように,比較グループをサンプリングする。例えば,研究グループで男性と女性の占める割

合が,それぞれ 40%と 60%ということであれば,比較グループの性別も同じ頻度分布になるよう

に,例えば男性と女性を研究グループのそれと同数になるように,あるいは定数倍になるように

サンプリングを行う。図 2.5.2 にケース・コントロール研究での頻度マッチングの事例を示す。

Page 63: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

60

図 2.5.2 ケース・コントロール研究における頻度マッチング事例(藤井(2008)より)

この事例では(●,●)のケースに対して,(●,○)のコントロールがマッチングされている。

この時,マッチングされるコントロールとしては(●,○)以外に(○,○)及び(●,●)の

2 パターンも考えられる。この例は,カテゴリー・データを用いてマッチングを行うカテゴリー・

マッチングの例であったが,マッチングに用いたい要因が連続データの場合は,何らかの方法で

許容範囲を定義する。例えば,年齢を 5 歳刻みのカテゴリーに分ける,ある検査値を「X 以上,Y未満」といった複数の範囲に分割する等である。そして,許容範囲内で条件が一致する対象者を

マッチングによって選択する。これがカリーパー・マッチングである。 ところで,曝露群を研究グループとしたコホート研究の場合,頻度マッチングによって,非曝

露群のマッチングに用いた要因の分布が,曝露群のそれに揃えられることになる。結果的に,こ

れは,曝露群を標準集団とした標準化を,マッチングを通じて行っているのと同じことである。

また,ケース・コントロール研究の場合は,コントロール群の頻度マッチングに用いた要因の分

布が,ケースのそれに揃えられる。したがって,ケース・コントロール研究においてマッチング

を行った場合は,曝露群と非曝露群の要因分布が類似するとかいったことは期待できない。この

ように,一口にマッチングと言っても,研究デザインによって,マッチングによって実現される

要因分布の類似性の内容が異なることに注意したい。後に見るように,この違いがマッチングに

よって得られたデータの解析方法の違いを導くのである。 なお,前向きにケースを同定するようなケース・コントロール研究の場合には,ケースが全員

集められるまで,果たして男性がケースの何割を占めるか,といったことはわからない。しかし,

過去の情報から,標的となるイベントが発生するような集団の特性が大まかにわかっている場合

は,そのような特徴の分布が概ね同様になるように,ケースの発生を待たずにコントロールを選

Page 64: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

61

択することも可能である。

2.5.2 コホート研究,ケース・コントロール研究におけるマッチング 本章では,コホート研究,ケース・コントロール研究におけるマッチング事例を示す。そこで,

ある研究対象集団を全員調べた場合のデータとして,表 2.5.3 のような状況を考えよう。ざっと確

認しておくと,男性でも女性でも,曝露によるリスクは非曝露時の 10 倍というデータである。ま

た,性別がこのイベントに対するリスク要因であることが既知であるとしよう。実際,このデー

タでも,男性でのリスクが,曝露の有無を問わず女性の 5 倍となっている。また,この例では,

男性では曝露群に属する人が非曝露群の 9 倍多く,逆に女性では非曝露群に属する人の方が 9 倍

多い。すなわち,曝露の有無と性別との間には明白な関連があり,交絡が生じている。このため,

性別を考慮せず,全体での結果を見るとリスク比が 33 と大きくバイアスしている。以下では,こ

のデータに対して,マッチングを行った場合にどのようなデータが得られ,またそれをどのよう

に解析するのが適切かを順にみていこう。 なお,これからは説明の都合上,元のグループからのサンプルの抽出が偏り無く理想的に行われ

たという過程のもとでのサンプリングの結果を示している。

表 2.5.3 想定した集団

男性 女性 全体

曝露 非曝露 曝露 非曝露 曝露 非曝露

ケース 4,500 50 100 90 4,600 140

計 900,000 100,000 100,000 900,000 1,000,000 1,000,000

リスク 0.005 0.0005 0.001 0.0001 0.0046 0.00014

リスク比 10 10 33

2.5.2.1 コホート研究 マッチングを行うコホート研究では,曝露群に対して交絡要因のマッチングを行なう。すなわ

ち,曝露群の交絡要因の分布をまず考え,それと類似した分布を持つ非曝露群をマッチングによ

って構成しようというのがねらいである。そこで,以下のような手順で,コホート・マッチング

を行った場合に,得られるであろうデータの例を表 2.5.4 に示した。

1. 曝露群から 10%をランダムに抽出(男性 90,000,女性 10,000) 2. 性別の比率(男性/女性=9)が曝露群と同じになるよう非曝露群から頻度マッチングにより

10%を抽出(男性 90,000,女性 10,000) 3. 2 で抽出された非曝露群について,ケースは男性では 45 例,女性では 1 例となる。

Page 65: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

62

表 2.5.4 コホート研究でのマッチング結果

男性 女性 全体

曝露 非曝露 曝露 非曝露 曝露 非曝露

ケース 450 45 10 1 460 46

計 90,000 90,000 10,000 10,000 100,000 100,000

リスク 0.005 0.0005 0.001 0.0001 0.0046 0.00046

リスク比 10 10 10

表 2.5.4 より,男性,女性,全体ともに曝露群と非曝露群間のリスク比はいずれも 10 である。こ

の結果から,(競合リスク,脱落が無い前提で)コホート研究の場合には,マッチング因子で調整

した解析を行わなくとも,全体の結果(Crude な結果)として,バイアスの無い結果が得られる

ことがわかる。 前述のとおり、コホート研究では,曝露群と類似した要因分布を持つ非曝露群を構成するため

にマッチングを行う。言い換えれば,曝露群を標準集団とした標準化を,マッチングという手段

を用いて実現している。このため,マッチング後は,もはや曝露の有無とマッチング要因との関

連性が無くなり、結果的に交絡が除去される。このため、マッチング因子で調整した解析を行わ

なくともバイアスの無い結果が得られる。ただし、競合リスクや脱落が存在すると,イベントと

打ち切りの明確な区別ができないためバイアスの原因になる(2.8 節参照)。

2.5.2.2 ケース・コントロール研究 次に,ケース・コントロール研究を想定して,以下の手順でマッチングを行ったとしよう。ケ

ース・コントロール研究では,ケースにおける交絡要因の分布をまず考え,選択されたコントロ

ールの集団が,それと類似した分布を持つようにマッチングを行う。なお,マッチング後に得ら

れるであろうデータの例を表 2.5.5 に示した。 1. ケース 4,740 例を全例選択する(男性:4,550 例,女性:190 例)。 2. コントロールとして男性、女性毎の例数がケースと同じになるよう頻度マッチングにより

4,740 例(男性:4,550 例,女性:190 例)を選択する。 3. 2 によって抽出されたコントロールにおいて,男性では曝露群:4095 例,非曝露群:455 例,

女性では曝露群:19 例,非曝露群:171 例となる

表 2.5.5 ケース・コントロール研究でのマッチング結果

男性 女性 全体

曝露 非曝露 曝露 非曝露 曝露 非曝露

ケース 4,500 50 100 90 4,600 140

コントロール 4,095 455 19 171 4,114 626

オッズ比 10 10 5.0

上記結果より,男性,女性のオッズ比は 10 であるものの,全体でのオッズ比は 5.0 である。こ

のことから,ケース・コントロール研究において,バイアスの無い結果を得るには,マッチング

Page 66: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

63

因子で調整した解析が必要になる。代表的なものとして,マッチング因子を層とした層別解析

(Mantel-Haenszel method 等),回帰分析(条件付きロジスティックモデル等)がある。条件付き

ロジスティックモデルについては後述する。 ところで,ケース・コントロール研究では仮にマッチング因子が交絡因子でなかったとしても,

常にマッチングに用いた因子で調整を行わなくてはならない。例えばマッチング前の元データと

して,表 2.5.6 のデータを考えよう。このデータでは,性によってリスクが変化することはなく,

要するに性がリスク要因ではないので,もはや交絡は生じていない。しかしながら,男性では曝

露群の例数が非曝露群の 9 倍、また女性では逆に非曝露群の例数が曝露群の 9 倍であり、少なく

とも曝露と性別には関連性がある。

表 2.5.6 想定した集団

男性 女性 全体

曝露 非曝露 曝露 非曝露 曝露 非曝露

ケース 450 10 50 90 500 100

計 90,000 10,000 10,000 90,000 100,000 100,000

リスク 0.0005 0.001 0.0005 0.001 0.0005 0.001

リスク比 5 5 5

上のデータに対し,先と同様な手順で性別をマッチング因子としてデータの選択を行うと,表

2.5.7 のようなデータが得られるであろう。結果を見ると,層ごとのオッズ比と全体のオッズ比は

一致していない。したがって,統計的な調整を行わないまま,解析を行なったとすると,オッズ

比が 1 に近づく方向にバイアスが入ることになる。

表 2.5.7 ケース・コントロール研究でのマッチング結果

男性 女性 全体

曝露 非曝露 曝露 非曝露 曝露 非曝露

ケース 450 10 50 90 500 100

コントロール 414 46 14 126 428 172

オッズ比(近似値) 5 5 2

なぜ,このような現象が生じるのだろうか。前述のとおり、ケース・コントロール研究では,

ケースの要因分布と似たコントロールを選択するためにマッチングを行う。ところがケース・コ

ントロール研究におけるコントロール選択の目的は,ケースと似た集団を得ることではなく、リ

スク集団全体のコピーを得ること,つまりリスク集団全体と似た集団をサンプリングし,そこで

の曝露状況を調べることであった。このため,ケースと似た集団を選べば選ぶほど、そしてマッ

チング要因が曝露と関係していればいるほど、ケースとコントロールの曝露状況が似てきてしま

い、オッズ比が 1 に近づくことになる。したがって、統計的な調整を行わないまま解析を行うと,

不可避的にオッズ比が 1 に近づいてしまうのである。上の事例では、確かに性は,リスクと無関

係で交絡要因ではなかった。しかし、曝露とは強く関連しているため、性によってマッチングを

行うと、コントロールの曝露状況がケースのそれに類似し,結果的に全体のオッズ比は 2 と、1

Page 67: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

64

に近づく方向にバイアスしたのであった。

2.5.3 条件付ロジスティック・モデル マッチングを行ったケース・コントロール研究の多くでは,条件付ロジスティック・モデルが用

いられる。条件付ロジスティックモデルは 2.3.2.1 節で示すロジスティック回帰モデルに対して,

層を表すパラメータ Kkk ,,2,1 (層化パラメータ)を導入したモデル

kikkikR βxx logit

である。ただし,添え字の ki は第 k 層に含まれる患者 i を表わす。このモデル式を変形すると kik

kik

kik

R

Rβx

x

xexpexp

1

という式が得られるが,ベースラインの状態,つまり 0kix となる場合を考えると

k

k

k

R

R exp01

0

となるので,さらに

ki

k

k

ki

ki

R

R

R

Rβx

x

xexp

01

0

1

と変形できる。この式から,層ごとに,ベースラインの状態でのリスク 0kR ,さらにオッズ

01

0

k

k

R

R

は異なるものの,共変量 kix の影響は層によらず共通,というモデルを想定しているこ

とがわかる。言い換えると,条件付ロジスティック・モデルは,層ごとに異なるベースラインオ

ッズ 01

0

k

k

R

R

が,共変量の影響により,比例的に kiβxexp 倍される,という比例オッズモデル

と同値である。 上記のモデルに対して通常の尤度を構成し, 尤推定量を求めることもできるが,各層の標本

数が少ない場合, 尤推定量はバイアスを持つことが知られている。そこで,このいわば条件な

しの尤度に対して,局外パラメータである層化パラメータを消去した条件付き尤度を考える。す

なわち,層化パラメータ k の十分統計量が与えられた条件の下でのパラメータβの条件付き尤度

を構成し, 尤推定量を求めるのである。具体的には,1:M 型のマッチングのときのβの条件付

き尤度は,第 k 層におけるマッチング比を kM とし,また第 k 層に含まれる 1kM 人の患者 kj た

ち( kMj 0 )のうち,特に ki がケースであったとすると

K

kM

jkj

ki

kCL

1

0

exp

exp

βx

βx

と表され, kix が曝露の有無を表わす2値変数(1=曝露あり,0=曝露なし)の場合は,曝露効果を

表すオッズ比 exp の 尤推定量を求めることができる。

Page 68: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

65

条件付ロジスティック解析は,SAS Ver.9 で proc logistic で計算できるようになっている。

Logistic を用いた条件付ロジスティック解析の例を示す。詳しくは浜田(2006)を参照いただ

きたい。

Dataset : data condlog; input response strat expos age sex $; cards; 1 1 0 38 F 0 1 0 55 M 1 2 1 38 F 0 2 0 48 F 1 3 1 40 M 0 3 1 64 F 1 4 1 38 M 0 4 1 61 M … 1 64 0 28 M 0 64 0 64 F ; run; proc logistic data=condlog descending; class strat sex; model response=expos sex age; strata strat; exact expos/estimate=both outdist=out1; run;

ここで

response: ケース or コントロールを示す変数 strat: マッチング因子 sex age: 調整する共変量の変数 expos: 曝露変数

2.5.4 カウンターマッチング(counter matching) 近ケース・コントロール研究で用いられる新しいマッチング方法として,カウンターマッチ

ング(counter matching)が研究されている。図 2.5.3 に事例を示す。

Page 69: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

66

図 2.5.3 ケース・コントロール研究におけるカウンターマッチング事例(藤井(2008)より)

上記事例ではケースが●の時には,コントロールからは○が選択されているが,●が選択され

ることはない。ケースの曝露状況に応じてコントロールが選択される。 カウンターマッチングのサンプリング方式の統計的意味づけを理解するためには,サンプリン

グ形式の基本的考え方を理解する必要がある。ここではサンプリングの基本的考え方を説明した

上でカウンターマッチングのサンプリング方式を説明してみたい。

2.5.4.1 さまざまなサンプリング方式 ネステッド・ケース・コントロール研究ではサンプリングを「ケース 1 人に対し,同時点のリス

ク集合 tR からm 人をサンプリングする」と考えた。この方法以外にも,さまざまなサンプリン

グ方式が考えられ,部分尤度を構成した際に,サンプリング確率が分母・分子で打ち消しあうよ

うにサンプリング方式を選択するということが本質的だったので,この条件さえ満たされていれ

ば,時点ごとにやや異なったサンプリング方式を採用しても,さほど問題が生じないのではない

かと考えられる。たとえば 1 対 3 マッチングを基本にしながらも,時点によっては 1 対 2 になっ

たり 1 対 4 になったりと時点ごとにマッチングの比が異なったとしても,部分尤度を構成する条

件付確率の計算は時点ごとに行うので,サンプリング確率の時間的な変化が部分尤度に影響を与

えることはない。

また,やや細かい議論になるが,漠然と「ケース 1 人に対してリスク集合 tR からm 人をサン

プリングする」と言う場合,少なくとも以下の 4 つの可能性がある。

1. 非ケースからコントロールをm 人,非復元抽出によりサンプリングする 2. 非ケースからコントロールをm 人,復元抽出によりサンプリングする

3. ケースも含めた tR 全員からコントロールをm 人,非復元抽出によりサンプリングする

Page 70: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

67

4. ケースも含めた tR 全員からコントロールをm 人,復元抽出によりサンプリングする

通常は 1 のサンプリング方式を採用することが多いが,サンプリングの対象者が十分多ければ,

いずれのサンプリング方式も妥当である。ただし,時間以外の要因も考慮して,さらに多くの要

因についてマッチングを行いたい場合,要因の組み合わせによってはサンプリングの対象者が少

なくなる懸念がある。このような場合には,1 と 4 のサンプリング方式は妥当だが,それ以外の

サンプリング方式では問題が生じることが知られている。また,4 のサンプリング方式を採用し

た場合,サンプリング確率が条件付確率の分母・分子から完全に消えるわけではないため,条件

付確率の積が通常の部分尤度にある定数を掛けた「擬似尤度(pseudolikelihood)」となる(Robins 1986)。 その他,詳細は文献にゆずるが,Two-stage sampling,Counter-matching,Quota sampling,またケ

ース・コホート研究におけるサンプリング方式も,サンプリング確率 itr の部分に様々なヴァ

リエーションを施した変法のひとつとして統一的に理解することができる(Borgen, Goldstein, Laugholz 1995, Langholz, Goldstein 2001, Langholz, Goldstein 1996)。ただし,サンプリング方式によ

っては, triP に相当する部分に,サンプリング確率に関係した項が消えずに残る場合がある。

そのような場合は,サンプリング確率と関係した項を重みとして考慮する必要があるため,実際

に運用する際には種々の注意が必要である。

2.5.4.2 1 対 1 マッチングの場合 以上の議論を 1 対 1 マッチングの場合にあてはめてみよう。すなわち,時点 t に発生したケース 1

人に対して,同時点のリスク集合 tR に含まれる非ケースから 1 人のコントロールを選択して計

2 名の部分集団からなる tr を構成することを考える。この場合のサンプリング確率は,ケース以

外の 1tN 人からランダムに 1 人サンプリングする確率に等しく

1

1

tNitr

となる。時間の経過とともにコホートサイズ tN が変化するため,サンプリング確率もまた変化

する。しかし,時点 t に発生したケースが誰であったとしても,その時点でのサンプリング確率は

同じなので,時点ごとに条件付確率を計算していけば,サンプリング確率が分母・分子で打ち消

しあう。このため,サンプリング確率の時間的な変化がハザード比の推定に影響を与えることは

ないのであった。 さて,ケース発生時に 1 対 1 マッチングを行う場合,ケースが曝露群に含まれるか非曝露群に

含まれるか,またコントロールが曝露群に含まれるか非曝露群に含まれるかによって 4 つの場合

が考えられる。それぞれに場合に対し,時点ごとの条件付確率がどのようになるかを下表に示し

た。この表から明らかなように,ケースとコントロールの曝露状況が等しい場合,部分尤度は定

数となる。定数を で微分しても 0 になるだけなので,ケースとコントロールの曝露状況が等し

いような部分集団 tr は の推定に寄与しないことがわかる。

Page 71: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

68

ケース コントロール 時点 t での部分尤度への寄与

triP 曝露 状況

イベント 発生確率

曝露 状況

イベント 発生確率

曝露 tt exp0

曝露 tt exp0

2

1

expexp

exp

00

0

tttt

tt

非 曝露

tt 0

1exp

exp

exp

exp

00

0

tttt

tt

非 曝露

tt 0

曝露 tt exp0

1exp

1

exp00

0

tttt

tt

非 曝露

tt 0

2

1

00

0

tttt

tt

時点ごとに上表のいずれかの場合が生じるので,研究終了時にどの組み合わせが何回生じたか

を数え上げると,下表のような結果が得られるであろう。

ケースの曝露状況 コントロールの曝露状況

曝露 非曝露

曝露 a b 非曝露 c d

たとえば,ケースとコントロールがともに曝露群に含まれていた場合,時点ごとの部分尤度へ

の寄与は2

1であり,このような組み合わせになった時点がa 回あったのなら,これら a 個の部分

リスク集合の部分尤度への寄与は

a

2

1となる。同様に考えると,上のような分割表が得られた場

合の部分尤度は

dcba

PL

2

1

1exp

1

1exp

exp

2

1

したがって,部分尤度の対数を で微分することにより

0

1exp

explog

cbbPL

という推定方程式が得られる。その解は c

bexp であり,ハザード比 exp が上の分割表の

非対角要素の比に等しいことが導かれる。このことから,非対角要素だけのデータを効率的に得

る方法として,カウンターマッチングのサンプリング方式が得られる。 もっと一般的な 1 対m マッチングを,ケースが発生した時点ごとに行った場合のハザード比は

これほど簡単な形にはならない。しかし,実質的な計算内容は以上と同様であり,考慮しなけれ

ばならないケースとコントロールの曝露・非曝露の組み合わせが増加するだけである。

Page 72: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

69

【参考文献】 Rothman KJ, Greenland S., Lash TL. Modern Epidemiology. Third edition. Lippincott Williams &

Wilkins, 2008. John M Last 編,日本疫学会訳. 疫学辞典第 3 版. 財団法人日本本公衆衛生協会, 2000.

丹後俊郎他. ロジスティック回帰分析 -SAS を利用した統計解析の実際-. 朝倉書店, 1996. James J. Schlesselman 編,重松逸造 監訳. 疫学・臨床医学のための患者対照研究-研究計画の

立案・実施・解析-. ソフトサイエンス社, 1985. 藤井良宜. 応用統計学会チュートリアルセミナー資料 2008. 浜田知久馬. ロジステック回帰による推測(V.9 LOGISTIC プロシジャの機能拡張). SAS Forum

ユーザー会 学術総会, 2006. Robins JM, Gail MH, Lubin JH. More on “biased selection of controls for case-control analyses of

cohort studies”. Biometrics 1986; 42: 293-299. Borgen Ø , Goldstein L, Laugholz B. Methods for the analysis of sampled cohort data in the Cox

proportional hazards model. The Annals of Statistics 1995; 23: 1749-1778. Langholz B, Goldstein L. Conditional logistic analysis of case-control studies with complex sampling.

Biostatistics 2001; 0: 1-22. Langholz B, Goldstein L. Risk set sampling in epidemiologic cohort study. Statistical Science 1996;

11: 35-53.

Page 73: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

70

2.6 傾向スコアとその利用

2.6.1 はじめに 治療や曝露をランダムに割り付けることができない観察研究において,交絡を調整し治療や曝露

と効果の因果関係を推定するために傾向スコア(propensity score: Rosenbaum and Rubin (1983))を

用いる方法が提案されている。傾向スコアは,観測された共変量のもとで対象者が治療を受ける

確率(治療の受けやすさ)と定義され,複数ある共変量の情報を,0 より大きく 1 より小さい一

つの値に縮約したものである。 例えば,喫煙が肺癌に及ぼす影響を調査したい場合,ランダム化によって喫煙や非喫煙を割り

付けることは,倫理的に不可能であろう。また喫煙者と非喫煙者とでは,喫煙習慣以外にも数多

くの要因が異なっていると考えられるので,たんに喫煙者と非喫煙者とで肺癌の発生や悪化,あ

るいはそれと関連するイベントの発生等を比較しても,おそらく交絡が生じているに違いない。

このような場合の傾向スコアを用いた解析では,まずどのような要因を持つ人たちが喫煙者であ

る可能性(曝露を受ける確率)が高いかと考える。例えば,喫煙者は男性に多い,高齢者の方が

喫煙者の占める割合が高そうだ,等々の情報を可能な限り活用して,まずこの曝露を受ける確率

をモデル化する。そして何らかの方法でこの確率が計算できたら,以下のように考える。すなわ

ち,この確率が似た値になった人たちは,少なくとも曝露の受けやすさに関しては,どこかしら

似た人たちであろう。だとすると,この確率の値を,あたかも共変量のように考えて,これまで

見てきた層別やマッチング,回帰,そして標準化に用いることが可能であろう。結果変数ではな

く,曝露変数に対して回帰を考える点が従来までの方法と大きく異なる点である。 近では,市場調査や世論調査などでも,インターネットを利用することが多くなっているが,

Web 調査では若者,男性,ネット好きなどの回答者が増え,母集団に想像以上の偏りが生じるこ

とがあり、傾向スコアはこのような場面でも頻用されている。 以下では,この方法の理論的な基礎に加え,実際の応用例についても紹介してみたい。

2.6.2 バランススコアとしての傾向スコア 傾向スコアは,理論的には次に述べるバランススコア(balancing score)の一つである。説明を簡

単にするため,まずは層別解析の拡張として傾向スコアを考えてみよう。 例えば性別が交絡要因であるとして,層別解析によって交絡調整を行う際,もちろん男性と女性

に層別し,男性の層には男性のみ含まれ,女性の層には女性のみ含まれる,といった層別の方法

が考えられる。しかし,層内の共変量の値が完全に等しくなるように層別する必要はなく,どの

層でも曝露群と非曝露群の共変量の分布が概ね等しくなるようにできれば,交絡防止には十分で

ある。例えば,性別以外のある要因で層別したところ,層によって男性の含まれる割合は変化す

るものの,層ごとにみれば,曝露群にも非曝露群にもほぼ同じ割合の男性が含まれている,とい

う状況が作り出せたとしよう。このような場合にも,層ごとに曝露群と非曝露群の比較を行えば,

少なくとも性別に起因する交絡は防止できる。つまり,交絡を防止する上では,必ずしも各層内

で交絡要因の値が等しい必要はなく,その分布についてバランスが取れていれば十分なのである

(佐藤,松山,2002,p161)。 次に,この「バランスが取れた」状態を表現するために,上の例の性別に相当する共変量を Z

で,また曝露群を X(=1: 曝露群,=0: 非曝露群)で表わそう。すると,曝露群でも非曝露群でも

共変量 Z の分布が等しい,という条件は )Pr()0|Pr()1|Pr( ZXZXZ ,

あるいは,まとめて )Pr()|Pr( ZXZ

と表わすことができる。条件付確率の定義にしたがってこれを変形すれば,要するに Z と X とは

独立だということであり,これを

Page 74: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

71

XZ

という記法で表わすこともある。この条件は,曝露群 X をランダム化によって定めた場合には,

平均的に成立していると考えられる。実際,ランダム化比較試験の後で,背景要因(共変量 Z に

相当)の分布を治療群(曝露群 X に相当)ごとに比較し,大きな違いがないことを確認すること

が多いが,これは実質的には上の条件を検討することに相当する。 さて,バランススコアとは,上のような条件が,バランススコアで分類した層ごとに成立する

ように,言い換えると,バランススコア Zb を与えたもとでの Z と X との条件付独立

ZbXZ

を保障するような Zb のことである。ここで, Zb というように,Z の写像として表わすのは,

このような条件を満たすバランススコアを,共変量 Z のみを用いて(他の情報を参照することな

く)構成したいからである。上のような条件付独立が成り立つ場合は

ZbZZbXZZbXZ Pr,0|Pr,1|Pr ,

あるいは,まとめて

ZbZZbXZ Pr,|Pr ,

が成り立つので,少なくとも Zb の値が似た人ばかりを集めて層をつくれば(あるいは Zb の

値を用いて何らかの調整を行えば),曝露群と非曝露群における共変量 Z の分布を等しくすること

ができる。ふたたび性別による層別の例を考えると, Zb の値によって定義された層ごとに男女

Z の分布 ZbZPr は異なるかもしれない。しかし,層ごとにみれば,曝露群(X=1)でも非曝露

群(X=0)でも男女の分布に違いはない

ZbXZZbXZ ,0|Pr,1|Pr

という条件が成立するような Zb が構成できれば,この Zb は,少なくとも性別に関してはバ

ランススコアになっている。なお,実際には,複数の交絡要因を同時に考慮したい場合がほとん

どなので,以下ではZ で,考慮したい複数の交絡要因から成る確率変数の列ベクトルを表わすこ

とにしよう。ただし,議論を簡単にするため,Z は離散的な値を取るカテゴリー変数とする。 では具体的に,この Zb をどのように構成したらいいだろうか。自明なバランススコアの例と

して,Z それ自身をあげることができる。というのは,条件付確率の性質から明らかに

1Pr,0|Pr,1|Pr ZZZXZZXZ

である。性別の例で考えると,男性の層に男性が占める割合は曝露群でも非曝露群でも 100%であ

り,言い換えると曝露群でも非曝露群でも男性の層には確率 1 で男性が含まれる。このため,

ZZb という意味での,つまりバランススコアとしての Z 自身は, も細かい(finest)バラ

ンススコアであると言える。 一方, も粗い(coarsest)バランススコアとして知られているのが,傾向スコア(propensity score)

である。傾向スコアは,ある共変量Z のもとで患者が曝露を受ける( 1X となる)条件付確率,

すなわち

ZXZe |1Pr)(

Page 75: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

72

と定義される。あるいは,共変量Z が取る値を小文字の z で表わし,傾向スコアを実現値Z の関

数として

zZXze |1Pr)(

と表わすこともある。2.6.6 節で示すように,実際の解析では,傾向スコアを共変量の関数として,

ロジスティックモデルを用いて表現することが多い。このように定義された傾向スコアが実際に

バランススコアであることを確認するには

ZeXZ

が成り立つこと,あるいは同じことだが, Z の任意の値 z に対して

zeXzezZX |1Pr)(,|1Pr

が成り立つことを示せばよい。ここで, z の値が決まれば,自動的に ze の値も決まることに注

意すると,明らかに zezZXzezZX |1Pr)(,|1Pr が成り立つので,結局

zezeX )(|1Pr

を示せば,傾向スコアがバランススコアであることが示される。この関係式は,曝露を受ける確

率,すなわち傾向スコアを与えたうえで,さらに曝露を受ける確率を求めると,ふたたび傾向ス

コアが得られる,という内容なので,考えようによっては自明であろう。念のため,証明の道筋

を示しておくと,いわゆる「全確率の公式」を,条件付確率を用いて展開した

ZXEzZzZXzZXX Zzz

PrPrPr,PrPr

という関係や,条件付期待値に関する同様な式 ZXEEXE Z を用いて,左辺を以下のよ

うに変形していけばよい。

zezeZeEzeZXEzezeZXE

ze

zezZzezZXzezZzezZXzeX

ZZZ

zz

1Pr , 1Pr

)(Pr

)(,Pr)(,|1Pr)(|Pr)(,|1Pr)(|1Pr

ここで,確率変数Z に関して総和や期待値を取る操作を行っているが, ze で条件付けているの

で,Z の取りうる値 zは, zeze を満たすようなものに限られる。このため総和にせよ期待

値にせよ,実質的にはこのような zたち(正確には次の 2.6.3 節の脚注で示した z )についての

み考えればよい。 こうして,傾向スコアがバランススコアであることが確認できたわけだが, 後に登場した関

係式 zezeX )(|1Pr は,以降でしばしば用いることになる。

2.6.3 傾向スコアとランダム化比較試験 前節では,傾向スコアがバランススコアの一種であること,またその場合の「バランス」とは,

式で表わすと

ZXXZ 1Pr

という関係を満たすこと,すなわち傾向スコア ZX 1Pr を与えたもとでは,曝露 X と共変量

Z とが独立になり,曝露群でも非曝露群でも共変量の分布が等しくなる,ということであった。

このことを,あらためてランダム化と関連付けながら再考してみよう。

Page 76: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

73

まず,被験者を確率 0.5 で 1:1 に曝露群( 1X )または非曝露群( 0X )に割り付ける場

合,共変量Z の値によらず,すべての被験者が確率 0.5 で曝露群に割り付けられるので

5.01Pr1Pr XZX

である。したがって,このようなランダム化比較試験における傾向スコアは真に 0.5 であり,傾

向スコアの値がそのまま割付確率にもなっている。

一方,観察研究の場合,別に割付を行うわけではないにせよ, ZXXZ 1Pr という関

係が成立している場合は,少なくとも傾向スコアの値が似た(理想的には同じ)患者たちの間で

は,曝露群と非曝露群とで共変量の分布が類似しているはずである。したがって,このような場

合には,傾向スコアの値で層を定義すると層ごとにランダム化(層別割付)を行った場合と同様

なデータ得られているはずだ,と考えることができる。つまり傾向スコアを介して,観察研究か

ら得られたデータを,あたかも特殊なランダム化比較試験から得られたデータであるかのように

みなす視点がひらけてくる。 この点をさらに調べるため,まず患者が曝露群に属する確率を,以下のように分解してみよう。

ze

ze

ze

zeze

zezeX

zeXX

Pr

Pr1Pr

,1Pr1Pr

ただし,式変形の過程で,前節で示した zezeX )(|1Pr という関係を用いた。また,総和

を,傾向スコアの値 ze ごとに取っているが,これは一次元の量である傾向スコアの値が同じに

なるような共変量ベクトル z は複数存在する可能性があるため,そのような z の集合を同一視※

することに相当する。 さて,この式で確率として表現されている部分を,とりあえず,そのような条件を満たす患者の

割合だと思って解釈してみよう。するとこの式の左辺は,曝露群に属する患者が集団全体の

1Pr X という割合を占めること表しており,右辺がその内訳を示している。つまり,傾向スコ

アの値が ze となる患者が,全体の zePr という割合を占め,そのさらに ze という割合の患

者が曝露群に属している,と解釈することができる。同様な関係を非曝露群の患者について調べ

※ この同一視は,数学的には「 zzzeze ~ 」という同値関係「~」によって表現できる。言い換え

ると, z の値の集合 z を考えるのではなく,それを同値関係「~」によって類別した商集合 ~z を考えよう

ということである。 z と同じ同値類に属する zの集合(の代表元)を z という記号で表わすと,傾向スコアの

値 ze について和を取るということは,この z について和を取ることと同義である。また,この定義から,傾

向スコアの値が ze となる確率は,共変量 z が同値類 z に含まれる確率

zz

zz PrPr と等しいので,上式を

z

zzeX Pr1Pr

と書き直すこともできる。なお,以下では,このような意味で傾向スコアの値について和を取っていることを前

提として,本文中で示した簡単な記法で済ませることにしよう。

Page 77: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

74

てみると

ze

ze

zeze

zezeXX

Pr1

Pr0Pr0Pr

となる。 後の式は,傾向スコア値が ze となる,全体の zePr という割合を占める患者のう

ち,特に ze1 という割合の患者が非曝露群に属している,と解釈できる。以上を総合すると,

観察研究から得られたデータを,あたかも以下のような特殊な「層別割付」を行ったランダム化

比較試験の結果とみなすことができよう。 1) まず各患者の共変量のデータ zZ から傾向スコア ze を求める。

2) 傾向スコアの値がほぼ同様な(理想的には一致する)患者を同じ層に属する患者とみなし,

層ごとに曝露群または非曝露群に割付比 ze : ze1 でランダムに割り付ける。

つまり,傾向スコアの値によって層が定義され,さらに層ごとに異なる(しかし層内では一定

の)割付比でランダム化するという手順である。こうすると,傾向スコアの値が似た zePr と

いう割合の患者たちのうち, ze という割合の患者が曝露群に,また ze1 という割合の患者が

非曝露群に「割り付け」られるので,この仮想的なランダム化比較試験から,実際に行われた観

察研究と同様なデータを得ることができるだろう。この「実際に観察研究から得られたデータを,

ある仮想的なランダム化比較試験の結果とみなす」という視点,あるいはそうみなせる状態に近

づけようとする視点が,傾向スコアを用いた解析の背後にある基本的な考え方である。次節では,

この観点から,傾向スコアを用いた様々な解析方法を概観してみよう。

2.6.4 傾向スコアを用いた解析

2.6.4.1 層別解析 前節で述べた「層別割付」の手順を考慮すると,ごく自然に,割付に用いた要因,つまり傾向ス

コアを,そのまま層別要因として解析する,という方法が導かれる。傾向スコアを用いて定義さ

れた層の中では,曝露群によらず交絡要因の分布が類似しており,すなわち交絡が除去されてい

るわけだから,まずは個々の層ごとに効果の指標を求め,それらを併合すればよいだろう。反応

変数がイベント発生の有無のような 2 値データの場合,たんに傾向スコアによって定義された層

を用いて,2.3.1 節で論じたような層別解析を用いれば,層を通じた共通効果を推定することがで

きる。 この方法は直観的にも理解しやすいし,統計解析ソフトの利用なども容易である。問題がある

とすれば,本来連続量である傾向スコアを用いて層を定義するため,傾向スコアのカテゴリー化

が不適切だと残差交絡と呼ばれるバイアスが生じる可能性があることである。この問題は,後に

触れるように,傾向スコアを用いてマッチングを行う場合にも生じる可能性がある。

2.6.4.2 回帰分析 傾向スコアを,先に述べたような特殊なランダム化比較試験の開始時に測定されたベースライン

値のひとつだと考えると,ごく自然に,傾向スコアを説明変数として回帰分析に用いる方法が導

かれる。もっとも単純な例は,曝露の有無を表わす変数に加え,傾向スコアをそのまま説明変数

としてモデルに含めるというものである。つまり,反応変数をY ,曝露の有無を X ,共変量の集

合をZ ,傾向スコアを Ze ,また誤差項を として

ZeXY

Page 78: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

75

というモデルを考える。このモデルでは,通常の,交互作用項を含まない共分散分析の場合と同

様に,結果変数に対する傾向スコアの影響が線型であること,また曝露効果が傾向スコアの値に

よらず共通であることを仮定している。Rosenbaum and Rubin(1983)は,いくつかの因果論的な

仮定(潜在反応変数モデルを用いた反事実的な仮定)のもとで,実際に傾向スコアと反応変数と

の関係が線型なら,こうしたモデルにより曝露効果が識別可能であることを示している。しかし,

傾向スコアと反応変数との関係が実際に線型であるという保障はないし,また確認する方法もな

さそうである。そこで,傾向スコアの多項式やスプライン関数をモデルに導入する,といったよ

り柔軟なアプローチも考えられる。 とはいえ,知りたいのは曝露効果であって,共変量が反応に及ぼす影響に特別な関心があるわ

けではない。そこで,共変量と反応変数との関係については特別なモデルを仮定しないセミ・パ

ラメトリックなモデル

ZhXY ,ただし Zh はZ の未知関数

を用いた方が柔軟だし,多くの仮定を必要としないという意味でロバストでもあるだろう。その

ような観点から,共変量と反応変数との関係 Zh をモデル化するかわりに,傾向スコアを用いて

共変量と曝露の関係をモデル化することによって,曝露効果に相当する係数 を推定する方法が

いくつか提案されている(例えば Robins and Mark(1992))。 また,傾向スコアをそのまま説明変数として用いるのではなく,実際に受けた曝露と,その期

待値の差 ZXEXI というあらたなスコア(intensity score)を定義し,これを説明変数とす

る方法も提案されている。X が 2 値の場合

ZeZXZXZXE 0Pr01Pr1

であるから,曝露群のスコアは ZeI 1 ,また非曝露群のスコアは ZeI となり,これら

のスコアを用いて IY

という回帰モデルをあてはめる。すると,実質的に,共変量と反応変数との間に特別な関係を仮

定しないセミ・パラメトリックなモデルと同様な推定を行うことができるというのである

(Brumbeck at al.(2003))。ただし,以上で示したようなモデルでは,後述する重み付き推定の場

合とは異なり,層を通じて効果が一定である,という仮定を置いている。その意味で,重み付き

推定の方が,理論的には,よりロバストであると言われている(例えば Brumbeck at al.(2003))。 さらに,共変量と曝露との関係,及び共変量と反応変数との関係を両方ともモデル化し,どち

らか一方が正しければ,曝露効果が推定できるように工夫された Doubly Robust 推定と呼ばれる

方法も提案されている。比較的,導入しやすそうなモデルとして,通常の回帰モデルに加え,傾

向スコアの逆数や 1-傾向スコアの逆数と関連する量を説明変数として追加するモデルがある。

このために,まず共変量や曝露と結果との関係 ZXYE , を,何らかの関数 ZX , を用いて表

現する。例えば,一般化線型モデルを考えて

ZXhgZXZXYE ,,, 1

などとモデル化する。ただし, g はリンク関数, h は X や Z に関する項の線型結合を定義する関

数であるが,場合によっては交互作用項や高次項なども含まれているかもしれない。一方,共変

量と曝露との関係である傾向スコア ZX 1Pr についても,何らかのモデル Ze を用いて推定

を行う。その上で

Page 79: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

76

Ze

X

Ze

XZXhgZX

1

1,, 21

1

というモデルをあてはめる。そして,推定されたモデル式(関数 h の係数や, 1 及び 2 の推定値)

と各患者 i さんの共変量の値 izZ を用いて,この i さんが曝露を受けた場合と受けなかった場合

の予測値

izZX ,1ˆ ,及び izZX ,0

をともに求める。こうして得られた全員(n人)分の患者の予測値から,算術平均

i

izZXn

,1ˆ1

,及び i

izZXn

,01

を求めると,これがDoubly Robust推定量になっている(Scharfstein et al.(1999),2005 Bang & Robins)。

すなわち,共変量と曝露との関係である傾向スコアの推定に用いたモデル Ze ,もしくは曝露や

共変量と結果との関係に関するモデル ZXh , のどちらか一方が正しければ(そして共変量 Z に

関する情報が交絡を除去するのに十分なだけ得られていれば),上の推定量により,曝露や非曝露

を介入として行った場合の期待値 1XdoYE ,及び 0XdoYE に相当する量が識別でき

る。なお,この方法は回帰モデルを用いた標準化の一種として位置づけることができ,上の方法

は,標準集団を,曝露群と非曝露群を合わせた集団全体とした場合に相当する。例えば, 1 及び 2を,モデル ZXh , の残差と考え期待値を0とすると,モデル ZXh , が正しい場合はモデル Ze

が誤っていても, Ze

X1 および Ze

X

1

12 の期待値は 0 となり,結果的に正しい推定値が得ら

れる。また,モデル Ze が正しい場合はモデル ZXh , が誤っていても,誤りによるバイアスが

Ze および Ze1 の逆数で残差が重み付けられることにより補正されるため,結果的に正しい

推定値が得られる。こうした意味でこの方法は Doubly Robust であるといわれる。

2.6.4.3 マッチング 例えば,マッチングによって傾向スコアの値が似ている被験者を曝露群と非曝露群から 1:1 の比

でサンプリングすると,得られたデータを,あたかも割付比 1:1 でランダム化を行った比較試験

の結果のようにみなすことができる。 このことをみるために,まず集団全体の人数が N 人だったとしよう。この集団全体をみわたし

たときに,傾向スコアの値が ze となる人たちの割合は zePr と表わせるので,その人数は

zeN Pr 人となるだろう。割付比 ze : ze1 で「層別割付」すると,このうち曝露群は

zezeN Pr 人,また非曝露群は zez-eN Pr1 人となるだろう。このとき,曝露群から

も非曝露群からも k 人サンプリングしたとすると,サンプリング確率は曝露群で zezNe

k

Pr,

また非曝露群で zezeN

k

Pr1 となり,サンプリング確率の比は ze

1: ze1

1となる。割

付比 ze : ze1 で「層別割付」して,さらに ze

1: ze1

1という比でサンプリングすれば,

結果的に,割付比 1:1 でランダム化したかのようなデータが得られるだろう。実際,傾向スコア

Page 80: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

77

を用いたマッチングは,こうした「比較可能な」データを得ることを目的として行われる。 ただし,サンプリングする人数 k を,層によらず固定すると,どの層からも同数の患者がサン

プリングされるため,サンプリング後の傾向スコアの分布は,実際の集団全体の分布 zePr と

は異なったものになるかもしれない。このため標準化の観点から得られた結果を解釈することは

できなくなる。一方,曝露群は全員採用して,非曝露群からは,層ごとに曝露群と同じだけの人

数をサンプリングすると(あるいは層ごとに,常に曝露群の 2 倍とかいった具合に定数倍の人数

をサンプリングすると),結果的に,傾向スコアの分布が曝露群のそれと一致することが期待でき

る。したがって,このようなサンプリング方式は,曝露群を標準集団とした標準化の一種として

も位置づけることができよう。 以上のように,傾向スコアを用いたマッチングといっても,実際には様々なヴァリエーション

が考えられ,また採用した方式によって結果の解釈も異なる。さらに,マッチングについても,

層別解析のところで述べたように,本来連続データである傾向スコアをカテゴリー化する際,そ

の不適切さゆえに残差交絡と呼ばれるバイアスが生じる懸念がある。

2.6.4.4 重み付け マッチングの場合とよく似た議論により,個々の患者に対し,曝露群に属する場合は傾向スコア

の逆数を,また非曝露群に属する場合は(1-傾向スコア)の逆数を重みとして与えると,やはり

見かけ上,割付比 1:1 でランダム化を行ったかのようなデータが得られる。

まず,傾向スコアの値が ze となる zeN Pr 人のうち,曝露群に属する zezeN Pr 人に

重み ze

1を与えると,あらたに生成される仮想的な集団の人数(あるいは重みの総和)は

zeNze

zezeN Pr1

Pr となる。これは元の集団全体の中で傾向スコアの値が ze であ

った人の数と同じであるから,この重みを用いると,重み付け後の曝露群の傾向スコアの分布が

元の集団全体のそれと等しくなることがわかる。

また,非曝露群の zez-eN Pr1 人に重み ze1

1を与えると,重み付け後の仮想的な集団

の大きさはやはり zeN Pr となり,ふたたび元の集団全体と同人数で,傾向スコアの分布も元

の集団全体と同じ集団ができる。こうして,曝露群も非曝露群も,元の集団全体と同じ大きさに

膨れ上がり,かつその傾向スコアの分布が,元の集団全体の分布 zePr に揃えられたことにな

る。すなわち,この重み付けは,集団全体を標準集団とした標準化に対応する。

また,上の重みのほかに,曝露群には ze

X 1Pr ,非曝露群には

ze

X

1

0Prという重みを与え

る stabilized weight と呼ばれる重み付けも提案されている。この場合,いま見たように,重みの分

母に相当する部分によって,各群の仮想集団はいったん元の集団全体と同じ大きさまで膨れ上が

る。また,傾向スコアの分布も,この分母によっていったん元の集団のそれに合わせられる。し

かし,さらに分子の部分を掛けることによって,つまり曝露群には曝露群の占める割合 1Pr X

を掛け,非曝露群には非曝露群の占める割合 0Pr X を掛けることで,結果的に集団の大きさ

は元に戻る。ただし,傾向スコアの分布の方は,この分子の影響で変化することはない。という

のは,曝露群と非曝露群とで掛けた数は違うものの,どの層にも同じ定数を掛けるからである。

つまり,この重み付けも集団全体を標準集団とした標準化とみなすことができるが,ただし重み

付け後の仮想集団の人数が元の集団のそれと変わらないため,見かけ上,あたかも元の各群の大

きさの比 1Pr X : 0Pr X でランダム化を行ったかのようなデータが得られることになる。

なお,この重みは,先の例では 1 という定数だった重みの分子の部分を,共変量 Z によらない,

Page 81: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

78

曝露群 X だけの関数 Xg で置き換えた形になっている。このような関数を重みの分子として用

いると,より効率のよい推定ができる可能性があることが知られており,その意味で「安定な

(stabilized)」重みと呼ばれている(Harnan and Robins(2006))。

さらに,曝露群に 1,非曝露群に ze

ze

1という重みを与えることもある。これまでと同様な議

論から,この重みを用いると,傾向スコアの値が ze である層の構成人数が,曝露群は

zezeN Pr のまま,そして非曝露群の方は zezeN Pr となる。つまり,この重み付けに

より,元の曝露群の集団と同じ傾向スコアの分布を持ち,かつその大きさも元の曝露群と同じ,

という集団が 2 つできる。これは,曝露群の方を標準集団とした標準化に相当する重み付けであ

り,この重み付けにより,あたかも曝露群の人たちを対象として(人数は 2 倍集めて)割付比 1:1 のランダム化比較試験を行ったかのようなデータが得られる。 なお,以上では説明を簡単にするため,傾向スコアで定められる層を想定して解説を行ったが,

実際に重み付けを行う際,わざわざ傾向スコアをカテゴリー化する必要はない。被験者ごとに計

算した傾向スコアや(1-傾向スコア)の値を使って重みを構成し,曝露変数と結果変数の関係を

解析する際,この重みを用いればよい。具体的な解析例については 2.6.7.2 節に後述する。 以上のように,傾向スコアの性質を利用し,観察研究から得られたデータを特殊なランダム化

比較試験の結果とみなすことで,層別,回帰,マッチング,重み付けといった様々なアプローチ

で交絡調整を行うことができる。次節では,このような解析が可能となる諸条件を見直しておこ

う。

2.6.5 傾向スコアを用いた解析の前提 以上のように,観察研究から得られたデータを,あたかも特殊なランダム化比較試験から得たデ

ータのようにみなせたのは,ひとえに条件

ZXXZ 1Pr

を仮定しているからである。この条件が満たされていなければ,以上の議論は成立しない。これ

まで傾向スコア zZX 1Pr の値が既知であるかのように論じてきたが,実際はこれを推定

する必要がある。したがって,上述の条件の成否はひとえに傾向スコアの推定の妥当性にかかっ

ていると言えよう。そのためには,以下の条件が満たされていることが重要である。 - 曝露の決定に影響を与える(そして結果にも影響を与える)交絡要因の情報が十分に得られ

ている

- 交絡要因と,曝露との関係 zZX 1Pr を表現するモデルが正しく特定されている

1 つ目の条件は,傾向スコアを用いる・用いないに係わらず,観察研究の結果を用いて,理想

的なランダム化比較試験を行ったとしたらこのような結果が得られたに違いない,と推測する際,

常に必要な条件である。2.2.1.2.3 節で因果グラフを用いて行った議論と結びつけると,この条件

は,本当にすべての交絡要因が観察されていなければならないということではなかった。少なく

とも

z

zZxXzZYxXdoY Pr,PrPr

というような形で,曝露を介入として行った場合に観察されるであろう因果的な効果を,実際に

得られたデータを用いて識別するのに十分なだけの Z に関する情報が得られていることが重要で

あった。要するに Z の値ごとに定義される層ごとに見れば「交絡がない」状態になっているとい

Page 82: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

79

うことであり, 2.2.1.2.4 節で述べたように,この条件は(Z を与えた下での)治療群や曝露群等

の「強い意味での無視可能性」という条件に対応するものとしても解釈できるのだった。

2 つ目の条件は,傾向スコアを推定する際, zezZX 1Pr というような形で,傾向ス

コアを共変量の関数としてモデル化する必要があるが,その際,モデルが不適切だと傾向スコア

の推定値も妥当性を欠くことになる,という問題点を示したものである。 このことを,再び 2.2.1.2.3 節の議論と結びつけると,上の 2 つ目の条件も成立する場合,上式

は,さらに

ze

ze

z zz

z

zezexXY

zexX

xXzeY

zZxX

xXzZY

zZxXzZYxXdoY

Pr,Pr

Pr

,,Pr

Pr

,,Pr

Pr,PrPr

       

       

       

と変形できる(記号 z については 2.6.3 節の脚注参照)。 後の式は,Z の値そのものではなく,

傾向スコアの値 ze を使って層別しても,層ごとの曝露と結果の関係を通じて,曝露を介入とし

て行った場合の効果が識別できることを示している。このため,Z の値そのもので細かく層別,

もしくは調整する必要はなく,傾向スコアという 1 次元の,もっと粗い量で調整すれば十分なの

であった。

また, 後から 2 番目の式に注目すると,まず分母は, 1X の場合は zezeX 1Pr と

傾向スコアそのものであり, 0X の場合は zezeXzeX 11Pr10Pr と(1-

傾向スコア),すなわち曝露を受けない確率になっている。また,分子は,傾向スコアの値ごとに

層別された層ごとの曝露 X と結果 Y の同時分布を示している。したがって,この式は,傾向スコ

アの値ごとに層別されたデータを,曝露群については傾向スコアの逆数で,また非曝露群につい

ては(1-傾向スコア)の逆数で重み付ければ,あとはただデータを併合するだけで,曝露を介入

として行った場合の効果を知ることができることを示している。 なお,これらの条件の成否を,実際に得られたデータから直接確認する事は不可能である。と

いうのは,交絡要因がすべて観察され,利用可能な状態でデータに含まれているとは限らないし,

そもそも何が交絡要因なのか,計画時には明確でない場合も少なくない。また,曝露の受けやす

さ,あるいは主治医による薬剤選択の確率を,どのようにモデル化するのが適切か不明確な場合

もあるだろう。とはいえ,これらの条件に対する間接的なチェック方法として,以下が提案され

ている(星野,繁枡(2004))。

(1) 傾向スコア算出に用いたモデルの擬似決定係数(pseudo-R2)や c-統計量(0.8 以上が良いと

される)などでモデルのフィットを確認する。 (2) 傾向スコアで層別あるいはマッチングした各層において,もとの共変量の分布が群間で等し

いことを確認する。 なお,2.3.3 節でも述べたように,傾向スコアの推定においても,統計的な基準のみに基づく機

械的な変数選択は避けた方が賢明である。ある方法で計算した p 値が大きいからといって交絡要

因でないという保証にはならないし,逆に p 値が小さいから常に交絡要因だというわけでもない。

したがって,この場合も,推定精度を多少犠牲にしても,バイアスの混入を避ける意味で,疑わ

Page 83: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

80

しい要因はなるべくモデルに含める,といったアプローチが現実的かもしれない。

2.6.6 傾向スコアの推定

次に,傾向スコアの算出法について述べる。ここで,対象者 i の曝露の有無を iX で,また共変量

を iZ (列ベクトル)で表わす。この iZ の中には,交絡要因の候補が単変数として含まれているだ

けでなく,それらの交互作用項や,また量的変数なら 1 次の項だけでなくその関数項も含まれて

いるかもしれない。 傾向スコアの推定には,ロジスティックモデル

i

T

iii

iiiiii z

zZX

zZXzZX

|1Pr1

|1Prlog|1Prlogit

を用いるのが標準的である。ただし, は回帰係数を表す列ベクトルであり,上のモデルをあて

はめることにより, 尤推定値̂ を求め,対象者 i の傾向スコア iiii zZXze |1Pr の推

定値 i

Ti

T

z

z

ˆexp1

ˆexp

を求める。

傾向スコアの算出法のための SAS プログラムの例を示す Dataset : data pscore; input treatment covz1 covz2 ... covzN ; cards; 0 1 38 ... 1 0 0 55 ... 0 1 1 38 ... 1 0 0 48 ... 1 1 1 40 ... 0

… 0 1 28 ... 0 0 0 64 ... 1

; run; proc logistic data=pscore descending ;

class covz1 ... covzN; model treatment = covz1 covz2 ... covzN ; output out = pdata prob = propens ;

run ; ここで treatment: 曝露変数で曝露=1,非曝露=0 となる 2 値変数 sex age: covz1,covz2 ... convzN は性別,年齢等の共変量を表す変数 pdata: 出力データセット名で,このデータセット の 変数 propens に対象者 i の傾向スコアが

入る

Page 84: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

81

2.6.7 傾向スコアを用いた解析の事例 この節では,傾向スコアによるマッチングを用いた事例と,重み付き解析の事例を紹介する。

2.6.7.1 傾向スコアを使ったマッチングによるコホートの選択 傾向スコアを使ったマッチングによって,2,799 人ずつのコホートを選択して,リハビリテーショ

ンの有無と地域社会への復帰率(community discharge rate)や生存率の関係を調査した,後ろ向き

コホート研究の例を示す(Murray et al. (2003) )。 表 2.6.1 老人ホーム入居後 1 週間時点での患者特性(左:マッチング前,右:マッチング後)Murray et al.

(2003) より

Characteristic RehabilitationNo Rehabilitation

Standardized Difference1) Rehabilitation

No Rehabilitation

Standardized Difference1)

n 6412 4738 2799 2799

Age ± SD(y) 78.1 ± 11.6 77.8 ± 13.3 1.88 77.5 ± 12.3 77.4 ± 13.0 -2.1

Sex(% female) 67 63 7.48 63 64 -2.75

Race(%white) 90 88 5.35 88 89 -1.7

Average therapy ± SD(h/wk) 6.8 ± 5.1 0.016 ± 0.09 NA 6.0 ± 5.0 0.02 ± 0.1 NA

BMI ± SD(kg/m2) 24.4 ± 6.3 23.6 ± 5.9 13.5 23.8 ± 6.4 23.8 ± 6.2 0.4

Motor ADL2) score ± SD 53.8 ± 18.6 56.1 ± 22.5 -11.7 52.7 ± 21.0 53.1 ± 21.8 -1.76

Cognitive ADL 2) score ± SD 79.8 ± 22.9 71.2 ± 25.0 36.0 74.5 ± 24.7 74.7 ± 24.7 -0.8

Lived alone(%) 41 33 15.3 36 36 0.74

Daily contact with relatives(%) 83 76 17.7 80 79 0.98

Bladder continent3) score ± SD 4.0 ± 2.5 3.8 ± 2.6 8.67 3.6 ± 2.6 3.6 ± 2.6 -0.04

Bowel continent3) score ± SD 5.2 ± 1.8 5.0 ± 1.9 10.6 4.92 ± 1.9 4.93 ± 1.9 -0.69

Atherosclerotic heart disease(%) 15 15 0.4 16 16 0.68

Diabetes(%) 24 20 9.48 23 22 2.55

Depression(%) 15 15 0.7 16 16 0.00

Bedfast(%) 8 13 -18.4 12 12 0.76

Possesses a cane(%) 54 29 52.1 36 37 -2.23

Possesses a wheelchair(%) 30 17 30.8 23 23 -0.08

Recent ADL decline(%) 67 43 49.8 53 54 -1.50

Dementia(%) 19 36 -38.2 26 27 -1.05

Dysphagia(%) 30 27 6.5 31 31 1.16

Special medical4)(%) 13 14 -2.3 16 15 1.38

Falls in last year(%) 42 29 27.5 33 33 -0.68 Abbreviations:NA,variables not included in the propensity model;SD,standard deviation

1)Standardized difference=100(XR-XNR)/(SR2+SNR

2)1/2, where XR and XNR are sample means in the rehabilitation and no-rehabilitation groups,and SR2 and SNR

2 are the variances.

2)Motor ADL score and cognitive ADL score are calculations of the motor and cognitive components FIM instrument the MDS+39 and placed on a 0 to 100 scale.

3) Bladder and bowel scores range from 1 to 7,with 7 representing complete continence.

4) Special medical includes chemotherapy,rafiation therapy,dialysis,transfusions,and suctioning.

傾向スコアのロジスティックモデルによる推定にはリハビリテーションの決定の要因と考えら

れる 112 の共変量を用いた。リハビリテーションありの症例群(曝露群)の症例を傾向スコアの

大きい順に並べ,リハビリテーションなしの症例群(非曝露群)から傾向スコアの値が も近い

者を選び 1:1 でマッチさせた。値の近さの許容範囲は 0.02 とし,この範囲で相手が見つからな

い場合にはマッチは行わなかった。この手続きを全てのリハビリテーションありの症例に対して

行った。下表は,傾向スコアによるマッチング前後の患者特性を比較したものである。傾向スコ

アの値によってはマッチの相手が見つからない場合があるため,症例数は両群で等しく(2,799 例)

Page 85: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

82

なるが,症例数はマッチング前の例数より少なくなる。 群間の患者特性の分布を比較する際の指標としては,標準化された群間差(standardized

difference:表脚注参照)の値が用いられており,検定による群間比較は行っていないことに注意

したい。傾向スコアによるマッチングにより,ほとんどの患者特性に関して群間差の絶対値が小

さくなり,曝露群と非曝露群の患者特性の分布がより類似したものとなった事がわかる。なお,

傾向スコアの推定モデルのフィットの指標である c-統計量は 0.82 であった。 なお,主要な解析は傾向スコアと他の重要な共変量で調整した回帰モデルに基づく方法で行わ

れ,傾向スコアによるマッチトペアの解析は副次的に行われたが,いずれの方法によっても,リ

ハビリテーションが地域社会への復帰率を増加させるという同様の結果が得られた。

2.6.7.2 傾向スコアによる重み付け解析 Sato, T. and Matsuyama, Y. (2003) は,傾向スコアを利用した重み付け解析について論じている。

各群を

治療(曝露)群 :)|1Pr(

1

iii zZX ,対照(非曝露)群:

)|1Pr(1

1

iii zZX

で重み付けた解析は IPTW(Inverse Probability Treatment Weight)法として知られており,既に 2.6.3節でみたように,あたかも集団全体を 1:1 の比でランダム化したかのようなデータが得られる。

標準化の観点からは,これは,集団全体を標準集団とした場合の標準化に相当する。また,重み

付け後の仮想的な集団の大きさは,治療(曝露)群でも対照(非曝露)群でも,元の集団全体の

大きさと等しくなるため,見かけ上の人数は,元の集団全体の人数の倍になる。 一方,各群を

治療(曝露)群 : 1)|1Pr(

)|1Pr(

iii

iii

zZX

zZX,対照(非曝露)群:

)|1Pr(1

)|1Pr(

iii

iii

zZX

zZX

で重み付けた場合には,治療(曝露)群については共変量の分布が不変に保たれ,一方,対照(非

曝露)群については,共変量の分布を治療(曝露)群の分布にあわせることになるので,結果的

に,治療(曝露)群に属する患者を 1:1 の比でランダム化したかのようなデータが得られる。標

準化の観点からは,これは,治療(曝露)群を標準集団とした標準化(リスク比の場合は SMR:Standard Mortality/Morbidity Ratio(標準化死亡/罹患率))に相当する。なお,重み付け後の仮想的

な集団の大きさは,治療(曝露)群でも対照(非曝露)群でも,元の治療(曝露)群の大きさと

等しくなるため,見かけ上の人数は,元の治療(曝露)群の人数の倍になる。 上記論文のうちのリスク比に関する解析結果を下記に示す。表 2.6.2 のデータはタモキシフェン

服用(TAM)と乳癌の再発(RECUR)の関連性をリンパ節転移の有無(LYM)で層別した結果で

ある(いずれも,有りの場合 1,無しの場合 0 となる 2 値変数)。調整を行わない本表の粗リスク

比は 1.01 であるが,表 2.6.3 で示した重み付けの手順に従うと,標準集団をグループ全体とした

場合のリスク比は 0.83(表 2.6.4),標準集団を治療群(曝露群)とした場合のリスク比は 0.85(表

2.6.5,標準化罹患/死亡率に相当)であり,表 2.6.2 の 1.01 と異なる値になる。 なお,同論文には,重み算出のための SAS プログラムが掲載されている。

Page 86: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

83

表 2.6.2 タモキシフェンの服用と乳癌の再発の関連性 (左:全体,右:リンパ節転移の有無 [LYM] 別)

Crude Data LYM=1 LYM=0

TAM=1 TAM=0 TAM=1 TAM=0 TAM=1 TAM=0

RECUR=1 464 424 368 253 96 171

Total no. 2549 2352 1215 760 1334 1592

Risk ratio 1.01 0.91 0.67

表 2.6.3 IPTW 法による重み付け(wT)と SMR による重み付け(wE)

LYM TAM RECURObserved

No. P(E | Z) wT Pseudo No.

Total wE Pseudo No.

Exposed

1 1 1 368 0.615 1.63 598.2 1 368

1 1 0 847 0.615 1.63 1376.8 1 847

1 0 1 253 0.385 2.60 657.5 1.60 404.5

1 0 0 507 0.385 2.60 1317.5 1.60 810.5

0 1 1 96 0.456 2.19 210.6 1 96

0 1 0 1238 0.456 2.19 2715.4 1 1238

0 0 1 171 0.544 1.84 314.3 0.84 143.3

0 0 0 1421 0.544 1.84 2611.7 0.84 1190.7 具体的な重み付けの値の計算は下記の通り行う。

wT : 615.01)1|1Pr(163.1 LYMTAM , )615.01(1))1|1Pr(1(160.2 LYMTAM ,

456.01)0|1Pr(119.2 LYMTAM , )04561(1))0|1Pr(1(184.1 LYMTAM

wE : 615.0615.0)1|1Pr()1|1Pr(1 LYMTAMLYMTAM ,

)615.01(615.0))1|1Pr(1()1|1Pr(60.1 LYMTAMLYMTAM ,

456.0456.0)0|1Pr()0|1Pr(1 LYMTAMLYMTAM ,

)456.01(45.0))0|1Pr(1()0|1Pr(84.0 LYMTAMLYMTAM

表 2.6.4 IPTW 法の重み付けにより構成された全体の擬似集団

TAM=1 TAM=0

RECUR=1 808.8 971.8

No. of women 4901 4901

Crude risk ratio=0.83

例:808.8=598.2+210.6(表 2.6: 3 より) 表 2.6.5 SMR の重み付けにより構成された全体の擬似集団

TAM=1 TAM=0

RECUR=1 464 547.8

No. of women 2549 2549

Crude risk ratio=0.85

例:547.8=404.5+143.3(表 2.6.4-3 より) 表 2.6: 2 ~表 2.6: 5:Sato, T. and Matsuyama, Y. (2003) より。

Page 87: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

84

2.6.7.3 既存の調整法との関係 交絡因子の既存の調整法である,層別解析による方法と回帰モデルによる方法について考える。

交絡の模式図を図 2.6.1 に示す。層別解析による交絡の調整とは,共変量の組でデータを層別する,

すなわち共変量に関して均一なサブグループを作成することであり矢線①を取り除くことに相当

する。回帰モデルによる交絡の調整とは,共変量の効果を統計モデルにより考慮することであり

矢線②を取り除くことに相当する(松山(2003))。すなわち,①の矢線が取り除かれると治療法

と結果の関係を共変量の影響を考えずに直接考察する事が出来る。また,②の矢線が取り除かれ

ると,共変量の影響を一定に保った状態で治療法と結果の関係を直接考察する事が出来る。

① ②

治療法 結果

性別年齢

コレステロール…

図 2.6.1 交絡の模式図(松山 (2003)より)

傾向スコアによる調整方法は,2.6.2 節で述べたとおり,層別解析の拡張として考えることがで

きる。 Rothman, et al. (2008,p449-451) は,傾向スコアによる方法と回帰モデルによる調整法をそれぞ

れ Exposure Modeling(曝露に対する共変量の影響をモデル化),Outcome Modeling(結果に対する

曝露と共変量の影響をモデル化)と分類しているが,測定の誤差やモデルの誤特定など交絡因子

を不適切に取り扱った場合はいずれの方法を用いてもバイアスをもたらす事を述べている。 いずれの方法を用いる事が適切かについては,研究の背景の知識なしには判定できないとし,

以下のような例を挙げている。

例えば,複数の栄養素の摂取と肺癌の関係に関する試験において,栄養素の摂取(曝露)

についてモデル化する方が,肺癌のリスクをモデル化するより簡単だとか正確だとかいう

ことは疑わしい。しかも,調べたい栄養素すべてに対して,あらたな Exposure Model が必

要だとなると,Exposure Modeling の方がより多くの労力を要するだろう。一方,逆の例と

して,ある医療処置や薬剤処方と生存との関係に焦点をあてた試験では,どのような人が

試験期間中に生存するかを正確にモデル化するよりも,どのような人がその処置や処方を

受けるかをモデル化する方が,われわれにとってはずっと容易かもしれない。 つまり,結果に対する曝露と共変量の影響を正確にモデル化することと,曝露に対する共変量

の影響をモデル化することと,相対的にどちらが容易か,という判断はわれわれの知識に依存す

る。これは薬剤疫学研究についても同様であり,上の例でも示唆されているように,たいていの

場合,薬剤の使用や共変量が結果に与える影響をモデル化するよりは,どのような場合にその薬

剤が使用される可能性が高いか,を経験的な事実等に基づきモデル化する方が簡単かもしれない。

薬剤疫学研究において傾向スコアが積極的に活用されていることの背景には,こうした事情もあ

るかもしれない。 また,モデルが正確だったとしても,2 つのアプローチは異なるパラメータを推定する為,同

じ結果をもたらすわけではないとも述べている。さらに,傾向スコアによる解析と回帰モデルに

よる解析のいずれかを選択するのではなく,Exposure Modeling と Outcome Modeling を結合する

Page 88: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

85

Doubly Robust 推定を紹介している。これは,2.6.4.2 節で簡単に触れたように,共変量と曝露との

関係,あるいは共変量や曝露と結果との関係の,いずれかのモデル化が正しければ,因果関係に

関する妥当な推定を行う事が出来るという方法であった(Scharfstein et al.(1999)など)。

2.6.8 傾向スコアとケース・コントロール研究 ところで,傾向スコアの理論はリスク集団からランダムサンプリングされているコホートを対象

とした前向きなコホート研究を想定して導かれているため,傾向スコアをケース・コントロール

研究のような後ろ向き研究から推定する場合は注意が必要である。ケース・コントロール研究に

おいては,ケースとコントロールのサンプリング確率が一般に大きく異なり(ケースの方が高い

確率でサンプリングされる),かつサンプリング確率が未知であることが多い。このため実際には

割合が小さいはずのケースの情報の重みが相対的に大きくなり,コホート全体のデータを用いて

傾向スコアを推定した値とは異なる結果が得られる可能性が高い。このため,ケース・コントロ

ール研究に対して傾向スコアを用いようとすると,様々な形でバイアスが生じることが知られて

いる(Mansson, R., Joffe, M. M., et.al. (2007))。

2.6.9 傾向スコアの活用上の留意点 傾向スコアは交絡調整のための有用な方法である。ただし,その利用に当たっては下記のような

注意が必要である。 十分多くの交絡要因を測定し傾向スコアを推定することが条件となる。 観察された共変量のみを調整している。ランダム化研究では未知の要因の影響も平均的に

は排除できる。 傾向スコアを推定するためのモデルの妥当性の検討。 共変量が欠測だと傾向スコアを求めることが出来ない。 比較群間で傾向スコアの重なりがある程度必要。

後の点については,あまり触れることがなかったが,以上の議論では,暗黙のうちに,曝露

群と非曝露群の傾向スコアの分布に,ある程度の重なりがあることを前提としていた。仮に,両

者の分布がまったくかけ離れていて,まったく重なりがないという場合,それは何を意味するの

だろうか。これは,傾向スコアで特徴づけられるような集団が,同時に曝露群にも非曝露群にも

属する可能性は極めて低いということだから,薬剤疫学研究の場合なら,どのような患者がどの

ような薬剤を用いるかという治療方針が既に定まっていて,それに例外はない,といった状況を

意味するだろう。もちろん,このような場合にあらためて薬剤疫学研究を行う意義はないだろう

から,その意味では非現実的な想定である。とはいえ,傾向スコアの分布をみたとき,特に曝露

群で極端に値が高い,あるいは非曝露群で極端に値が低い患者については,慎重な検討が必要か

もしれない。マッチングを行えばこれらの患者は自動的に除外されるだろうし,層別解析を行っ

た場合にも,これらの患者は結果的に推定に貢献しないかもしれない。また,重み付き解析や回

帰分析では,これらの患者を含めた場合と除いた場合とで,結果が異なるかもしれない。 今日のように大規模データベースが利用できる環境では,多くの交絡因子の情報が入手しやす

くなるため,傾向スコアを利用する機会は今後も増えていくと思われる。しかしながら,その利

用が本格化したのは比較的 近であるため,回帰など他の伝統的な方法との比較検討を含め,何

らかの感度解析を併用することが当面は必要と思われる。 【参考文献】 Brumback B, Greenlad S, Redman M, Kivat N, Diehr P. The Intensity-Score Approach to Adjusting for

Confounding. Biometrics 2003; 59: 274-285. Hernan MA, Diaz SH, Robins JM. A Structural Approach to Selection Bias. Epidemiology 2004; 15(5):

615-625.

Page 89: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

86

Mansson R, Joffe MM, Sun W, Hennessy S. On the estimation and Use of Propensity Scores on Case-Control and Case-Cohort Studies. American Journal of Epidemiology 2007; 166: 332-339.

Murray PK, Singer M, Dawson NV, Thomas C.L. Outcomes of Rehabilitation Services for Nursing Home Residents. Archives of Physical Medicine and Rehabilitation 2003; 84: 1129-1136.

Robins JM and Mark SD. Estimating Exposure Effects by Modeling the Expectation of Exposure Conditional on Confounders. Biometrics 1992; 48: 479-495.

Rosenbaum PR and Rubin DB. The central role of the propensity score in observational studies for causal effects. Biometrika 1983; 70: 41-55.

Rosenbaum PR. From association to causation in observational studies: The role of tests of strongly ignorable treatment assignment. Journal of American Statistical Association 1984; 79: 41-48.

Greenland S. Chapter 21 Introduction to regression modeling. In: Rothman KJ, Greenland S., Lash TL. Modern Epidemiology. Third edition. Lippincott Williams & Wilkins, 2008.

Sato T. and Matsuyama Y. Marginal Structural Models as a Tool for Standardization. Epidemiology 2003; 14(6): 680-686.

Scharfstein DO, Rotnitsky A, Robins JM. Adjusting for nonignorable drop-out using semiparametric nonresponse models. Journal of American Statistical Association 1999; 94: 1096-1120.

佐藤俊哉, 松山裕. 疫学・臨床研究における因果推論. In: 甘利俊一,他編. 多変量解析の展開. 岩波書店, 2002: 131-176.

星野崇宏, 繁枡算男. 傾向スコア解析法による因果効果の推定と調査データの調整について. 行動計量学 2004; 31: 43-61.

松山裕. Propensity Score を用いた交絡調整. 2003年度統計関連学会連合大会チュートリアルセ

ミナー資料, 2003. 宮川雅巳. 統計的因果推論. 朝倉書店, 2004.

Page 90: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

87

2.7 サンプルサイズ 観察研究であっても,推定値が十分に推定できるだけの試験規模があり,目的とする結果が得ら

れることは重要なことであり,試験規模の見積もりは必要となる。リスクを指標とする場合は観

察研究でも,無作為化試験に使われる通常の例数設計公式が使われる。

2

01

2

001112/

)(

/)1()1()1()/11(

PP

rPPPPZPPrZn

ここで n: コホート研究の場合は曝露群の患者数,ケースコントロール研究の場合はケースの患者

数 Zα/2: αでの棄却限界値(両側) Z1-β: βの棄却限界値 r: コホート研究の場合は曝露群と非曝露群の患者数の比,ケースコントロール研究の場合

はケースとコントロールの患者数の比 P1: コホート研究の場合は曝露群の発現割合,ケースコントロール研究の場合はケースで曝

露された人の割合 P0: コホート研究の場合は非曝露群の発現割合,ケースコントロール研究の場合はコントロ

ールで曝露された人の割合

P : r

rPP

101 ,P1と P0の重み付け平均

次に発生率については

2

2

12/

)1/()1/(

)1/()1/(

rrrIRrIR

rIRrIRZrrZn

ここで, IR: 検出したい曝露群と非曝露群のリスク比 コホート研究

例えば,ある薬剤投薬が心筋梗塞の発現と関連があるかどうかを検討するために,コホート研究

を立案したときに。基準治療との発現割合の相対比を RR=0.80 と見積もって,基準治療での発現

割合を P0=5.0%,その薬剤と基準薬のコホートの大きさの比を r=3,α=0.05 両側,検出力 90%と

したときに。 P1=P0RR なので P1=0.05×0.80=0.04

0475.031

05.0304.0

P

5.081,6

)05.004.0(

0.05)/3-0.05(10.04)-0.04(11.2816)0475.01(0475.0)3/11(96.12

2

n

となる。この結果,曝露群として約 6,100 例,非曝露群として 18,300 例程度の試験規模を見積も

る。

Page 91: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

88

また,ランダム化試験と違って観察研究の場合薬剤群を割り付けないので,開いたコホート研究

の場合,曝露群と非曝露群の比を事前に決めることは出来ない。そのため過去の市販状況などか

ら非曝露/曝露比を見積もる。どうしても見積もれなければ,公式から明らかのように r=1 のとき

が曝露群の観察数が 大となるので,いずれか少ないほうの群が,r=1 としたときの例数 9,000 例

を超えるまでコホートの登録を続けるという方法をとることも現実的である。

ケースコントロール研究

発現割合のオッズ比を OR=1.8 と見積もり,コントロールの曝露割合を P0=25%,ケースとコント

ロールの比を r=2,α=0.05 両側,検出力 90%としてケースコントロール研究を立案すると

)1(1 0

01

ORP

ORPP なので

375.0)18.1(25.01

8.125.01

P

29166.021

25.02375.0

P

2.213

)25.0375.0(

0.25)/2-0.25(10.375)-0.375(11.2816)29166.01(29166.0)2/11(96.12

2

n

となる。この結果,ケースとして約 220 例,コントロールとして 440 例程度の試験規模を見積も

る。 ケースコントロール研究の場合,コントロールを確保することは比較的簡単に出来るので,ケー

スとコントロールの比の r を 5 倍や 10 倍に取ることも可能である。しかし例数設定の公式からも

明らかなように,ケースとコントロールの比は 5 倍ぐらいで検出力は頭打ちになるので(図 2.7.1),コントロールの数を 5 倍以上増やしても検出力としては寄与しない。

r 曝露群の例数 総例数

1 9,029 18,058 2 6,820 20,459 3 6,081 24,326 4 5,712 28,560 5 5,490 32,941 6 5,342 37,395 7 5,236 41,891 8 5,157 46,413 9 5,095 50,953

Page 92: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

89

図 2.7.1 P0=0.5,P1=0.6,ケース 300 例のときのケースとコントロールの比 rと検出力 多くの観察研究の場合初めから実施可能な試験規模が決まっている場合もある。その場合には,

検出力を(例えば,60%,80%,90%,95%)かえていったときの 小検出差を見積もる。あるい

は 小検出差を(例えばオッズ比を 1.5,2.0,3.0,5.0)かえていったときの検出力を見積もるこ

とも意味がある。 またコホート研究の場合は,試験期間中の打ち切りや,脱落が多ければ必要なだけの Event 数を

確保できなくなることがある。脱落率が高いようであれば,脱落率を加味した観察例数を想定す

る必要がある。例えば,死亡などによる脱落が年齢層や性別と関係すると想定されるのであれば,

それらの層毎の Event 発生数を個別に見積もって,それらの合計を期待 Event 数とし, 初の例数

で割って P0を推定する方法もある。 観察研究の解析では交絡の調整を行う。またケースコントロールではマッチングによりコントロ

ールを選択することも多いい。交絡の調整やマッチングを行った場合,患者数は上記の式で求め

たほど必要はない。そのためそれらの調整解析に対応した層別による例数設計を行うことも可能

であるが,実際的にはそれに必要な全ての情報を見積もることは難しい。例えば,マッチングを

行う場合には,ケースとコントロールの比およびケースとコントロールにおける曝露状況の一致

のペア(concordant pair)と不一致のペア(discordant pair)の比の推定が必要であり現実的にはそ

れらの正確な見積もりは難しい。そのため,不正確な見積もりにもとづいて検出力を落とすより

は,保守的な観察例数を選択するほうが賢明な選択となる場合が多いい。また,交絡要因の影響

が相当強い状況(オッズ比にして 5 以上)でない限り,実際にはほとんど検出力に影響しないの

で,よほどのことがない限りその必要性はない。 【参考文献】 Kelsey JL, Whittemore AS, Evans AS, Thompson WD. Chapter 12 Methods of sampling and

estimation of sample size. In: Method in observational epidemiology. Oxford, 1996. Gail MH, Benichou J. Sample size for epidemiologic studies. In: Encyclopedia of epidemiologic

methods. Wiley, 2000.

Page 93: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

90

2.8 競合リスク 対象を経時的に観察し,注目している事象が発生するまでの時間あるいは経時的な累積発生割合

を推定する生存時間解析において,注目する事象以外の原因(競合リスク,competing risk)での

観察の打ち切りがおこり,しばしば解析上深刻な問題を引き起こす。多くの場合,競合リスクに

よる打ち切りが試験の対象としている治療法の比較とは無関係に独立に起こると仮定して解析を

実施するが,データからこの独立性の仮定は確認できない。生存時間関数の推定には Kaplan-Meier推定量が良く用いられるが,競合リスクが存在する場合 Kaplan-Meier 推定量にはバイアスが入る

ことが知られている。たとえ独立性を仮定できたとしてもその解釈には問題があることが指摘さ

れている。 近は,競合リスクの独立性を仮定しない解析法が提案されている。 1つのイベントに対して複数の原因や現象などで分類し,1つの原因(事象)が観察されれば他

の原因(事象)は観察できない場合がある。そのときある原因(事象)は他の原因(事象)とリ

スクを競合し,競合リスクイベントと呼ばれる。 例えば降圧剤の心筋梗塞の予防試験において,心筋梗塞の発生または心血管病死をエンドポイン

トとしたとする。心筋梗塞の発生により試験を中止した患者は,その後の心血管病死を観察する

ことができず,逆に心血管病死により試験を中止した患者は,その後の心筋梗塞の発生を観察す

ることができない。つまり心筋梗塞の発生は心血管病死の競合リスクイベントであり,逆もまた

競合リスクイベントである。このような場合は,独立性の仮定は成り立たないので,通常,心筋

梗塞の発生あるいは心血管病死の複合エンドポイントとするが,心筋梗塞の発生の生存時間関数

を推定することはできない。また,ある重篤な有害事象が発生して観察が打ち切られたとすると,

この有害事象の発現は複合エンドポイントの競合リスクイベントとなる。この有害事象が特定の

薬剤の投薬と関連していて独立性の仮定が成り立たなければ,複合イベントの生存時間関数の推

定はバイアスを含むことになる。 【参考文献】 西川正子. 生存時間解析における競合危険モデル入門. 2007 年度 統計関連学会連合大会チュ

ートリアルセッション, 2007.

Page 94: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

91

3. 薬剤疫学研究のプロトコール

3.1 全体の構成 疫学研究の研究実施計画書は一般的に、要旨(サマリー)、研究実施計画書骨子(コア・プロトコ

ール)、研究実施計画書(フル・プロトコール)からなるパッケージである。まず研究の大枠を示

して予算確保などの合意を得た上で(要旨)、研究の全体像を把握できるような計画を策定し(研

究実施計画書骨子)さらに合意を得た上で、 後に実際のオペレーションまで含めた研究計画の

詳細を記載する(研究実施計画書)。このため、全体としては同じ内容を異なる粒度で繰り返し記

載することとなる。 例えば PMS として研究調査を行う場合に当局に提出する「実施計画書」を考えてみると、記載す

る内容の粒度は骨子レベルの内容で十分であろう。逆に、協力医療機関に実際のデータフローや

サンプル送付について説明する際や、論文執筆を念頭に置いた場合には、研究の詳細まで記載し

た研究実施計画書が必要となるはずである(協力医療機関には、科学的論拠より実際のオペレー

ションに特化した、「データハンドリングガイドライン」を別に準備するのも良い)。 ここでは記載すべき内容の説明について重複を避けるため、もっとも詳細な研究実施計画書のみ

を示し、要旨・骨子にも含めるべき内容は、項目ごとに「要旨」「骨子」と示す。 また,これはあくまでも一例であり,各社の状況において適切に変更されるべきである。

3.2 表紙 製薬企業が関わる疫学研究には、いくつかの形が存在するだろう。たとえば、製造販売後調査と

して行われるもの、Outcomes Study として承認申請を目的とせずに行われるもの(Clinical Outcomes Study として GCP 下で治験の一環として行われるものを除く)医師主導型研究

(Investigator-Initiated Studies Program, IISP)の形をとるものなどである。それぞれの研究において、

責任者(スポンサー)、データ収集とデータマネジメント、統計解析、論文執筆と発表などの担当

をプロトコールに明示する。別に契約書を作成する場合には、その旨、契約書に記載し、調査協

力者から署名捺印をもらってもよい。 <表紙に記載する一文の例>

当研究のために収集された情報およびその解析結果は《調査実施者》に帰属する。 調査協力者には調査に協力することで得た情報について、守秘義務が発生する。

<その他表紙に記載する事項>

調査実施者 会社名、連絡先など 調査名 調査のタイトルは、内容を簡潔に、はっきりと表すものとする。タイトルには少なくとも、研究

デザイン、対象、曝露、アウトカムが含まれるようにする。 バージョンおよび日付 内容を更新した場合には、変更箇所をまとめて表紙の後に挿入する。また、それぞれのバージョ

ンの承認日を記載する。 倫理委員会 必要であれば記載する。

Page 95: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

92

3.3 要旨

調査名 調査のタイトルは、内容を簡潔に、はっきりと表すものとする。タイトルには少なくとも、

研究デザイン、対象、曝露、アウトカムが含まれるようにする。

調査の目的 調査の研究目的を記載する

調査の必要性・妥当性 ここではたとえば薬事法に基づいて行うこと(承認条件であることなど)、国民の健康を守

る公衆衛生目的にかなうこと、薬剤の適正使用につながること、など、具体的かつ簡潔に調

査の必要性と妥当性を説明する。

研究デザインのまとめ 研究デザインと全体のタイムラインについて記載する。

対象 研究の対象となる患者集団を特定する。データベース研究の場合には、使用するデータベー

スの特徴(レセプト,診療記録)を記載し,データベース上での定義を記載する。

実施手順

Page 96: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

93

3.4 研究実施計画 実施計画書を,研究実施計画書骨子と研究実施計画書に分けて記載することもできる。骨子にも

含まれるべきものは,括弧付けで骨子として示した。

1. 目的 (骨子) 目的をはっきりと簡潔に書く。必要なら主要目的、副次的目的などに分けて書く。症例数や予

算も考慮し、主要目的が副次的目的達成のために、犠牲にならないように考慮する。

2. 研究の背景 これまでに公表されている学術的根拠について包括的に調査し、まとめる。 アウトカムとした疾患について、これまでにわかっていること、わからないことを述べる。例

えば間質性肺炎をアウトカムとする研究なら、間質性肺炎の定義、疾患の医学的背景と生物学

的メカニズム、背景発生率、薬剤との因果関係、臨床試験での結果、予後、人種差、診断方法、

診断エラー率(特異度、感度、陽性・陰性的中率)、データベース研究における定義の方法とそ

の妥当性など。 この研究で曝露とした薬剤について、これまでにわかっていること、わからないことを述べる。

例えば薬剤 A の投与を曝露とする研究なら、薬剤 A の薬理学的特徴、薬効と適応、臨床試験

での結果と承認の要旨、重要な特定されたリスクと潜在的リスク、薬剤との因果関係、データ

ベース研究における定義の方法とその妥当性など。 臨床研究では研究の論理的根拠は非常に重要視される。研究前に包括的なシステマティックレ

ビューを行い、研究テーマについてすでにわかっていること、および当研究で明らかにするべ

き問を明確にしなければならない。 評価項目(endpoint)の設定根拠について記載する。その項目を測定の妥当性の根拠をガイド

ラインや学会の設定基準、およびデータベースでの予備的な妥当性検討結果などの根拠に基づ

いて記載する。ケース・コントロール研究では評価項目は設定されないため、目的の論理的根

拠を記載する。

3. 研究デザインと実施期間 (骨子)

3.1 研究デザイン 研究デザインと研究期間について記載する。研究期間は安全性の研究の場合には特に重要であ

る。

3.2 研究の限界 可能性のあるバイアス(選択バイアス・情報バイアス)および交絡因子について記載する。ま

た、バイアスの方向(過大評価になるのか、過小評価になるのか)、および特異的かどうかに

ついて記載する。バイアスを避ける方策について考慮・工夫したことしたことと、その上での

研究の限界を記載する。

3.3 研究の中止 前向き研究の場合,研究の中止基準などを定める場合には記載する。

4. 対象(骨子) 研究の対象となる患者集団を特定する。詳細な組入れ・除外基準は「4.1 対象組み入れ基準」に

記載される。データベース研究の場合には、データベースの種類(レセプト,診療記録)も記

載する。 前向きコホート研究の場合 対象者(=コホート)は曝露と疾患によって定義される。製造販売後の調査の場合、曝露は多

くは薬剤となり、疾患はその薬剤の投与理由となる。 疾患のみによって定義されたコホートは疾患登録(例えばがん登録)と呼ぶことができる。疾

Page 97: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

94

患登録の中でコホート研究を行う場合には疾患登録全体と、その中につくるコホートの両方の

定義を記載する。 ケース・コントロール研究の場合 この研究におけるリスク集団の定義を記載する。 ケース(症例)はアウトカム(結果)によって定義される。アウトカムは多くの場合、疾患や

リスクイベントである。ケース・コントロール研究は、疾患がまれである場合に用いられるデ

ザインであるので、ケースは「選択」せず、全例をケースとして登録する場合がほとんどであ

る。方法については疾患の診断方法、アウトカムとする疾患の適応・除外基準は詳細に記載さ

れるべきである。特に、データベース研究では、特定の薬剤の投与、特定の検査の実施などの

組合せで疾患を定義せざるを得ないことが多く、この研究においてアウトカムをどのように定

義したかは、非常に重要である。 一方コントロールは理想的にはリスク集団からランダムにサンプリングされる。もし、ケース

とのマッチングを行う場合にはマッチング条件について記載する。 ケース・コホートおよびネスティッド ケース・コントロール研究の場合 まず、コホートを定義する。普通はデータベース内に設定される。コホートはデータベース全

体に含まれる患者さんの中から疾患、人口学的特長(年齢・性別など)、時期(新薬発売後何

ヶ月目から何ヶ月目までの間に来院し、処方・検査を受けた症例、など)、曝露状況などによっ

て定義する。次にケース(と必要ならコントロール)について、上記のように記載する。

4.1 対象選択基準

4.2 対象除外基準 リスク集団について詳細に記載する。データベース研究の場合には、 ICD-10 など具体的な疾

患コードなどを用いて定義する。 ケース・コントロール研究の場合には、組入れ・除外基準はケースとコントロールで異なるので

それぞれについて記載する。

5. 実施手順 それぞれの手順の詳細を、一つ一つ順を追って記載する。データハンドリングガイドや手順書

が別に準備されるときにはその旨記載する。 実施手順は研究デザインによって異なる。以下には前向きケース・コントロール研究の例を挙

げた。実施手順ははっきりとわかりやすく、また実施可能性を十分に考慮したものでなければ

ならない。実施可能性が不明な場合には、先に妥当性確認のパイロットを実施する必要がある

場合もある。

6. 測定項目 研究の内的妥当性を保障するためには、何をどのように測定するかが極めて重要である。研究

の内的妥当性は、研究で観察しようとしている情報で、実際に得たい結果を得られるというこ

とが保証される場合に担保される。内的妥当性が担保できない研究は行われるべきではない。

曝露、アウトカム、共変量(あれば)のそれぞれについて、測定する項目とその方法、検査の

手順 ケース コントロール

ケースを特定する X

ケースに合わせてコントロールを選ぶ X

ケースとコントロールを登録する X X

曝露情報を調査する X X

・・・

Page 98: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

95

感度や特異度、誤分類、擬陽性・擬陰性の影響について記載する。あらかじめ、検査の妥当性

の確認を行った場合には、その結果について記載する。

6.1 測定項目一覧 (骨子) 曝露、アウトカム、共変量について、測定・評価する項目を列挙する。 データベース研究で

は、プログラムを書く人を想定してスクリーニングの要領で定義する。一般的に複数の条件を

組み合わせた方が、良い推定になるので、その場合にはどの順番でどの条件を適応するかにつ

いても考慮する。

6.2 曝露 例えば薬剤 A の投与を曝露とするなら、○年○月○日から△年△月△日までに薬剤 A(HOT code:XXXXXXX、XXXXXXX)を処方された、など。

6.3 アウトカム 例えばリスクイベント A の発現をアウトカムとするなら、○年○月○日から△年△月△日ま

でに検査 A で XX 以上、ICD-10 XXX.XX が半年以内で初めてコードされ、しかも薬剤 B を投

与されていること、など。

6.4 共変量 調整する共変量について定義もふまえて、具体的に記載する。

7. 安全性 有害事象の評価と記録 医薬品の安全性の研究を主目的とする研究であっても,一般的な安全性情報の取り扱い方法を

ここで記載する。研究が行われる国の法令に従って、安全性の情報は適切に報告されることを

記載する。どのように報告されるかは具体的に記載する。

8. 統計解析 (骨子) 統計解析は具体的で詳細でなければならない。特に、データベースを用いた研究では、データ

ベースの内容を詳細に検討し,対象疾患,評価項目などを定義するコードを記載し、直接プロ

グラムに反映させられることを意識して作成される必要がある。

8.1 解析モデル 解析上の統計的モデルを記載する。

8.2 解析集団 解析集団は、対象と同じでよいが、いくつかの解析集団を予定している場合にはその定義を記

載する。疾患コードで定義する場合は,コード表を列記する。

8.3 解析方法 それぞれのデザインにおける具体的な解析方法を記載する。

8.3.1 有効性の解析 アウトカムに関する解析方法を調整する共変量,調整方法などを含めて具体的に記載する。安

全性を主目的にした研究であっても,主要な解析はここに記載する。

8.3.2 安全性の解析 見出された安全性に関する知見についての報告方法などを記載する。

8.4 例数設定の根拠 具体的に記載する。

9. データマネジメント データソースからデータ解析までのデータの具体的な実施手順について記載する。別にデータ

ハンドリングガイドを準備するときや業務をアウトソースするときにはその旨記載する。

Page 99: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

96

10. 生体学的試料 調査研究で何らかの生体学的試料を用いる場合には、そのサンプリング方法、輸送方法、検査

方法、検査担当会社、廃棄方法、各種規制への対応などを記載する。別に詳細を記載した別冊

を用意する場合には、その旨記載する。

11. 研究の管理と規制条件の詳細

11.1 守秘義務 どの情報についてどのような守秘義務が誰に発生するのかを確認し、記載する。

11.2 規制条件の遵守と監査 臨床試験の倫理指針、疫学調査の倫理指針、GPSP、GCP など、関連規制およびガイドライン

のいずれに従って行うのかを明記する。規制当局その他による監査が行われるなら、その旨記

載する。

11.3 品質管理と品質保証 データベース研究では、データベースそのものの QC/QA に加え、そこからデータを抽出する

過程の QC/QA、データ解析の QC/QA などが必要となる。

11.4 研究内容および結果の公開 研究結果によらず、研究内容(方法や期間を含む)および結果の公開について記載する。収集

した情報およびその解析結果の帰属は調査実施者(スポンサー)となる。発表を予定する場合

には、専門の委員会および責任者を決めておく。委員の責任についても明記する。

11.5 利益相反 研究者,スポンサー等の利益相反について記載する。

12. 文献一覧

13. 付録

対象選択基準,除外基準,暴露,アウトカム,共変量の定義などのコードリストは,付録

にまとめて記載すると本文が読みやすくなる。

3.5 参考資料 国際薬剤疫学会(ISPE)の GPP (Good Pharmacovigilance Practices and Pharmacoepidemiologic Assessment)と FDA の Guidelines for Good Pharmacoepidemiology Practices のプロトコールに関する

記載の対比を次の表にまとめた。

Page 100: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

97

Summary of Pharmacoepidemiology Protocol Development Guideline

ISPE FDA Good Pharmacovigilance Practices and

Pharmacoepidemiologic Assessment Guidelines for Good

Pharmacoepidemiology Practices

Administration Title and version

A descriptive title and version identifier (e.g., date)

Responsible parties

The names, titles, degrees, addresses, and affiliations of all responsible parties, including the principal investigator, co-investigators, and a list of all collaborating primary institutions and other relevant study sites

Sponsor The name and address of each sponsor Abstract An abstract of the protocol Timeline The proposed study tasks, milestones, and timeline

Objective A statement of research objectives, specific aims, and rationale

Clearly specified study objectives

Critical Review

A critical review of the literature to evaluate pertinent information and gaps in knowledge

A critical review of the literature

Methods Synopsis The overall research design, strategy, and reasons

for choosing the proposed study design

Population The population or sample to be studied the population to be studied Definitions Clear operational definitions of health outcomes,

exposures, and other measured risk factors as well as selection criteria and comparison groups

the case definitions to be used

Data source The strategies and data sources for determining exposures, health outcomes, and all other variables relevant to the study objectives, such as potential confounding variables and effect measure modifiers

the data sources to be used (including a rationale for data sources if from outside the U.S.)

Analysis and Data management Study size and statistical power

Projected study size, statistical precision, and the basis for their determination

the projected study size and statistical power calculations

Data collection

Methods used in assembling the study data the methods for data collection, management, and analysis.

Data management

Procedures for data management

Data analysis Methods for data analysis

Page 101: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

98

Others QA & QC A description of quality assurance and quality

control procedures for all phases of the study

Limitations Limitations of the study design, data sources, and analytic methods

Ethics A description of plans for protecting human subjects

Publication A description of plans for disseminating and communicating study results, including the presence or absence of any restrictions on the extent and timing of publication

Resources Resources required to conduct the study references Bibliographic references amendments Dated amendments to the protocol.

【参考文献】 ISPE. Guidelines for Good Pharmacoepidemiology Practices (GPP) Revision 2. 2007

[http://www.pharmacoepi.org/resources/guidelines_08027.cfm (accessed 2010.5.14)]. FDA. Guidance for Industry: Good Pharmacovigilance Practice and Pharmacoepidemiologic

Assessment. March 2005. [http://www.fda.gov/ohrms/dockets/ac/05/briefing/2005-4136b1_02_Good%20Pharmacovigilance%20Practices.pdf (accessed 2010.5.14)]

Page 102: 薬剤疫学研究入門 そのデザインと解析 -製薬企業 … › information › evaluation › publishing_center › ...2 1. 研究仮説と研究デザイン 1.1 薬剤疫学研究の流れ

99

薬剤疫学研究入門 そのデザインと解析

-製薬企業の臨床開発部門で働く生物統計家のために- 資料作成者 タスクフォース 7

鍵村 達夫 日本ベーリンガーインゲルハイム(推進委員兼タスクフォースリーダー)

木村 友美 萬有製薬株式会社

後藤 祐司 鳥居薬品株式会社

小森 哲志 バイエル薬品株式会社

佐々木 紀幸 日本アルコン株式会社

塩境 一仁 第一三共株式会社

竹内 久朗 田辺三菱製薬株式会社

監修

統計・DM 部会 部会長 東宮 秀夫 大日本住友製薬株式会社 同 副部会長 酒井 弘憲 田辺三菱製薬株式会社 同 副部会長 渡橋 靖 第一三共株式会社 同 副部会長 小宮山 靖 ファイザー株式会社

以上の資料作成に当たり、医薬品評価委員会 川口委員長ならびに本資料の査読を実施頂いた 査読担当の諸氏に感謝致します。