医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3...

40
医療統計学 vol.11 木村 朗 オッズ比

Upload: others

Post on 13-Jan-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

医療統計学 vol.11

木村 朗

オッズ比

Page 2: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

オッズ比とは

• オッズ比(Odds Ratio)とは、

オッズ(Odds)の比のこと。

• オッズとは何?

オッズは、ある事象の起きる確率(P)と起きない確率(1-P)の比のこと。

Page 3: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

確率は0%~100%

つまり、0~1の範囲をとる

起きる確率をPとすると、起きない確率は1-P

このときの、P / (1-P)がオッズ。

Page 4: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく
Page 5: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

例)オッズ

• ある事象が起きる確率が50%(0.5)とすると、起きない確率は50%(1-0.5)になる。事象の起きるオッズは、0.5 / (1-0.5) = 1 。

• オッズが1になるということは、事象の起きる確率と起きない確率が同じことを意味する。

Page 6: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

練習問題 オッズ

ある事象が起きる確率が80%(0.8)だったとすると、オッズはいくつになるか?

事象の起きない確率は20%(1-0.8)、

オッズは、0.8 / (1-0.8) = 0.8 / 0.2 = 4

すなわち、オッズは4になり、これは起きる確率は起きない確率の4倍であることを意味する。

Page 7: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

オッズ比

オッズ比は、ある条件におけるオッズ

と別の条件におけるオッズの比のこと。

Page 8: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

例)

• 男性において、事象の起きる確率が50%(0.5)だとすると、起きない確率は50%(1-0.5)。オッズは1(0.5/0.5)。

• 女性において、事象の起きる確率が75%(0.75)だとすると、起きない確率は25%(1-0.75)。オッズは3(0.75/ 0.25)。

• 事象が起きる確率について、男性のオッズが1、女性のオッズが3です。このときの比がオッズ比になります。つまり、男性に対して女性のオッズは3倍になるということで、「女性のほうが男性に対して3倍事象が起きやすい」といえます。

Page 9: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

練習

•男性において、事象の起きる確率が30%(0.3)であった。

•女性において、事象の起きる確率が45%(0.45)であった。

この事象について、女性が男性より生じ易い程度について、オッズ比を求めて、その程度を示して下さい。

Page 10: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

オッズ比は医療データの解析においてよく利用される! このオッズは、2×2分割表(クロス集計表)における解析や、ロジスティック回帰分析において計算しますが、例えば、医療データ解析においてよく利用され、「喫煙者は非喫煙者に対して、ある疾病のリスクが○○倍になる」などのような解釈に使われたりする。

Page 11: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

注意!オッズ比とリスク比!! • オッズ比は死亡生存のように2値変数のアウトカムと研究要因の相関の強さを示すMeasure of Associationです。

• 例えばタバコを吸うと心筋梗塞のリスクが50%で吸わない人はその半分の25%だとします。

• リスク比は50%割る25%で2となり、タバコを吸うとリスクが2倍になるといえます。

• この場合のオッズ比は3となり、オッズ比から結果を論じると、喫煙で心筋梗塞のリスクが3倍になったという間違った結果を導いてしまいます。

• 臨床研究では2値変数のアウトカムではオッズ比を用いることが多く、リスク比を使うことは珍しいのです。

• 2値変数のアウトカムの解析に必ずと言っていいほど使われるロジスティック回帰モデルは結果はオッズ比を用いて表します。

Page 12: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

• リスク比をオッズ比に変えるにはコントロール群(暴露のない群)でのイベント率が必要です。

• たとえばそのイベント率が1%と50%ではオッズ比が10の時、リスク比は9,と1.8となりかなり変わってきます。

Page 13: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

○○オッズが3倍になったと表現する。 有意差があった。そのオッズ比はXX(LL~HH)であった。

Page 14: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

名義尺度の相関

• データが名義尺度の時について説明しましょう。 表5.1のデータを8cm未満と8cm以上の2種類に分類し、名義尺度にしてみましょう。

Page 15: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

体長分類\尾長分類

8cm未満 8cm以上 計

8cm未満 4 0 4

8cm以上 2 5 7

計 6 5 11

マウスの体長分類と尾長分類

Page 16: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

• 名義尺度のデータでは一般に分類間に大小関係はないので、今までのような意味での相関関係はあり得ません。 しかし2つの分類の間に何らかの関連性があり、一方の分類が他方の分類に影響を与えるということは考えられます。 上の表でいいますと、体長と尾長の間に正の相関性があれば両者が同じ分類になるようなマウスが多くなり、左上と右下のカラムの例数が増えると思われます。 もう少し一般化していいますと、縦または横の分類ごとにながめた時、横または縦の分類パターン(表では「4-0」と「2-5」)に違いがあることになります。

• このような関連性を要約する値としては、χ2値があります。 しかしχ2値は例数と自由度によって最大値が異なり、値を比較するのに不便です。 そこで総例数をNとし、縦と横の分類数のうち小さい方の値をsとして、

Page 17: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

θ2=R2= χo

2 ――――

N(s-1)

Page 18: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

• と、総例数と自由度で割った値を用います。 この値を「クラメール(Cramer)の連関係数(coefficient of contingency)」と呼びますが、実はχ2検定における寄与率R2に他なりません。

Page 19: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

• データが2×2分割表の時は自由度が1になりますので、次のようにχ2値を総例数Nで割るだけになります。

θ2=R2= χo

2 ―――

N =φ2

Page 20: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

• この値の平方根を特に「φ(ファイ)係数」または「4分点相関係数」と呼び、心理学の分野でよく用いられています。 また当然のことながら、χ2検定を利用して連関係数についての検定を行なうことができます。

• しかし、この検定に実質的な意味はほとんどありません。 また順序尺度のデータと違って名義尺度のデータは計量尺度のデータとして扱うことはできないので、回帰分析を適用することはできません。

• 表のデータについて実際に計算すると次のようになります。

重要!但し、似ているがオッズ比の検定では効果を発揮するので、勘違いしないように

Page 21: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

•θ2=φ2=0.476(47.6%) θ=φ=0.690 χo

2=2.753(p=0.0971)<χ2(1,0.05)=3.841…有意水準5%で有意ではない

Page 22: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

•以上のように検定結果は有意ではありませんが、連関係数が50%近くありますので、体長と尾長の分類間には関連があるかもしれないと考えておいた方が良いでしょう。

• 2×2分割表において2種類の分類間の関連性を表す指標としては、φ係数の他にオッズ比ORがあります。 この値は関連性が全くない時は1になり、関連性がある時は1未満または1よりも大きくなります。 ただしφ係数のように上下限が決まっているわけではないので、関連性の程度を表す指標としてはφ係数ほど便利ではありません。 またこの値は比に基づいているので、データの中に0のものがあると計算できなかったり、関連性を的確に表さなかったりすることがあります。 表データについて実際に計算すると次のようになります。

Page 23: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

•OR=19.8 χo

2=3.179(p=0.0745)<χ2(1,0.05)=3.841…有意水準5%で有意ではない

Page 24: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

参考 オッズ比の復習

正常人10例と慢性肝炎患者10例のGOT

GOT 正常 異常 計

正常群 5 5 10

慢性肝炎群 1 9 10

計 6 14 20

このように2群のデータを2種類に分類したものを、「2×2分割表」または「4分表」と呼びます。 縦と横の分類は群や正常・異常だけではなくどんな分類法でもかまわず、統計学ではよく利用される表です。 この場合、両群合わせた正常率と異常率は、

Page 25: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

正常率:1-p1= 6

―― 20

=0.3

異常率:p1= 14 ―― 20

=0.7

Page 26: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

Chi二乗の復習も・・・

• ですから、もし正常人と慢性肝炎患者のGOTが等

しく、同じ割合で正常と異常が発生するのなら、理論的には次表のような結果になるはずです。

Page 27: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

理論度数

GOT 正常 異常 計

正常群 3 7 10

慢性肝炎群

3 7 10

計 6 14 20

Page 28: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

• この理論度数と実際の例数つまり実現度数とのくい違いを利用すれば、両群の母集団における正常例・異常例の発生率が等しいかどうかを検定することができます。 その手法を「フィッシャーの正確検定(Fisher's exact test)」または「フィッシャーの直接確率計算法による検定」といい、二項検定と同じように、t値のような検定統計量を用いずに有意確率p値を直接計算することができます。

実現度数と理論度数のくい違いを平方し、それを理論度数で割った値を合計して検定統計量χo2値とします。 m×n分割表における度数の自由度は(m-1)×(n-1)になります

Page 29: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

•正常人群と慢性肝炎群のGOT異常率をそれぞれπN、πHとしますと、この場合の帰無仮説は、

H0:πH=πN(≒p1=0.7)

H0:πH-πN=δ=δ0=0

または、

Page 30: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

• と表すことができます。 有意水準5%として例題について計算すると、次のような結果になります。

Page 31: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

•正常群の異常率:pN1=

5

10

=0.5 (50%)

Page 32: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

慢性肝炎群の異常率

:pH1= 9

―― 10

=0.9 (90%)

Page 33: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

•検定:

• p=0.1409>0.05…有意水準5%で有意ではない

Page 34: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

• 実現度数と理論度数のくい違いは、計量値でいえば個々のデータと平均との偏差に相当します。 そこでそのくい違いを平方し、理論度数で割って1理論度数当りのくい違い量とした値はちょうど分散のようなものに相当し、それによって実現度数と理論度数のくい違いの大きさを要約することができます。 その値を各度数ごとに計算して合計したものを「χ2(カイジジョウ)値」といい、この値はくい違いが大きくなるほど大きな値になり、くい違いがなければ0になります。

• したがってこのχ2値は、有意確率p値すなわち「実現度数と理論度数のくい違いはない」という帰無仮説が正しい確率と反比例的な関係があることになり、t値と同じように検定統計量として利用することができます。 このχ2値を用いてフィッシャーの正確検定を行う手法を「2×2のχ2検定」といい、フィッシャーの正確検定を正規近似した手法に相当します。

Page 35: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

• 分割表における縦と横の合計度数のことを「周辺度数」といい、周辺度数を変化させないで、自由に値を変えられる度数の個数を「自由度」といいます。 例えば表3.17では10、10、6、14が周辺度数であり、5、5、1、9の度数のうちどれか1つを変化させますと、周辺度数を変えないためには他の3つの値を変えなければなりません。 つまり1つの度数は自由に値を変えられますが、他の3つの値は自動的に決まってしまいます。 したがって2×2分割表における度数の自由度は1になります。

• t検定と同様にχ2検定でも、実験結果のχ2値からp値を求めて有意水準と比べる代わりに、p値がちょうど有意水準と等しくなる時のχ2値と実験結果のχ2値を比べることができます。 その基準のχ2値は度数の自由度によって違い、当然、自由度が増えるほど大きな値になります。 自由度がφの時の基準のχ2値のことを「自由度φのχ2分布における100・α%点」といい、「χ2(φ,α)」と書きます。 この値は統計の教科書などに載っていて、

Page 36: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

• Χ2(1,0.05)=3.841 χ2(1,0.01)=6.635

• χ2(2,0.05)=5.991 χ2(2,0.01)=9.210

などがよく使われます。 またt値とχ2値の間には次のような関係があります。

χ2(1,α)={t(∞,α)}2

Page 37: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

• 2×2のχ2検定に用いられるのは自由度が1の時のもので、実験結果から求められたχ2値をχo2と書きますと、

• χo2≧χ2(1,α)の時有意水準100・α%で有意

となります。 有意水準5%、信頼係数95%として例題について計算しますと次のようになります。

χo2=2.143(p=0.1432)<χ2(1,0.05)=3.841…有意水準5%で有意ではない

δ(両群の母異常率の差)の95%信頼区間:下限δL=-0.06 上限δU=0.86

Page 38: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

• 2×2のχ2検定と同じような原理を利用しているものの、正確検定に対する近似法が若干異なったものに「マンテル・ヘンツェル(Mantel-Haenszel)の検定」と呼ばれる手法があります。 この手法は2×2のχ2検定よりわずかに小さいχ2値が得られ、χ2検定よりも一般性があるので生命表解析など色々な場面で利用されます。 これは2×2分割表のデータを順位が2つだけの順序分類尺度と考えて、ウィルコクソンの2標本検定を適用したものと本質的に同一の手法です

Page 39: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

• 横の分類数が2つ以上の時にもフィッシャーの正確検定と同じような原理を利用した同じような手法が適用でき、2群における分類パターンの違いを検討することができます。 この場合、正確検定は非常に計算が複雑になるため、一般にはχ2検定が用いられます。 群が2つで分類数がnの時のχ2検定を「2×nのχ2検定」と呼び、さらに一般化して群がmで分類数がnの時のχ2検定を「m×nのχ2検定」と呼びます。

• どれも原理は2×2の時と同じで、実現度数と理論度数のくい違いを平方し、それを理論度数で割った値を合計して検定統計量χo2値とします。 m×n分割表における度数の自由度は(m-1)×(n-1)になりますので、検定は、

Page 40: 医療統計学 vol - kimuakikimuakilabo.main.jp/statintro_11.pdf正常群 3 7 10 慢性肝炎 群 3 7 10 計 6 14 20 •この理論度数と実際の例数つまり実現度数とのく

•自由度φ=(m-1)×(n-1)

• χo2≧χ2(φ,α)の時有意水準100・α%で有意

「有意ではない」ということは「データの信頼性が低いから結論を保留する」という意味であって、「差がない」もしくは「同等である」などという意味では決してありません。

したがって、検定結果が統計的に有意ではないからといって同等性を証明したことにはならず、あくまでも実験結果を実質科学的に考察し、両群の差が実質科学的には無視できる程度で両群がほぼ同等と考えられる時、初めて同等性を証明したことになります。