医学に活かす確率・統計

• A4用紙の配布–縦に使います–学生番号　氏名

避けて通れない確率・統計

• 不確実だから– 研究はわからないことを対象にする

• 未知が対象

– 臨床は不十分な情報に基づいて行動する• 既知のリストから選び出す

• 研究も　臨床も、論理的・科学的であることが必要だから– 他人を説得する– 自分が納得する

• 論理・科学の (唯一の )共通言語だから

手法は不要　考え方は必要

• 過去問になっている問題• 過去問の類似問題• 新しい問題

計算機は不要 (かも )　勘は必要

• 確率的思考をしているときに、電卓をたたいている暇はない

• そこそこ、はずれない「勘」を持っていることが大事

• その「勘」のよさが、臨床のセンス、研究のセンスのよさ・・・のような気がします

• この辺りのことに、なにがしかのイメージを持つことが 3コマの目標です

計算機が欲しいなら

• フリーソフトをどうぞ– R

http://www.r-project.org/http://www.okada.jp.org/RWiki/index.php

http://www.r-project.org/

http://www.r-project.org/

http://www.okada.jp.org/RWiki/index.php

http://www.okada.jp.org/RWiki/index.php

確率・統計的な考え方のこつ

• 自分なりにわかること–覚えることは何もない–自分で考えを進められれば、よし–疑う

• 情報を鵜呑みにしない• 理由を見つける• こだわらない・こだわっている自分に気づく

–「絶対」はない• 場合にわける• 条件をつける

推定 *

推定 *　：　斜字体の言葉はこの講義で理解するべき概念(「学問的」部分 )

合格したい試験がある

• 自分が合格する確率は？


• 自分が合格する確率は？• 「当てる」ために必要な情報は？


• 自分が合格する確率は？• 「当てる」ために有用な情報は？

–合格率は？


• 自分が合格する確率は？• 「当てる」ために有用な情報は？

–合格率は？• どうしてそれを知ることが有用？


• 自分が合格する確率は？• 「当てる」ために必要な情報は？

–合格率は？–何の試験？

• どうしてそれを知ることが有用？

【医師国家試験・医学部のある大学別合格率と合格者数】（ 2008年度医師国家試験のデータ）

大学名　　　　　　　　　新卒　　　　　　　　　　　　　　　既卒　　　　　（受験者数・合格者数・合格率）　＜受験者数・合格者数・合格率＞国立大学医学部（ 42校）（ 4,016 3,819 95.1％）＜ 434 257 59.2％＞北海道大学（ 106 　 104 　 98.1％）　　　＜ 17 　 10 　 58.8％＞旭川医科大学（ 96　　 89 　 92.7％）　　　＜ 8　 3 37.5％＞

弘前大学（ 102 101 99.0％）＜ 9 5 55.6％＞東北大学（ 88 84 95.5％）＜ 16 4 25.0％＞秋田大学（ 103 94 91.3％）＜ 8 6 75.0％＞山形大学（ 99 97 98.0％）＜ 3 3 100.0％＞筑波大学（ 108 105 97.2％）＜ 8 8 100.0％＞群馬大学（ 103 94 91.3％）＜ 7 6 85.7％＞千葉大学（ 103 99 96.1％）＜ 7 4 57.1％＞東京大学（ 95 88 92.6％）＜ 2 0 0.0％＞東京医科歯科大学（ 86 82 95.3％）＜ 7 6 85.7％＞新潟大学（ 94 86 91.5％）＜ 6 2 33.3％＞富山大学（ 91 88 96.7％）＜ 7 5 71.4％＞金沢大学（ 101 97 96.0％）＜ 11 4 36.4％＞福井大学（ 107 97 90.7％）＜ 12 5 41.7％＞山梨大学（ 97 90 92.8％）＜ 14 11 78.6％＞信州大学（ 98 93 94.9％）＜ 8 2 25.0％＞岐阜大学（ 80 78 97.5％）＜ 8 5 62.5％＞浜松医科大学（ 112 109 97.3％）＜ 6 4 66.7％＞名古屋大学（ 100 96 96.0％）＜ 5 2 40.0％＞三重大学（ 97 95 97.9％）＜ 7 5 71.4％＞

滋賀医科大学（ 100 95 95.0％）＜ 3 2 66.7％＞京都大学（ 97 95 97.9％）＜ 16 9 56.3％＞大阪大学（ 98 92 93.9％）＜ 11 6 54.5％＞神戸大学（ 100 98 98.0％）＜ 11 7 63.6％＞鳥取大学（ 78 76 97.4％）　＜ 11 8 72.7％＞島根大学（ 89 82 92.1％）＜ 7 4 57.1％＞岡山大学（ 92 87 94.6％）＜ 8 5 62.5％＞広島大学（ 95 89 93.7％）＜ 10 5 50.0％＞山口大学（ 96 83 86.5％）＜ 10 9 90.0％＞徳島大学（ 89 85 95.5％）＜ 15 7 46.7％＞香川大学（ 89 87 97.8％）＜ 8 7 87.5％＞愛媛大学（ 92 91 98.9％）＜ 10 7 70.0％＞高知大学（ 88 81 92.0％）＜ 13 5 38.5％＞九州大学（ 100 98 98.0％）＜ 15 10 66.7％＞佐賀大学（ 91 88 96.7％）　＜ 7 3 42.9％＞長崎大学（ 77 72 93.5％）＜ 18 11 61.1％＞熊本大学（ 94 93 98.9％）＜ 18 8 44.4％＞大分大学（ 84 80 95.2％）＜ 11 9 81.8％＞宮崎大学（ 96 90 93.8％）＜ 15 12 80.0％＞鹿児島大学（ 93 89 95.7％）＜ 24 16 66.7％＞琉球大学（ 112 102 91.1％）＜ 17 7 41.2％＞

【医師国家試験・医学部のある大学別合格率と合格者数】（ 2008年度医師国家試験のデータ）

大学名　　　　　　　　　新卒　　　　　　　　　　　　　　　既卒　　　　　（受験者数・合格者数・合格率）　＜受験者数・合格者数・合格率＞国立大学医学部（ 42校）（ 4,016 3,819 95.1％）＜ 434 257 59.2％＞北海道大学（ 106 　 104 　 98.1％）　　　＜ 17 　 10 　 58.8％＞旭川医科大学（ 96　　 89 　 92.7％）　　　＜ 8　 3 37.5％＞

弘前大学（ 102 101 99.0％）＜ 9 5 55.6％＞東北大学（ 88 84 95.5％）＜ 16 4 25.0％＞秋田大学（ 103 94 91.3％）＜ 8 6 75.0％＞山形大学（ 99 97 98.0％）＜ 3 3 100.0％＞筑波大学（ 108 105 97.2％）＜ 8 8 100.0％＞群馬大学（ 103 94 91.3％）＜ 7 6 85.7％＞千葉大学（ 103 99 96.1％）＜ 7 4 57.1％＞東京大学（ 95 88 92.6％）＜ 2 0 0.0％＞東京医科歯科大学（ 86 82 95.3％）＜ 7 6 85.7％＞新潟大学（ 94 86 91.5％）＜ 6 2 33.3％＞富山大学（ 91 88 96.7％）＜ 7 5 71.4％＞金沢大学（ 101 97 96.0％）＜ 11 4 36.4％＞福井大学（ 107 97 90.7％）＜ 12 5 41.7％＞山梨大学（ 97 90 92.8％）＜ 14 11 78.6％＞信州大学（ 98 93 94.9％）＜ 8 2 25.0％＞岐阜大学（ 80 78 97.5％）＜ 8 5 62.5％＞浜松医科大学（ 112 109 97.3％）＜ 6 4 66.7％＞名古屋大学（ 100 96 96.0％）＜ 5 2 40.0％＞三重大学（ 97 95 97.9％）＜ 7 5 71.4％＞

滋賀医科大学（ 100 95 95.0％）＜ 3 2 66.7％＞京都大学（ 97 95 97.9％）＜ 16 9 56.3％＞大阪大学（ 98 92 93.9％）＜ 11 6 54.5％＞神戸大学（ 100 98 98.0％）＜ 11 7 63.6％＞鳥取大学（ 78 76 97.4％）　＜ 11 8 72.7％＞島根大学（ 89 82 92.1％）＜ 7 4 57.1％＞岡山大学（ 92 87 94.6％）＜ 8 5 62.5％＞広島大学（ 95 89 93.7％）＜ 10 5 50.0％＞山口大学（ 96 83 86.5％）＜ 10 9 90.0％＞徳島大学（ 89 85 95.5％）＜ 15 7 46.7％＞香川大学（ 89 87 97.8％）＜ 8 7 87.5％＞愛媛大学（ 92 91 98.9％）＜ 10 7 70.0％＞高知大学（ 88 81 92.0％）＜ 13 5 38.5％＞九州大学（ 100 98 98.0％）＜ 15 10 66.7％＞佐賀大学（ 91 88 96.7％）　＜ 7 3 42.9％＞長崎大学（ 77 72 93.5％）＜ 18 11 61.1％＞熊本大学（ 94 93 98.9％）＜ 18 8 44.4％＞大分大学（ 84 80 95.2％）＜ 11 9 81.8％＞宮崎大学（ 96 90 93.8％）＜ 15 12 80.0％＞鹿児島大学（ 93 89 95.7％）＜ 24 16 66.7％＞琉球大学（ 112 102 91.1％）＜ 17 7 41.2％＞

•場合分け•どうしてそれを知ることが有用？


• 自分が合格する確率は？

• 模試とは？

共用試験ナビ-年度一覧　 >　第６版　共用試験ナビ　 >　医学系 CBT－第３回正式実施全国成績

http://www.cato.umin.jp/cbt_navi.htm



http://www.cato.umin.jp/11/0101kyouyou_gaiyou.html

模試から得る情報

• 自分の得点• 自分の順位

• 知りたいことは？

全体　 vs. 個


• 知りたいことは？–自分の得点→自分の「真の」正答力–自分の順位→自分の「真の」順位


• 知りたいことは？–自分の得点→自分の「真の」正答力–自分の順位→自分の「真の」順位

• さらに知りたいことは？–「真の」正答力→自分が本番でとる得点–「真の」順位→自分が本番でとる順位

模試から得る情報• 知りたいことは？

–自分の得点→自分の「真の」正答力–自分の順位→自分の「真の」順位

• さらに、知りたいことは？–「真の」正答力→自分が本番でとる得点–「真の」順位→自分が本番でとる順位

• さらに、さらに、知りたいことは？–「真の」正答力と「ありたい正答力」との差–その差の詰め方

模試から得る情報• 知りたいことは？

–自分の得点→自分の「真の」正答力–自分の順位→自分の「真の」順位

• 試験実施者が本当に知りたいことは–「正答力」ではなくて「実力」なんだけれど・・・

• 「知りたいこと」は観察できない (ことが多い )–テスト (検査 )で代用する–実験で代用する


• 「真の正答力」を推定する– 10問中 8問の正解–模試の点数→「真の正当力」

• どうやって？


• 「真の正答力」を推定する–模試の点数→「真の正当力」

• どうやって？


• 「真の正答力」を推定する–模試の点数→「真の正当力」

• どうやって？– 仮説からスタートする– 仮説を立てよう

模試から得る情報• 「真の正答力」を推定する

– 模試の点数→「真の正当力」• どうやって？

– 仮説からスタートする

–「真の正答力は、『正答する確率』が 80%である」という仮説

• 仮説には「確率」がある


• 「真の正答力は、『正答する確率』が80%である」という仮説

• この場合の模試の点数は？ ->RGUI 　 (編集→ GUIpreference→フォント (20))

– p<-0.8;nq<-10

– rs<-rbinom(nq,1,p);mean(rs)*nq

– rs<-rbinom(nq,1,p);mean(rs)*nq

– …


• 「真の正答力は、『正答する確率』が80%である」という仮説– 「テストのたびに値が変わる・・・」

• p<-0.8• nq<-10• nt<-10• rs<-matrix(rbinom(nq*nt,1,p),nrow=nt)• obs<-apply(rs,1,sum)• table(obs)



• テストを繰り返せば• p<-0.8• nq<-10

• nt<-10• rs<-matrix(rbinom(nq*nt,1,p),nrow=nt)• obs<-apply(rs,1,sum)• table(obs)

p<-0.8nq<-10

nt<-100rs<-matrix(rbinom(nq*nt,1,p),nrow=nt)obs<-apply(rs,1,sum)table(obs)h<-hist(obs,xlim=c(0,nq),breaks=-1:nq) plot(0:nq,h$counts,type="b")




p<-0.8nq<-10nt<-100rs<-matrix(rbinom(nq*nt,1,p),nrow=nt)obs<-apply(rs,1,sum)table(obs)h<-hist(obs,xlim=c(0,nq),breaks=-1:nq) plot(0:nq,h$counts,type="b")



• 100回　模試を受けても・・・• p<-0.8• nq<-10• nt<-10• rs<-matrix(rbinom(nq*nt,1,p),nrow=nt)• obs<-apply(rs,1,sum)• table(obs)




• 100回　模試を受けても・・・• p<-0.8• nq<-10• nt<-10• rs<-matrix(rbinom(nq*nt,1,p),nrow=nt)• obs<-apply(rs,1,sum)• table(obs)


100回　模試を受けても


• 「真の正答力は、『正答する確率』が80%である」という仮説– 「テストのたびに値が変わる・・・」→無限回　受ければ


• plot(0:nq,h$counts,type="b")• ds<-dbinom(0:nq,nq,p)• par(new=TRUE)• plot(0:nq,ds,type="b",col="red")




• plot(0:nq,h$counts,type="b")• ds<-dbinom(0:nq,nq,p)• par(new=TRUE)• plot(0:nq,ds,type="b",col="red")

みんなが使うものだから

• 正答確率　 0.8の場合の得点分布の確率分布は

• 「知られている」

みんなが使うものならば• 正答確率　 0.8の場合の得点分布の確率分布は• 「知られている」

• 「知られてい」れば、「知れ」ばよし– 情報収集・調査・勉強

• 「知られていないけれど、知りた」ければ、「知れ」ばよし– 研究


• 「真の正答力」を推定する– 「真の正答力は、『正答する確率』が 80%である」という仮説– どうして、「 80%」と思った？？？– 50%,10%,90%だったら？

• p<-c(0.8,0.5,0.1,0.9)• ds<-dbinom(0:nq,nq,p[1])• ylim<-c(0,1)• plot(0:nq,ds,type="b",col="red",ylim=ylim)

• par(new=T)• ds<-dbinom(0:nq,nq,p[2])• plot(0:nq,ds,type="b",ylim=ylim)



0.8 0.5

0.1 0.9

0.8 0.5

0.1 0.9

今、気になるのは、８点を取った場合

• 仮説→事象が起きる　確率　 (起きそうなやすさ )

• 事象が起きる→仮説　尤度　 (ありそうな程度 )真の正答確率が p　のときに 8点を取る確率は

8点を取ったときに、真の正答確率が pである尤度

「真の正答力は、『正答する確率』が pである」という仮説の下で、 10問中 8問を正答する確率

10問中 8問を正答したときに、真の正答力が pである尤度

point<-8p<-seq(from=0,to=1,by=0.01)ds<-dbinom(point,nq,p)plot(p,ds,type="l")abline(h=ds[81])

par(new=T)v<-dbeta(p,point+1,nq-point+1)plot(p,v)


• 「真の正答力」を推定する• 何点を取ろうとも。

p<-seq(from=0,to=1,by=0.01)obss<-matrix(0,length(p),nq+1)for(i in 1:length(p)){ obss[i,]<-ds<-dbinom(0:nq,nq,p[i])}persp(obss,xlab="p",ylab="points",theta=90,phi=30) persp(obss,xlab="p",ylab="points",theta=0,phi=30)

仮説の下での確率密度分布

テストの点

実力

観察の下での尤度分布

実力

テストの点

実力テストの点

実力が 0.8の場合

尤度

１回目の模試が 8点の場合

実力

• p=0.8のときに最も大きい–最大の尤度を持つ仮説は「 p=0.8」

– pの最尤推定値

「真の正答力は、『正答する確率』が pである」という仮説の下で、 10問中 8問を

正答する確率

10問中 8問正答のときの真の正答力の尤度

実力

１回目の模試が 80%正解の場合

模試の結果から、実力を推定した。

正答率 80％を最高に（最尤推定値 )　：　点推定

幅がある (信頼区間 )　：　区間推定

実力

実力はどこまで推定できた？信頼区間をどう決めたい？

実力

信頼区間をどう決めたい？

下限と上限に挟まれた範囲が 95%

上限・下限それぞれに 2.5%ずつ

上限・下限の尤度を同じにして合わせて 5%

上限・下限を中心から等距離とするとして、合わせて5％

下限だけ？

真の力より、次回は何点取るか？

• 真の正答確率は 0 <= p <=1

• p=P のときに t 点 (t=0,1,2,...,10)を取る確率は　 Pr(t|p=P)

• p=Pの確率は Pr(p=P)

• 全部の pについて、 Pr(t|p=P) x Pr(p=P)を足し合わせれば、 t点を取る確率がわかる

point<-8p<-seq(from=0,to=1,by=0.01)#ds<-dbinom(point,nq,p)#plot(p,ds,type="l")#abline(h=ds[81])

#par(new=T)v<-dbeta(p,point+1,nq-point+1)plot(p,v,type="l",col="red")

newpoints<-0:nq

cp<-choose(nq,newpoints)

out<-matrix(0,length(newpoints),length(p))for(i in 1:length(newpoints)){

out[i,]<-cp[i]*p^newpoints[i]*(1-p)^(nq-newpoints[i])*v

}

out2<-apply(out,1,sum)par(new=T)plot(newpoints,out2,type="b")

真の力より、次回は何点取るか？

次回は何点取るの？

推定

• 推定 (の代表 )値• 推定値の範囲（信頼区間）• 推定結果「の全部」を使って、さらなる推定

実力

テストの点

実力が 0.8の場合

１回目の模試が 80%正解の場合

確率

尤度

確率と尤度

テストの点

実力

確率

１回目の模試が 80%正解の場合に、次回の試験の点数の予想

問題

• 確率と尤度について自分の言葉で説明しなさい (A4の紙に記入 )

臨床における推定• 診断という推定

–診断Ａという仮説–診断Ｂという仮説– …

• 予後の推定–予後Ｘという予想–予後Ｙという予想

• 推定 (診断 )には–最尤推定がある–信頼区間がある

Aのときの確率

A,B,...の尤度

臨床情報問診・検査

予後推定 (A,Bが決まらなくても・・・ )

予想の調整

• 「真の正当力が 80%」と思っていた• 75/100点を取った

–「ま、そんなものか」–「真の正当力」の予想は（ほぼ）変わらない

• 50/100点を取った–「え・・・」–「真の正当力は 60%くらいかな・・・」–「真の正当力」の予想が変わる

予想の調整


–「え・・・」–「真の正当力は 60％くらいかな」

• 50/100点を取った–「ま、そんなものか」–「真の正当力」の予想は（ほぼ）変わらない


–「え・・・」–「真の正当力は 60％くらいかな」

• 50/100点を取った–「ま、そんなものか」–「真の正当力」の予想は（ほぼ）変わらない

事前予想

事後予想

観察

研究における推定

• 値を計測（実験）したら、必ず推定

• 模試：全 10問の模試–たくさんの実験（ 10問）を実施していた

• 実験も繰り返しが必要

• 推定には繰り返しが必要

医学に活かす 確率・統計

Documents

医学に活かす確率・統計