powerpoint プレゼンテーション...dl x x x x n n = ( + +) = 1 より µ 1 2 14 2....
TRANSCRIPT
2
目 次
• 前回演習の答え
• 第一章 誤差論
– ヒストグラム、極限分布、確率分布
– 正規分布と最も確からしい値
– 推定と検定
• 正規分布から派生する分布
– 誤差の伝播
第一回目で説明
演習
• ある試料の重さを10回測定したら、以下の表を得た.• このヒストグラムを作成せよ.• 但し、横軸を3.4から4.6とし、
測定値の幅を0.2刻みとせよ。
3
測定回数 測定値1 3.662 3.833 3.784 3.895 4.156 4.167 3.808 4.389 3.74
10 3.76
平均値 3.92分散 0.04905
解答例
• ある試料の重さを10回測定したら、以下の表を得た.• このヒストグラムを作成せよ.• 但し、横軸を3.4から4.6とし、
測定値の幅を0.2刻みとせよ。
4
測定回数 測定値1 3.662 3.833 3.784 3.895 4.156 4.167 3.808 4.389 3.74
10 3.76
平均値 3.92分散 0.049053.4 3.6 3.8 4.0 4.2 4.4 4.6
横軸の刻みは、例えば、3.6以上3.8未満とする。
1234567
解答例
• ある試料の重さを10回測定したら、以下の表を得た.• このヒストグラムを作成せよ.• 但し、横軸を3.4から4.6とし、
測定値の幅を0.2刻みとせよ。
5
測定回数 測定値1 3.662 3.833 3.784 3.895 4.156 4.167 3.808 4.389 3.74
10 3.76
平均値 3.92分散 0.049053.4 3.6 3.8 4.0 4.2 4.4 4.6
横軸の刻みは、例えば、3.6より大きく3.8以下とする。
1234567
復習 ヒストグラム極限分布(母集団)
• 測定回数を多くしていくと、ヒストグラムの縦軸が大きくなる.そこで、測定回数に応じて横軸の区間の分割も多くしていくことを考える.
6
0
1
2
3
4
5
6
7
20 21 22 23 24 25
• ある区間(a,b)の総量が、その範囲の値が得られる測定回数をあらわしている.
• 測定値の総数が多くなればなるほど、ヒストグラムは滑らかになっていく
a b
復習 極限分布
• 測定回数を無限回行ったと仮定して、得られる分布を極限分布という.
7
• 測定量がある範囲の区間に入る回数の和は、極限分布ではその区間の面積に比例することになることがわかるであろう
• また、極限分布では、全測定回数は全体の面積に比例する
a ba b
復習 確率分布
• そこで、総面積を1に規格化すると確率分布となる.– ここで言う規格化とは、面積を1にするようにある値を掛けること
– 縦軸を調整していると考えてよい
8
a b
f(a)
f(b)
f(x)
x
!重要!
xが区間a~bの間の値
を取る確率はこの面積である
( )b
a
P a x b≤ ≤ = ∫ f(x)dx式では などと書く
代表的な確率分布=正規分布(ガウス分布)
• 正規分布(μ、σ2)の形は、
• この時、測定値xiが得られる確率は、測定の微小な範囲dxiとして
• 積分の代わりに,関数の値と微小な幅をかけて確率(=面積)を出してい
る。このように、微小な範囲dxiを設定することは数学的なテクニックのみならず、測定値は原理的に揺らぎがあるという実際の物理を反映している。
9
−−= 2
2
2)(exp
21)(
σµ
πσxxf
2
2
( )1( ) exp22i
i ixP x dxµσπσ
−= −
0
0.1
0.2
0.3
0.4
0.5
-4 -3 -2 -1 0 1 2 3 4
正規分布(0,1)
10
授業の流れ
• 前回で、確率論的に扱われる誤差の分布と性質をまなんだ。
• 次に、その結果を利用して、測定値から真値を推定する方法を学ぶ。
11
推定と検定
• 推定・・・抽出した標本値に基づいて,母集団の特性を推し量ること
– 点推定・・真値などの値を推定する
– 区間推定・・母平均などの値がある確度で入る区間を推定する.
• 検定・・・ある仮定が正しいかどうかを標本値から判断すること
12
点推定
• 1.統計量の期待値としての推定量を不偏推定量と云う.下記のように点推定に使用される
• 例1.標本値x1~xnから母平均μを推定
• 例2. 母分散の推定
• 2.最尤推定・・・点推定の一つであるが、母集団分布の形がわかっている時に,標本値(測定結果)が得られる確率が最も高いと仮定して、母数を推定する方法.
1ix x
n= →µ∑
( )22 211 1 i
n s x xn n
= − →σ− − ∑
13
最尤推定の例 1.正規分布の場合(再掲載)
• 正規分布(μ,σ2)から大きさnの独立な標本(通常の測定値と思ってよい)x1~xnを取り,σ2が既知のときに,μを推定する.
• x1~xnは既知だから、Lを最大とするμは
−−= 2
2
2)(exp
21)(
σµ
πσxxf
1 2( ) ( ) ( )nL f x f x f x=
0=µd
dL xxxxn n =++= )(1
21 µより
14
2. ポアソン分布の場合
• ポアソン分布(2項分布の平均値μを一定とし,確率pを無限小、試行nを無限大として得られる)の場合は,
• より
• やはり
• 母分散がわかっている場合• 母平均の最尤推定量=不偏推定量
!)exp(
!)exp(
!)exp(
21
21
n
xxx
xxxL
nµµµµµµ −−⋅−=
0=µd
dL
xxxxn n =++= )(1
21 µ
15
• 区間推定とは、具体的には、信頼水準γ(99%や95%が多い)を選び,未知母数がγの確率で入る区間を標本値から決定する.
• 表現の例
• ある量Xの真値μは、99%の確率で
• の範囲にある。
区間推定
0 0x x x xµ−∆ ≤ ≤ + ∆ 信頼水準γ
範囲(上限)範囲(下限)
16
区間推定の方法
• ある変数の確率分布関数がわかっていれば、その変数がある区間に入る確率(=面積)が計算できた。
• 例えば、平均値の確率変数の確率分布関数がわかれば、中心値を含む対称な区間の確率(=面積)が判る。
• そこで、信頼水準γ(99%や95%が多い)を何らかの方法で選ぶ。
• 未知母数の確率分布を探し出して、γの確率で入る区間を標本値(測定値)から決定する。.
17
• の形から,斜線部の面積がγになるz1を選び,逆変換すればよい.
区間推定の例 正規分布の応用
• 正規分布の母集団から、大きさnの標本x1~xnをとる.
• 確率変数 は,正規分布(μ,σ2/n)に従う.
• の変換でZは正規分布(0,1)に従う.
X( ) /Z X n= −µ σ
( )f z
1 1x z x zn nσ σ
− ≤ µ ≤ +
Normal distribution
0
0.1
0.2
0.3
0.4
0.5
-4 -3 -2 -1 0 1 2 3 4
z
f(z)
z1-z1
1 1z Z z− ≤ ≤
18
正規分布表
• 左図は正規分布を数値計算して作成した表である.
• 斜線の部分の面積がある値Φ(z)(行、列)になるzの値(表の中)が示されている.
• の形から,斜線部の面積がγになるz1を選び,逆変換すればよい.
( )f z
1 1z Z z− ≤ ≤
19
例題1
• ある試料の重さを10回測定したら、以下の表を得た.この時の測定値の分散が0.049と判っている時、確率99%で真値の入る区間を推定せよ.
測定値 3.663.833.783.894.154.163.8
4.383.743.76
平均値 3.92
20
例題1の解答例
• 正規分布表から99%のところを探すΦ=0.495• すると、z1=2.5758
21
計算すると
• すると、上の式で、 10回測定でn=10• 平均値 =3.92• 正規分布表からz1=2.5758で、
• 分散σ2=0.049より、偏差σ=0.22136• よって、
– 真値μが99%の確率で入る区間は[3.73~4.10]
1 1x z x zn nσ σ
− ≤ µ ≤ +
x
例題1-1
• それでは、例題1で、確率90%で真値の入る区間を推定する場合は下表のどこを読むか.
22
正規分布表から90%のところを探すΦ=???
23
計算すると
• すると、上の式で、 10回測定でn=10• 平均値 =3.92• 正規分布表からz1=1.6449で、
• 分散σ2=0.049より、偏差σ=0.22136• よって、
– 真値μが90%の確率で入る区間は[3.80~4.03]
1 1x z x zn nσ σ
− ≤ µ ≤ +
x
24
25
母分散が未知の時はどうすればよいか?
• 現実の世界では、母分散はわからない(母集団に関する値は、神のみぞ知る)
• 従って、母分散が未知の時は,先ほどの正規分布は使用できない.• なぜなら、下の式から
• 明らかにμとσの二つの未知変数を同時に推定できない
• この推定を行うためには,正規分布以外の分布を必要とする.• この分布を導くために,少し,回り道であるが,いろいろな有名な確
率分布を見てみよう.
1 1z x zn nσ σ
µ − ≤ ≤ µ +
26
χ2分布(かいじじょうぶんぷ)
• χ2分布は、標本分散の分布の情報を与える
• 標本の確率変数X1~Xnより,
• を作ると,このχ2は,以下の分布に従う。
• この分布を自由度nのχ2分布と云う
• 証明は確率の本を見ること(数学的帰納法)
2 2 21 2 nZ X X X= + + +
( 2) / 2 / 2/ 2
1( ) ( 0)2 ( / 2)0 ( 0)
n Zn nT Z Z e Z
nZ
− −= >Γ
= ≤
27
ガンマ関数
• ガンマ関数の定義
• 例えば
• 部分積分を使うと、
1
0
( ) x yx y e dy∞
− −Γ = ∫
( 1) !n nΓ + =
(0) 1, (1/ 2) πΓ = Γ =
( 1) ( )n n nΓ + = Γ
2
1 2 !( )2 2 !n
nnn
πΓ + =
• nが0以上の整数の時、
• ガンマ関数は、階乗を非整数まで拡張したものである
28
χ2分布の特徴 1
• χ2分布は、以下の特徴がある.
• (1) 正規分布(μ、σ2)に従う母集団から,大きさnの標本 x1~xn
を抽出した時,
• は自由度nのχ2分布に従う.
• X1,X2,・・・はそれぞれx1,x2,・・・に対応する確率変数
( ) ( ) ( )2 2 21 22
1nZ X X X = −µ + −µ + + −µ σ
29
χ2分布の特徴 2
• (2) 上記、μの代わりに平均値を用いて、
• は、自由度n-1のχ2分布に従う.ここに、S2は標本分散の確率変数.
• なぜなら、
• で、各 の内、実際の独立変数はn-1である。
( ) ( ) ( )2
2 2 21 22 2
1n
nSZ X X X X X X = − + − + + − = σ σ
( ) ( ) ( )1 2 0nX X X X X X− + − + + − =
iX X−
30
例題2 母分散の推定
• ある試料の重さを10回測定したら、右の表を得た.
• この時の測定値が正規分布に従うと解っている時、確率95%で母分散σ2の入る区間を推定せよ.
測定値 9.810.311.98.79.5
10.210.98.29.4
10.5
平均値 9.94
31
例題2の解答
• 標本分散s2を計算すると、
• 確率変数Z=nS2/σ2は、自由度9のχ2分布に従うので、数表を利用して、0.95の確率になる値を求める。
( )22 1 1.034is x xn
= − =∑
注意:χ2分布の形から両端を求めるためには、α=(1-0.95)/2と1-αの値が必要
32
例題2の解答
• 前ページの式から下限と上限の値は、自由度9で、確率(面積)が0.025になる値と、0.975になる値である。
33
例題2の解答
• よって、 の範囲を示す以下の式を得る
• 母分散の95%信頼区間は、
2
22.70 10 19.02Sσ
≤ × ≤下限 上限
n
20.544 3.381σ≤ ≤
2
2=σ
nSZ
例題
• 例題2で、母分散σ2の入る区間を確率90%で推定した場合は下表でどこを読むべきか.
• 下限と上限の値は、自由度9で、確率(面積)がXXXになる値と、YYYになる値である。
34
35
演習
36
• ある試料の長さを10回測定したら、以下の表を得た.この時の測定値の平均値と標準偏差が,それぞれ,3.92,0.221と判っている時、確率95%で真値の入る区間を推定せよ.
• 必要なら以下の数値表を使用せよ。
37
測定値 3.663.833.783.894.154.163.8
4.383.743.76
平均値 3.915分散 0.049045偏差 0.221461
3.162278z1 1.96
0.137263上限 4.05下限 3.78
1σ zn
10
1 1x z x zn nσ σ
− ≤ µ ≤ +
演習の補助資料
• すると、上の式で、 10回測定でn=10• 平均値 =3.92• 正規分布表からz1=????で、
• 分散σ2=0.049より、偏差σ=0.22136• よって、
– 真値μが95%の確率で入る区間は
[???~???]
x
38
ポイント
• 推定– 点推定と区間推定
• 点推定– 統計量の期待値としての推定量を不偏推定量
– 最尤推定
• 区間推定– 確率分布を利用
• 代表的な確率分布– 正規分布、ポアソン分布、2項分布など
• 正規分布から導かれる確率分布– χ2分布、F分布、t分布など
39