母集団・標本・データ 確率変数・標本空間・事象...
TRANSCRIPT
母集団・標本・データ確率変数・標本空間・事象
確率の定義
ランダムに抽出
母集団・標本・データ
(四角、赤)
(四角、赤)
(丸、赤)
(丸、黒)
(四角、青)
(三角、黒)
調 査観 測
母集団 標本
データ
母集団とは:具体的な集団と抽象的なシステム
• 調査したい対象であり、通常、その性質はわからない。– 母集団を「20歳以上の国民全体」として、世論調査が実施される。
– 母集団を「日本の総世帯」として、視聴率調査(家計調査)が行われる。
– 母集団を「日本経済」(ありとあらゆる現象を生み出すシステム)として、ありとあらゆるデータが記録されてゆく。
– 母集団を「プロ野球機構」とすれば、ひとつひとつの試合が標本となり、データが得られる。
ランダムの影響を受けつつ実現する
日本経済
母集団・標本・データ株価の場合
(.21,.03)
(.05,.1)
(.04,.03)
(.05,.21)
(.01,.08)
(.01,.03)
調 査
母集団
標本
データ
2010/4
2010/5
2010/7
2010/6
2010/8
2010/9
(為替レート, TOPIX)
ランダムの影響を受けつつ実現する
プロ野球というシステム
母集団・標本・データプロ野球の場合
(8,1)
(5,1)
(4,1)
(4,2)
(12,8)
(10,3)
調 査
母集団
標本
データ
TvsG 2010-1
TvsG 2010-2
TvsG 2010-3
TvsG 2010-4
TvsG5
TvsG6
(ヒット数,得点)
有限母集団(具体的な集団)と無限母集団(抽象的なシステム
• 「日本の20 才以上の国民」は、数が多いとは言え、数に限りがある(有限母集団)。
• 「日本の世帯全体」も同様である(有限母集団)。
• 「日本経済」とすると、数限りないシナリオが考えられる(無限母集団)。
• 「プロ野球機構」が生みだす試合は、どれ一つとして同じものはない(無限母集団)。
「サイコロを投げる」ことは有限母集団か、それとも、無限母集団か?
• 有限母集団説:
–1から6までの目しか出ないのだから、袋の中に1から6までの番号のついた玉を入れたものであり、母集団は6個の玉である。
• 無限母集団説:
–サイコロを投げるという作業と一口に言っても、サイコロの個体差、投げ方(速度、方向)そして床の材質など無限のシナリオがある。母集団はそれらのシナリオの全体である。
サイコロ投げ:有限母集団説を採れば・・・・
• 母集団から1個ラ
ンダムに取り出し数字を確認する作業を、X(確率変数)とする。
12
3 45
6
母集団
割合はそれぞれ「6分の1」である。
確率は、それぞれ6分の1である。
サイコロ投げ:無限母集団説に立てば・・・
サイコロ投げの方法をすべて考える
母集団
• 母集団の投げ方の一つをランダムに実現させて、その目を確認する作業を X (確率変数)とする。
確率は6分の1かどうかは分らない。
いずれの母集団でも、
• 母集団の比率と、
• 確率変数(母集団から1個だけランダムに
抽出して観測する場合)の確率とは一致する。
古典的確率と統計的確率
• 古典的確率:有限母集団説に立った確率の割り振り方で、サイコロの場合、それぞれの目の出る確率を 6分の1 (前もって決める立場)とする。
• 統計的確率:無限母集団説に立った確率の割り振り方で、サイコロの目の出る確率は、実際に数多く投げることによって、その近似的な値を得る(調査によってはじめて明らかになるという立場)。
確率変数とは?• データが得られるまでの作業(手続き、プロセス)を確率変数で表現する。–例1)有権者から1人をランダムに選び、内閣を支持するかを(Yes, No)で尋ねる作業を X すると、得られるデータは、Yes か No のいずれかである。
–例2)コインを1回投げて表の出る回数を調べる作業を Y とすると、得られるデータは {0,1} である。
–例3)有権者から100人をランダムに選び、内閣支持者率を調べる作業を Z とするとき、得られるデータは、{0.01, 0.02, ….., 0.99,1.00}のどれかである。
確率変数のバリエーション
• 例4) サイコロを1回振ったときの目の和を調べる作業を X とする。
• 例5)サイコロを2回振ったときの目の和(を調べる作業)を Y とする。
• 例6)サイコロを3回振ったときの目の平均を Z とする。
• 例7)サイコロを1000回振ったときの目の平均を W とする。
基本は1個
• サイコロを1回振る作業を n 回繰り返すことを、
と書くことにすれば、
21 XXY
nXXXX ,,,, 321
3
321 XXXZ
1000
1000321 XXXXW
サイコロを1回投げる:X
• Xの標本空間は、S={{1}, {2}, {3}, {4}, {5}, {6} } である。
• 標本空間内の集合(事象)を考える。
S:標本空間
A:奇数B:4以上
古典的確率の立場で、事象に確率を割り当てる
• それぞれの目の出る確率は6分の1である。
S:標本空間
A:奇数 B:4以上
)(AP
)(BP
)(SP
)( BAP
)( BAP
統計的確率の立場で、事象に確率を割り当てる
• 主観的に確率を割り当ててみよう。
S:標本空間
A:奇数 B:4以上
)(AP
)(BP
)(SP
)( BAP
)( BAP
サイコロを2回投げる:
• の標本空間は、
• { {1,1}, {1,2}, {1,3}, {1,4}, {1,5}, {1,6},
• {2,1}, {2,2}, {2,3}, {2,4},{2,5}, {2,6},
• {3,1}, {3,2}, {3,3}, {3,4},{3,5}, {3,6},
• {4,1}, {4,2}, {4,3}, {4,4},{4,5}, {4,6},
• {5,1}, {5,2}, {5,3}, {5,4},{5,5}, {5,6},
• {6,1}, {6,2}, {6,3}, {6,4},{6,5}, {6,6} }
),( 21 XX
),( 21 XX
事象(集合)をいろいろ考えてみよう
• ぞろ目、合計10以上、合計4以下など等・・・
S:標本空間
A:ぞろ目 B:合計4以下
サイコロを3回投げる: ),,( 321 XXX
• 標本空間の要素を一つ一つ書いてられない。
• { {1,1,1}, {1,1,2}, {1,1,3}, {1,1,4}, {1,1,5}, {1,1,6},
• {1,2,1}, {1,2,2}, {1,2,3}, {1,2,4},{1,2,5}, {1,2,6},
• ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
• {6,6,1}, {6,6,2}, {6,6,3}, {6,6,4},{6,6,5}, {6,6,6} }
• 一つ一つの要素の確率よりもむしろ、事象(集合)の確率の方が興味の対象となる(例:合計が12以上になる確率などなど・・・・)
公理論的確率の定義
• 公理1.P(A)≧0
• 公理2.P(S)=1
• 公理3.A1, A2, A3, ・・・, An は互いに共通部分を持たない
とすれば、
)()()()( 2121 nn APAPAPAAAP
• 公理論的確率の定義は、確率の抽象的な扱いを可能にした。
• 数学の一分野としての確率論が、この定義を基に発展した。
第1章 統計学と確率
• 古典的確率であれ、統計的確率であれ、確率の割り振り方に矛盾がなければそれでよしとする考え方。
確率変数で表現すると、• 母集団から1個をランダム
に抽出し、その色を調べるという試行を Xで表わし、その結果観察された結果を xで表わす。
• この作業を n 回繰り返すことを、以下のように表わす。
母集団
nXXX ,,, 21
確率変数で表現すると、• 母集団から1個をランダムに抽出し、その形と色を調べるという試行を( X, Y ) で表わし、その結果観察された結果を ( x, y)で表わす。
• この作業を n 回繰り返すことを、以下のように表わす。
母集団
),(,),,(),,( 2211 nn YXYXYX
以下は配布資料
母集団・標本・データ
(四角、赤)
(四角、赤)
(丸、赤)
(丸、黒)
(四角、青)
(三角、黒)
母集団 標本
データ
日本経済
母集団・標本・データ株価の場合
(.21,.03)
(.05,.1)
(.04,.03)
(.05,.21)
(.01,.08)
(.01,.03)
母集団
標本
データ
2010/4
2010/5
2010/7
2010/6
2010/8
2010/9
(為替レート, TOPIX)
サイコロ投げ有限母集団説を採れば・・・・
12
3 45
6
母集団
サイコロ投げ無限母集団説に立てば・・・
母集団
サイコロを1回投げる:X
• Xの標本空間は、S={{1}, {2}, {3}, {4}, {5}, {6} } である。
• 標本空間内の集合(事象)を考える。
S:標本空間
A:奇数B:4以上
古典的確率の立場で、事象に確率を割り当てる
• それぞれの目の出る確率は6分の1である。
S:標本空間
A:奇数 B:4以上
)(AP
)(BP
)(SP
)( BAP
)( BAP
統計的確率の立場で、事象に確率を割り当てる
• 主観的に確率を割り当ててみよう。
S:標本空間
A:奇数 B:4以上
)(AP
)(BP
)(SP
)( BAP
)( BAP
サイコロを2回投げる:(X,Y)
• (X,Y) の標本空間は、
• { {1,1}, {1,2}, {1,3}, {1,4}, {1,5}, {1,6},
• {2,1}, {2,2}, {2,3}, {2,4},{2,5}, {2,6},
• {3,1}, {3,2}, {3,3}, {3,4},{3,5}, {3,6},
• {4,1}, {4,2}, {4,3}, {4,4},{4,5}, {4,6},
• {5,1}, {5,2}, {5,3}, {5,4},{5,5}, {5,6},
• {6,1}, {6,2}, {6,3}, {6,4},{6,5}, {6,6} }
事象(集合)をいろいろ考えてみよう
• ぞろ目、合計10以上、合計4以下など等・・・
S:標本空間
A: B: