母集団・標本・データ 確率変数・標本空間・事象...

33
母集団・標本・データ 確率変数・標本空間・事象 確率の定義

Upload: others

Post on 28-Sep-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

母集団・標本・データ確率変数・標本空間・事象

確率の定義

Page 2: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

ランダムに抽出

母集団・標本・データ

(四角、赤)

(四角、赤)

(丸、赤)

(丸、黒)

(四角、青)

(三角、黒)

調 査観 測

母集団 標本

データ

Page 3: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

母集団とは:具体的な集団と抽象的なシステム

• 調査したい対象であり、通常、その性質はわからない。– 母集団を「20歳以上の国民全体」として、世論調査が実施される。

– 母集団を「日本の総世帯」として、視聴率調査(家計調査)が行われる。

– 母集団を「日本経済」(ありとあらゆる現象を生み出すシステム)として、ありとあらゆるデータが記録されてゆく。

– 母集団を「プロ野球機構」とすれば、ひとつひとつの試合が標本となり、データが得られる。

Page 4: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

ランダムの影響を受けつつ実現する

日本経済

母集団・標本・データ株価の場合

(.21,.03)

(.05,.1)

(.04,.03)

(.05,.21)

(.01,.08)

(.01,.03)

調 査

母集団

標本

データ

2010/4

2010/5

2010/7

2010/6

2010/8

2010/9

(為替レート, TOPIX)

Page 5: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

ランダムの影響を受けつつ実現する

プロ野球というシステム

母集団・標本・データプロ野球の場合

(8,1)

(5,1)

(4,1)

(4,2)

(12,8)

(10,3)

調 査

母集団

標本

データ

TvsG 2010-1

TvsG 2010-2

TvsG 2010-3

TvsG 2010-4

TvsG5

TvsG6

(ヒット数,得点)

Page 6: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

有限母集団(具体的な集団)と無限母集団(抽象的なシステム

• 「日本の20 才以上の国民」は、数が多いとは言え、数に限りがある(有限母集団)。

• 「日本の世帯全体」も同様である(有限母集団)。

• 「日本経済」とすると、数限りないシナリオが考えられる(無限母集団)。

• 「プロ野球機構」が生みだす試合は、どれ一つとして同じものはない(無限母集団)。

Page 7: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

「サイコロを投げる」ことは有限母集団か、それとも、無限母集団か?

• 有限母集団説:

–1から6までの目しか出ないのだから、袋の中に1から6までの番号のついた玉を入れたものであり、母集団は6個の玉である。

• 無限母集団説:

–サイコロを投げるという作業と一口に言っても、サイコロの個体差、投げ方(速度、方向)そして床の材質など無限のシナリオがある。母集団はそれらのシナリオの全体である。

Page 8: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

サイコロ投げ:有限母集団説を採れば・・・・

• 母集団から1個ラ

ンダムに取り出し数字を確認する作業を、X(確率変数)とする。

12

3 45

6

母集団

割合はそれぞれ「6分の1」である。

確率は、それぞれ6分の1である。

Page 9: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

サイコロ投げ:無限母集団説に立てば・・・

サイコロ投げの方法をすべて考える

母集団

• 母集団の投げ方の一つをランダムに実現させて、その目を確認する作業を X (確率変数)とする。

確率は6分の1かどうかは分らない。

Page 10: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

いずれの母集団でも、

• 母集団の比率と、

• 確率変数(母集団から1個だけランダムに

抽出して観測する場合)の確率とは一致する。

Page 11: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

古典的確率と統計的確率

• 古典的確率:有限母集団説に立った確率の割り振り方で、サイコロの場合、それぞれの目の出る確率を 6分の1 (前もって決める立場)とする。

• 統計的確率:無限母集団説に立った確率の割り振り方で、サイコロの目の出る確率は、実際に数多く投げることによって、その近似的な値を得る(調査によってはじめて明らかになるという立場)。

Page 12: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

確率変数とは?• データが得られるまでの作業(手続き、プロセス)を確率変数で表現する。–例1)有権者から1人をランダムに選び、内閣を支持するかを(Yes, No)で尋ねる作業を X すると、得られるデータは、Yes か No のいずれかである。

–例2)コインを1回投げて表の出る回数を調べる作業を Y とすると、得られるデータは {0,1} である。

–例3)有権者から100人をランダムに選び、内閣支持者率を調べる作業を Z とするとき、得られるデータは、{0.01, 0.02, ….., 0.99,1.00}のどれかである。

Page 13: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

確率変数のバリエーション

• 例4) サイコロを1回振ったときの目の和を調べる作業を X とする。

• 例5)サイコロを2回振ったときの目の和(を調べる作業)を Y とする。

• 例6)サイコロを3回振ったときの目の平均を Z とする。

• 例7)サイコロを1000回振ったときの目の平均を W とする。

Page 14: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

基本は1個

• サイコロを1回振る作業を n 回繰り返すことを、

と書くことにすれば、

21 XXY

nXXXX ,,,, 321

3

321 XXXZ

1000

1000321 XXXXW

Page 15: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

サイコロを1回投げる:X

• Xの標本空間は、S={{1}, {2}, {3}, {4}, {5}, {6} } である。

• 標本空間内の集合(事象)を考える。

S:標本空間

A:奇数B:4以上

Page 16: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

古典的確率の立場で、事象に確率を割り当てる

• それぞれの目の出る確率は6分の1である。

S:標本空間

A:奇数 B:4以上

)(AP

)(BP

)(SP

)( BAP

)( BAP

Page 17: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

統計的確率の立場で、事象に確率を割り当てる

• 主観的に確率を割り当ててみよう。

S:標本空間

A:奇数 B:4以上

)(AP

)(BP

)(SP

)( BAP

)( BAP

Page 18: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

サイコロを2回投げる:

• の標本空間は、

• { {1,1}, {1,2}, {1,3}, {1,4}, {1,5}, {1,6},

• {2,1}, {2,2}, {2,3}, {2,4},{2,5}, {2,6},

• {3,1}, {3,2}, {3,3}, {3,4},{3,5}, {3,6},

• {4,1}, {4,2}, {4,3}, {4,4},{4,5}, {4,6},

• {5,1}, {5,2}, {5,3}, {5,4},{5,5}, {5,6},

• {6,1}, {6,2}, {6,3}, {6,4},{6,5}, {6,6} }

),( 21 XX

),( 21 XX

Page 19: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

事象(集合)をいろいろ考えてみよう

• ぞろ目、合計10以上、合計4以下など等・・・

S:標本空間

A:ぞろ目 B:合計4以下

Page 20: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

サイコロを3回投げる: ),,( 321 XXX

• 標本空間の要素を一つ一つ書いてられない。

• { {1,1,1}, {1,1,2}, {1,1,3}, {1,1,4}, {1,1,5}, {1,1,6},

• {1,2,1}, {1,2,2}, {1,2,3}, {1,2,4},{1,2,5}, {1,2,6},

• ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・

• {6,6,1}, {6,6,2}, {6,6,3}, {6,6,4},{6,6,5}, {6,6,6} }

• 一つ一つの要素の確率よりもむしろ、事象(集合)の確率の方が興味の対象となる(例:合計が12以上になる確率などなど・・・・)

Page 21: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

公理論的確率の定義

• 公理1.P(A)≧0

• 公理2.P(S)=1

• 公理3.A1, A2, A3, ・・・, An は互いに共通部分を持たない

とすれば、

)()()()( 2121 nn APAPAPAAAP

• 公理論的確率の定義は、確率の抽象的な扱いを可能にした。

• 数学の一分野としての確率論が、この定義を基に発展した。

第1章 統計学と確率

• 古典的確率であれ、統計的確率であれ、確率の割り振り方に矛盾がなければそれでよしとする考え方。

Page 22: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

確率変数で表現すると、• 母集団から1個をランダム

に抽出し、その色を調べるという試行を Xで表わし、その結果観察された結果を xで表わす。

• この作業を n 回繰り返すことを、以下のように表わす。

母集団

nXXX ,,, 21

Page 23: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

確率変数で表現すると、• 母集団から1個をランダムに抽出し、その形と色を調べるという試行を( X, Y ) で表わし、その結果観察された結果を ( x, y)で表わす。

• この作業を n 回繰り返すことを、以下のように表わす。

母集団

),(,),,(),,( 2211 nn YXYXYX

Page 24: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

以下は配布資料

Page 25: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

母集団・標本・データ

(四角、赤)

(四角、赤)

(丸、赤)

(丸、黒)

(四角、青)

(三角、黒)

母集団 標本

データ

Page 26: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

日本経済

母集団・標本・データ株価の場合

(.21,.03)

(.05,.1)

(.04,.03)

(.05,.21)

(.01,.08)

(.01,.03)

母集団

標本

データ

2010/4

2010/5

2010/7

2010/6

2010/8

2010/9

(為替レート, TOPIX)

Page 27: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

サイコロ投げ有限母集団説を採れば・・・・

12

3 45

6

母集団

Page 28: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

サイコロ投げ無限母集団説に立てば・・・

母集団

Page 29: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

サイコロを1回投げる:X

• Xの標本空間は、S={{1}, {2}, {3}, {4}, {5}, {6} } である。

• 標本空間内の集合(事象)を考える。

S:標本空間

A:奇数B:4以上

Page 30: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

古典的確率の立場で、事象に確率を割り当てる

• それぞれの目の出る確率は6分の1である。

S:標本空間

A:奇数 B:4以上

)(AP

)(BP

)(SP

)( BAP

)( BAP

Page 31: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

統計的確率の立場で、事象に確率を割り当てる

• 主観的に確率を割り当ててみよう。

S:標本空間

A:奇数 B:4以上

)(AP

)(BP

)(SP

)( BAP

)( BAP

Page 32: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

サイコロを2回投げる:(X,Y)

• (X,Y) の標本空間は、

• { {1,1}, {1,2}, {1,3}, {1,4}, {1,5}, {1,6},

• {2,1}, {2,2}, {2,3}, {2,4},{2,5}, {2,6},

• {3,1}, {3,2}, {3,3}, {3,4},{3,5}, {3,6},

• {4,1}, {4,2}, {4,3}, {4,4},{4,5}, {4,6},

• {5,1}, {5,2}, {5,3}, {5,4},{5,5}, {5,6},

• {6,1}, {6,2}, {6,3}, {6,4},{6,5}, {6,6} }

Page 33: 母集団・標本・データ 確率変数・標本空間・事象 確率の定義...ランダムに抽 出 母集団・標本・データ (四角、赤) (四角、赤) (丸、赤)

事象(集合)をいろいろ考えてみよう

• ぞろ目、合計10以上、合計4以下など等・・・

S:標本空間

A: B: