met 2211 statistikk og dataanalyse

11
MET 2211 Statistikk og dataanalyse Forelesning 12.09.2003 Kapittel 5: Sannsynlighetsregning

Upload: jania

Post on 21-Jan-2016

54 views

Category:

Documents


0 download

DESCRIPTION

MET 2211 Statistikk og dataanalyse. Forelesning 12.09.2003 Kapittel 5: Sannsynlighetsregning. Oppgaver. 4-1 4-2 4-3 4-4. Perspektiver på sannsynlighet. Sannsynlighet som populasjonsandel - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: MET 2211 Statistikk og dataanalyse

MET 2211Statistikk og dataanalyse

Forelesning 12.09.2003

Kapittel 5:

Sannsynlighetsregning

Page 2: MET 2211 Statistikk og dataanalyse

10.09.2003 MET 2211 - Fred Wenstøp 2

Oppgaver

4-1 4-2 4-3 4-4

Page 3: MET 2211 Statistikk og dataanalyse

10.09.2003 MET 2211 - Fred Wenstøp 3

Perspektiver på sannsynlighet

Sannsynlighet som populasjonsandel Sannsynligheten for å trekke et menneske med en spesiell egenskap

er lik populasjonsandelen til denne egenskapen

Sannsynlighet som relativ hyppighet i det lange løp Myntkast

Subjektiv sannsynlighet Defineres i forhold til et ruletthjul eller lignende

Aksiomatisk definisjon Sannsynlighet som areal

Page 4: MET 2211 Statistikk og dataanalyse

10.09.2003 MET 2211 - Fred Wenstøp 4

Sannsynlighet

Sannsynlighet må alltid defineres i forhold til et eksperiment

Man snakker om sannsynligheten for ulike utfall av eksperimentet

Utfallsrom Et fullstendig sett med gjensidig

utelukkende utfall Jente som røyker Jente som ikke røyker Gutt som røyker Gutt som ikke røyker

Eksperiment: Trekk en tilfeldig person fra

klassen Mulige interessante utfall

Jente Gutt Jente som røyker Person som røyker Jente eller person som

røyker osv.

Page 5: MET 2211 Statistikk og dataanalyse

10.09.2003 MET 2211 - Fred Wenstøp 5

Sannsynlighet og krysstabeller

P(J) = 70/201 = 35%

P(G)= 131/201 =65%

P(R) = 20/201 = 10%

P(J R) = 5/201 =2%

P(GR) = 15/201 =7%

KJØNN * RØYK Crosstabulation

65 5 70

93% 7% 100%

36% 25% 35%

32% 2% 35%

116 15 131

89% 11% 100%

64% 75% 65%

89% 7% 65%

181 20 201

90% 10% 100%

100% 100% 100%

90% 10% 100%

Count

% within KJØNN

% within RØYK

% of Total

Count

% within KJØNN

% within RØYK

% of Total

Count

% within KJØNN

% within RØYK

% of Total

jente

gutt

KJØNN

Total

røyker ikke røyker

RØYK

Total

P(R|J) = 5/70 = 7 %P(R|G) = 15/131 = 11%

Page 6: MET 2211 Statistikk og dataanalyse

10.09.2003 MET 2211 - Fred Wenstøp 6

Sannsynlighet som areal

P(J) = 0,35 P(G)=0,65 P(R) =0,10 P(J R) = 0,02 P(GR) = 0,07

P(J) = 0,35 P(G)=0,65

(J R) (GR)

Generell regneregel: P(J R) = P(J) + P(R) - P(J R)= 0,35 +0,10 –0,02 = 0,43

Betinget sannsynlighet: P(R | J) = P(J R) / P(J)

R

20170 135

5 15

Page 7: MET 2211 Statistikk og dataanalyse

10.09.2003 MET 2211 - Fred Wenstøp 7

Betinget sannsynlighet

DefinisjonP(R | J) = P(J R) / P(J)Fra tabellen

P(J) = 35 % P(G)= 65 % P(R) = 10 % P(J R) = 2% P(GR) = 7% P(R | J) = 7 % P(R | G) = 11 % P(J | R) = 25 % P(G | R) = 75 %

KJØNN * RØYK Crosstabulation

65 5 70

93% 7% 100%

36% 25% 35%

32% 2% 35%

116 15 131

89% 11% 100%

64% 75% 65%

89% 7% 65%

181 20 201

90% 10% 100%

100% 100% 100%

90% 10% 100%

Count

% within KJØNN

% within RØYK

% of Total

Count

% within KJØNN

% within RØYK

% of Total

Count

% within KJØNN

% within RØYK

% of Total

jente

gutt

KJØNN

Total

røyker ikke røyker

RØYK

Total

Page 8: MET 2211 Statistikk og dataanalyse

10.09.2003 MET 2211 - Fred Wenstøp 8

Bayes formel

Per definisjon: P(AB) = P(AB) / P(B)

derfor også: P(BA) = P(AB) / P(A)

Kombinert: P(BA) = P(AB) P(B) / P(A) =

)'()'|()()|(

)()|()|(

BPBAPBPBAP

BPBAPABP

Page 9: MET 2211 Statistikk og dataanalyse

10.09.2003 MET 2211 - Fred Wenstøp 9

Bayes formel,HIV-eksempel

Elizatesten

Sensitivitet: P(Test positivSmittet) = P(T+S) = 0,99

Spesifisitet: P(T-S’) = 0,98

Prevalens i befolkningen: P(S) = 0,001

Testen din er positiv! Hva er sannsynligheten for at du er smittet?

P(ST+) = P(T+S) P(S)/(P(T+S) P(S) + P(T+S’) P(S’))

= 0,99 0,001 / (0,990,001 + 0,020,999) = 0,047

Page 10: MET 2211 Statistikk og dataanalyse

10.09.2003 MET 2211 - Fred Wenstøp 10

Sannsynlighetstre

D e n n a tu rlig e ga ng

0 ,99T e s t P o s it iv

T + o g S0 ,00 099

0 ,01T e st n eg a tiv

T - o g S0 ,00 001

0 ,001S m itte t

S

0 ,02T e s t P o s it iv

T + o g S '0 ,01 998

0 ,98T e st n eg a tiv

T - o g S '0 ,97 902

0 ,999Ikke sm itte t

S '

S ta rt

Page 11: MET 2211 Statistikk og dataanalyse

10.09.2003 MET 2211 - Fred Wenstøp 11

Invertert sannsynlighetstre

E x an te a n a lyse

ST + o g S0 ,00 099

S 'T + o g S '0 ,01 998

0 ,02 097T +

ST - o g S0 ,00 001

S 'T - o g S '0 ,97 902

0 ,97 903T -

T e s tresu lta t

0,047 0,953 0,00001 0,99999