met 2211 statistikk og dataanalyse
DESCRIPTION
MET 2211 Statistikk og dataanalyse. Forelesning 12.09.2003 Kapittel 5: Sannsynlighetsregning. Oppgaver. 4-1 4-2 4-3 4-4. Perspektiver på sannsynlighet. Sannsynlighet som populasjonsandel - PowerPoint PPT PresentationTRANSCRIPT
MET 2211Statistikk og dataanalyse
Forelesning 12.09.2003
Kapittel 5:
Sannsynlighetsregning
10.09.2003 MET 2211 - Fred Wenstøp 2
Oppgaver
4-1 4-2 4-3 4-4
10.09.2003 MET 2211 - Fred Wenstøp 3
Perspektiver på sannsynlighet
Sannsynlighet som populasjonsandel Sannsynligheten for å trekke et menneske med en spesiell egenskap
er lik populasjonsandelen til denne egenskapen
Sannsynlighet som relativ hyppighet i det lange løp Myntkast
Subjektiv sannsynlighet Defineres i forhold til et ruletthjul eller lignende
Aksiomatisk definisjon Sannsynlighet som areal
10.09.2003 MET 2211 - Fred Wenstøp 4
Sannsynlighet
Sannsynlighet må alltid defineres i forhold til et eksperiment
Man snakker om sannsynligheten for ulike utfall av eksperimentet
Utfallsrom Et fullstendig sett med gjensidig
utelukkende utfall Jente som røyker Jente som ikke røyker Gutt som røyker Gutt som ikke røyker
Eksperiment: Trekk en tilfeldig person fra
klassen Mulige interessante utfall
Jente Gutt Jente som røyker Person som røyker Jente eller person som
røyker osv.
10.09.2003 MET 2211 - Fred Wenstøp 5
Sannsynlighet og krysstabeller
P(J) = 70/201 = 35%
P(G)= 131/201 =65%
P(R) = 20/201 = 10%
P(J R) = 5/201 =2%
P(GR) = 15/201 =7%
KJØNN * RØYK Crosstabulation
65 5 70
93% 7% 100%
36% 25% 35%
32% 2% 35%
116 15 131
89% 11% 100%
64% 75% 65%
89% 7% 65%
181 20 201
90% 10% 100%
100% 100% 100%
90% 10% 100%
Count
% within KJØNN
% within RØYK
% of Total
Count
% within KJØNN
% within RØYK
% of Total
Count
% within KJØNN
% within RØYK
% of Total
jente
gutt
KJØNN
Total
røyker ikke røyker
RØYK
Total
P(R|J) = 5/70 = 7 %P(R|G) = 15/131 = 11%
10.09.2003 MET 2211 - Fred Wenstøp 6
Sannsynlighet som areal
P(J) = 0,35 P(G)=0,65 P(R) =0,10 P(J R) = 0,02 P(GR) = 0,07
P(J) = 0,35 P(G)=0,65
(J R) (GR)
Generell regneregel: P(J R) = P(J) + P(R) - P(J R)= 0,35 +0,10 –0,02 = 0,43
Betinget sannsynlighet: P(R | J) = P(J R) / P(J)
R
20170 135
5 15
10.09.2003 MET 2211 - Fred Wenstøp 7
Betinget sannsynlighet
DefinisjonP(R | J) = P(J R) / P(J)Fra tabellen
P(J) = 35 % P(G)= 65 % P(R) = 10 % P(J R) = 2% P(GR) = 7% P(R | J) = 7 % P(R | G) = 11 % P(J | R) = 25 % P(G | R) = 75 %
KJØNN * RØYK Crosstabulation
65 5 70
93% 7% 100%
36% 25% 35%
32% 2% 35%
116 15 131
89% 11% 100%
64% 75% 65%
89% 7% 65%
181 20 201
90% 10% 100%
100% 100% 100%
90% 10% 100%
Count
% within KJØNN
% within RØYK
% of Total
Count
% within KJØNN
% within RØYK
% of Total
Count
% within KJØNN
% within RØYK
% of Total
jente
gutt
KJØNN
Total
røyker ikke røyker
RØYK
Total
10.09.2003 MET 2211 - Fred Wenstøp 8
Bayes formel
Per definisjon: P(AB) = P(AB) / P(B)
derfor også: P(BA) = P(AB) / P(A)
Kombinert: P(BA) = P(AB) P(B) / P(A) =
)'()'|()()|(
)()|()|(
BPBAPBPBAP
BPBAPABP
10.09.2003 MET 2211 - Fred Wenstøp 9
Bayes formel,HIV-eksempel
Elizatesten
Sensitivitet: P(Test positivSmittet) = P(T+S) = 0,99
Spesifisitet: P(T-S’) = 0,98
Prevalens i befolkningen: P(S) = 0,001
Testen din er positiv! Hva er sannsynligheten for at du er smittet?
P(ST+) = P(T+S) P(S)/(P(T+S) P(S) + P(T+S’) P(S’))
= 0,99 0,001 / (0,990,001 + 0,020,999) = 0,047
10.09.2003 MET 2211 - Fred Wenstøp 10
Sannsynlighetstre
D e n n a tu rlig e ga ng
0 ,99T e s t P o s it iv
T + o g S0 ,00 099
0 ,01T e st n eg a tiv
T - o g S0 ,00 001
0 ,001S m itte t
S
0 ,02T e s t P o s it iv
T + o g S '0 ,01 998
0 ,98T e st n eg a tiv
T - o g S '0 ,97 902
0 ,999Ikke sm itte t
S '
S ta rt
10.09.2003 MET 2211 - Fred Wenstøp 11
Invertert sannsynlighetstre
E x an te a n a lyse
ST + o g S0 ,00 099
S 'T + o g S '0 ,01 998
0 ,02 097T +
ST - o g S0 ,00 001
S 'T - o g S '0 ,97 902
0 ,97 903T -
T e s tresu lta t
0,047 0,953 0,00001 0,99999