kansrekening en statistiek - universiteit utrechtiemhoff/college/statistiek/stat1.pdf ·...
TRANSCRIPT
Kansrekening en Statistiek
College 1
Dinsdag 14 September
1 / 34
Literatuur
http://www.phil.uu.nl/˜ iemhoff
Applied Statistics for the Behavioral Sciences - 5th edition,Dennis E. Hinkle, William Wiersma, and Stephen G. Jurs.
Hoofdstuk 1 t/m 4 van de (legale) online versie vanIntroduction to Probability,Charles M. Grinstead and J. Laurie Snell:http://www.dartmouth.edu/∼chance/teaching aids/books articles/probability book/book.html.
Optioneel: software R.
2 / 34
Kansrekening en Statistiek?
• Wat is de kans dat ik de loterij win? Kansspelen
• Bevordert luieren de fantasie? Psychologie
• Hoe leert mijn spamfilter wat spam is? Informatica
• Does God play dice with the universe? Natuurkunde
• Is Lucia de B. schuldig? Nee. Rechtspraak
• Werkt paracetamol? Geneeskunde
• Wat is een kans? Filosofie
3 / 34
Inductief redeneren
Deductief redeneren (logica): Uit dit volgt dat.
Inductief redeneren (kansrekening):
Uit dit volgt met deze waarschijnlijkheid dat.
Als dit gebeurt is de kans dat dat gebeurt zo en zoveel.
4 / 34
Indeling college
1 Kansrekening.
2 Statistiek.
Onderweg Toepassingen, geschiedenis, filosofie en kritiek.
5 / 34
Kritisch zijn
6 / 34
1 Kansrekening
Indeling:
• Axioma’s van de kansrekening
• Eigenschappen
• Discrete stochasten
• Natuurlijke getallen.
7 / 34
Vragen: verjaardag
Wat is de kans dat twee van ons op dezelfde dag jarig zijn?
8 / 34
Vragen: Monty Hall
Achter een van drie gesloten deuren staat een auto, achter de andere twee eengeit. Jij gaat voor een deur staan. Bijv:
geit geit
jij
auto
De quizmaster Monty Hall opent een van de twee deuren waar jij niet voorstaat en waarachter een geit staat:
????
???
geit geit
jij
auto
Jij mag blijven staan of voor de andere gesloten deur gaan staan. Vervolgenswin je dat wat achter jouw deur staat. Is het beter altijd van deur teveranderen (indien je geen geit wilt)?
9 / 34
Vragen: loterij
Wat is de kans dat je bij een loterij met 100 loten en drie prijzen een prijs wintals je 7 loten koopt? Is die kans veel groter dan als je 5 loten koopt?
10 / 34
Vragen: cirkels
&%'$
Een computer genereert willekeurige punten in de grote cirkel. Wat is de kansdat het punt in de kleine cirkel valt?
In tegenstelling tot de vorige vragen is bij dit experiment het aantal uitkomstenoneindig.
11 / 34
Vragen: natuurlijke getallen
Wat is de kans dat je uit een zak gevuld met de natuurlijke getallen een 7 trekt?
12 / 34
Vragen: het drie gevangenen probleem
Er zijn drie gevangen, A, B en C , die weten dat er twee van hen willekeuriggekozen en vervolgens terechtgesteld zullen worden. De overlevingskans voorieder van hen is dus 1
3. A vraagt aan Rita, de cipier, om een gevange ongelijk A
te noemen die terechtgesteld wordt. Rita zegt: B.
Wat is nu de kans dat A overleeft?
Er lijken twee antwoorden mogelijk:
• A krijgt geen nieuwe informatie, hij wist toch al dat B of C terechtgesteldzou worden, dus zijn overlevingskans blijft 1
3.
• Eerst waren er drie mogelijkheden: A of B of C overleeft. Nu zijn er tweemogelijkheden: A of C overleeft. De kans dat A overleeft is 1
2.
Wat is de juiste redenering?
13 / 34
Vragen: een rechtszaak
De rechtszaak People vs Collins (1968) in Californie:
Een portemonnee wordt gestolen en een getuige zegt een blonde vrouw metstaart te hebben zien vluchten in een gele auto bestuurd door een zwarte manmet baard. Een aantal dagen later wordt er een paar dat aan deze beschrijvingvoldoet gearresteerd, maar er wordt geen bewijsmateriaal gevonden.
Hoe zou je kansrekening kunnen toepassen in deze rechtszaak?
14 / 34
Vragen: spam
Je laat een spamfilter weten dat een mail onterecht als spam is geclassificeerd.
Volgens welke regels past het filter zich aan, d.w.z. hoe leert een spamfilter?
15 / 34
Uitkomstenruimte
Def. Een kansexperiment heeft een aantal mogelijke uitkomsten.
De uikomstenruimte (sample space) is de verzameling S van alle mogelijkeuitkomsten. (Het boek gebruikt Ω in plaats van S .)
16 / 34
Uitkomstenruimte
Vb.
• Twee dobbelstenen gooien en het aantal ogen tellen: S = 2, 3, . . . , 12.• Een dobbelsteen en een munt gooien:
S = 1K , 1M, 2K , 2M, . . . , 6K , 6M = 1, . . . , 6 × K , M.• Een vis uit een vijver hengelen: S =
17 / 34
Uitkomstenruimte
Vb. Het aantal manieren om drie schilderijen naast elkaar te hangen.
S = ASD,ADS,SAD,SDA,DAS,DSA.
18 / 34
Uitkomstenruimte: volgorde
Vb.
• Twee willekeurige getallen onder de 2 kiezen ongeacht de volgorde:S = (0, 0), (0, 1), (1, 1).• Een willekeurig getal onder de 2 kiezen, en dan nogmaals:
S = (0, 0), (0, 1), (1, 0), (1, 1).• Een commissie van drie parlementsleden kiezen:
S bestaat uit alle verzamelingen van drie parlementsleden.
• Een commissie van drie parlementsleden kiezen, bestaande uit eenvoorzitter, secretaris en penningmeester:S bestaat uit alle rijtjes van drie parlementsleden.
19 / 34
Gebeurtenis
Def. Een gebeurtenis (event) is een deelverzameling A van de uitkomstenruimteS : A ⊆ S .
S@
@@@@@
@@@@@@
A
20 / 34
Gebeurtenis
Vb.
• Even gooien bij het gooien van een dobbelsteen: A = 2, 4, 6.
1 3 5 2 4 6
• Positieve uitslag bij het testen op een ziekte: A = ziek.• Een bruine, grijze en zwarte hoed worden willekeurig aan haakjes 1 t/m 3
gehangen.
De gebeurtenis dat de grijze hoed aan haakje 1 of 2 en de zwarte hoedaan 1 of 3 hangt: A = GBZ,BGZ,ZGB.
21 / 34
Kansen toekennen
Vraag: Wat is de kans op een gebeurtenis?
Doel: Kansen kunnen berekenen en vergelijken. Inductief redeneren.
Intuıtie: Als alle uitkomsten even waarschijnlijk zijn, dan is de kans op elkeuitkomst hetzelde.
22 / 34
De drie axioma’s van de kansrekening
Def. De kans op gebeurtenis A wordt aangeduid met P(A).
Def. Het aantal elementen in A wordt aangeduid met #A.
Axioma’s
• Voor elke gebeurtenis A geldt P(A) ≥ 0.
• Voor de uitkomstenruimte S geldt P(S) = 1.
• Als A1, A2, . . . onafhankelijk (onderling disjunct) zijn, dan geldt
P(∞[i=1
Ai ) =∞Xi=1
P(Ai ).
St. Als S een eindige uitkomstenruimte is waarin alle uitkomsten dezelfde kanshebben, dan geldt voor elke gebeurtenis A:
P(A) =#A
#S=
aantal elementen van A
aantal elementen van S.
23 / 34
Kansen toekennen
• • •
• • •
• • •
P(A) =#A
#S=
3
9.
24 / 34
Kansen toekennen
Vb. S bestaat uit zes schoeisels:
Bij het willekeurig pakken van een schoeisel is de kans op een vis 13.
De kans op een slipper is 23.
25 / 34
Kansen toekennen
Vb.
• Een bruine, grijze en zwarte hoed willekeurig aan haakjes 1 t/m 3 hangen:P(BGZ) = P(BZG) = P(GBZ) = P(GZB) = P(ZGB) = P(ZBG) = 1
6.
• Een dodecaeder gooien: P(1) = P(2) = · · · = P(12) = 112
.
26 / 34
Kansen toekennen
Vb. De kans op een blauwe of grijze bal bij het trekken van 1 bal uit een vaasmet 2 blauwe, 3 grijze en 4 paarse ballen:
P(B of G) =# blauwe en grijze ballen
# ballen=
5
9.
@@
@@
@@@
@@
••
•••
••
• •
27 / 34
Kansen toekennen: ongeordend
Vb. Uit een groep van 3 vrouwen en 2 mannen wordt een commissie van driemensen (willekeurig) gekozen. De kans op een commissie van 2 vrouwen en 1man is P(twee vrouwen en een man) = 6
10= 3
5:
S = ~,~,~,|,~,~, |,~,~, |,~,~, ?
|,~,~, |,~,~, |,~,~, ?
|,|,~, |,|,~, |,|,~ .
28 / 34
Kansen toekennen: geordend
Vb. Uit een groep van 3 vrouwen en 2 mannen wordt een commissie bestaandeuit een voorzitter, secretaris en penningmeester gekozen. De kans op eencommissie waarbij de voorzitter en secretaris vrouwen zijn en depenningmeester een man, is P(twee vrouwen en een man) = 12
60= 1
5:
S = ~~~,~~~,~~~,~~~,~~~,~~~,
|~~,|~~,|~~,|~~,|~~,|~~,
~|~,~|~,~|~,~|~,~|~,~|~,
~~|,~~|,~~|,~~|,~~|,~~|, ?
|~~,|~~,|~~,|~~,|~~,|~~,
~|~,~|~,~|~,~|~,~|~,~|~,
~~|,~~|,~~|,~~|,~~|,~~|, ?
||~,||~,||~,||~,||~,||~,
|~|,|~|,|~ |,|~|,|~|,|~|,
~ ||,~||,~||,~||,~||,~|| .
29 / 34
Stochasten
Def. Een stochastische variabele (stochast, random variable) is een variabelewaarvan de waarden de uitkomsten van een kansexperiment zijn, d.w.z. dewaarden van de bijbehorende uitkomstenruimte. Stochasten worden aangeduidmet X , Y , Z .
Als S een aftelbare uitkomstenruimte van een experiment is en X is debijbehorende stochast, dan is de kansverdeling (verdeling, distributie,distributiefunctie) van X de functie f (m in boek) die aan elke waarde van Xde kans op die waarde toekent.Er geldt:
• P(X = i) = f (i)
• f : S → [0, 1]
•Xi∈S
f (i) = 1
• P(A) =Xi∈A
f (i).
30 / 34
Stochasten
Vb.
• Een dobbelsteen gooien: de waarden van X zijn 1, 2, 3, 4, 5, 6.De verdeling f wordt gegeven door f (1) = · · · = f (6) = 1
6.
Compacte notatie: “P(X = 2)” i.p.v. “P(2 gooien)”.
• De kans op een zekere ziekte is 0.6. Testen op de ziekte: de waarden vanX zijn pos en neg. De verdeling f wordt gegeven door f (pos) = 0.6 enf (neg) = 0.4.
31 / 34
Stochasten
Vb. Een bal trekken uit een vaas met 2 blauwe, 3 grijze en 4 paarse ballen:
@@
@@
@@@
@@
••
•••
••
• •
De waarden van X zijn B, G en P.
f (B) = P(X = B) = 29, f (G) = P(X = G) = 3
9, f (P) = P(X = P) = 4
9.
P(X = B of X = G) = 59.
32 / 34
Conventie
Ten behoeve van een compacte notatie kan het nuttig zijn om een stochast Xalleen getalswaarden te laten aannemen.
Vb. De kans op een zekere ziekte is 0.6. Het experiment is het testen op deziekte. Voor de waardes van de bijbehorende stochast worden niet pos en negmaar 1 (pos) en 0 (neg) genomen.
Dat geeft P(X = 0) = 0.4 en P(X = 1) = 0.6.
33 / 34
Finis
34 / 34