6 populære fordelinger - gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_indblik i...

30
Populære fordelinger 133 6 Populære fordelinger I kapitel 4 introducerede vi stokastiske variabler som en måde at repræsentere udfald af et eksperiment på. De stokastiske variabler kunne være både diskre- te (fx terningslag) og kontinuerte (fx varemængder). I dette kapitel skal vi se på nogle hyppigt forekommende typer af fordelinger for stokastiske variabler. Selvom en stokastisk variabel kan have en hvilken som helst fordeling, så viser det sig, at der er nogle bestemte fordelinger, som vi ofte støder på i praksis. Mange af de anvendelige fordelinger kan man beskrive relativt simpelt. I de foregående kapitler har vi til enhver mulig værdi af en stokastisk variabel op- skrevet en tilhørende sandsynlighed. Det har vi typisk gjort i tabelform, hvis der er flere end to værdier. Men hvis en stokastisk variabel kan antage mange værdier, kræver det en stor uoverskuelig tabel at specificere fordelingen. I nog- le tilfælde kan man i stedet specificere fordelingen af en stokastisk variabel ved hjælp af få parametre. Når de er beskrevet, kan man udregne sandsynlig- heden for alle mulige værdier af den stokastiske variabel ved blot at indsætte i en formel. De fordelinger, vi støder på i dette kapitel, kan alle specificeres ved hjælp af en formel og nogle få parameterværdier. I afsnit 6.1 til 6.4 skal vi kigge på fire forskellige diskrete fordelinger, mens vi i afsnit 6.5 skal stifte bekendtskab med normalfordelingen, som er en forde- ling for en kontinuert stokastisk variabel. Endelig skal vi i afsnit 6.6 kigge på en simultan fordeling for flere diskrete stokastiske variabler. 6.1 Bernoullifordelingen En diskret stokastisk variabel X siges at følge en Bernoullifordeling, hvis: i) der er to mulige udfald, dvs. X kan antage to værdier (typisk 1 og 0); og ii) sandsynligheden for, at den antager de to værdier, er henholdsvis p og 1 – p. Vi siger da, at X er Bernoullifordelt med parameteren p. Det skrives: X ~ Ber(p), hvor „~“ læses som „fordelt“.

Upload: others

Post on 30-Jan-2020

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

Populære fordelinger 133

6 Populære fordelinger

I kapitel 4 introducerede vi stokastiske variabler som en måde at repræsentere

udfald af et eksperiment på. De stokastiske variabler kunne være både diskre-

te (fx terningslag) og kontinuerte (fx varemængder). I dette kapitel skal vi se

på nogle hyppigt forekommende typer af fordelinger for stokastiske variabler.

Selvom en stokastisk variabel kan have en hvilken som helst fordeling, så viser

det sig, at der er nogle bestemte fordelinger, som vi ofte støder på i praksis.

Mange af de anvendelige fordelinger kan man beskrive relativt simpelt. I de

foregående kapitler har vi til enhver mulig værdi af en stokastisk variabel op-

skrevet en tilhørende sandsynlighed. Det har vi typisk gjort i tabelform, hvis

der er flere end to værdier. Men hvis en stokastisk variabel kan antage mange

værdier, kræver det en stor uoverskuelig tabel at specificere fordelingen. I nog-

le tilfælde kan man i stedet specificere fordelingen af en stokastisk variabel

ved hjælp af få parametre. Når de er beskrevet, kan man udregne sandsynlig-

heden for alle mulige værdier af den stokastiske variabel ved blot at indsætte i

en formel. De fordelinger, vi støder på i dette kapitel, kan alle specificeres ved

hjælp af en formel og nogle få parameterværdier.

I afsnit 6.1 til 6.4 skal vi kigge på fire forskellige diskrete fordelinger, mens

vi i afsnit 6.5 skal stifte bekendtskab med normalfordelingen, som er en forde-

ling for en kontinuert stokastisk variabel. Endelig skal vi i afsnit 6.6 kigge på

en simultan fordeling for flere diskrete stokastiske variabler.

6.1 Bernoullifordelingen

En diskret stokastisk variabel X siges at følge en Bernoullifordeling, hvis:

i) der er to mulige udfald, dvs. X kan antage to værdier (typisk 1 og 0); og

ii) sandsynligheden for, at den antager de to værdier, er henholdsvis p og 1 – p.

Vi siger da, at X er Bernoullifordelt med parameteren p. Det skrives: X ~ Ber(p),

hvor „~“ læses som „fordelt“.

Page 2: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

134 Indblik i statistik – for samfundsvidenskab

Ofte betegner man de to mulige udfald for X som henholdsvis „succes“ (når X

= 1) og „fiasko“ (når X = 0). De to betegnelser skal dog ikke forstås således, at

det ene udfald nødvendigvis er bedre end det andet. Det er blot en måde,

hvorpå man har valgt at benævne udfaldene. Alternativt siger man, at X „har

egenskaben“ (når X = 1) eller „ikke har egenskaben“ (når X = 0). Men det er

blot en anden talemåde for det, der grundlæggende er det samme, nemlig at X

kan antage to og kun to værdier.

Der er – måske lidt overraskende – mange populationer, som leder frem til

Bernoullifordelte stokastiske variabler. Her er tre eksempler.

Eksempel 6.1: Til eksperimentet „at kaste med en mønt“ er populationen: „krone“ og „plat“.

Vi kan definere en stokastisk variabel, X, således, at den antager værdien 1 i

tilfælde af krone (succes) og værdien 0 i tilfælde af plat (fiasko). Hvis plat og

krone er lige sandsynlige, dvs. hvis mønten ikke er skæv, så er X Bernoulli-

fordelt med parameteren p = ½ , dvs. X ~ Ber (½).

Eksempel 6.2: Hvis vi stopper en tilfældig dansker på gaden og spørger vedkommende, om

han (eller hun) stemmer ja eller nej til en kommende afstemning, og vi anta-

ger, at der kun er disse to svarmuligheder, og at alle potentielle respondenter

har taget stilling til spørgsmålet, så ingen svarer „ved ikke“, så har vi at gøre

med en population bestående af ja-sigere og nej-sigere. Vi kan derfor definere

en stokastisk variabel, X, der tager værdien 1, hvis personen viser sig at være

en ja-siger, og værdien 0, hvis det er en nej-siger. Da er X Bernoullifordelt

med parameteren p, hvor p er andelen i populationen, der stemmer ja.

Eksempel 6.3: Lad Y være en stokastisk variabel, der antager værdien 1, hvis det regner i

morgen, og værdien 0, hvis det ikke gør det. Den tilhørende population er en

superpopulation med elementerne „regn“ og „ikke-regn“. Dermed er Y Ber-

noullifordelt med parameteren p, hvor p er sandsynligheden for regn i mor-

gen (hvordan denne sandsynlighed så end er bestemt).

Figur 6.1:

Bernoulliforde-

lingenX

1 – p 0 (fiasko)

1 (succes)p

Plat og krone

– del 1

Ja eller nej

Vejret i morgen

Page 3: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

Populære fordelinger 135

Som de ovenstående eksempler illustrerer, så er Bernoullifordelingen relevant

i situationer, hvor vi udvælger et element fra en population med to typer af

elementer. Det kan være fra en virkelig population med to elementer, som i

eksempel 6.2 med den danske befolkning, eller en superpopulation, som i ek-

sempel 6.3 med regnvejret. Populationer med kun to typer af elementer kal-

des også Bernoullipopulationer.

Vi kan også finde beskrivende mål for en stokastisk variabel, som er Bernoul-

lifordelt. Fordi der kun er to mulige værdier for en sådan stokastisk variabel,

kan man let udregne middelværdien og variansen ved hjælp af de metoder, vi

præsenterede i kapitel 5:

E(X) = 1 – p + 0 · ( 1 – p) = p

E(X2) = 12 · p + 02 · (1 – p) =p

V(X) = E(X2) – [E(X)]2 = p – p2 = p · (1 – p)

Lad os opsummere egenskaberne for en Bernoullifordelt stokastik variabel i

en boks:

6.2 Binomialfordelingen

Binomialfordelingen fremkommer, når man udtrækker n elementer uafhæn-

gigt af hinanden fra en Bernoullipopulation. På den måde har hver udtræk-

ning sandsynligheden p for succes. Dvs. hvis X1 er den stokastiske variabel for

udfaldet af den første udtrækning, således at X1 = 1 angiver en succes, så er X1

Bernoullifordelt med parameteren p: X1 ~ Ber(p). Tilsvarende er X2 ~ Ber(p),

hvor X2 angiver udfaldet af den anden udtrækning, osv. op til Xn. Den stoka-

En Bernoullipopulation er en virkelig population eller en superpopulation, der består af to typer af elementer: succeser og fiaskoer.

Bernoullifordelingen, X ~ Ber(p)

Sandsynlighedsfunktion: f(1) = p og f(0) = 1 – p

Middelværdi og varians: E(X) = p og V(X) = p · (1 – p)

Fortolkning: X angiver udfaldet af en udtrækning fra en Bernoullipopulation, hvor X = 1 er succes, X = 0 er fiasko, og p er sandsynligheden for en succes.

Page 4: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

136 Indblik i statistik – for samfundsvidenskab

stiske variabel, Y, der angiver antallet af succeser i de n udtrækninger, siges da

at være binomialfordelt med parametrene n og p. Vi skriver det på følgende

måde: Y ~ Bin(n, p), hvor n er antallet af udtrækninger og p er sandsynlighe-

den for succes i hver af de n udtrækninger.

Eksempel 6.4: Hvis vi slår plat eller krone fem gange og definerer den stokastiske variabel Y

som antallet af „kroner“ i de fem forsøg, så er Y binomialfordelt med n = 5 og

p = ½: Y ~ Bin(5, ½).

Hvis Y er binomialfordelt med parametrene n og p, så betyder det, at Y kan

antage værdierne 0, 1, 2,…, n. Mere specifikt, så antager Y værdien 0, hvis in-

gen af de n udtrækninger resulterer i en succes, dvs. hvis X1 = 0, X2 = 0, …,

Xn = 0. Derimod antager Y værdien n, hvis alle de udtrukne er succeser: X1 = 1,

X2 = 1, …, Xn = 1. Vi kan derfor generelt skrive Y som: Y = X1 + X2 +…+ Xn =

stokastiske variabel for udfaldet af den første udtrækning, således at X1 = 1 angiver en succes, så er X1 Bernoullifordelt med parameteren p: Xi ~ Ber(p). Tilsvarende er X2 ~ Ber(p), hvor X2 angiver udfaldet af den anden udtrækning, osv. op til Xn. Den stokastiske variabel, Y, der angiver antallet af succeser i de n udtrækninger, siges da at være binomialfordelt med parametrene n og p. Vi skriver det på følgende måde: Y ~ Bin(n,p), hvor n er antallet af udtrækninger og p er sandsynligheden for succes i hver af de n udtrækninger.

Eksempel 6.4: Hvis vi slår plat eller krone fem gange og definerer den stokastiske variabel Y som antallet af 'kroner' i de fem forsøg, så er Y binomialfordelt med n = 5 og p = ½: Y ~ Bin(5, ½). [Eksempel slut]

Hvis Y er binomialfordelt med parametrene n og p, så betyder det, at Y kan antage værdierne 0, 1, 2,…, n. Mere specifikt, så antager Y værdien 0, hvis ingen af de n udtrækninger resulterer i en succes, dvs. hvis X1 = 0, X2 = 0, …, Xn = 0. Derimod antager Y værdien n, hvis alle de udvalgte er succeser: X1 = 1, X2 = 1, …, Xn = 1. Vi kan derfor

generelt skrive Y som: Y = X1 + X2 +…+ Xn = 1

n

iiX

=∑ . Den værdi, Y antager, er således lig med antallet af succeser i de n udtrækninger, dvs. summen af Xi’erne.1

Binomialfordelingen fremkommer altså som fordelingen af en sum af uafhængige Bernoullifordelte stokastiske variabler. Som vi skal se senere, så er den yderst anvendelig, når man fx udarbejder meningsmålinger på ja/nej-valg (som fx en EU-afstemning) eller efterspørgselsprognoser for køb/ikke-køb af en vare. I disse tilfælde udvælger man en stikprøve fra en Bernoullipopulation bestående af enten ja- og nej-sigere eller købere og ikke-købere. Vi mangler imidlertid at finde en formel for sandsynlighedsfordelingen for Y. Næste eksempel viser, hvordan denne formel kan opbygges.

Eksempel 6.5: Forestil dig, at vi slår plat eller krone to gange og lad Y være antallet af 'kroner' i de to kast. Da er Y binomialfordelt med n = 2 og p

1 Dette illustrerer også, hvorfor det er hensigtsmæssigt at kode de to mulige udfald

for Xi som 0 og 1 i stedet for fx 13 og 17.

. Den værdi, Y antager, er således lig med antallet af succeser i de n ud-

trækninger, dvs. summen af Xi’erne.1

Binomialfordelingen fremkommer altså som fordelingen af en sum af uaf-

hængige Bernoullifordelte stokastiske variabler. Som vi skal se senere, så er

den yderst anvendelig, når man fx udarbejder meningsmålinger for ja/nej-

valg (som fx en EU-afstemning) eller efterspørgselsprognoser for køb/ikke-

køb af en vare. I disse tilfælde udvælger man en stikprøve fra en Bernoullipo-

pulation bestående af enten ja- og nej-sigere eller købere og ikke-købere.

Vi mangler imidlertid at finde en formel for sandsynlighedsfordelingen for

Y. Næste eksempel viser, hvordan denne formel kan opbygges.

Eksempel 6.5: Forestil dig, at vi slår plat eller krone to gange, og lad Y være antallet af „kroner“

i de to kast. Da er Y binomialfordelt med n = 2 og p = ½, dvs. Y ~ Bin(2, ½). Lad

Xi være udfaldet af det i’te kast, således at X1 = 1, hvis det første kast bliver

krone, og X1 = 0, hvis det bliver plat, og tilsvarende for X2. Da er Y lig med sum-

men af X1 og X2: Y = X1 + X2. Fordi de to kast er uafhængige, så ved vi endvi-

dere fra kapitel 4, at deres simultane sandsynlighed, f(x1, x2), er lig med pro-

duktet af de marginale sandsynligheder, fX1(x1) og fX2

(x2), dvs: f(x1, x2) = fX1(x1)

· fX2(x2). Sandsynligheden for at slå to gange krone er lig med sandsynligheden

for at slå krone i det første slag ganget med sandsynligheden for krone i det

andet slag osv. De forskellige mulige udfald af eksperimentet med tilhørende

sandsynligheder og værdier af Y kan derfor sammenfattes i følgende tabel:

1. Dette illustrerer også, hvorfor det er hensigtsmæssigt at kode de to mulige udfald for Xi som 0 og 1 i stedet for fx 13 og 17.

Plat og krone

– del 2

Plat og krone

– del 3

Page 5: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

Populære fordelinger 137

X1 X2 Sandsynlighed Y

1100

1010

p · p = ½ · ½ = ¼p · (1 – p) = ½ · ½ = ¼(1 – p) · p = ½ · ½ = ¼(1 – p) · (1 – p) = ½ · ½ = ¼

2110

Lad sandsynlighedsfunktionen for Y være fY(y). Den kan da skrives som:

fY(2) = ¼

fY(1) = ¼ + ¼ = ½

fY(0) = ¼

Sandsynligheden for Y = 1 er lig med summen af to sandsynligheder fra tabel

6.1, idet der er to kombinationer af udfald af X1 og X2, der begge giver Y = 1,

nemlig hvis man først slår plat og dernæst krone eller først krone og dernæst

plat.

Eksempel 6.5 illustrerer, at sandsynlighedsfordelingen for Y afhænger af det

antal situationer, der kan lede til det samme antal succeser i n udtrækninger.

Dette kaldes også antal kombinationer i statistikkens verden. Vi kan altså sige,

at hvis Y ~ Bin(n, p), så er fY(y), hvor y er et helt tal, givet ved:

fY(y) = „antal kombinationer af værdier af Xi’ere der giver Y = y“ ·

„sandsynligheden for en sådan kombination“.

I eksempel 6.5 er der to kombinationer af værdier af X1 og X2, som giver Y = 1.

Sandsynligheden for hver af disse kombinationer er (½)2. Derfor er fY(1) =

2 · (½)2 = ½.

Mere generelt kan vi finde antallet af kombinationer, der giver k succeser i n

udtrækninger, ved hjælp af følgende formel:

hvor „n!“ udtales „n fakultet“ og beregnes som: n! = n · (n – 1) · (n – 2) · … · 2 · 1.

Eksempel 6.6: 4! = 4 · 3 · 2 · 1 = 24 og 2! = 2 · 1 = 2 og 0!=1. Det sidste er en definition.

Tabel 6.1

Binomialkoefficienten:

”sandsynligheden for en sådan kombination”. I Eksempel 6.5 er der to kombinationer af værdier af X1 og X2, som giver Y = 1. Sandsynligheden for hver af disse kombinationer er (½)2. Derfor er f(1) = 2⋅(½)2 = ½. Mere generelt kan vi finde antallet af kombinationer, der giver k succeser i n udtrækninger, ved hjælp af følgende formel:

Binomialkoefficienten: )!(!!

knk

n

k

n

−=

hvor ”n!” udtales ”n fakultet” og beregnes som: n! = n ⋅ (n-1) ⋅ (n-2) ⋅… ⋅ 2 ⋅1.

Eksempel 6.6: 4! = 4 ⋅ 3 ⋅ 2 ⋅ 1 = 24 og 2! = 2 ⋅ 1 = 2 og 0!=1. Det sidste er en definition. [Eksempel slut]

Eksempel 6.7: I eksempel 6.5 fandt vi, at der var to måder, hvorpå man kunne få én krone (k = 1) i to forsøg (n = 2). Lad os kontrollere, at formlen også giver os dette:

211

2)!12(!1

!212

=⋅

=−

=

[Eksempel slut]

Eksempel 6.8:

622

24)!24(!2

!424

=⋅

=−

=

Dvs. der er 6 måder, hvorved man kan udtrække to succeser i fire udtrækninger, fx 2 gange ”krone” i fire kast med en mønt. En måde kunne være: plat-krone-plat-krone, en anden: plat-plat-krone-krone. Opskriv selv de 6 forskellige kombinationer. [Eksempel slut]

Binomialkoefficienten er vores generelle formel til at beregne antallet af kombinationer i n udtrækninger, der giver k succeser. Så mangler vi blot at finde sandsynligheden for hver af disse kombinationer. Da de enkelte elementer er udvalgt uafhængigt, så ved vi, at sandsynligheden for en given kombination af Xi’ere er lig med produktet af deres marginale sandsynligheder.

Sandsynlighe-

der for to

gange plat og

krone

Fakultet!

k! · (n – k)!

Page 6: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

138 Indblik i statistik – for samfundsvidenskab

Eksempel 6.7: I eksempel 6.5 fandt vi, at der var to måder, hvorpå man kunne få én krone

(k = 1) i to forsøg (n = 2). Lad os kontrollere, at formlen også giver os dette:

”sandsynligheden for en sådan kombination”. I Eksempel 6.5 er der to kombinationer af værdier af X1 og X2, som giver Y = 1. Sandsynligheden for hver af disse kombinationer er (½)2. Derfor er f(1) = 2⋅(½)2 = ½. Mere generelt kan vi finde antallet af kombinationer, der giver k succeser i n udtrækninger, ved hjælp af følgende formel:

Binomialkoefficienten: )!(!!

knk

n

k

n

−=

hvor ”n!” udtales ”n fakultet” og beregnes som: n! = n ⋅ (n-1) ⋅ (n-2) ⋅… ⋅ 2 ⋅1.

Eksempel 6.6: 4! = 4 ⋅ 3 ⋅ 2 ⋅ 1 = 24 og 2! = 2 ⋅ 1 = 2 og 0!=1. Det sidste er en definition. [Eksempel slut]

Eksempel 6.7: I eksempel 6.5 fandt vi, at der var to måder, hvorpå man kunne få én krone (k = 1) i to forsøg (n = 2). Lad os kontrollere, at formlen også giver os dette:

211

2)!12(!1

!212

=⋅

=−

=

[Eksempel slut]

Eksempel 6.8:

622

24)!24(!2

!424

=⋅

=−

=

Dvs. der er 6 måder, hvorved man kan udtrække to succeser i fire udtrækninger, fx 2 gange ”krone” i fire kast med en mønt. En måde kunne være: plat-krone-plat-krone, en anden: plat-plat-krone-krone. Opskriv selv de 6 forskellige kombinationer. [Eksempel slut]

Binomialkoefficienten er vores generelle formel til at beregne antallet af kombinationer i n udtrækninger, der giver k succeser. Så mangler vi blot at finde sandsynligheden for hver af disse kombinationer. Da de enkelte elementer er udvalgt uafhængigt, så ved vi, at sandsynligheden for en given kombination af Xi’ere er lig med produktet af deres marginale sandsynligheder.

Eksempel 6.8:

”sandsynligheden for en sådan kombination”. I Eksempel 6.5 er der to kombinationer af værdier af X1 og X2, som giver Y = 1. Sandsynligheden for hver af disse kombinationer er (½)2. Derfor er f(1) = 2⋅(½)2 = ½. Mere generelt kan vi finde antallet af kombinationer, der giver k succeser i n udtrækninger, ved hjælp af følgende formel:

Binomialkoefficienten: )!(!!

knk

n

k

n

−=

hvor ”n!” udtales ”n fakultet” og beregnes som: n! = n ⋅ (n-1) ⋅ (n-2) ⋅… ⋅ 2 ⋅1.

Eksempel 6.6: 4! = 4 ⋅ 3 ⋅ 2 ⋅ 1 = 24 og 2! = 2 ⋅ 1 = 2 og 0!=1. Det sidste er en definition. [Eksempel slut]

Eksempel 6.7: I eksempel 6.5 fandt vi, at der var to måder, hvorpå man kunne få én krone (k = 1) i to forsøg (n = 2). Lad os kontrollere, at formlen også giver os dette:

211

2)!12(!1

!212

=⋅

=−

=

[Eksempel slut]

Eksempel 6.8:

622

24)!24(!2

!424

=⋅

=−

=

Dvs. der er 6 måder, hvorved man kan udtrække to succeser i fire udtrækninger, fx 2 gange ”krone” i fire kast med en mønt. En måde kunne være: plat-krone-plat-krone, en anden: plat-plat-krone-krone. Opskriv selv de 6 forskellige kombinationer. [Eksempel slut]

Binomialkoefficienten er vores generelle formel til at beregne antallet af kombinationer i n udtrækninger, der giver k succeser. Så mangler vi blot at finde sandsynligheden for hver af disse kombinationer. Da de enkelte elementer er udvalgt uafhængigt, så ved vi, at sandsynligheden for en given kombination af Xi’ere er lig med produktet af deres marginale sandsynligheder.

Dvs. der er seks måder, hvorpå man kan udtrække to succeser i fire udtræk-

ninger, fx 2 gange „krone“ i fire kast med en mønt. En måde kunne være:

plat-krone-plat-krone, en anden: plat-plat-krone-krone. Opskriv selv de seks

forskellige kombinationer.

Binomialkoefficienten er vores generelle formel til at beregne antallet af kom-

binationer i n udtrækninger, der giver k succeser. Så mangler vi blot at finde

sandsynligheden for hver af disse kombinationer. Da de enkelte elementer er

udvalgt uafhængigt, så ved vi, at sandsynligheden for en given kombination af

Xi’ere er lig med produktet af deres marginale sandsynligheder.

Eksempel 6.9: Sandsynligheden for at slå plat-plat-krone-krone i fire (uafhængige) kast

med en mønt er således ½ · ½ · ½ · ½ = (½)4.

Eksempel 6.10: Hvis vi trækker fem uafhængige gange fra en Bernoullipopulation med p =

0,3, så er sandsynligheden for først at få to succeser, dernæst to fiaskoer og til

sidst én succes givet ved: 0,3 · 0,3 · (1-0,3) · (1-0,3) · 0,3 = (0,3)3 · (1-0,3)5-3.

Generelt er sandsynligheden for en given kombination af k succeser og n – k

fiaskoer i n uafhængige udtrækninger givet ved formlen: pk · (1 – p)n–k, hvor p

er sandsynligheden for succes i hver udtrækning. Vi kan derfor skrive sand-

synligheden for, at Y er lig med k, som følger:

Eksempel 6.9: Sandsynligheden for at slå plat-plat-krone-krone i fire

(uafhængige) kast med en mønt er således ½ ⋅ ½ ⋅½ ⋅ ½ = (½)4. [Eksempel slut]

Eksempel 6.10: Hvis vi trækker fem uafhængige gange fra en Bernoullipopulation med p = 0,3, så er sandsynligheden for først at få to

succeser, dernæst to fiaskoer og til sidst én succes givet ved: 0,3 ⋅ 0,3 ⋅ (1-

0,3) ⋅ (1-0,3) ⋅ 0,3 = (0,3)3⋅(1-0,3)5-3 . [Eksempel slut]

Generelt er sandsynligheden for en given kombination af k succeser og n-k fiaskoer i n uafhængige udtrækninger givet ved formlen: pk(1-p)n-k, hvor p er sandsynligheden for succes i hver udtrækning. Vi kan derfor skrive sandsynligheden for, at Y er lig med k som følger:

( ) (1 )k n kY

nf k p p

k−

= −

hvor

n

k

er antallet af kombinationer, der giver k succeser, og pk(1-

p)n-k er sandsynligheden for hver af disse kombinationer. Dette er sandsynlighedsfunktionen for en Bin(n,p) stokastisk variabel, Y. Bemærk, at hvis n er lig med fx 100, så kan Y antage 101 forskellige værdier, hver med 101 forskellige sandsynligheder. Men vi behøver kun at kende n og p for at bruge formlen ovenfor til at udregne alle disse 101 sandsynligheder. Vi kan også beregne beskrivende mål for en binomialfordelt variabel ligesom i kapitel 4. Her udnytter vi, at Y er en sum af uafhængige stokastiske variabler: 1 ... nY X X= + + . Dermed er middelværdien af Y givet ved:

1 1( ) ( ... ) ( ) ... ( ) ...n nE Y E X X E X E X p p n p= + + = + = + + = ⋅

mens variansen af Y er:

1 1( ) ( ... ) ( ) ... ( ) (1 ) ... (1 ) (1 )n nV Y V X X V X V X p p p p np p= + + = + + = − + + − = −

Variansen af X1 + … +Xn er her blot lig med summen af de enkelte varianser, idet Xi’erne er uafhængige og kovarianserne dermed nul, jf. regnereglerne i kapitel 4. Vi opsummerer binomialfordelingen i en boks:

hvor

Eksempel 6.9: Sandsynligheden for at slå plat-plat-krone-krone i fire

(uafhængige) kast med en mønt er således ½ ⋅ ½ ⋅½ ⋅ ½ = (½)4. [Eksempel slut]

Eksempel 6.10: Hvis vi trækker fem uafhængige gange fra en Bernoullipopulation med p = 0,3, så er sandsynligheden for først at få to

succeser, dernæst to fiaskoer og til sidst én succes givet ved: 0,3 ⋅ 0,3 ⋅ (1-

0,3) ⋅ (1-0,3) ⋅ 0,3 = (0,3)3⋅(1-0,3)5-3 . [Eksempel slut]

Generelt er sandsynligheden for en given kombination af k succeser og n-k fiaskoer i n uafhængige udtrækninger givet ved formlen: pk(1-p)n-k, hvor p er sandsynligheden for succes i hver udtrækning. Vi kan derfor skrive sandsynligheden for, at Y er lig med k som følger:

( ) (1 )k n kY

nf k p p

k−

= −

hvor

n

k

er antallet af kombinationer, der giver k succeser, og pk(1-

p)n-k er sandsynligheden for hver af disse kombinationer. Dette er sandsynlighedsfunktionen for en Bin(n,p) stokastisk variabel, Y. Bemærk, at hvis n er lig med fx 100, så kan Y antage 101 forskellige værdier, hver med 101 forskellige sandsynligheder. Men vi behøver kun at kende n og p for at bruge formlen ovenfor til at udregne alle disse 101 sandsynligheder. Vi kan også beregne beskrivende mål for en binomialfordelt variabel ligesom i kapitel 4. Her udnytter vi, at Y er en sum af uafhængige stokastiske variabler: 1 ... nY X X= + + . Dermed er middelværdien af Y givet ved:

1 1( ) ( ... ) ( ) ... ( ) ...n nE Y E X X E X E X p p n p= + + = + = + + = ⋅

mens variansen af Y er:

1 1( ) ( ... ) ( ) ... ( ) (1 ) ... (1 ) (1 )n nV Y V X X V X V X p p p p np p= + + = + + = − + + − = −

Variansen af X1 + … +Xn er her blot lig med summen af de enkelte varianser, idet Xi’erne er uafhængige og kovarianserne dermed nul, jf. regnereglerne i kapitel 4. Vi opsummerer binomialfordelingen i en boks:

er antallet af kombinationer, der giver k succeser, og pk(1 – p)n–k er

sandsynligheden for hver af disse kombinationer. Dette er sandsynligheds-

funktionen for en Bin(n, p) stokastisk variabel, Y. Bemærk, at hvis n er lig med

Plat og krone

– del 4

Binomial­

koefficienten

1! · (2 – 1)!

”sandsynligheden for en sådan kombination”. I Eksempel 6.5 er der to kombinationer af værdier af X1 og X2, som giver Y = 1. Sandsynligheden for hver af disse kombinationer er (½)2. Derfor er f(1) = 2⋅(½)2 = ½. Mere generelt kan vi finde antallet af kombinationer, der giver k succeser i n udtrækninger, ved hjælp af følgende formel:

Binomialkoefficienten: )!(!!

knk

n

k

n

−=

hvor ”n!” udtales ”n fakultet” og beregnes som: n! = n ⋅ (n-1) ⋅ (n-2) ⋅… ⋅ 2 ⋅1.

Eksempel 6.6: 4! = 4 ⋅ 3 ⋅ 2 ⋅ 1 = 24 og 2! = 2 ⋅ 1 = 2 og 0!=1. Det sidste er en definition. [Eksempel slut]

Eksempel 6.7: I eksempel 6.5 fandt vi, at der var to måder, hvorpå man kunne få én krone (k = 1) i to forsøg (n = 2). Lad os kontrollere, at formlen også giver os dette:

211

2)!12(!1

!212

=⋅

=−

=

[Eksempel slut]

Eksempel 6.8:

622

24)!24(!2

!424

=⋅

=−

=

Dvs. der er 6 måder, hvorved man kan udtrække to succeser i fire udtrækninger, fx 2 gange ”krone” i fire kast med en mønt. En måde kunne være: plat-krone-plat-krone, en anden: plat-plat-krone-krone. Opskriv selv de 6 forskellige kombinationer. [Eksempel slut]

Binomialkoefficienten er vores generelle formel til at beregne antallet af kombinationer i n udtrækninger, der giver k succeser. Så mangler vi blot at finde sandsynligheden for hver af disse kombinationer. Da de enkelte elementer er udvalgt uafhængigt, så ved vi, at sandsynligheden for en given kombination af Xi’ere er lig med produktet af deres marginale sandsynligheder.

”sandsynligheden for en sådan kombination”. I Eksempel 6.5 er der to kombinationer af værdier af X1 og X2, som giver Y = 1. Sandsynligheden for hver af disse kombinationer er (½)2. Derfor er f(1) = 2⋅(½)2 = ½. Mere generelt kan vi finde antallet af kombinationer, der giver k succeser i n udtrækninger, ved hjælp af følgende formel:

Binomialkoefficienten: )!(!!

knk

n

k

n

−=

hvor ”n!” udtales ”n fakultet” og beregnes som: n! = n ⋅ (n-1) ⋅ (n-2) ⋅… ⋅ 2 ⋅1.

Eksempel 6.6: 4! = 4 ⋅ 3 ⋅ 2 ⋅ 1 = 24 og 2! = 2 ⋅ 1 = 2 og 0!=1. Det sidste er en definition. [Eksempel slut]

Eksempel 6.7: I eksempel 6.5 fandt vi, at der var to måder, hvorpå man kunne få én krone (k = 1) i to forsøg (n = 2). Lad os kontrollere, at formlen også giver os dette:

211

2)!12(!1

!212

=⋅

=−

=

[Eksempel slut]

Eksempel 6.8:

622

24)!24(!2

!424

=⋅

=−

=

Dvs. der er 6 måder, hvorved man kan udtrække to succeser i fire udtrækninger, fx 2 gange ”krone” i fire kast med en mønt. En måde kunne være: plat-krone-plat-krone, en anden: plat-plat-krone-krone. Opskriv selv de 6 forskellige kombinationer. [Eksempel slut]

Binomialkoefficienten er vores generelle formel til at beregne antallet af kombinationer i n udtrækninger, der giver k succeser. Så mangler vi blot at finde sandsynligheden for hver af disse kombinationer. Da de enkelte elementer er udvalgt uafhængigt, så ved vi, at sandsynligheden for en given kombination af Xi’ere er lig med produktet af deres marginale sandsynligheder.

2! · (4 – 2)!

”sandsynligheden for en sådan kombination”. I Eksempel 6.5 er der to kombinationer af værdier af X1 og X2, som giver Y = 1. Sandsynligheden for hver af disse kombinationer er (½)2. Derfor er f(1) = 2⋅(½)2 = ½. Mere generelt kan vi finde antallet af kombinationer, der giver k succeser i n udtrækninger, ved hjælp af følgende formel:

Binomialkoefficienten: )!(!!

knk

n

k

n

−=

hvor ”n!” udtales ”n fakultet” og beregnes som: n! = n ⋅ (n-1) ⋅ (n-2) ⋅… ⋅ 2 ⋅1.

Eksempel 6.6: 4! = 4 ⋅ 3 ⋅ 2 ⋅ 1 = 24 og 2! = 2 ⋅ 1 = 2 og 0!=1. Det sidste er en definition. [Eksempel slut]

Eksempel 6.7: I eksempel 6.5 fandt vi, at der var to måder, hvorpå man kunne få én krone (k = 1) i to forsøg (n = 2). Lad os kontrollere, at formlen også giver os dette:

211

2)!12(!1

!212

=⋅

=−

=

[Eksempel slut]

Eksempel 6.8:

622

24)!24(!2

!424

=⋅

=−

=

Dvs. der er 6 måder, hvorved man kan udtrække to succeser i fire udtrækninger, fx 2 gange ”krone” i fire kast med en mønt. En måde kunne være: plat-krone-plat-krone, en anden: plat-plat-krone-krone. Opskriv selv de 6 forskellige kombinationer. [Eksempel slut]

Binomialkoefficienten er vores generelle formel til at beregne antallet af kombinationer i n udtrækninger, der giver k succeser. Så mangler vi blot at finde sandsynligheden for hver af disse kombinationer. Da de enkelte elementer er udvalgt uafhængigt, så ved vi, at sandsynligheden for en given kombination af Xi’ere er lig med produktet af deres marginale sandsynligheder.

Plat og krone

– del 5

Kombinations­

sandsynlighed

Eksempel 6.9: Sandsynligheden for at slå plat-plat-krone-krone i fire

(uafhængige) kast med en mønt er således ½ ⋅ ½ ⋅½ ⋅ ½ = (½)4. [Eksempel slut]

Eksempel 6.10: Hvis vi trækker fem uafhængige gange fra en Bernoullipopulation med p = 0,3, så er sandsynligheden for først at få to

succeser, dernæst to fiaskoer og til sidst én succes givet ved: 0,3 ⋅ 0,3 ⋅ (1-

0,3) ⋅ (1-0,3) ⋅ 0,3 = (0,3)3⋅(1-0,3)5-3 . [Eksempel slut]

Generelt er sandsynligheden for en given kombination af k succeser og n-k fiaskoer i n uafhængige udtrækninger givet ved formlen: pk(1-p)n-k, hvor p er sandsynligheden for succes i hver udtrækning. Vi kan derfor skrive sandsynligheden for, at Y er lig med k som følger:

( ) (1 )k n kY

nf k p p

k−

= −

hvor

n

k

er antallet af kombinationer, der giver k succeser, og pk(1-

p)n-k er sandsynligheden for hver af disse kombinationer. Dette er sandsynlighedsfunktionen for en Bin(n,p) stokastisk variabel, Y. Bemærk, at hvis n er lig med fx 100, så kan Y antage 101 forskellige værdier, hver med 101 forskellige sandsynligheder. Men vi behøver kun at kende n og p for at bruge formlen ovenfor til at udregne alle disse 101 sandsynligheder. Vi kan også beregne beskrivende mål for en binomialfordelt variabel ligesom i kapitel 4. Her udnytter vi, at Y er en sum af uafhængige stokastiske variabler: 1 ... nY X X= + + . Dermed er middelværdien af Y givet ved:

1 1( ) ( ... ) ( ) ... ( ) ...n nE Y E X X E X E X p p n p= + + = + = + + = ⋅

mens variansen af Y er:

1 1( ) ( ... ) ( ) ... ( ) (1 ) ... (1 ) (1 )n nV Y V X X V X V X p p p p np p= + + = + + = − + + − = −

Variansen af X1 + … +Xn er her blot lig med summen af de enkelte varianser, idet Xi’erne er uafhængige og kovarianserne dermed nul, jf. regnereglerne i kapitel 4. Vi opsummerer binomialfordelingen i en boks:

Eksempel 6.9: Sandsynligheden for at slå plat-plat-krone-krone i fire

(uafhængige) kast med en mønt er således ½ ⋅ ½ ⋅½ ⋅ ½ = (½)4. [Eksempel slut]

Eksempel 6.10: Hvis vi trækker fem uafhængige gange fra en Bernoullipopulation med p = 0,3, så er sandsynligheden for først at få to

succeser, dernæst to fiaskoer og til sidst én succes givet ved: 0,3 ⋅ 0,3 ⋅ (1-

0,3) ⋅ (1-0,3) ⋅ 0,3 = (0,3)3⋅(1-0,3)5-3 . [Eksempel slut]

Generelt er sandsynligheden for en given kombination af k succeser og n-k fiaskoer i n uafhængige udtrækninger givet ved formlen: pk(1-p)n-k, hvor p er sandsynligheden for succes i hver udtrækning. Vi kan derfor skrive sandsynligheden for, at Y er lig med k som følger:

( ) (1 )k n kY

nf k p p

k−

= −

hvor

n

k

er antallet af kombinationer, der giver k succeser, og pk(1-

p)n-k er sandsynligheden for hver af disse kombinationer. Dette er sandsynlighedsfunktionen for en Bin(n,p) stokastisk variabel, Y. Bemærk, at hvis n er lig med fx 100, så kan Y antage 101 forskellige værdier, hver med 101 forskellige sandsynligheder. Men vi behøver kun at kende n og p for at bruge formlen ovenfor til at udregne alle disse 101 sandsynligheder. Vi kan også beregne beskrivende mål for en binomialfordelt variabel ligesom i kapitel 4. Her udnytter vi, at Y er en sum af uafhængige stokastiske variabler: 1 ... nY X X= + + . Dermed er middelværdien af Y givet ved:

1 1( ) ( ... ) ( ) ... ( ) ...n nE Y E X X E X E X p p n p= + + = + = + + = ⋅

mens variansen af Y er:

1 1( ) ( ... ) ( ) ... ( ) (1 ) ... (1 ) (1 )n nV Y V X X V X V X p p p p np p= + + = + + = − + + − = −

Variansen af X1 + … +Xn er her blot lig med summen af de enkelte varianser, idet Xi’erne er uafhængige og kovarianserne dermed nul, jf. regnereglerne i kapitel 4. Vi opsummerer binomialfordelingen i en boks:

··

Page 7: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

Populære fordelinger 139

fx 100, så kan Y antage 101 forskellige værdier, med tilhørende 101 forskellige

sandsynligheder. Men vi behøver kun at kende n og p for at bruge formlen

ovenfor til at udregne alle disse 101 sandsynligheder.

Vi kan også beregne beskrivende mål for en binomialfordelt variabel lige-

som i kapitel 5. Her udnytter vi, at Y er en sum af uafhængige stokastiske va-

riabler: Y = X1 + … + Xn. Dermed er middelværdien af Y givet ved:

E(Y) = E(X1 + … + Xn) = E(X1) + … + E(Xn) = p + … + p = n · p

mens variansen af Y er:

V(Y) = V(X1 + … + Xn) = V(X1) + … + V(Xn) =

p · (1 – p) + … + p · (1 – p) = n · p · (1 – p)

Variansen af X1 + … + Xn er her blot lig med summen af de enkelte varianser,

idet Xi’erne er uafhængige og kovarianserne dermed nul, jf. regnereglerne i

kapitel 5.

Vi opsummerer binomialfordelingen i en boks:

Eksempel 6.11: Hvad er sandsynligheden for tre gange krone i eksempel 6.4, hvor Y ~

Bin(5, ½)?

Binomialfordelingen, Y ~ Bin(n, p)

Sandsynlighedsfunktion: ( ) (1 )k n k

Y

nf k p p

k−

= − , k = 0, 1, 2, …, n

Middelværdi og varians: ( ) og ( ) (1 )E Y n p V Y n p p= ⋅ = ⋅ ⋅ − Fortolkning: Y angiver antal succeser blandt n uafhængige udtrækninger fra en Bernoullipopulation, hvor der er konstant sandsynlighed p for succes i hver udtrækning.

Eksempel 6.11: Hvad er sandsynligheden for tre gange krone i eksempel 6.4, hvor Y ~ Bin(5, ½)?

3 5 35(3) 0,5 (1 0,5) 0,3125

3Yf−

= − =

Middelværdien og variansen af Y er i dette tilfælde:

( ) 5 0,5 2,5 og ( ) 5 0,5 (1 0,5) 1, 25E Y V Y= ⋅ = = ⋅ ⋅ − =[Eksempel slut]

Eksempel 6.12: Forestil dig, at vi har et selskab på syv personer. Hvad er sandsynligheden for, at to af de syv personer er født på en mandag? Hvis de syv personers fødselsdage er uafhængige (altså ingen tvillinger i selskabet), så kan hver enkelt person ses som en udtrækning fra en Bernoullipopulation af ”mandagsfødte” og ”ikke-mandagsfødte”. p = 1/7 må da være sandsynligheden for at trække en mandagsfødt (en succes). Den stokastiske variabel Y, der angiver antallet af mandagsbørn i selskabet, er derfor binomialfordelt med n = 7 og p = 1/7. Dermed bliver sandsynligheden for, at to personer i selskabet er født en mandag givet ved:

2 7 27( 2) (1/ 7) (1 1/ 7) 0,198

2P Y −

= = − =

Hvad er nu sandsynligheden for, at mindst to har fødselsdag en mandag? Denne sandsynlighed er lig med 1 minus sandsynligheden for, at højest én har fødselsdag en mandag. Dvs:

1 7 1 0 7

( 2) 1 ( 1) 1 ( 1) ( 0)7 7

1 (1/ 7) (1 1/ 7) (1/ 7) (1 1/ 7)1 0

1 0, 40 0,34 0,26

P Y P Y P Y P Y

≥ = − ≤ = − = − =

= − − − −

= − − =

Middelværdien og variansen af Y er i dette tilfælde:

Binomialfordelingen, Y ~ Bin(n, p)

Sandsynlighedsfunktion: ( ) (1 )k n k

Y

nf k p p

k−

= − , k = 0, 1, 2, …, n

Middelværdi og varians: ( ) og ( ) (1 )E Y n p V Y n p p= ⋅ = ⋅ ⋅ − Fortolkning: Y angiver antal succeser blandt n uafhængige udtrækninger fra en Bernoullipopulation, hvor der er konstant sandsynlighed p for succes i hver udtrækning.

Eksempel 6.11: Hvad er sandsynligheden for tre gange krone i eksempel 6.4, hvor Y ~ Bin(5, ½)?

3 5 35(3) 0,5 (1 0,5) 0,3125

3Yf−

= − =

Middelværdien og variansen af Y er i dette tilfælde:

( ) 5 0,5 2,5 og ( ) 5 0,5 (1 0,5) 1, 25E Y V Y= ⋅ = = ⋅ ⋅ − =[Eksempel slut]

Eksempel 6.12: Forestil dig, at vi har et selskab på syv personer. Hvad er sandsynligheden for, at to af de syv personer er født på en mandag? Hvis de syv personers fødselsdage er uafhængige (altså ingen tvillinger i selskabet), så kan hver enkelt person ses som en udtrækning fra en Bernoullipopulation af ”mandagsfødte” og ”ikke-mandagsfødte”. p = 1/7 må da være sandsynligheden for at trække en mandagsfødt (en succes). Den stokastiske variabel Y, der angiver antallet af mandagsbørn i selskabet, er derfor binomialfordelt med n = 7 og p = 1/7. Dermed bliver sandsynligheden for, at to personer i selskabet er født en mandag givet ved:

2 7 27( 2) (1/ 7) (1 1/ 7) 0,198

2P Y −

= = − =

Hvad er nu sandsynligheden for, at mindst to har fødselsdag en mandag? Denne sandsynlighed er lig med 1 minus sandsynligheden for, at højest én har fødselsdag en mandag. Dvs:

1 7 1 0 7

( 2) 1 ( 1) 1 ( 1) ( 0)7 7

1 (1/ 7) (1 1/ 7) (1/ 7) (1 1/ 7)1 0

1 0, 40 0,34 0,26

P Y P Y P Y P Y

≥ = − ≤ = − = − =

= − − − −

= − − =

Eksempel 6.12: Forestil dig, at vi har et selskab på syv personer. Hvad er sandsynligheden

for, at to af de syv personer er født på en mandag? Hvis de syv personers fød-

selsdage er uafhængige (altså ingen tvillinger i selskabet), så kan hver enkelt

person ses som en udtrækning fra en Bernoullipopulation af „mandagsfød-

Binomialfordelingen, Y ~ Bin(n, p)

Sandsynlighedsfunktion: , k = 0, 1, 2, …, n

Binomialfordelingen, Y ~ Bin(n, p)

Sandsynlighedsfunktion: ( ) (1 )k n k

Y

nf k p p

k−

= − , k = 0, 1, 2, …, n

Middelværdi og varians: ( ) og ( ) (1 )E Y n p V Y n p p= ⋅ = ⋅ ⋅ − Fortolkning: Y angiver antal succeser blandt n uafhængige udtrækninger fra en Bernoullipopulation, hvor der er konstant sandsynlighed p for succes i hver udtrækning.

Eksempel 6.11: Hvad er sandsynligheden for tre gange krone i eksempel 6.4, hvor Y ~ Bin(5, ½)?

3 5 35(3) 0,5 (1 0,5) 0,3125

3Yf−

= − =

Middelværdien og variansen af Y er i dette tilfælde:

( ) 5 0,5 2,5 og ( ) 5 0,5 (1 0,5) 1, 25E Y V Y= ⋅ = = ⋅ ⋅ − =[Eksempel slut]

Eksempel 6.12: Forestil dig, at vi har et selskab på syv personer. Hvad er sandsynligheden for, at to af de syv personer er født på en mandag? Hvis de syv personers fødselsdage er uafhængige (altså ingen tvillinger i selskabet), så kan hver enkelt person ses som en udtrækning fra en Bernoullipopulation af ”mandagsfødte” og ”ikke-mandagsfødte”. p = 1/7 må da være sandsynligheden for at trække en mandagsfødt (en succes). Den stokastiske variabel Y, der angiver antallet af mandagsbørn i selskabet, er derfor binomialfordelt med n = 7 og p = 1/7. Dermed bliver sandsynligheden for, at to personer i selskabet er født en mandag givet ved:

2 7 27( 2) (1/ 7) (1 1/ 7) 0,198

2P Y −

= = − =

Hvad er nu sandsynligheden for, at mindst to har fødselsdag en mandag? Denne sandsynlighed er lig med 1 minus sandsynligheden for, at højest én har fødselsdag en mandag. Dvs:

1 7 1 0 7

( 2) 1 ( 1) 1 ( 1) ( 0)7 7

1 (1/ 7) (1 1/ 7) (1/ 7) (1 1/ 7)1 0

1 0, 40 0,34 0,26

P Y P Y P Y P Y

≥ = − ≤ = − = − =

= − − − −

= − − =

Middelværdi og varians: E(Y) = n · p og V(Y) = n · p · (1 – p)

Fortolkning: Y angiver antal succeser blandt n uafhængige udtrækninger fra en Bernoullipopulation, hvor der er konstant sandsynlighed p for succes i hver ud-trækning.

Binomialfordelingen, Y ~ Bin(n, p)

Sandsynlighedsfunktion: ( ) (1 )k n k

Y

nf k p p

k−

= − , k = 0, 1, 2, …, n

Middelværdi og varians: ( ) og ( ) (1 )E Y n p V Y n p p= ⋅ = ⋅ ⋅ − Fortolkning: Y angiver antal succeser blandt n uafhængige udtrækninger fra en Bernoullipopulation, hvor der er konstant sandsynlighed p for succes i hver udtrækning.

Eksempel 6.11: Hvad er sandsynligheden for tre gange krone i eksempel 6.4, hvor Y ~ Bin(5, ½)?

3 5 35(3) 0,5 (1 0,5) 0,3125

3Yf−

= − =

Middelværdien og variansen af Y er i dette tilfælde:

( ) 5 0,5 2,5 og ( ) 5 0,5 (1 0,5) 1, 25E Y V Y= ⋅ = = ⋅ ⋅ − =[Eksempel slut]

Eksempel 6.12: Forestil dig, at vi har et selskab på syv personer. Hvad er sandsynligheden for, at to af de syv personer er født på en mandag? Hvis de syv personers fødselsdage er uafhængige (altså ingen tvillinger i selskabet), så kan hver enkelt person ses som en udtrækning fra en Bernoullipopulation af ”mandagsfødte” og ”ikke-mandagsfødte”. p = 1/7 må da være sandsynligheden for at trække en mandagsfødt (en succes). Den stokastiske variabel Y, der angiver antallet af mandagsbørn i selskabet, er derfor binomialfordelt med n = 7 og p = 1/7. Dermed bliver sandsynligheden for, at to personer i selskabet er født en mandag givet ved:

2 7 27( 2) (1/ 7) (1 1/ 7) 0,198

2P Y −

= = − =

Hvad er nu sandsynligheden for, at mindst to har fødselsdag en mandag? Denne sandsynlighed er lig med 1 minus sandsynligheden for, at højest én har fødselsdag en mandag. Dvs:

1 7 1 0 7

( 2) 1 ( 1) 1 ( 1) ( 0)7 7

1 (1/ 7) (1 1/ 7) (1/ 7) (1 1/ 7)1 0

1 0, 40 0,34 0,26

P Y P Y P Y P Y

≥ = − ≤ = − = − =

= − − − −

= − − =

· ·

Binomialfordelingen, Y ~ Bin(n, p)

Sandsynlighedsfunktion: ( ) (1 )k n k

Y

nf k p p

k−

= − , k = 0, 1, 2, …, n

Middelværdi og varians: ( ) og ( ) (1 )E Y n p V Y n p p= ⋅ = ⋅ ⋅ − Fortolkning: Y angiver antal succeser blandt n uafhængige udtrækninger fra en Bernoullipopulation, hvor der er konstant sandsynlighed p for succes i hver udtrækning.

Eksempel 6.11: Hvad er sandsynligheden for tre gange krone i eksempel 6.4, hvor Y ~ Bin(5, ½)?

3 5 35(3) 0,5 (1 0,5) 0,3125

3Yf−

= − =

Middelværdien og variansen af Y er i dette tilfælde:

( ) 5 0,5 2,5 og ( ) 5 0,5 (1 0,5) 1, 25E Y V Y= ⋅ = = ⋅ ⋅ − =[Eksempel slut]

Eksempel 6.12: Forestil dig, at vi har et selskab på syv personer. Hvad er sandsynligheden for, at to af de syv personer er født på en mandag? Hvis de syv personers fødselsdage er uafhængige (altså ingen tvillinger i selskabet), så kan hver enkelt person ses som en udtrækning fra en Bernoullipopulation af ”mandagsfødte” og ”ikke-mandagsfødte”. p = 1/7 må da være sandsynligheden for at trække en mandagsfødt (en succes). Den stokastiske variabel Y, der angiver antallet af mandagsbørn i selskabet, er derfor binomialfordelt med n = 7 og p = 1/7. Dermed bliver sandsynligheden for, at to personer i selskabet er født en mandag givet ved:

2 7 27( 2) (1/ 7) (1 1/ 7) 0,198

2P Y −

= = − =

Hvad er nu sandsynligheden for, at mindst to har fødselsdag en mandag? Denne sandsynlighed er lig med 1 minus sandsynligheden for, at højest én har fødselsdag en mandag. Dvs:

1 7 1 0 7

( 2) 1 ( 1) 1 ( 1) ( 0)7 7

1 (1/ 7) (1 1/ 7) (1/ 7) (1 1/ 7)1 0

1 0, 40 0,34 0,26

P Y P Y P Y P Y

≥ = − ≤ = − = − =

= − − − −

= − − =

· ·

Binomialfordelingen, Y ~ Bin(n, p)

Sandsynlighedsfunktion: ( ) (1 )k n k

Y

nf k p p

k−

= − , k = 0, 1, 2, …, n

Middelværdi og varians: ( ) og ( ) (1 )E Y n p V Y n p p= ⋅ = ⋅ ⋅ − Fortolkning: Y angiver antal succeser blandt n uafhængige udtrækninger fra en Bernoullipopulation, hvor der er konstant sandsynlighed p for succes i hver udtrækning.

Eksempel 6.11: Hvad er sandsynligheden for tre gange krone i eksempel 6.4, hvor Y ~ Bin(5, ½)?

3 5 35(3) 0,5 (1 0,5) 0,3125

3Yf−

= − =

Middelværdien og variansen af Y er i dette tilfælde:

( ) 5 0,5 2,5 og ( ) 5 0,5 (1 0,5) 1, 25E Y V Y= ⋅ = = ⋅ ⋅ − =[Eksempel slut]

Eksempel 6.12: Forestil dig, at vi har et selskab på syv personer. Hvad er sandsynligheden for, at to af de syv personer er født på en mandag? Hvis de syv personers fødselsdage er uafhængige (altså ingen tvillinger i selskabet), så kan hver enkelt person ses som en udtrækning fra en Bernoullipopulation af ”mandagsfødte” og ”ikke-mandagsfødte”. p = 1/7 må da være sandsynligheden for at trække en mandagsfødt (en succes). Den stokastiske variabel Y, der angiver antallet af mandagsbørn i selskabet, er derfor binomialfordelt med n = 7 og p = 1/7. Dermed bliver sandsynligheden for, at to personer i selskabet er født en mandag givet ved:

2 7 27( 2) (1/ 7) (1 1/ 7) 0,198

2P Y −

= = − =

Hvad er nu sandsynligheden for, at mindst to har fødselsdag en mandag? Denne sandsynlighed er lig med 1 minus sandsynligheden for, at højest én har fødselsdag en mandag. Dvs:

1 7 1 0 7

( 2) 1 ( 1) 1 ( 1) ( 0)7 7

1 (1/ 7) (1 1/ 7) (1/ 7) (1 1/ 7)1 0

1 0, 40 0,34 0,26

P Y P Y P Y P Y

≥ = − ≤ = − = − =

= − − − −

= − − =

Binomialfordelingen, Y ~ Bin(n, p)

Sandsynlighedsfunktion: ( ) (1 )k n k

Y

nf k p p

k−

= − , k = 0, 1, 2, …, n

Middelværdi og varians: ( ) og ( ) (1 )E Y n p V Y n p p= ⋅ = ⋅ ⋅ − Fortolkning: Y angiver antal succeser blandt n uafhængige udtrækninger fra en Bernoullipopulation, hvor der er konstant sandsynlighed p for succes i hver udtrækning.

Eksempel 6.11: Hvad er sandsynligheden for tre gange krone i eksempel 6.4, hvor Y ~ Bin(5, ½)?

3 5 35(3) 0,5 (1 0,5) 0,3125

3Yf−

= − =

Middelværdien og variansen af Y er i dette tilfælde:

( ) 5 0,5 2,5 og ( ) 5 0,5 (1 0,5) 1, 25E Y V Y= ⋅ = = ⋅ ⋅ − =[Eksempel slut]

Eksempel 6.12: Forestil dig, at vi har et selskab på syv personer. Hvad er sandsynligheden for, at to af de syv personer er født på en mandag? Hvis de syv personers fødselsdage er uafhængige (altså ingen tvillinger i selskabet), så kan hver enkelt person ses som en udtrækning fra en Bernoullipopulation af ”mandagsfødte” og ”ikke-mandagsfødte”. p = 1/7 må da være sandsynligheden for at trække en mandagsfødt (en succes). Den stokastiske variabel Y, der angiver antallet af mandagsbørn i selskabet, er derfor binomialfordelt med n = 7 og p = 1/7. Dermed bliver sandsynligheden for, at to personer i selskabet er født en mandag givet ved:

2 7 27( 2) (1/ 7) (1 1/ 7) 0,198

2P Y −

= = − =

Hvad er nu sandsynligheden for, at mindst to har fødselsdag en mandag? Denne sandsynlighed er lig med 1 minus sandsynligheden for, at højest én har fødselsdag en mandag. Dvs:

1 7 1 0 7

( 2) 1 ( 1) 1 ( 1) ( 0)7 7

1 (1/ 7) (1 1/ 7) (1/ 7) (1 1/ 7)1 0

1 0, 40 0,34 0,26

P Y P Y P Y P Y

≥ = − ≤ = − = − =

= − − − −

= − − =

Plat og krone

– del 6

Fødselsdag på

en mandag

Page 8: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

140 Indblik i statistik – for samfundsvidenskab

te“ og „ikke-mandagsfødte“. p = 1/7 må da være sandsynligheden for at

trække en mandagsfødt (en succes). Den stokastiske variabel Y, der angiver

antallet af mandagsbørn i selskabet, er derfor binomialfordelt med n = 7 og

p = 1/7. Dermed bliver sandsynligheden for, at to personer i selskabet er født

en mandag givet ved:

Binomialfordelingen, Y ~ Bin(n, p)

Sandsynlighedsfunktion: ( ) (1 )k n k

Y

nf k p p

k−

= − , k = 0, 1, 2, …, n

Middelværdi og varians: ( ) og ( ) (1 )E Y n p V Y n p p= ⋅ = ⋅ ⋅ − Fortolkning: Y angiver antal succeser blandt n uafhængige udtrækninger fra en Bernoullipopulation, hvor der er konstant sandsynlighed p for succes i hver udtrækning.

Eksempel 6.11: Hvad er sandsynligheden for tre gange krone i eksempel 6.4, hvor Y ~ Bin(5, ½)?

3 5 35(3) 0,5 (1 0,5) 0,3125

3Yf−

= − =

Middelværdien og variansen af Y er i dette tilfælde:

( ) 5 0,5 2,5 og ( ) 5 0,5 (1 0,5) 1, 25E Y V Y= ⋅ = = ⋅ ⋅ − =[Eksempel slut]

Eksempel 6.12: Forestil dig, at vi har et selskab på syv personer. Hvad er sandsynligheden for, at to af de syv personer er født på en mandag? Hvis de syv personers fødselsdage er uafhængige (altså ingen tvillinger i selskabet), så kan hver enkelt person ses som en udtrækning fra en Bernoullipopulation af ”mandagsfødte” og ”ikke-mandagsfødte”. p = 1/7 må da være sandsynligheden for at trække en mandagsfødt (en succes). Den stokastiske variabel Y, der angiver antallet af mandagsbørn i selskabet, er derfor binomialfordelt med n = 7 og p = 1/7. Dermed bliver sandsynligheden for, at to personer i selskabet er født en mandag givet ved:

2 7 27( 2) (1/ 7) (1 1/ 7) 0,198

2P Y −

= = − =

Hvad er nu sandsynligheden for, at mindst to har fødselsdag en mandag? Denne sandsynlighed er lig med 1 minus sandsynligheden for, at højest én har fødselsdag en mandag. Dvs:

1 7 1 0 7

( 2) 1 ( 1) 1 ( 1) ( 0)7 7

1 (1/ 7) (1 1/ 7) (1/ 7) (1 1/ 7)1 0

1 0, 40 0,34 0,26

P Y P Y P Y P Y

≥ = − ≤ = − = − =

= − − − −

= − − =

Hvad er nu sandsynligheden for, at mindst to har fødselsdag en mandag?

Denne sandsynlighed er lig med 1 minus sandsynligheden for, at højest én har

fødselsdag en mandag. Dvs:

Binomialfordelingen, Y ~ Bin(n, p)

Sandsynlighedsfunktion: ( ) (1 )k n k

Y

nf k p p

k−

= − , k = 0, 1, 2, …, n

Middelværdi og varians: ( ) og ( ) (1 )E Y n p V Y n p p= ⋅ = ⋅ ⋅ − Fortolkning: Y angiver antal succeser blandt n uafhængige udtrækninger fra en Bernoullipopulation, hvor der er konstant sandsynlighed p for succes i hver udtrækning.

Eksempel 6.11: Hvad er sandsynligheden for tre gange krone i eksempel 6.4, hvor Y ~ Bin(5, ½)?

3 5 35(3) 0,5 (1 0,5) 0,3125

3Yf−

= − =

Middelværdien og variansen af Y er i dette tilfælde:

( ) 5 0,5 2,5 og ( ) 5 0,5 (1 0,5) 1, 25E Y V Y= ⋅ = = ⋅ ⋅ − =[Eksempel slut]

Eksempel 6.12: Forestil dig, at vi har et selskab på syv personer. Hvad er sandsynligheden for, at to af de syv personer er født på en mandag? Hvis de syv personers fødselsdage er uafhængige (altså ingen tvillinger i selskabet), så kan hver enkelt person ses som en udtrækning fra en Bernoullipopulation af ”mandagsfødte” og ”ikke-mandagsfødte”. p = 1/7 må da være sandsynligheden for at trække en mandagsfødt (en succes). Den stokastiske variabel Y, der angiver antallet af mandagsbørn i selskabet, er derfor binomialfordelt med n = 7 og p = 1/7. Dermed bliver sandsynligheden for, at to personer i selskabet er født en mandag givet ved:

2 7 27( 2) (1/ 7) (1 1/ 7) 0,198

2P Y −

= = − =

Hvad er nu sandsynligheden for, at mindst to har fødselsdag en mandag? Denne sandsynlighed er lig med 1 minus sandsynligheden for, at højest én har fødselsdag en mandag. Dvs:

1 7 1 0 7

( 2) 1 ( 1) 1 ( 1) ( 0)7 7

1 (1/ 7) (1 1/ 7) (1/ 7) (1 1/ 7)1 0

1 0, 40 0,34 0,26

P Y P Y P Y P Y

≥ = − ≤ = − = − =

= − − − −

= − − =

Bemærk, at hvis Bernoullieksperimentet foregår ved, at vi trækker fra en endelig

population, fx udvælger en elev fra en klasse, så betyder antagelsen om uafhæn-

gighed mellem de enkelte udtrækninger, at vi må trække med tilbagelægning,

for at de enkelte udtrækninger kan blive uafhængige. Dvs. når vi har trukket den

første elev og observeret, om vedkommende er en pige (succes) eller en dreng

(fiasko), så må vi „lægge personen tilbage“ i populationen, før vi trækker igen. I

princippet har vi derfor mulighed for at trække den samme person to gange.

Hvad ville der ske, hvis vi ikke lagde personen tilbage? Antag, at den første

person, vi udtrækker, er en succes (en pige). Hvis ikke vi ikke lægger hende til-

bage, betyder det, at andelen af tilbageværende piger i klassen nu er blevet min-

dre. Hvis der fx til at starte med var 5 piger og 5 drenge, så er der nu kun 4 piger

tilbage. Det betyder, at sandsynligheden for at trække en pige i anden omgang er

blevet mindre. Den er nu kun 4/9, hvor den før var 5/10. Derfor må vi kræve, at

der foregår tilbagelægning af de udtrukne elementer, når vi trækker fra en ende-

lig population, hvis Y skal være binomialfordelt. Hvis ikke vi gør det, så ender vi

i stedet i den hypergeometriske fordeling, som vi skal kigge på om et øjeblik.

6.3 Den hypergeometriske fordeling

Den hypergeometriske fordeling er tæt relateret til binomialfordelingen. Den

fremkommer, når man udtrækker n elementer til en stikprøve fra en virkelig

Bernoullipopulation uden tilbagelægning. Dvs. det samme element i popula-

··

Binomialfordelingen, Y ~ Bin(n, p)

Sandsynlighedsfunktion: ( ) (1 )k n k

Y

nf k p p

k−

= − , k = 0, 1, 2, …, n

Middelværdi og varians: ( ) og ( ) (1 )E Y n p V Y n p p= ⋅ = ⋅ ⋅ − Fortolkning: Y angiver antal succeser blandt n uafhængige udtrækninger fra en Bernoullipopulation, hvor der er konstant sandsynlighed p for succes i hver udtrækning.

Eksempel 6.11: Hvad er sandsynligheden for tre gange krone i eksempel 6.4, hvor Y ~ Bin(5, ½)?

3 5 35(3) 0,5 (1 0,5) 0,3125

3Yf−

= − =

Middelværdien og variansen af Y er i dette tilfælde:

( ) 5 0,5 2,5 og ( ) 5 0,5 (1 0,5) 1, 25E Y V Y= ⋅ = = ⋅ ⋅ − =[Eksempel slut]

Eksempel 6.12: Forestil dig, at vi har et selskab på syv personer. Hvad er sandsynligheden for, at to af de syv personer er født på en mandag? Hvis de syv personers fødselsdage er uafhængige (altså ingen tvillinger i selskabet), så kan hver enkelt person ses som en udtrækning fra en Bernoullipopulation af ”mandagsfødte” og ”ikke-mandagsfødte”. p = 1/7 må da være sandsynligheden for at trække en mandagsfødt (en succes). Den stokastiske variabel Y, der angiver antallet af mandagsbørn i selskabet, er derfor binomialfordelt med n = 7 og p = 1/7. Dermed bliver sandsynligheden for, at to personer i selskabet er født en mandag givet ved:

2 7 27( 2) (1/ 7) (1 1/ 7) 0,198

2P Y −

= = − =

Hvad er nu sandsynligheden for, at mindst to har fødselsdag en mandag? Denne sandsynlighed er lig med 1 minus sandsynligheden for, at højest én har fødselsdag en mandag. Dvs:

1 7 1 0 7

( 2) 1 ( 1) 1 ( 1) ( 0)7 7

1 (1/ 7) (1 1/ 7) (1/ 7) (1 1/ 7)1 0

1 0, 40 0,34 0,26

P Y P Y P Y P Y

≥ = − ≤ = − = − =

= − − − −

= − − =

Binomialfordelingen, Y ~ Bin(n, p)

Sandsynlighedsfunktion: ( ) (1 )k n k

Y

nf k p p

k−

= − , k = 0, 1, 2, …, n

Middelværdi og varians: ( ) og ( ) (1 )E Y n p V Y n p p= ⋅ = ⋅ ⋅ − Fortolkning: Y angiver antal succeser blandt n uafhængige udtrækninger fra en Bernoullipopulation, hvor der er konstant sandsynlighed p for succes i hver udtrækning.

Eksempel 6.11: Hvad er sandsynligheden for tre gange krone i eksempel 6.4, hvor Y ~ Bin(5, ½)?

3 5 35(3) 0,5 (1 0,5) 0,3125

3Yf−

= − =

Middelværdien og variansen af Y er i dette tilfælde:

( ) 5 0,5 2,5 og ( ) 5 0,5 (1 0,5) 1, 25E Y V Y= ⋅ = = ⋅ ⋅ − =[Eksempel slut]

Eksempel 6.12: Forestil dig, at vi har et selskab på syv personer. Hvad er sandsynligheden for, at to af de syv personer er født på en mandag? Hvis de syv personers fødselsdage er uafhængige (altså ingen tvillinger i selskabet), så kan hver enkelt person ses som en udtrækning fra en Bernoullipopulation af ”mandagsfødte” og ”ikke-mandagsfødte”. p = 1/7 må da være sandsynligheden for at trække en mandagsfødt (en succes). Den stokastiske variabel Y, der angiver antallet af mandagsbørn i selskabet, er derfor binomialfordelt med n = 7 og p = 1/7. Dermed bliver sandsynligheden for, at to personer i selskabet er født en mandag givet ved:

2 7 27( 2) (1/ 7) (1 1/ 7) 0,198

2P Y −

= = − =

Hvad er nu sandsynligheden for, at mindst to har fødselsdag en mandag? Denne sandsynlighed er lig med 1 minus sandsynligheden for, at højest én har fødselsdag en mandag. Dvs:

1 7 1 0 7

( 2) 1 ( 1) 1 ( 1) ( 0)7 7

1 (1/ 7) (1 1/ 7) (1/ 7) (1 1/ 7)1 0

1 0, 40 0,34 0,26

P Y P Y P Y P Y

≥ = − ≤ = − = − =

= − − − −

= − − =

Binomialfordelingen, Y ~ Bin(n, p)

Sandsynlighedsfunktion: ( ) (1 )k n k

Y

nf k p p

k−

= − , k = 0, 1, 2, …, n

Middelværdi og varians: ( ) og ( ) (1 )E Y n p V Y n p p= ⋅ = ⋅ ⋅ − Fortolkning: Y angiver antal succeser blandt n uafhængige udtrækninger fra en Bernoullipopulation, hvor der er konstant sandsynlighed p for succes i hver udtrækning.

Eksempel 6.11: Hvad er sandsynligheden for tre gange krone i eksempel 6.4, hvor Y ~ Bin(5, ½)?

3 5 35(3) 0,5 (1 0,5) 0,3125

3Yf−

= − =

Middelværdien og variansen af Y er i dette tilfælde:

( ) 5 0,5 2,5 og ( ) 5 0,5 (1 0,5) 1, 25E Y V Y= ⋅ = = ⋅ ⋅ − =[Eksempel slut]

Eksempel 6.12: Forestil dig, at vi har et selskab på syv personer. Hvad er sandsynligheden for, at to af de syv personer er født på en mandag? Hvis de syv personers fødselsdage er uafhængige (altså ingen tvillinger i selskabet), så kan hver enkelt person ses som en udtrækning fra en Bernoullipopulation af ”mandagsfødte” og ”ikke-mandagsfødte”. p = 1/7 må da være sandsynligheden for at trække en mandagsfødt (en succes). Den stokastiske variabel Y, der angiver antallet af mandagsbørn i selskabet, er derfor binomialfordelt med n = 7 og p = 1/7. Dermed bliver sandsynligheden for, at to personer i selskabet er født en mandag givet ved:

2 7 27( 2) (1/ 7) (1 1/ 7) 0,198

2P Y −

= = − =

Hvad er nu sandsynligheden for, at mindst to har fødselsdag en mandag? Denne sandsynlighed er lig med 1 minus sandsynligheden for, at højest én har fødselsdag en mandag. Dvs:

1 7 1 0 7

( 2) 1 ( 1) 1 ( 1) ( 0)7 7

1 (1/ 7) (1 1/ 7) (1/ 7) (1 1/ 7)1 0

1 0, 40 0,34 0,26

P Y P Y P Y P Y

≥ = − ≤ = − = − =

= − − − −

= − − =

· · ·

Binomialfordelingen, Y ~ Bin(n, p)

Sandsynlighedsfunktion: ( ) (1 )k n k

Y

nf k p p

k−

= − , k = 0, 1, 2, …, n

Middelværdi og varians: ( ) og ( ) (1 )E Y n p V Y n p p= ⋅ = ⋅ ⋅ − Fortolkning: Y angiver antal succeser blandt n uafhængige udtrækninger fra en Bernoullipopulation, hvor der er konstant sandsynlighed p for succes i hver udtrækning.

Eksempel 6.11: Hvad er sandsynligheden for tre gange krone i eksempel 6.4, hvor Y ~ Bin(5, ½)?

3 5 35(3) 0,5 (1 0,5) 0,3125

3Yf−

= − =

Middelværdien og variansen af Y er i dette tilfælde:

( ) 5 0,5 2,5 og ( ) 5 0,5 (1 0,5) 1, 25E Y V Y= ⋅ = = ⋅ ⋅ − =[Eksempel slut]

Eksempel 6.12: Forestil dig, at vi har et selskab på syv personer. Hvad er sandsynligheden for, at to af de syv personer er født på en mandag? Hvis de syv personers fødselsdage er uafhængige (altså ingen tvillinger i selskabet), så kan hver enkelt person ses som en udtrækning fra en Bernoullipopulation af ”mandagsfødte” og ”ikke-mandagsfødte”. p = 1/7 må da være sandsynligheden for at trække en mandagsfødt (en succes). Den stokastiske variabel Y, der angiver antallet af mandagsbørn i selskabet, er derfor binomialfordelt med n = 7 og p = 1/7. Dermed bliver sandsynligheden for, at to personer i selskabet er født en mandag givet ved:

2 7 27( 2) (1/ 7) (1 1/ 7) 0,198

2P Y −

= = − =

Hvad er nu sandsynligheden for, at mindst to har fødselsdag en mandag? Denne sandsynlighed er lig med 1 minus sandsynligheden for, at højest én har fødselsdag en mandag. Dvs:

1 7 1 0 7

( 2) 1 ( 1) 1 ( 1) ( 0)7 7

1 (1/ 7) (1 1/ 7) (1/ 7) (1 1/ 7)1 0

1 0, 40 0,34 0,26

P Y P Y P Y P Y

≥ = − ≤ = − = − =

= − − − −

= − − =

Binomialfordelingen, Y ~ Bin(n, p)

Sandsynlighedsfunktion: ( ) (1 )k n k

Y

nf k p p

k−

= − , k = 0, 1, 2, …, n

Middelværdi og varians: ( ) og ( ) (1 )E Y n p V Y n p p= ⋅ = ⋅ ⋅ − Fortolkning: Y angiver antal succeser blandt n uafhængige udtrækninger fra en Bernoullipopulation, hvor der er konstant sandsynlighed p for succes i hver udtrækning.

Eksempel 6.11: Hvad er sandsynligheden for tre gange krone i eksempel 6.4, hvor Y ~ Bin(5, ½)?

3 5 35(3) 0,5 (1 0,5) 0,3125

3Yf−

= − =

Middelværdien og variansen af Y er i dette tilfælde:

( ) 5 0,5 2,5 og ( ) 5 0,5 (1 0,5) 1, 25E Y V Y= ⋅ = = ⋅ ⋅ − =[Eksempel slut]

Eksempel 6.12: Forestil dig, at vi har et selskab på syv personer. Hvad er sandsynligheden for, at to af de syv personer er født på en mandag? Hvis de syv personers fødselsdage er uafhængige (altså ingen tvillinger i selskabet), så kan hver enkelt person ses som en udtrækning fra en Bernoullipopulation af ”mandagsfødte” og ”ikke-mandagsfødte”. p = 1/7 må da være sandsynligheden for at trække en mandagsfødt (en succes). Den stokastiske variabel Y, der angiver antallet af mandagsbørn i selskabet, er derfor binomialfordelt med n = 7 og p = 1/7. Dermed bliver sandsynligheden for, at to personer i selskabet er født en mandag givet ved:

2 7 27( 2) (1/ 7) (1 1/ 7) 0,198

2P Y −

= = − =

Hvad er nu sandsynligheden for, at mindst to har fødselsdag en mandag? Denne sandsynlighed er lig med 1 minus sandsynligheden for, at højest én har fødselsdag en mandag. Dvs:

1 7 1 0 7

( 2) 1 ( 1) 1 ( 1) ( 0)7 7

1 (1/ 7) (1 1/ 7) (1/ 7) (1 1/ 7)1 0

1 0, 40 0,34 0,26

P Y P Y P Y P Y

≥ = − ≤ = − = − =

= − − − −

= − − =

Binomialfordelingen, Y ~ Bin(n, p)

Sandsynlighedsfunktion: ( ) (1 )k n k

Y

nf k p p

k−

= − , k = 0, 1, 2, …, n

Middelværdi og varians: ( ) og ( ) (1 )E Y n p V Y n p p= ⋅ = ⋅ ⋅ − Fortolkning: Y angiver antal succeser blandt n uafhængige udtrækninger fra en Bernoullipopulation, hvor der er konstant sandsynlighed p for succes i hver udtrækning.

Eksempel 6.11: Hvad er sandsynligheden for tre gange krone i eksempel 6.4, hvor Y ~ Bin(5, ½)?

3 5 35(3) 0,5 (1 0,5) 0,3125

3Yf−

= − =

Middelværdien og variansen af Y er i dette tilfælde:

( ) 5 0,5 2,5 og ( ) 5 0,5 (1 0,5) 1, 25E Y V Y= ⋅ = = ⋅ ⋅ − =[Eksempel slut]

Eksempel 6.12: Forestil dig, at vi har et selskab på syv personer. Hvad er sandsynligheden for, at to af de syv personer er født på en mandag? Hvis de syv personers fødselsdage er uafhængige (altså ingen tvillinger i selskabet), så kan hver enkelt person ses som en udtrækning fra en Bernoullipopulation af ”mandagsfødte” og ”ikke-mandagsfødte”. p = 1/7 må da være sandsynligheden for at trække en mandagsfødt (en succes). Den stokastiske variabel Y, der angiver antallet af mandagsbørn i selskabet, er derfor binomialfordelt med n = 7 og p = 1/7. Dermed bliver sandsynligheden for, at to personer i selskabet er født en mandag givet ved:

2 7 27( 2) (1/ 7) (1 1/ 7) 0,198

2P Y −

= = − =

Hvad er nu sandsynligheden for, at mindst to har fødselsdag en mandag? Denne sandsynlighed er lig med 1 minus sandsynligheden for, at højest én har fødselsdag en mandag. Dvs:

1 7 1 0 7

( 2) 1 ( 1) 1 ( 1) ( 0)7 7

1 (1/ 7) (1 1/ 7) (1/ 7) (1 1/ 7)1 0

1 0, 40 0,34 0,26

P Y P Y P Y P Y

≥ = − ≤ = − = − =

= − − − −

= − − =

·

Page 9: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

Populære fordelinger 141

tionen kan højst blive udvalgt én gang. Sandsynligheden for at trække en suc-

ces (eller en fiasko) ændrer sig derfor undervejs, fordi antallet af tilbagevæ-

rende succeser (og fiaskoer) i populationen ændres, efterhånden som

elementerne udvælges.

Forestil dig, at vi trækker n gange uden tilbagelægning fra en population

med N elementer, hvoraf M er succeser og N – M er fiaskoer. Hvis vi lader Y

angive det samlede antal succeser i de n udtrækninger, så siges Y at være hy-

pergeometrisk fordelt med parametrene n, M, og N. Vi skriver da, at Y ~

Hyp(n, M, N). Sandsynlighedsfunktionen for Y, dvs. sandsynligheden for at

trække k succeser i de n forsøg, er givet i den følgende boks:

Bemærk, at vi aldrig kan trække mere end M succeser (antallet af succeser i

populationen). Derfor er sandsynligheden for Y > M lig med nul. Bemærk

også, at M/N er andelen af succeser i populationen til at begynde med. Hvis vi

derfor i stedet havde trukket med tilbagelægning, ville Y være binomialfordelt

med p = M/N.

Den hypergeometriske fordeling kan man bruge i forbindelse med fx en

kvalitetskontrol. Det næste eksempel illustrerer dette:

Eksempel 6.13: En virksomhed har produceret N = 10 maskiner, hvoraf M = 3 er defekte.

Virksomheden ved dog ikke, at tre af maskinerne er defekte. Da kvalitets-

kontrol er kostbart, bestemmer virksomheden at udvælge tre maskiner, som

den tester for defekter. Lad Y være antallet af succeser (her defekte maskiner)

i de tre udtrækninger. Da udtrækningen sker uden tilbagelægning (der er

ingen idé i at undersøge den samme maskine to gange), så er Y hypergeome-

trisk fordelt med parametrene n = 3, M = 3 og N = 10. Sandsynligheden for,

at kvalitetskontrollen finder to defekte maskiner, er:

Hypergeometrisk fordeling, Y ~ Hyp(n, M, N)

Sandsynlighedsfunktion:

Forestil dig, at vi trækker n gange uden tilbagelægning fra en population med N elementer, hvoraf M er succeser og N-M er fiaskoer. Hvis vi lader Y angive det samlede antal succeser i de n udtrækninger, så siges Y at være hypergeometrisk fordelt med parametrene n, M, og N. Vi skriver da, at Y ~ Hyp(n, M, N). Sandsynlighedsfunktionen for Y, dvs. sandsynligheden for at trække k succeser i de n forsøg, er givet i den følgende boks:

Hypergeometrisk fordeling, Y ~ Hyp(n, M, N)

Sandsynlighedsfunktion:

( )Y

M N M

k n kf k

N

n

− − =

, k = 0, 1, 2, …, M

Middelværdi og varians:

1)( og )(

−−−⋅=⋅=

N

nN

N

MN

N

MnYV

N

MnYE

Fortolkning: Y angiver antal succeser i n udtrækninger uden tilbagelægning fra en virkelig Bernoullipopulation med N elementer, heraf M med egenskaben succes.

Bemærk, at vi aldrig kan trække mere end M succeser (antallet af succeser i populationen). Derfor er sandsynligheden for Y>M lig med nul. Bemærk også, at M/N er andelen af succeser i populationen til at begynde med. Hvis vi derfor i stedet havde trukket med tilbagelægning, ville Y være binomialfordelt med p = M/N. Den hypergeometriske fordeling kan man bruge i forbindelse med fx en kvalitetskontrol. Det næste eksempel illustrerer dette:

Eksempel 6.13: Lad os antage, at en virksomhed har produceret N = 10 maskiner, hvoraf M = 3 er defekte. Virksomheden ved dog ikke, at tre af maskinerne er defekte. Da kvalitetskontrol er kostbart, bestemmer virksomheden at udvælge tre maskiner, som den tester for defekter. Lad Y være antallet af succeser (her defekte maskiner) i de tre udtrækninger. Da udtrækningen sker uden tilbagelægning (der er ingen idé i at undersøge den samme maskine to gange), så er Y hypergeometrisk fordelt med

, k = 0, 1, 2, …, M

Middelværdi og varians:

Forestil dig, at vi trækker n gange uden tilbagelægning fra en population med N elementer, hvoraf M er succeser og N-M er fiaskoer. Hvis vi lader Y angive det samlede antal succeser i de n udtrækninger, så siges Y at være hypergeometrisk fordelt med parametrene n, M, og N. Vi skriver da, at Y ~ Hyp(n, M, N). Sandsynlighedsfunktionen for Y, dvs. sandsynligheden for at trække k succeser i de n forsøg, er givet i den følgende boks:

Hypergeometrisk fordeling, Y ~ Hyp(n, M, N)

Sandsynlighedsfunktion:

( )Y

M N M

k n kf k

N

n

− − =

, k = 0, 1, 2, …, M

Middelværdi og varians:

1)( og )(

−−−⋅=⋅=

N

nN

N

MN

N

MnYV

N

MnYE

Fortolkning: Y angiver antal succeser i n udtrækninger uden tilbagelægning fra en virkelig Bernoullipopulation med N elementer, heraf M med egenskaben succes.

Bemærk, at vi aldrig kan trække mere end M succeser (antallet af succeser i populationen). Derfor er sandsynligheden for Y>M lig med nul. Bemærk også, at M/N er andelen af succeser i populationen til at begynde med. Hvis vi derfor i stedet havde trukket med tilbagelægning, ville Y være binomialfordelt med p = M/N. Den hypergeometriske fordeling kan man bruge i forbindelse med fx en kvalitetskontrol. Det næste eksempel illustrerer dette:

Eksempel 6.13: Lad os antage, at en virksomhed har produceret N = 10 maskiner, hvoraf M = 3 er defekte. Virksomheden ved dog ikke, at tre af maskinerne er defekte. Da kvalitetskontrol er kostbart, bestemmer virksomheden at udvælge tre maskiner, som den tester for defekter. Lad Y være antallet af succeser (her defekte maskiner) i de tre udtrækninger. Da udtrækningen sker uden tilbagelægning (der er ingen idé i at undersøge den samme maskine to gange), så er Y hypergeometrisk fordelt med

Fortolkning: Y angiver antal succeser i n udtrækninger uden tilbagelægning fra en virkelig Bernoullipopulation med N elementer, heraf M med egenskaben succes.

· ·

Forestil dig, at vi trækker n gange uden tilbagelægning fra en population med N elementer, hvoraf M er succeser og N-M er fiaskoer. Hvis vi lader Y angive det samlede antal succeser i de n udtrækninger, så siges Y at være hypergeometrisk fordelt med parametrene n, M, og N. Vi skriver da, at Y ~ Hyp(n, M, N). Sandsynlighedsfunktionen for Y, dvs. sandsynligheden for at trække k succeser i de n forsøg, er givet i den følgende boks:

Hypergeometrisk fordeling, Y ~ Hyp(n, M, N)

Sandsynlighedsfunktion:

( )Y

M N M

k n kf k

N

n

− − =

, k = 0, 1, 2, …, M

Middelværdi og varians:

1)( og )(

−−−⋅=⋅=

N

nN

N

MN

N

MnYV

N

MnYE

Fortolkning: Y angiver antal succeser i n udtrækninger uden tilbagelægning fra en virkelig Bernoullipopulation med N elementer, heraf M med egenskaben succes.

Bemærk, at vi aldrig kan trække mere end M succeser (antallet af succeser i populationen). Derfor er sandsynligheden for Y>M lig med nul. Bemærk også, at M/N er andelen af succeser i populationen til at begynde med. Hvis vi derfor i stedet havde trukket med tilbagelægning, ville Y være binomialfordelt med p = M/N. Den hypergeometriske fordeling kan man bruge i forbindelse med fx en kvalitetskontrol. Det næste eksempel illustrerer dette:

Eksempel 6.13: Lad os antage, at en virksomhed har produceret N = 10 maskiner, hvoraf M = 3 er defekte. Virksomheden ved dog ikke, at tre af maskinerne er defekte. Da kvalitetskontrol er kostbart, bestemmer virksomheden at udvælge tre maskiner, som den tester for defekter. Lad Y være antallet af succeser (her defekte maskiner) i de tre udtrækninger. Da udtrækningen sker uden tilbagelægning (der er ingen idé i at undersøge den samme maskine to gange), så er Y hypergeometrisk fordelt med

Forestil dig, at vi trækker n gange uden tilbagelægning fra en population med N elementer, hvoraf M er succeser og N-M er fiaskoer. Hvis vi lader Y angive det samlede antal succeser i de n udtrækninger, så siges Y at være hypergeometrisk fordelt med parametrene n, M, og N. Vi skriver da, at Y ~ Hyp(n, M, N). Sandsynlighedsfunktionen for Y, dvs. sandsynligheden for at trække k succeser i de n forsøg, er givet i den følgende boks:

Hypergeometrisk fordeling, Y ~ Hyp(n, M, N)

Sandsynlighedsfunktion:

( )Y

M N M

k n kf k

N

n

− − =

, k = 0, 1, 2, …, M

Middelværdi og varians:

1)( og )(

−−−⋅=⋅=

N

nN

N

MN

N

MnYV

N

MnYE

Fortolkning: Y angiver antal succeser i n udtrækninger uden tilbagelægning fra en virkelig Bernoullipopulation med N elementer, heraf M med egenskaben succes.

Bemærk, at vi aldrig kan trække mere end M succeser (antallet af succeser i populationen). Derfor er sandsynligheden for Y>M lig med nul. Bemærk også, at M/N er andelen af succeser i populationen til at begynde med. Hvis vi derfor i stedet havde trukket med tilbagelægning, ville Y være binomialfordelt med p = M/N. Den hypergeometriske fordeling kan man bruge i forbindelse med fx en kvalitetskontrol. Det næste eksempel illustrerer dette:

Eksempel 6.13: Lad os antage, at en virksomhed har produceret N = 10 maskiner, hvoraf M = 3 er defekte. Virksomheden ved dog ikke, at tre af maskinerne er defekte. Da kvalitetskontrol er kostbart, bestemmer virksomheden at udvælge tre maskiner, som den tester for defekter. Lad Y være antallet af succeser (her defekte maskiner) i de tre udtrækninger. Da udtrækningen sker uden tilbagelægning (der er ingen idé i at undersøge den samme maskine to gange), så er Y hypergeometrisk fordelt med

Kvalitets­

kontrol

Page 10: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

142 Indblik i statistik – for samfundsvidenskab

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

Dermed er sandsynligheden 1 – 0,175 = 0,825 for, at virksomheden kommer

til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev

fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle

tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte

maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette

eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine

undgår kvalitetskontrollen.

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften.

Virksomhedens ledelse overvejer, om den skal udvælge de fire personer til-

fældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men

ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på

arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden)

for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet

udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre

børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra

en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-foræl-

dre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi,

at Y ~ Hyp(4, 7, 19). Den forventede værdi af Y er da E(Y) = nM/N = 4 · 7/19

= 1,473. Vi skal nu beregne P(Y > 1). Denne sandsynlighed må være lig med

1 – P(Y = 1) – P(Y = 0):

1 – P(Y = 1) – P(Y = 0)

7 19 – 7 7 19 – 7 · · 7! 12! 7! 12! 1 4 – 1 0 4 – 0 · · 6! · 1! 9! · 3! 7! · 0! 8! · 4! = 1 – = 1 – – = 0,475 19 19 19! 19! 4 4 15! · 4! 15! · 4!

Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

·

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

På vagt

juleaften

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

parametrene n = 3, M = 3 og N = 10. Sandsynligheden for, at kvalitetskontrollen finder to defekte maskiner, er:

3 10 3 3! 7!2 3 2 2! 1! 1! 6!(2) 0,17510!10

3! 7!3

Yf

− ⋅− ⋅ ⋅= = =

Dermed er sandsynligheden 1-0,175 = 0,825 for, at virksomheden kommer til at sælge en maskine, som er defekt – nemlig den maskine, som ikke blev fanget i kontrollen. Sandsynligheden for, at kvalitetskontrollen opdager alle tre defekte maskiner er 0,0083. Hvis virksomheden vil undgå at sende defekte maskiner på markedet, har den altså ikke nogen god kvalitetskontrol i dette eksempel, da der er over 99% sandsynlighed for, at mindst én defekt maskine undgår kvalitetskontrollen.

[Eksempel slut]

Eksempel 6.14: I en virksomhed skal man udvælge fire ansatte til at tage vagten juleaften. Virksomhedens ledelse overvejer, om den skal udvælge de fire personer tilfældigt blandt de 19 ansatte. Dette forekommer umiddelbart mest fair, men ledelsen vil samtidig være ked af, at ansatte med mindre børn skal være på arbejde juleaften. Den ønsker derfor at beregne risikoen (sandsynligheden) for, at der kommer mere end én forælder på vagt juleaften, hvis vagtholdet udvælges tilfældigt blandt de ansatte. Af de 19 ansatte er der 7 med mindre børn.

Udtrækningen af vagter blandt de ansatte kan ses som fire udtrækninger fra en Bernoullipopulation med 7 succeser (forældre) og 12 fiaskoer (ikke-forældre). Hvis vi lader Y angive antallet af forældre blandt de udtrukne, så ved vi, at Y~Hyp(4,7,19). Den forventede værdi af Y er da

( ) / 4 7 /19 1, 473E Y nM N= = ⋅ = . Vi skal nu beregne P(Y>1). Denne sandsynlighed må være lig med 1-P(Y=1)-P(Y=0):

7 19 7 7 19 7 7! 12! 7! 12!1 7 1 0 7 0 6! 1! 1! 6! 7! 0! 7! 5!1 ( 1) ( 0) 1 1 19!19 19

7! 12!7 7

P Y P Y

− − ⋅ − ⋅− − ⋅ ⋅ ⋅ ⋅− = − = = − − = − =

0,475 Der er altså 47,5% sandsynlighed for, at mere end én forælder kommer på

vagt juleaften.

Page 11: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

Populære fordelinger 143

6.4 Poissonfordelingen

Binomialfordelingen og den hypergeometriske fordeling fremkommer, når

man tager en stikprøve fra en Bernoullipopulation og undersøger sandsynlig-

heden for at få et bestemt antal successer. Dette kunne fx være en situation,

hvor vi spørger nogle mennesker på gaden, om de stemmer „ja“ (Xi = 1) eller

„nej“ (Xi = 0) til en kommende afstemning. Det kunne også være, at vi spurg-

te om de „stemmer“ (Xi = 1) eller „ikke stemmer“ (Xi = 0) ved det forestående

valg, eller om de er „gift“ (Xi = 1) eller „ikke gift“ (Xi = 0). Den stokastiske va-

riabel, Y, der angiver antallet af ja-stemmer i et sådant eksperiment, Y = X1 +

X2 +…+ Xn, er binomialfordelt, hvis udtrækningerne er uafhængige, og hy-

pergeometrisk fordelt, hvis udtrækningerne er uden tilbagelægning og der-

med afhængige.

Forstil dig nu, at vi er interesserede i at lave en model for, hvor mange kun-

der, der kommer ind i en butik. Vi observerer derfor en butik i 10 timer og

lader den stokastiske variabel, X1, antage værdien 1, hvis der kommer kunder

ind i butikken i løbet af den første time, og værdien 0, hvis der ikke gør det.

Tilsvarende angiver X2, om der kommer kunder ind i løbet af den anden time.

Hvis vi lader Y være lig med X1 + X2 + … + X10, er Y så binomialfordelt? Ja,

hvis: i) udtrækningerne er uafhængige, dvs. hvis der kommer kunder i en gi-

ven time, så påvirker det ikke sandsynligheden for kunder i de efterfølgende

timer; og ii) hvis sandsynligheden for at observere kunder i hver af de 10 ti-

mer er den samme. I så fald er Y binomialfordelt med n=10 og p lig med sand-

synligheden for, at der kommer kunder i løbet af en given time.

Det kunne måske være mere interessant at modellere det samlede antal

kunder i løbet af de 10 timer. Problemet med binomialmodellen er, at X1 an-

tager værdien 1, uanset om der kommer 1 eller 100 kunder ind i butikken den

første time. Dette kunne man måske løse ved at for korte tidsintervallerne. I

stedet for at observere, om der kommer kunder i løbet af en time, kunne vi

lave en observation hvert minut. Hvis tidsintervallet var et minut, og vi stadig

betragtede butikken i 10 timer, ville vi trække 600 (= 60·10) gange i stedet for

10 gange fra Bernoullipopulationen. Stadig må vi antage, at udtrækningerne

er uafhængige, og at sandsynligheden for at observere kunder er den samme i

alle 600 tidsintervaller. Naturligvis er sandsynligheden for at observere kun-

der i et givet tidsinterval nu blevet mindre, således at der også er mindre risiko

for at observere mere end én kunde pr. tidsinterval. Dermed vil værdien af Y

også være tættere på at angive det faktiske antal kunder, der kommer ind i for-

retningen.

Der er dog stadig en vis risiko for, at mere end én kunde kommer ind i bu-

tikken inden for et givet tidsinterval. Hvis vi imidlertid fortsætter med at

Page 12: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

144 Indblik i statistik – for samfundsvidenskab

mindske tidsintervallerne, indtil de bliver uendeligt små, så vil denne risiko til

sidst forsvinde. Sandsynligheden for, at der kommer mere end én kunde ind i

butikken i løbet af et uendeligt lille tidsinterval, bliver nul. Dermed bliver Y

også lig med summen af kunder i løbet af de 10 timer. Fordi tidsintervallerne

er blevet uendeligt små, må vi have uendeligt mange tidsintervaller, dvs. vi må

trække uendeligt mange gange, for at de skal dække de 10 timer. Det bliver

derfor meget besværligt (umuligt) at regne på Y’s sandsynlighedsfunktion fra

binomialfordelingen. Heldigvis viser det sig, at sandsynlighedsfunktionen,

dvs. sandsynligheden for at observere k kunder i løbet af de 10 timer, nu kan

skrives som:

tidsintervallet var et minut og vi stadig betragtede butikken i 10 timer ville vi trække 600 (= 60⋅10) gange i stedet for 10 gange fra Bernoullipopulationen. Stadig må vi antage, at udtrækningerne er uafhængige, og at sandsynligheden for at observere kunder er den samme i alle 600 tidsintervaller. Naturligvis er sandsynligheden for at observere kunder i et givet tidsinterval nu blevet mindre, således, at der også er mindre risiko for at observere mere end én kunde pr. tidsinterval. Dermed vil værdien af Y også være tættere på at angive det faktiske antal kunder, der kommer ind i forretningen. Der er dog stadig en vis risiko for, at mere end én kunde kommer ind i butikken inden for det givne tidsinterval. Hvis vi imidlertid fortsætter med at mindske tidsintervallerne, indtil de bliver uendeligt små, så vil denne risiko til sidst forsvinde. Sandsynligheden for, at der kommer mere end én kunde ind i butikken i løbet af et uendeligt lille tidsinterval, bliver nul. Dermed bliver Y også lig med summen af kunder i løbet af de 10 timer. Fordi tidsintervallerne er blevet uendeligt små, må vi have uendeligt mange tidsintervaller, dvs. vi må trække uendeligt mange gange, for at de skal dække de 10 timer. Det bliver derfor meget besværligt (umuligt) at regne på Y’s sandsynlighedsfunktion fra binomialfordelingen. Heldigvis viser det sig, at sandsynlighedsfunktionen, dvs. sandsynligheden for at observere k kunder i løbet af de 10 timer, nu kan skrives som:

λλ −== ek

kYPk

!)(

hvor λ er det forventede antal kunder i løbet af de 10 timer. I dette tilfælde siger man, at Y er Poissonfordelt med parameteren λ. En Poissonfordelt variabel angiver altså antallet af begivenheder (fx kunder) i løbet af et tidsinterval (fx 10 timer). Man kan således opfatte en Poissonfordelt variabel Y, som antallet af succeser, hvis man igennem en tidsperiode trækker kontinuerligt (uafbrudt) fra en Bernoullipopulation og til sidst lægger antallet af succeser (hændelser) sammen. Dette er da værdien af Y. Alternativt kan man opfatte det som en situation, hvor man trækker én gang fra en

hvor λ er det forventede antal kunder i løbet af de 10 timer. I dette tilfælde

siger man, at Y er Poissonfordelt med parameteren λ. En Poissonfordelt varia-

bel angiver altså antallet af begivenheder (fx kunder) i løbet af et tidsinterval

(fx 10 timer).

Man kan således opfatte en Poissonfordelt variabel, Y, som antallet af suc-

ceser, hvis man igennem en tidsperiode trækker kontinuerligt (uafbrudt) fra

en Bernoullipopulation og til sidst lægger antallet af succeser (hændelser)

sammen. Dette er da værdien af Y. Alternativt kan man opfatte det som en si-

tuation, hvor man trækker én gang fra en superpopulation bestående af for-

skellige „hændelsesantal“. Dvs. man trækker fx elementet „2 kunder på 10 ti-

mer“. Y er da lig med 2.

Som det forhåbentlig fremgår af det ovenstående, så er der nogle underlig-

gende antagelser, som skal være opfyldt, for at vi kan modellere en situation

ved hjælp af Poissonfordelingen. Disse er følgende:

i) antallet af hændelser i ikke-overlappende tidsintervaller skal være uaf-

hængige (antallet af kunder i den ene time skal være uafhængigt af an-

tallet af kunder i den anden time osv.).

ii) sandsynlighederne i to lige lange intervaller skal være ens (dvs. samme

sandsynlighed for at observere kunder i hver time).

iii) sandsynligheden for mere end én hændelse i et meget kort tidsinterval

skal være nul.

Eksempel 6.15: En internetvirksomhed ved, at der i gennemsnit er fem hits pr. time på dens

hjemmeside. I forbindelse med lanceringen af et nyt produkt ønsker den at

beregne sandsynligheden for, at den når ud til mindst 10 kunder via dens

hjemmeside i den første time. Kan den bruge Poissonfordelingen til dette?

tidsintervallet var et minut og vi stadig betragtede butikken i 10 timer ville vi trække 600 (= 60⋅10) gange i stedet for 10 gange fra Bernoullipopulationen. Stadig må vi antage, at udtrækningerne er uafhængige, og at sandsynligheden for at observere kunder er den samme i alle 600 tidsintervaller. Naturligvis er sandsynligheden for at observere kunder i et givet tidsinterval nu blevet mindre, således, at der også er mindre risiko for at observere mere end én kunde pr. tidsinterval. Dermed vil værdien af Y også være tættere på at angive det faktiske antal kunder, der kommer ind i forretningen. Der er dog stadig en vis risiko for, at mere end én kunde kommer ind i butikken inden for det givne tidsinterval. Hvis vi imidlertid fortsætter med at mindske tidsintervallerne, indtil de bliver uendeligt små, så vil denne risiko til sidst forsvinde. Sandsynligheden for, at der kommer mere end én kunde ind i butikken i løbet af et uendeligt lille tidsinterval, bliver nul. Dermed bliver Y også lig med summen af kunder i løbet af de 10 timer. Fordi tidsintervallerne er blevet uendeligt små, må vi have uendeligt mange tidsintervaller, dvs. vi må trække uendeligt mange gange, for at de skal dække de 10 timer. Det bliver derfor meget besværligt (umuligt) at regne på Y’s sandsynlighedsfunktion fra binomialfordelingen. Heldigvis viser det sig, at sandsynlighedsfunktionen, dvs. sandsynligheden for at observere k kunder i løbet af de 10 timer, nu kan skrives som:

λλ −== ek

kYPk

!)(

hvor λ er det forventede antal kunder i løbet af de 10 timer. I dette tilfælde siger man, at Y er Poissonfordelt med parameteren λ. En Poissonfordelt variabel angiver altså antallet af begivenheder (fx kunder) i løbet af et tidsinterval (fx 10 timer). Man kan således opfatte en Poissonfordelt variabel Y, som antallet af succeser, hvis man igennem en tidsperiode trækker kontinuerligt (uafbrudt) fra en Bernoullipopulation og til sidst lægger antallet af succeser (hændelser) sammen. Dette er da værdien af Y. Alternativt kan man opfatte det som en situation, hvor man trækker én gang fra en

·

En hjemmeside

Page 13: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

Populære fordelinger 145

Det kræver, at man med rimelighed kan antage: i) at antallet af hits i ikke-

overlappende tidsintervaller er uafhængige; ii) at sandsynlighederne for hits

i to lige lange tidsintervaller er de samme; og iii) sandsynligheden for mere

end ét hit i et meget kort tidsinterval er nul.

Virksomheden vurderer, at dette er rimelige antagelser, og at antallet af hits

derfor er Poissonfordelt. Da det forventede antal hits pr. time er 5, er dette

værdien af λ. Sandsynligheden for præcis 10 hits i løbet af den første time ef-

ter lanceringen kan da beregnes som:

superpopulation bestående af forskellige ”hændelsesantal”. Dvs. man trækker fx elementet ”2 kunder på 10 timer”. Y er da lig med 2. Som det forhåbentlig fremgår af det ovenstående, så er der nogle underliggende antagelser, som skal være opfyldt, for at vi kan modellere en situation ved hjælp af Poissonfordelingen. Disse er følgende:

i) antallet af hændelser i ikke-overlappende tidsintervaller skal være uafhængige (antallet af kunder i den ene time skal være uafhængigt af antallet af kunder i den anden time, osv.).

ii) sandsynlighederne i to lige lange intervaller skal være éns (dvs. samme sandsynlighed for at observere kunder i hver time).

iii) sandsynligheden for mere end én hændelse i et meget kort tidsinterval skal være nul.

Eksempel 6.15: En internetvirksomhed ved, at der i gennemsnit er fire hits pr. time på dens hjemmeside. I forbindelse med lanceringen af et nyt produkt ønsker den at beregne sandsynligheden for, at den når ud til mindst 10 kunder via dens hjemmeside i den første time. Kan den bruge Poissonfordelingen til dette? Det kræver, at man med rimelighed kan antage: i) at antallet af hits i ikke-overlappende tidsintervaller er uafhængige; ii) at sandsynlighederne for hits i to lige lange tidsintervaller er de samme; og iii) sandsynligheden for mere end ét hit i et meget kort tidsinterval er nul.

Virksomheden vurderer, at dette er rimelige antagelser, og at antallet af hits derfor er Poissonfordelt. Da det forventede antal hits pr. time er 4, er

dette værdien af λ. Sandsynligheden for præcis 10 hits i løbet af den første time efter lanceringen kan da beregnes som:

1055( 10) 0,018

10!P Y e−= = =

For at få sandsynligheden for mindst 10 kunder skal vi hertil lægge sandsynligheden for 11 kunder, sandsynligheden for 12 kunder, osv.

Alternativt kan vi udregne P(Y≥10) som

1 ( 9) ( 8) ... ( 0)P Y P Y P Y− = − = − − = . Til sidst i kapitlet skal vi se, hvorledes denne sandsynlighed hurtigt kan udregnes i Excel. [Eksempel slut]

For at få sandsynligheden for mindst 10 kunder skal vi hertil lægge sandsyn-

ligheden for 11 kunder, sandsynligheden for 12 kunder osv. Alternativt kan

vi udregne P(Y ≥ 10) som 1 – P(Y = 9) – P(Y = 8) – … – P(Y = 0). Til sidst i

kapitlet skal vi se, hvorledes denne sandsynlighed hurtigt kan udregnes i Ex-

cel.

Vi opsummerer Poissonfordelingen i følgende boks:

Eksempel 6.16: Et pizzeria får i gennemsnit tre bestillinger pr. kvarter. Det har lovet kun-

derne, at pizzaen er gratis, hvis der går mere end et kvarter fra bestilling til

levering. Dette vil ske, hvis der i et givet kvarter kommer mere end fem be-

stillinger. Derfor ønsker pizzeriaejeren at beregne risikoen for dette. Hvis vi

antager, at Y angiver antallet af pizzabestillinger i et kvarter, og at Y følger en

Poissonfordeling, så er λ = 3. Dermed bliver sandsynlighederne for hen-

holdsvis 0, 1, 2, 3, 4 og 5 bestillinger:

Poissonfordelingen, Y ~ Poi(λ)

Sandsynlighedsfunktion: fY (k) =

Vi opsummerer Poissonfordelingen i følgende boks: Poissonfordelingen, Y ~ Poi(λ)

Sandsynlighedsfunktion: λλ −== e

kkYP

k

!)(

, k = 0, 1, 2, …

Middelværdi og varians: λλ == )( og )( YVYE

Fortolkning: Y angiver antal hændelser i en tidsperiode, hvor: λ er det forventede antal hændelser hændelser i ikke-overlappende tidsintervaller er uafhængige sandsynlighederne i to lige lange intervaller er ens sandsynligheden for mere end én hændelse i et meget kort tidsinterval er nul.

Eksempel 6.16: Et pizzeria får i gennemsnit tre bestillinger pr. kvarter. Det har lovet kunderne, at pizzaen er gratis, hvis der går mere end et kvarter fra bestilling til levering. Dette vil ske, hvis der i et givet kvarter kommer mere end fem bestillinger. Derfor ønsker pizzeriaejeren at beregne risikoen for dette. Hvis vi antager, at Y angiver antallet af pizzabestillinger i et kvarter, og

at Y følger en Poissonfordeling, så vil 3λ = . Dermed bliver sandsynlighederne for henholdsvis 0, 1, 2, 3, 4, og 5 bestillinger:

0 1 23 3 3

3 4 53 3 3

3 3 3( 0) 0,050, ( 1) 0,144, ( 2) 0,224,0! 1! 2!3 3 3( 3) 0, 224, ( 4) 0,168, ( 5) 0,101,3! 4! 5!

P Y e P Y e P Y e

P Y e P Y e P Y e

− − −

− − −

= = = = = = = = =

= = = = = = = = =

Og sandsynligheden for mere end 6 bestillinger kan da beregnes som:

( 6) 1 ( 0) ( 1) ( 2) ( 3) ( 4) ( 5)1 0,050 0,144 0, 224 0, 224 0,168 0,101 0,089

P Y P Y P Y P Y P Y P Y P Y≥ = − = − = − = − = − = − == − − − − − − =

Der er således 8,9% sandsynlighed for, at ejeren i et givet kvarter må aflevere mindst en pizza gratis.

[Eksempel slut]

· e – λ, k = 0, 1, 2, …

Middelværdi og varians: E(Y) = λ og V(Y) = λ

Fortolkning: Y angiver antal hændelser i en tidsperiode, hvor:•   λ er det forventede antal hændelser•   hændelser i ikke-overlappende tidsintervaller er uafhængige•   sandsynlighederne i to lige lange intervaller er ens•   sandsynligheden for mere end én hændelse i et meget kort tidsinterval er nul.

·

superpopulation bestående af forskellige ”hændelsesantal”. Dvs. man trækker fx elementet ”2 kunder på 10 timer”. Y er da lig med 2. Som det forhåbentlig fremgår af det ovenstående, så er der nogle underliggende antagelser, som skal være opfyldt, for at vi kan modellere en situation ved hjælp af Poissonfordelingen. Disse er følgende:

i) antallet af hændelser i ikke-overlappende tidsintervaller skal være uafhængige (antallet af kunder i den ene time skal være uafhængigt af antallet af kunder i den anden time, osv.).

ii) sandsynlighederne i to lige lange intervaller skal være éns (dvs. samme sandsynlighed for at observere kunder i hver time).

iii) sandsynligheden for mere end én hændelse i et meget kort tidsinterval skal være nul.

Eksempel 6.15: En internetvirksomhed ved, at der i gennemsnit er fire hits pr. time på dens hjemmeside. I forbindelse med lanceringen af et nyt produkt ønsker den at beregne sandsynligheden for, at den når ud til mindst 10 kunder via dens hjemmeside i den første time. Kan den bruge Poissonfordelingen til dette? Det kræver, at man med rimelighed kan antage: i) at antallet af hits i ikke-overlappende tidsintervaller er uafhængige; ii) at sandsynlighederne for hits i to lige lange tidsintervaller er de samme; og iii) sandsynligheden for mere end ét hit i et meget kort tidsinterval er nul.

Virksomheden vurderer, at dette er rimelige antagelser, og at antallet af hits derfor er Poissonfordelt. Da det forventede antal hits pr. time er 4, er

dette værdien af λ. Sandsynligheden for præcis 10 hits i løbet af den første time efter lanceringen kan da beregnes som:

1055( 10) 0,018

10!P Y e−= = =

For at få sandsynligheden for mindst 10 kunder skal vi hertil lægge sandsynligheden for 11 kunder, sandsynligheden for 12 kunder, osv.

Alternativt kan vi udregne P(Y≥10) som

1 ( 9) ( 8) ... ( 0)P Y P Y P Y− = − = − − = . Til sidst i kapitlet skal vi se, hvorledes denne sandsynlighed hurtigt kan udregnes i Excel. [Eksempel slut]

Bestilling af

pizzaer

Page 14: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

146 Indblik i statistik – for samfundsvidenskab

Vi opsummerer Poissonfordelingen i følgende boks: Poissonfordelingen, Y ~ Poi(λ)

Sandsynlighedsfunktion: λλ −== e

kkYP

k

!)(

, k = 0, 1, 2, …

Middelværdi og varians: λλ == )( og )( YVYE

Fortolkning: Y angiver antal hændelser i en tidsperiode, hvor: λ er det forventede antal hændelser hændelser i ikke-overlappende tidsintervaller er uafhængige sandsynlighederne i to lige lange intervaller er ens sandsynligheden for mere end én hændelse i et meget kort tidsinterval er nul.

Eksempel 6.16: Et pizzeria får i gennemsnit tre bestillinger pr. kvarter. Det har lovet kunderne, at pizzaen er gratis, hvis der går mere end et kvarter fra bestilling til levering. Dette vil ske, hvis der i et givet kvarter kommer mere end fem bestillinger. Derfor ønsker pizzeriaejeren at beregne risikoen for dette. Hvis vi antager, at Y angiver antallet af pizzabestillinger i et kvarter, og

at Y følger en Poissonfordeling, så vil 3λ = . Dermed bliver sandsynlighederne for henholdsvis 0, 1, 2, 3, 4, og 5 bestillinger:

0 1 23 3 3

3 4 53 3 3

3 3 3( 0) 0,050, ( 1) 0,144, ( 2) 0,224,0! 1! 2!3 3 3( 3) 0, 224, ( 4) 0,168, ( 5) 0,101,3! 4! 5!

P Y e P Y e P Y e

P Y e P Y e P Y e

− − −

− − −

= = = = = = = = =

= = = = = = = = =

Og sandsynligheden for mere end 6 bestillinger kan da beregnes som:

( 6) 1 ( 0) ( 1) ( 2) ( 3) ( 4) ( 5)1 0,050 0,144 0, 224 0, 224 0,168 0,101 0,089

P Y P Y P Y P Y P Y P Y P Y≥ = − = − = − = − = − = − == − − − − − − =

Der er således 8,9% sandsynlighed for, at ejeren i et givet kvarter må aflevere mindst en pizza gratis.

[Eksempel slut]

Og sandsynligheden for mere end 5 bestillinger kan da beregnes som:

P(Y ≥ 6) = 1 – P(Y = 0) – P(Y = 1) – P(Y = 2) – P(Y = 3) – P(Y = 4) –

P(Y = 5) = 1 – 0,050 – 0,149 – 0,224 – 0,224 – 0,168 – 0,101 = 0,084

Der er således 8,4% sandsynlighed for, at ejeren i et givet kvarter må aflevere

gratis pizza.

6.5 Normalfordelingen

Fordelingerne i afsnit 6.1 til 6.4 er alle diskrete fordelinger, hvor den stokasti-

ske variabel kun kan antage et tælleligt antal værdier. Normalfordelingen, som

vi nu skal se på, er derimod en fordeling for en kontinuert stokastisk variabel.

Normalfordelingen har opnået sin popularitet af to årsager. For det første har

mange naturlige størrelser i virkelige populationer en fordeling, som ligner

normalfordelingen, og for det andet, som vi skal se i de efterfølgende kapitler,

er mange estimatorer og teststatistikker normalfordelte.

Tæthedsfunktionen for en normalfordelt variabel, Y, er illustreret i figur 6.2

for forskellige værdier af µ og σ 2. Man kan se i figuren, at grafen for tætheds-

funktionen afhænger af både µ og σ 2. Middelværdien ligger midt i grafen,

hvor tæthedsfunktionen antager den største værdi. Hvis middelværdien, µ, er

høj, så ligger grafen længere til højre. Der vil da være større sandsynlighed for

at få større værdier af Y. Hvis variansen er høj, så har grafen „tykkere haler“,

dvs. der er større sandsynlighed for at få værdier af Y, som ligger langt væk fra

middelværdien.

Normalfordelingen, Y ~ N(µ, σ 2)

En kontinuert stokastisk variabel, Y, er normalfordelt, hvis den har tæthedsfunk-tion:

6.5 Normalfordelingen

Fordelingerne i afsnit 6.1 til 6.4 er alle diskrete fordelinger, hvor den stokastiske variabel kun kan antage et tælleligt antal værdier. Normalfordelingen, som vi nu skal se på, er derimod en fordeling for en kontinuert stokastisk variabel. Normalfordelingen har opnået sin popularitet af to årsager. For det første har mange naturlige størrelser i virkelige populationer en fordeling, som ligner normalfordelingen, og for det andet, som vi skal se i de efterfølgende kapitler, er mange estimatorer og teststatistikker normalfordelte.

Normalfordelingen, 2~ ( , )Y N µ σ

En kontinuert stokastisk variabel Y er normalfordelt, hvis den har tæthedsfunktionen:

2

21

21)(

−−

= σµ

πσ

y

eyf

hvor µ = E(Y) er middelværdien og σ2 = V(Y) er variansen.

Tæthedsfunktionen for en normalfordelt variabel Y er illustreret i Figur 6.2 for forskellige værdier af µ og σ2. Vi kan se i figuren, at grafen for tæthedsfunktionen afhænger af både µ og σ2. Middelværdien ligger midt i grafen, hvor tæthedsfunktionen antager den største værdi. Hvis middelværdien, µ, er høj, så ligger grafen længere til højre. Der vil derfor være større sandsynlighed for at få større værdier af Y. Hvis variansen er høj, så har grafen ” tykkere haler”, dvs. der er større sandsynlighed for at få værdier af Y, som ligger langt væk fra middelværdien.

Figur 6.2 Tæthedsfunktioner for normalfordelte variabler [Figur 5.2 i IIS, side 95]

Hvordan finder vi sandsynligheder i normalfordelingen? Hvis 2~ ( , )Y N µ σ , så er sandsynligheden for at få en værdi af Y, som er

hvor µ = E(Y) er middelværdien, og σ 2 = V(Y) er variansen.

Vi opsummerer Poissonfordelingen i følgende boks: Poissonfordelingen, Y ~ Poi(λ)

Sandsynlighedsfunktion: λλ −== e

kkYP

k

!)(

, k = 0, 1, 2, …

Middelværdi og varians: λλ == )( og )( YVYE

Fortolkning: Y angiver antal hændelser i en tidsperiode, hvor: λ er det forventede antal hændelser hændelser i ikke-overlappende tidsintervaller er uafhængige sandsynlighederne i to lige lange intervaller er ens sandsynligheden for mere end én hændelse i et meget kort tidsinterval er nul.

Eksempel 6.16: Et pizzeria får i gennemsnit tre bestillinger pr. kvarter. Det har lovet kunderne, at pizzaen er gratis, hvis der går mere end et kvarter fra bestilling til levering. Dette vil ske, hvis der i et givet kvarter kommer mere end fem bestillinger. Derfor ønsker pizzeriaejeren at beregne risikoen for dette. Hvis vi antager, at Y angiver antallet af pizzabestillinger i et kvarter, og

at Y følger en Poissonfordeling, så vil 3λ = . Dermed bliver sandsynlighederne for henholdsvis 0, 1, 2, 3, 4, og 5 bestillinger:

0 1 23 3 3

3 4 53 3 3

3 3 3( 0) 0,050, ( 1) 0,144, ( 2) 0,224,0! 1! 2!3 3 3( 3) 0, 224, ( 4) 0,168, ( 5) 0,101,3! 4! 5!

P Y e P Y e P Y e

P Y e P Y e P Y e

− − −

− − −

= = = = = = = = =

= = = = = = = = =

Og sandsynligheden for mere end 6 bestillinger kan da beregnes som:

( 6) 1 ( 0) ( 1) ( 2) ( 3) ( 4) ( 5)1 0,050 0,144 0, 224 0, 224 0,168 0,101 0,089

P Y P Y P Y P Y P Y P Y P Y≥ = − = − = − = − = − = − == − − − − − − =

Der er således 8,9% sandsynlighed for, at ejeren i et givet kvarter må aflevere mindst en pizza gratis.

[Eksempel slut]

· · ·

·

Vi opsummerer Poissonfordelingen i følgende boks: Poissonfordelingen, Y ~ Poi(λ)

Sandsynlighedsfunktion: λλ −== e

kkYP

k

!)(

, k = 0, 1, 2, …

Middelværdi og varians: λλ == )( og )( YVYE

Fortolkning: Y angiver antal hændelser i en tidsperiode, hvor: λ er det forventede antal hændelser hændelser i ikke-overlappende tidsintervaller er uafhængige sandsynlighederne i to lige lange intervaller er ens sandsynligheden for mere end én hændelse i et meget kort tidsinterval er nul.

Eksempel 6.16: Et pizzeria får i gennemsnit tre bestillinger pr. kvarter. Det har lovet kunderne, at pizzaen er gratis, hvis der går mere end et kvarter fra bestilling til levering. Dette vil ske, hvis der i et givet kvarter kommer mere end fem bestillinger. Derfor ønsker pizzeriaejeren at beregne risikoen for dette. Hvis vi antager, at Y angiver antallet af pizzabestillinger i et kvarter, og

at Y følger en Poissonfordeling, så vil 3λ = . Dermed bliver sandsynlighederne for henholdsvis 0, 1, 2, 3, 4, og 5 bestillinger:

0 1 23 3 3

3 4 53 3 3

3 3 3( 0) 0,050, ( 1) 0,144, ( 2) 0,224,0! 1! 2!3 3 3( 3) 0, 224, ( 4) 0,168, ( 5) 0,101,3! 4! 5!

P Y e P Y e P Y e

P Y e P Y e P Y e

− − −

− − −

= = = = = = = = =

= = = = = = = = =

Og sandsynligheden for mere end 6 bestillinger kan da beregnes som:

( 6) 1 ( 0) ( 1) ( 2) ( 3) ( 4) ( 5)1 0,050 0,144 0, 224 0, 224 0,168 0,101 0,089

P Y P Y P Y P Y P Y P Y P Y≥ = − = − = − = − = − = − == − − − − − − =

Der er således 8,9% sandsynlighed for, at ejeren i et givet kvarter må aflevere mindst en pizza gratis.

[Eksempel slut]

· ·

Vi opsummerer Poissonfordelingen i følgende boks: Poissonfordelingen, Y ~ Poi(λ)

Sandsynlighedsfunktion: λλ −== e

kkYP

k

!)(

, k = 0, 1, 2, …

Middelværdi og varians: λλ == )( og )( YVYE

Fortolkning: Y angiver antal hændelser i en tidsperiode, hvor: λ er det forventede antal hændelser hændelser i ikke-overlappende tidsintervaller er uafhængige sandsynlighederne i to lige lange intervaller er ens sandsynligheden for mere end én hændelse i et meget kort tidsinterval er nul.

Eksempel 6.16: Et pizzeria får i gennemsnit tre bestillinger pr. kvarter. Det har lovet kunderne, at pizzaen er gratis, hvis der går mere end et kvarter fra bestilling til levering. Dette vil ske, hvis der i et givet kvarter kommer mere end fem bestillinger. Derfor ønsker pizzeriaejeren at beregne risikoen for dette. Hvis vi antager, at Y angiver antallet af pizzabestillinger i et kvarter, og

at Y følger en Poissonfordeling, så vil 3λ = . Dermed bliver sandsynlighederne for henholdsvis 0, 1, 2, 3, 4, og 5 bestillinger:

0 1 23 3 3

3 4 53 3 3

3 3 3( 0) 0,050, ( 1) 0,144, ( 2) 0,224,0! 1! 2!3 3 3( 3) 0, 224, ( 4) 0,168, ( 5) 0,101,3! 4! 5!

P Y e P Y e P Y e

P Y e P Y e P Y e

− − −

− − −

= = = = = = = = =

= = = = = = = = =

Og sandsynligheden for mere end 6 bestillinger kan da beregnes som:

( 6) 1 ( 0) ( 1) ( 2) ( 3) ( 4) ( 5)1 0,050 0,144 0, 224 0, 224 0,168 0,101 0,089

P Y P Y P Y P Y P Y P Y P Y≥ = − = − = − = − = − = − == − − − − − − =

Der er således 8,9% sandsynlighed for, at ejeren i et givet kvarter må aflevere mindst en pizza gratis.

[Eksempel slut]

0,149,

2, π, σ *2

6.5 Normalfordelingen

Fordelingerne i afsnit 6.1 til 6.4 er alle diskrete fordelinger, hvor den stokastiske variabel kun kan antage et tælleligt antal værdier. Normalfordelingen, som vi nu skal se på, er derimod en fordeling for en kontinuert stokastisk variabel. Normalfordelingen har opnået sin popularitet af to årsager. For det første har mange naturlige størrelser i virkelige populationer en fordeling, som ligner normalfordelingen, og for det andet, som vi skal se i de efterfølgende kapitler, er mange estimatorer og teststatistikker normalfordelte.

Normalfordelingen, 2~ ( , )Y N µ σ

En kontinuert stokastisk variabel Y er normalfordelt, hvis den har tæthedsfunktionen:

2

21

21)(

−−

= σµ

πσ

y

eyf

hvor µ = E(Y) er middelværdien og σ2 = V(Y) er variansen.

Tæthedsfunktionen for en normalfordelt variabel Y er illustreret i Figur 6.2 for forskellige værdier af µ og σ2. Vi kan se i figuren, at grafen for tæthedsfunktionen afhænger af både µ og σ2. Middelværdien ligger midt i grafen, hvor tæthedsfunktionen antager den største værdi. Hvis middelværdien, µ, er høj, så ligger grafen længere til højre. Der vil derfor være større sandsynlighed for at få større værdier af Y. Hvis variansen er høj, så har grafen ” tykkere haler”, dvs. der er større sandsynlighed for at få værdier af Y, som ligger langt væk fra middelværdien.

Figur 6.2 Tæthedsfunktioner for normalfordelte variabler [Figur 5.2 i IIS, side 95]

Hvordan finder vi sandsynligheder i normalfordelingen? Hvis 2~ ( , )Y N µ σ , så er sandsynligheden for at få en værdi af Y, som er

6.5 Normalfordelingen

Fordelingerne i afsnit 6.1 til 6.4 er alle diskrete fordelinger, hvor den stokastiske variabel kun kan antage et tælleligt antal værdier. Normalfordelingen, som vi nu skal se på, er derimod en fordeling for en kontinuert stokastisk variabel. Normalfordelingen har opnået sin popularitet af to årsager. For det første har mange naturlige størrelser i virkelige populationer en fordeling, som ligner normalfordelingen, og for det andet, som vi skal se i de efterfølgende kapitler, er mange estimatorer og teststatistikker normalfordelte.

Normalfordelingen, 2~ ( , )Y N µ σ

En kontinuert stokastisk variabel Y er normalfordelt, hvis den har tæthedsfunktionen:

2

21

21)(

−−

= σµ

πσ

y

eyf

hvor µ = E(Y) er middelværdien og σ2 = V(Y) er variansen.

Tæthedsfunktionen for en normalfordelt variabel Y er illustreret i Figur 6.2 for forskellige værdier af µ og σ2. Vi kan se i figuren, at grafen for tæthedsfunktionen afhænger af både µ og σ2. Middelværdien ligger midt i grafen, hvor tæthedsfunktionen antager den største værdi. Hvis middelværdien, µ, er høj, så ligger grafen længere til højre. Der vil derfor være større sandsynlighed for at få større værdier af Y. Hvis variansen er høj, så har grafen ” tykkere haler”, dvs. der er større sandsynlighed for at få værdier af Y, som ligger langt væk fra middelværdien.

Figur 6.2 Tæthedsfunktioner for normalfordelte variabler [Figur 5.2 i IIS, side 95]

Hvordan finder vi sandsynligheder i normalfordelingen? Hvis 2~ ( , )Y N µ σ , så er sandsynligheden for at få en værdi af Y, som er

6.5 Normalfordelingen

Fordelingerne i afsnit 6.1 til 6.4 er alle diskrete fordelinger, hvor den stokastiske variabel kun kan antage et tælleligt antal værdier. Normalfordelingen, som vi nu skal se på, er derimod en fordeling for en kontinuert stokastisk variabel. Normalfordelingen har opnået sin popularitet af to årsager. For det første har mange naturlige størrelser i virkelige populationer en fordeling, som ligner normalfordelingen, og for det andet, som vi skal se i de efterfølgende kapitler, er mange estimatorer og teststatistikker normalfordelte.

Normalfordelingen, 2~ ( , )Y N µ σ

En kontinuert stokastisk variabel Y er normalfordelt, hvis den har tæthedsfunktionen:

2

21

21)(

−−

= σµ

πσ

y

eyf

hvor µ = E(Y) er middelværdien og σ2 = V(Y) er variansen.

Tæthedsfunktionen for en normalfordelt variabel Y er illustreret i Figur 6.2 for forskellige værdier af µ og σ2. Vi kan se i figuren, at grafen for tæthedsfunktionen afhænger af både µ og σ2. Middelværdien ligger midt i grafen, hvor tæthedsfunktionen antager den største værdi. Hvis middelværdien, µ, er høj, så ligger grafen længere til højre. Der vil derfor være større sandsynlighed for at få større værdier af Y. Hvis variansen er høj, så har grafen ” tykkere haler”, dvs. der er større sandsynlighed for at få værdier af Y, som ligger langt væk fra middelværdien.

Figur 6.2 Tæthedsfunktioner for normalfordelte variabler [Figur 5.2 i IIS, side 95]

Hvordan finder vi sandsynligheder i normalfordelingen? Hvis 2~ ( , )Y N µ σ , så er sandsynligheden for at få en værdi af Y, som er

6.5 Normalfordelingen

Fordelingerne i afsnit 6.1 til 6.4 er alle diskrete fordelinger, hvor den stokastiske variabel kun kan antage et tælleligt antal værdier. Normalfordelingen, som vi nu skal se på, er derimod en fordeling for en kontinuert stokastisk variabel. Normalfordelingen har opnået sin popularitet af to årsager. For det første har mange naturlige størrelser i virkelige populationer en fordeling, som ligner normalfordelingen, og for det andet, som vi skal se i de efterfølgende kapitler, er mange estimatorer og teststatistikker normalfordelte.

Normalfordelingen, 2~ ( , )Y N µ σ

En kontinuert stokastisk variabel Y er normalfordelt, hvis den har tæthedsfunktionen:

2

21

21)(

−−

= σµ

πσ

y

eyf

hvor µ = E(Y) er middelværdien og σ2 = V(Y) er variansen.

Tæthedsfunktionen for en normalfordelt variabel Y er illustreret i Figur 6.2 for forskellige værdier af µ og σ2. Vi kan se i figuren, at grafen for tæthedsfunktionen afhænger af både µ og σ2. Middelværdien ligger midt i grafen, hvor tæthedsfunktionen antager den største værdi. Hvis middelværdien, µ, er høj, så ligger grafen længere til højre. Der vil derfor være større sandsynlighed for at få større værdier af Y. Hvis variansen er høj, så har grafen ” tykkere haler”, dvs. der er større sandsynlighed for at få værdier af Y, som ligger langt væk fra middelværdien.

Figur 6.2 Tæthedsfunktioner for normalfordelte variabler [Figur 5.2 i IIS, side 95]

Hvordan finder vi sandsynligheder i normalfordelingen? Hvis 2~ ( , )Y N µ σ , så er sandsynligheden for at få en værdi af Y, som er

·

Page 15: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

Populære fordelinger 147

Hvordan finder vi sandsynligheder i normalfordelingen? Hvis Y ~ N(µ, σ 2), så

er sandsynligheden for at få en værdi af Y, som er mindre end eller lig med y,

givet ved F(y), hvor F er den kumulative sandsynlighedsfunktion for Y. Gra-

fisk set er F(y) lig med arealet under tæthedsfunktionen til venstre for y som

illustreret i figur 6.3.

Det er oplagt, at dette areal vil afhænge af størrelserne af µ og σ 2. Hvis µ er

høj, vil arealet være mindre. En højere middelværdi gør det mindre sandsyn-

ligt at observere en lav værdi af Y. Arealet, dvs. den kumulative sandsynlig-

hedsfunktion, kan udregnes ved at integrere tæthedsfunktionen. Dette er des-

værre umuligt, da der ikke eksisterer et analytisk udtryk for F(y), når Y er

Figur 6.2

Tæthedsfunk­

tioner for

normalfordelte

variabler

y–5 –3 –1 10 3 5 7

0,3

0,2

0,1

f(y)

=1,2 =3σ

µ

=3,2 =1σ

µ

Figur 6.3

Kumulativ

sandsynlighed

i en normalfor­

deling

f(y)

F(y1)

y

y1

–5 –3 –1 0 31 5 7

0,3

0,2

0,1 =1,2 =3σ

µ

Page 16: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

148 Indblik i statistik – for samfundsvidenskab

normalfordelt. Ved brug af computersimulationer kan man dog for givne

værdier af µ og σ 2 simulere sandsynligheden for, at Y vil antage en værdi min-

dre end y. Det er dog stadig ikke en særlig praktisk løsning i mange situatio-

ner.

Heldigvis kan man udregne de kumulative sandsynligheder for enhver nor-

malfordeling ud fra den normalfordeling, som har middelværdi µ = 0 og vari-

ans σ 2 = 1. Denne specifikke normalfordeling, N(0, 1), kaldes standardnor-

malfordelingen. Den er så vigtig, at dens kumulative sandsynlighedsfunktion

har fået et specielt symbol, Φ(z), og tilsvarende har dens tæthedsfunktion fået

betegnelsen φ(z). Den kumulative sandsynlighedsfunktion, Φ(z), er desuden

tabuleret i tabel 1 bagerst i bogen for udvalgte værdier af z. De næste to ek-

sempler viser, hvordan man kan bruge tabellen til at finde sandsynligheder i

standardnormalfordelingen.

Eksempel 6.17: Lad Z være standardnormalfordelt, dvs Z ~ N(0, 1). Find sandsynligheden

for, at Z er mindre end –2,62. Vi skal altså finde Φ(z), hvor z = –2,62. I tabel

1 bagerst i bogen angiver det første tal i hver række værdien af z til og med 1.

decimal, hvorimod det første tal i hver kolonne angiver den 2. decimal af z.

Vi skal derfor finde den værdi i tabellen, der står ud for rækken med –2,6 og

kolonnen med 2. Her finder vi værdien 0,0044. Sandsynligheden for en værdi

af Z mindre end –2,62 er derfor 0,0044.

z 0 1 2

–3,0 0,0013 0,0013 0,0013

–2,9 0,0019 0,0018 0,0018

–2,8 0,0026 0,0025 0,0024

–2,7 0,0035 0,0034 0,0033

–2,6 0,0047 0,0045 0,0044

–2,5 0,0062 0,0060 0,0059

Eksempel 6.18: Find P(Z > 1,06), når Z er standardnormalfordelt. Fra tabel 1 finder vi, at

P(Z ≤ 1,06) = Φ(1,06) = 0,8554. Sandsynligheden for, at Z er større end 1,06,

er da:

P(Z>1,06) = 1 – Φ(1,06) = 1 – 0,8554 = 0,1446.

Når det nu er muligt at finde sandsynligheder for standardnormalfordelingen,

mangler vi blot at etablere sammenhængen mellem standardnormalfordelin-

gen og alle de andre normalfordelinger. Denne sammenhæng finder man ved

Tabel 5.2

Udsnit af

sandsynlig­

hedstabel 1

Tabelopslag 1

Tabelopslag 2

Page 17: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

Populære fordelinger 149

standardisering. Standardisering ændrer en stokastisk variabel med middel-

værdi µ og varians σ2 til en ny stokastisk variabel med middelværdi 0 og vari-

ans 1. Hvis den oprindelige stokastiske variabel er normalfordelt, så vil den

nye stokastiske variabel også være normalfordelt, men nu med middelværdi 0

og varians 1:

Det følgende eksempel viser, hvordan vi kan bruge standardisering til at ud-

regne sandsynligheder for en normalfordelt variabel:

Eksempel 6.19: Lad Y ~ N(10, 4). Vi skal finde sandsynligheden P(Y ≤ 8). Dette gøres ved

hjælp af standardisering:

Eksempel 6.19: Lad Y ~ N(10, 4). Vi skal finde sandsynligheden P(Y≤8). Dette gøres ved hjælp af standardisering:

( ) 10 8 10 10( 8) 10 8 10 1 ( 1)2 2 2

Y YP Y P Y P P P Z

− − − ≤ = − ≤ − = ≤ = ≤ − = ≤ −

= ( 1)Φ −

hvor vi udnytter, at vi gerne må trække det samme tal (middelværdien 10) fra og dividere med det samme tal (standardafvigelsen 2) på begge sider af et ulighedstegn. Fordi Y er normalfordelt med middelværdi 10 og varians 4, så må variablen Z = (Y-10)/2 være standard-normalfordelt ifølge boksen ovenfor. Dermed kan vi slå den sidste sandsynlighed op i tabel 1. Vi finder

således, at ( 8) ( 1) 0,1587P Y ≤ = Φ − = . [Eksempel slut]

Sandsynligheden for, at den stokastiske variabel Y antager en værdi mindre end a , er altså den samme som sandsynligheden for, at den standardiserede variabel Z = (Y-µ)/σ antager en værdi mindre end ( a -µ)/σ, og denne sandsynlighed kan findes ved at bruge tabel 1 for standard-normalfordelingen. Lad os opsummere teknikken i en boks: Sandsynligheder i normalfordelingen:

For 2~ ( , )Y N µ σ gælder følgende regler:

) ( )

) ( ) 1

) ( )

ai P Y a

aii P Y a

a biii P b Y a

µσ

µσ

µ µσ σ

− ≤ = Φ

− ≥ = − Φ

− − ≤ ≤ = Φ − Φ

hvor a og b er konstanter og Φ (z) findes i tabel 1.

Eksempel 6.20: Lad den stokastiske variabel X repræsentere afkastet på en aktie (i kroner på et år). Antag desuden, at X er normalfordelt med

( ) 20E X µ= = og 2( ) 5V X σ= = . Hvad er da risikoen

(sandsynligheden) for et afkast på mindre end 15 kroner i et givet år? Vi løser problemet på samme måde som i ovenstående eksempel:

hvor vi udnytter, at vi gerne må trække det samme tal (middelværdien 10)

fra og dividere med det samme tal (standardafvigelsen 2) på begge sider af et

ulighedstegn. Fordi Y er normalfordelt med middelværdi 10 og varians 4, så

må variablen Z = (Y – 10)/2 være standardnormalfordelt ifølge boksen oven-

for. Dermed kan vi slå den sidste sandsynlighed op i tabel 1. Vi finder såle-

des, at P(Y ≤ 8) = Φ(–1) = 0,1587.

Sandsynligheden for, at den stokastiske variabel, Y, antager en værdi mindre

end a, er altså den samme som sandsynligheden for, at den standardiserede

variabel, Z = (Y – µ)/σ, antager en værdi mindre end (a – µ)/σ, og denne

sandsynlighed kan findes ved at bruge tabel 1 for standardnormalfordelingen.

Lad os opsummere teknikken i en boks:

Standardisering af en stokastisk variabel

Den stokastiske variabel, Y, med middelværdi E(Y) = µ og varians V(Y) = σ 2 standardiseres ved at udregne:

ud for rækken med –2,6 og kolonnen med 2. Her finder vi værdien 0,0044. Sandsynligheden for en værdi af Z mindre end –2,62 er derfor 0,0044.

Tabel 5.2 Udsnit af sandsynlighedstabel 1

[IIS, s. 97]

[Eksempel slut]

Eksempel 6.18: Find P(Z>1,06), når Z er standard-normalfordelt. Fra tabel

1 finder vi, at P(Z≤1,06) = (1,06)Φ =0,8554. Sandsynligheden for, at Z er større end 1,06, er da:

P(Z>1,06) = 1 - (1,06)Φ = 1 – 0,8554 = 0,1446. [Eksempel slut]

Når det nu er muligt at finde sandsynligheder for standard-normalfordelingen, mangler vi blot at etablere sammenhængen mellem standard-normalfordelingen og alle de andre normalfordelinger. Denne sammenhæng finder man ved standardisering. Standardisering ændrer en stokastisk variabel med middelværdi µ og varians σ2 til en ny stokastisk variabel med middelværdi 0 og varians 1. Hvis den oprindelige stokastiske variabel er normalfordelt, så vil den nye stokastiske variabel også være normalfordelt, men nu med middelværdi 0 og varians 1:

Standardisering af en stokastisk variabel Den stokastiske variabel Y med middelværdi E(Y) = µ og varians V(Y) = σ2 standardiseres ved at udregne:

YZ

µσ−=

. Z bliver da en stokastisk variabel med middelværdi E(Z) = 0 og varians V(Z) = 1.

Specielt for normalfordelingen: Hvis 2~ ( , )Y N µ σ , så er ~ (0,1)Z N .

Det følgende eksempel viser, hvordan vi kan bruge standardisering til at udregne sandsynligheder for en normalfordelt variabel:

Z bliver da en stokastisk variabel med middelværdi E(Z) = 0 og varians V(Z) = 1.

Specielt for normalfordelingen: Hvis Y ~ N(µ, σ 2), så er Z ~ N(0, 1).

Standardi­

sering

Eksempel 6.19: Lad Y ~ N(10, 4). Vi skal finde sandsynligheden P(Y≤8). Dette gøres ved hjælp af standardisering:

( ) 10 8 10 10( 8) 10 8 10 1 ( 1)2 2 2

Y YP Y P Y P P P Z

− − − ≤ = − ≤ − = ≤ = ≤ − = ≤ −

= ( 1)Φ −

hvor vi udnytter, at vi gerne må trække det samme tal (middelværdien 10) fra og dividere med det samme tal (standardafvigelsen 2) på begge sider af et ulighedstegn. Fordi Y er normalfordelt med middelværdi 10 og varians 4, så må variablen Z = (Y-10)/2 være standard-normalfordelt ifølge boksen ovenfor. Dermed kan vi slå den sidste sandsynlighed op i tabel 1. Vi finder

således, at ( 8) ( 1) 0,1587P Y ≤ = Φ − = . [Eksempel slut]

Sandsynligheden for, at den stokastiske variabel Y antager en værdi mindre end a , er altså den samme som sandsynligheden for, at den standardiserede variabel Z = (Y-µ)/σ antager en værdi mindre end ( a -µ)/σ, og denne sandsynlighed kan findes ved at bruge tabel 1 for standard-normalfordelingen. Lad os opsummere teknikken i en boks: Sandsynligheder i normalfordelingen:

For 2~ ( , )Y N µ σ gælder følgende regler:

) ( )

) ( ) 1

) ( )

ai P Y a

aii P Y a

a biii P b Y a

µσ

µσ

µ µσ σ

− ≤ = Φ

− ≥ = − Φ

− − ≤ ≤ = Φ − Φ

hvor a og b er konstanter og Φ (z) findes i tabel 1.

Eksempel 6.20: Lad den stokastiske variabel X repræsentere afkastet på en aktie (i kroner på et år). Antag desuden, at X er normalfordelt med

( ) 20E X µ= = og 2( ) 5V X σ= = . Hvad er da risikoen

(sandsynligheden) for et afkast på mindre end 15 kroner i et givet år? Vi løser problemet på samme måde som i ovenstående eksempel:

Eksempel 6.19: Lad Y ~ N(10, 4). Vi skal finde sandsynligheden P(Y≤8). Dette gøres ved hjælp af standardisering:

( ) 10 8 10 10( 8) 10 8 10 1 ( 1)2 2 2

Y YP Y P Y P P P Z

− − − ≤ = − ≤ − = ≤ = ≤ − = ≤ −

= ( 1)Φ −

hvor vi udnytter, at vi gerne må trække det samme tal (middelværdien 10) fra og dividere med det samme tal (standardafvigelsen 2) på begge sider af et ulighedstegn. Fordi Y er normalfordelt med middelværdi 10 og varians 4, så må variablen Z = (Y-10)/2 være standard-normalfordelt ifølge boksen ovenfor. Dermed kan vi slå den sidste sandsynlighed op i tabel 1. Vi finder

således, at ( 8) ( 1) 0,1587P Y ≤ = Φ − = . [Eksempel slut]

Sandsynligheden for, at den stokastiske variabel Y antager en værdi mindre end a , er altså den samme som sandsynligheden for, at den standardiserede variabel Z = (Y-µ)/σ antager en værdi mindre end ( a -µ)/σ, og denne sandsynlighed kan findes ved at bruge tabel 1 for standard-normalfordelingen. Lad os opsummere teknikken i en boks: Sandsynligheder i normalfordelingen:

For 2~ ( , )Y N µ σ gælder følgende regler:

) ( )

) ( ) 1

) ( )

ai P Y a

aii P Y a

a biii P b Y a

µσ

µσ

µ µσ σ

− ≤ = Φ

− ≥ = − Φ

− − ≤ ≤ = Φ − Φ

hvor a og b er konstanter og Φ (z) findes i tabel 1.

Eksempel 6.20: Lad den stokastiske variabel X repræsentere afkastet på en aktie (i kroner på et år). Antag desuden, at X er normalfordelt med

( ) 20E X µ= = og 2( ) 5V X σ= = . Hvad er da risikoen

(sandsynligheden) for et afkast på mindre end 15 kroner i et givet år? Vi løser problemet på samme måde som i ovenstående eksempel:

Eksempel 6.19: Lad Y ~ N(10, 4). Vi skal finde sandsynligheden P(Y≤8). Dette gøres ved hjælp af standardisering:

( ) 10 8 10 10( 8) 10 8 10 1 ( 1)2 2 2

Y YP Y P Y P P P Z

− − − ≤ = − ≤ − = ≤ = ≤ − = ≤ −

= ( 1)Φ −

hvor vi udnytter, at vi gerne må trække det samme tal (middelværdien 10) fra og dividere med det samme tal (standardafvigelsen 2) på begge sider af et ulighedstegn. Fordi Y er normalfordelt med middelværdi 10 og varians 4, så må variablen Z = (Y-10)/2 være standard-normalfordelt ifølge boksen ovenfor. Dermed kan vi slå den sidste sandsynlighed op i tabel 1. Vi finder

således, at ( 8) ( 1) 0,1587P Y ≤ = Φ − = . [Eksempel slut]

Sandsynligheden for, at den stokastiske variabel Y antager en værdi mindre end a , er altså den samme som sandsynligheden for, at den standardiserede variabel Z = (Y-µ)/σ antager en værdi mindre end ( a -µ)/σ, og denne sandsynlighed kan findes ved at bruge tabel 1 for standard-normalfordelingen. Lad os opsummere teknikken i en boks: Sandsynligheder i normalfordelingen:

For 2~ ( , )Y N µ σ gælder følgende regler:

) ( )

) ( ) 1

) ( )

ai P Y a

aii P Y a

a biii P b Y a

µσ

µσ

µ µσ σ

− ≤ = Φ

− ≥ = − Φ

− − ≤ ≤ = Φ − Φ

hvor a og b er konstanter og Φ (z) findes i tabel 1.

Eksempel 6.20: Lad den stokastiske variabel X repræsentere afkastet på en aktie (i kroner på et år). Antag desuden, at X er normalfordelt med

( ) 20E X µ= = og 2( ) 5V X σ= = . Hvad er da risikoen

(sandsynligheden) for et afkast på mindre end 15 kroner i et givet år? Vi løser problemet på samme måde som i ovenstående eksempel:

Page 18: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

150 Indblik i statistik – for samfundsvidenskab

Eksempel 6.20: Lad den stokastiske variabel, X, repræsentere afkastet på en aktie (i kroner på

et år). Antag desuden, at X er normalfordelt med E(X) = µ = 20 og V(X) = σ 2

= 5. Hvad er da risikoen (sandsynligheden) for et afkast på mindre end 15

kroner i et givet år? Vi løser problemet på samme måde som i ovenstående

eksempel:

20 15 20 20( 15) 2, 24 ( 2,24) 0,01265 5 5

X XP X P P

− − − ≤ = ≤ = ≤ − = Φ − =

Der er altså kun en sandsynlighed på 1,26% for et afkast på mindre end 15 kroner. [Eksempel slut]

6.6 Multinomialfordelingen

Den multinomiale fordeling er en generalisering af binomialfordelingen. Men i stedet for at trække fra en population med kun to forskellige typer af elementer (en Bernoullipopulation), så trækker man nu fra en population med m forskellige typer. Et element kan derfor antage m forskellige værdier. Som i binomialfordelingen antages det, at udtrækningerne er uafhængige. Det betyder, at hvis der udtrækkes fra en virkelig population, så sker det med tilbagelægning.

Eksempel 6.21: Forestil dig, at vi stopper fem tilfældige mennesker på gaden og spørger, om de stemmer i) ja, ii) nej eller iii) blankt til en kommende EU afstemning. Her er der således tre forskellige typer af elementer i populationen (ja, nej, og blank). I princippet er det ikke noget til hinder for, at vi kommer til at stoppe den samme person to gange, så derfor er der tale om en trækning med tilbagelægning fra populationen. [Eksempel slut]

I binomialfordelingen lod vi Xi være en stokastisk variabel, der antog værdien 1, hvis den i’te udtrækning resulterede i en succes. Den stokastiske variabel Y (antallet af succeser i de n trækninger) var da lig med summen af Xi’erne. I eksempel 6.21 kan vi ikke nøjes med en enkelt variabel. Vi kunne lade Y angive antallet af ja-stemmer, men det er ikke tilstrækkeligt til at fortælle os, hvordan nej-stemmer og blanke stemmer fordeler sig i stikprøven. Til eksperimentet i eksempel 6.21 har vi brug for tre stokastiske variabler.

Eksempel 6.22: Lad den stokastiske variabel Y1 være antallet af ja-sigere i de fem udtrækninger fra eksempel 6.22, Y2 antallet af nej-sigere og Y3 antallet af blanke. Det er fordelingen af (Y1, Y2, Y3), som siges at være en

Der er altså kun en sandsynlighed på 1,25% for et afkast på mindre end 15

kroner.

6.6 Multinomialfordelingen

Den multinomiale fordeling er en generalisering af binomialfordelingen. Men

i stedet for at trække fra en population med kun to forskellige typer af ele-

menter (en Bernoullipopulation), så trækker man nu fra en population med

m forskellige typer. Et element kan derfor antage m forskellige værdier. Som i

binomialfordelingen antages det, at udtrækningerne er uafhængige. Det bety-

der, at hvis der udtrækkes fra en virkelig population, så sker det med tilbage-

lægning.

Eksempel 6.21: Forestil dig, at vi stopper fem tilfældige mennesker på gaden og spørger, om

de stemmer ja, nej eller blankt til en kommende EU-afstemning. Her er der

således tre forskellige typer af elementer i populationen (ja, nej, og blank). I

Sandsynligheder i normalfordelingen:

For Y ~ N(µ, σ 2) gælder følgende regler:

Eksempel 6.19: Lad Y ~ N(10, 4). Vi skal finde sandsynligheden P(Y≤8). Dette gøres ved hjælp af standardisering:

( ) 10 8 10 10( 8) 10 8 10 1 ( 1)2 2 2

Y YP Y P Y P P P Z

− − − ≤ = − ≤ − = ≤ = ≤ − = ≤ −

= ( 1)Φ −

hvor vi udnytter, at vi gerne må trække det samme tal (middelværdien 10) fra og dividere med det samme tal (standardafvigelsen 2) på begge sider af et ulighedstegn. Fordi Y er normalfordelt med middelværdi 10 og varians 4, så må variablen Z = (Y-10)/2 være standard-normalfordelt ifølge boksen ovenfor. Dermed kan vi slå den sidste sandsynlighed op i tabel 1. Vi finder

således, at ( 8) ( 1) 0,1587P Y ≤ = Φ − = . [Eksempel slut]

Sandsynligheden for, at den stokastiske variabel Y antager en værdi mindre end a , er altså den samme som sandsynligheden for, at den standardiserede variabel Z = (Y-µ)/σ antager en værdi mindre end ( a -µ)/σ, og denne sandsynlighed kan findes ved at bruge tabel 1 for standard-normalfordelingen. Lad os opsummere teknikken i en boks: Sandsynligheder i normalfordelingen:

For 2~ ( , )Y N µ σ gælder følgende regler:

) ( )

) ( ) 1

) ( )

ai P Y a

aii P Y a

a biii P b Y a

µσ

µσ

µ µσ σ

− ≤ = Φ

− ≥ = − Φ

− − ≤ ≤ = Φ − Φ

hvor a og b er konstanter og Φ (z) findes i tabel 1.

Eksempel 6.20: Lad den stokastiske variabel X repræsentere afkastet på en aktie (i kroner på et år). Antag desuden, at X er normalfordelt med

( ) 20E X µ= = og 2( ) 5V X σ= = . Hvad er da risikoen

(sandsynligheden) for et afkast på mindre end 15 kroner i et givet år? Vi løser problemet på samme måde som i ovenstående eksempel:

hvor a og b er konstanter, og Φ(z) findes i tabel 1.

Eksempel 6.19: Lad Y ~ N(10, 4). Vi skal finde sandsynligheden P(Y≤8). Dette gøres ved hjælp af standardisering:

( ) 10 8 10 10( 8) 10 8 10 1 ( 1)2 2 2

Y YP Y P Y P P P Z

− − − ≤ = − ≤ − = ≤ = ≤ − = ≤ −

= ( 1)Φ −

hvor vi udnytter, at vi gerne må trække det samme tal (middelværdien 10) fra og dividere med det samme tal (standardafvigelsen 2) på begge sider af et ulighedstegn. Fordi Y er normalfordelt med middelværdi 10 og varians 4, så må variablen Z = (Y-10)/2 være standard-normalfordelt ifølge boksen ovenfor. Dermed kan vi slå den sidste sandsynlighed op i tabel 1. Vi finder

således, at ( 8) ( 1) 0,1587P Y ≤ = Φ − = . [Eksempel slut]

Sandsynligheden for, at den stokastiske variabel Y antager en værdi mindre end a , er altså den samme som sandsynligheden for, at den standardiserede variabel Z = (Y-µ)/σ antager en værdi mindre end ( a -µ)/σ, og denne sandsynlighed kan findes ved at bruge tabel 1 for standard-normalfordelingen. Lad os opsummere teknikken i en boks: Sandsynligheder i normalfordelingen:

For 2~ ( , )Y N µ σ gælder følgende regler:

) ( )

) ( ) 1

) ( )

ai P Y a

aii P Y a

a biii P b Y a

µσ

µσ

µ µσ σ

− ≤ = Φ

− ≥ = − Φ

− − ≤ ≤ = Φ − Φ

hvor a og b er konstanter og Φ (z) findes i tabel 1.

Eksempel 6.20: Lad den stokastiske variabel X repræsentere afkastet på en aktie (i kroner på et år). Antag desuden, at X er normalfordelt med

( ) 20E X µ= = og 2( ) 5V X σ= = . Hvad er da risikoen

(sandsynligheden) for et afkast på mindre end 15 kroner i et givet år? Vi løser problemet på samme måde som i ovenstående eksempel:

Eksempel 6.19: Lad Y ~ N(10, 4). Vi skal finde sandsynligheden P(Y≤8). Dette gøres ved hjælp af standardisering:

( ) 10 8 10 10( 8) 10 8 10 1 ( 1)2 2 2

Y YP Y P Y P P P Z

− − − ≤ = − ≤ − = ≤ = ≤ − = ≤ −

= ( 1)Φ −

hvor vi udnytter, at vi gerne må trække det samme tal (middelværdien 10) fra og dividere med det samme tal (standardafvigelsen 2) på begge sider af et ulighedstegn. Fordi Y er normalfordelt med middelværdi 10 og varians 4, så må variablen Z = (Y-10)/2 være standard-normalfordelt ifølge boksen ovenfor. Dermed kan vi slå den sidste sandsynlighed op i tabel 1. Vi finder

således, at ( 8) ( 1) 0,1587P Y ≤ = Φ − = . [Eksempel slut]

Sandsynligheden for, at den stokastiske variabel Y antager en værdi mindre end a , er altså den samme som sandsynligheden for, at den standardiserede variabel Z = (Y-µ)/σ antager en værdi mindre end ( a -µ)/σ, og denne sandsynlighed kan findes ved at bruge tabel 1 for standard-normalfordelingen. Lad os opsummere teknikken i en boks: Sandsynligheder i normalfordelingen:

For 2~ ( , )Y N µ σ gælder følgende regler:

) ( )

) ( ) 1

) ( )

ai P Y a

aii P Y a

a biii P b Y a

µσ

µσ

µ µσ σ

− ≤ = Φ

− ≥ = − Φ

− − ≤ ≤ = Φ − Φ

hvor a og b er konstanter og Φ (z) findes i tabel 1.

Eksempel 6.20: Lad den stokastiske variabel X repræsentere afkastet på en aktie (i kroner på et år). Antag desuden, at X er normalfordelt med

( ) 20E X µ= = og 2( ) 5V X σ= = . Hvad er da risikoen

(sandsynligheden) for et afkast på mindre end 15 kroner i et givet år? Vi løser problemet på samme måde som i ovenstående eksempel:

Aktieafkast

0,0125

En EU­afstem­

ning – del 1

Page 19: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

Populære fordelinger 151

princippet er der ikke noget til hinder for, at vi kommer til at stoppe den

samme person to gange, så derfor er der tale om en udtrækning med tilbage-

lægning fra populationen.

I binomialfordelingen lod vi Xi være en stokastisk variabel, der antog værdien

1, hvis den i’te udtrækning resulterede i en succes. Den stokastiske variabel, Y

(antallet af succeser i de n trækninger), var da lig med summen af Xi’erne. I

eksempel 6.21 kan vi ikke nøjes med en enkelt variabel. Vi kunne lade Y an-

give antallet af ja-stemmer, men det er ikke tilstrækkeligt til at fortælle os,

hvordan nej-stemmer og blanke stemmer fordeler sig i stikprøven. Til ekspe-

rimentet i eksempel 6.21 har vi brug for tre stokastiske variabler.

Eksempel 6.22: Lad den stokastiske variabel Y1 være antallet af ja-sigere i de fem udtræknin-

ger fra eksempel 6.21, Y2 antallet af nej-sigere og Y3 antallet af blanke. Det er

fordelingen af (Y1, Y2, Y3), som siges at være en multinomialfordeling. Antag

nu, at andelen af ja-stemmer i populationen er 0,4, andelen, der stemmer nej,

er 0,5, og andelen, der stemmer blankt (eller ikke stemmer), er 0,1. Hvad er da

sandsynligheden for, at stikprøven kommer til at bestå af fx to ja-sigere (Y1 =

2), to nej-sigere (Y2 = 2) og en blank (Y3 = 1)?

Når vi har at gøre med en multinomialfordeling, skal vi, som illustreret i eksem-

pel 6.22, beregne sandsynligheden for tre eller flere stokastiske variabler, (Y1,

Y2,…,Ym). Multinomialfordelingen er derfor en simultan fordeling. I eksempel

6.22 er der tale om en simultan fordeling for Y1, Y2 og Y3. Det næste eksempel

viser, hvordan sandsynligheder i multinomialfordelingen fremkommer:

Eksempel 6.23: Baseret på populationsandelene fra eksempel 6.22 kan vi starte med at be-

regne sandsynligheden for først at møde to ja-sigere, dernæst to nej-sigere og

til sidst én der stemmer blankt. Denne sandsynlighed er givet ved:

0,4·0,4·0,5·0,5·0,1 = 0,004, fordi de enkelte udtrækninger er uafhængige.

Tilsvarende er sandsynligheden 0,004 for at møde den samme kombination

af vælgere i en anden rækkefølge, fx 0,1·0,4·0,5·0,5·0,4 = 0,004.

For at finde den samlede sandsynlighed skal vi gange sandsynligheden 0,004

med det antal kombinationer af udfald, der resulterer i to ja-sigere, to nej-sigere

og en blank stemme. Dette antal af kombinationer kan findes ved hjælp af form-

len i nedenstående boks, som kaldes multinomialkoefficienten. Denne er en ge-

neralisering af binomialkoefficienten fra afsnit 6.2. I dette tilfælde giver den:

En EU­afstem­

ning – del 2

En EU­afstem­

ning – del 3

Page 20: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

152 Indblik i statistik – for samfundsvidenskab

multinomialfordeling. Antag nu, at andelen af ja-stemmer i populationen er 0,4, andelen, der stemmer nej, er 0,5, og andelen, der stemmer blankt (eller ikke stemmer), er 0,1. Hvad er da sandsynligheden for, at stikprøven kommer til at bestå af fx to ja-sigere (Y1 = 2), to nej-sigere (Y2 = 2) og en blank (Y3 = 1)? [Eksempel slut]

Når vi har at gøre med en multinomialfordeling, skal vi, som illustreret i eksempel 6.22, beregne sandsynligheden for tre eller flere stokastiske variabler, (Y1, Y2,…,Ym). Multinomialfordelingen er derfor en simultan fordeling. I eksempel 6.22 er der tale om en simultan fordeling for Y1, Y2 og Y3. Det næste eksempel viser, hvordan sandsynligheder i multinomialfordelingen fremkommer:

Eksempel 6.23: Baseret på populationsandelene fra eksempel 6.22 kan vi starte med at beregne sandsynligheden for først at møde to ja-sigere, dernæst to nej-sigere og til sidst én der stemmer blankt. Denne

sandsynlighed er givet ved: 0,4⋅0,4⋅0,5⋅0,5⋅0,1 = 0,004, fordi de enkelte udtrækninger er uafhængige, idet vi trækker med tilbagelægning. Tilsvarende er sandsynligheden 0,004 for at møde den samme kombination

af vælgere i en anden rækkefølge, fx 0,1⋅0,4⋅0,5⋅0,5⋅0,4 = 0,004.

For at finde den samlede sandsynlighed skal vi gange sandsynligheden 0,004 med det antal kombinationer af udfald, der resulterer i to ja-sigere, to nej-sigere og en blank stemme. Dette antal af kombinationer kan findes ved hjælp af formlen i nedenstående boks, som kaldes multinomialkoefficienten. Denne er en generalisering af binomialkoefficienten fra afsnit 6.2. I dette tilfælde giver den:

30!1!2!2

!51,2,2

5=

⋅⋅=

Dvs. der findes 30 forskellige kombinationer, hvorved man kan få to ja-sigere, to nej-sigere og en blank. Den samlede sandsynlighed for at

udtrække to ja-sigere, to nej-sigere og en blank er derfor 0,004⋅30 = 0,12. [Eksempel slut]

Multinomialkoefficienten Antallet af kombinationer, hvorved n udfald kan resultere i k1 udfald af type 1, k2 udfald af type 2, …, og km udfald af type m, er givet ved:

Dvs. der findes 30 forskellige kombinationer, hvorved man kan få to ja-sige-

re, to nej-sigere og en blank. Den samlede sandsynlighed for at udtrække to

ja-sigere, to nej-sigere og en blank er derfor 0,004 · 30 = 0,12.

Sandsynligheden for at udtrække k1 elementer af type 1, k2 af type 2 osv. i n

uafhængige trækninger fra en population med m forskellige elementer er der-

for:

1 2 1 2

!, ,..., ! ! !m m

n n

k k k k k k

= ⋅ ⋅ ⋅⋅ ,

hvor 1 2 ... mk k k n+ + + = . Baseret på det ovenstående eksempel kan vi skrive sandsynligheden for at udtrække k1 elementer af type 1, k2 af type 2 osv. i n uafhængige trækninger fra en population med m forskellige elementer som:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

hvor p1 er sandsynligheden for at få et udfald af type 1 i en udtrækning, p2 sandsynligheden for at få et udfald af type 2 osv.

Eksempel 6.24: Forestil dig, at vi slår 12 gange med en terning og observerer antallet af enere, toere, treere, firere, femmere og seksere. Hvad er sandsynligheden for at slå to af hver slags? Hvis vi lader Y1 angive antallet af enere, Y2 antallet af toere, osv., så vil (Y1, Y2, Y3, Y4, Y5, Y6) være multinomialfordelt med p1 = 1/6, p2 = 1/6, …, p6 = 1/6. Vi kan jo betragte hvert kast som en udtrækning fra populationen af terningslag, hvor sandsynligheden for at trække (slå) en ener er 1/6, osv. Dermed bliver sandsynligheden for to enere, to toere, osv.:

2 2 2 2 2 2

1 2 6

2 2 2 2 2 2 12

12 1 1 1 1 1 1( 2, 2,..., 2)2,2,2,2,2,2 6 6 6 6 6 6

12! 1 12! 1 0,00342!2!2!2!2!2! 6 2 2 2 2 2 2 6

P Y Y Y

+ + + + +

= = = =

= = = ⋅ ⋅ ⋅ ⋅ ⋅

[Eksempel slut]

Lad os slutte med at opsummere multinomialfordelingen i en boks:

Multinomialfordelingen, 1 2 1 2( , ,..., ) ~ ( , , ,..., )m mY Y Y M n p p p

Sandsynlighedsfunktion:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

hvor p1 er sandsynligheden for at få et udfald af type 1 i en udtrækning, p2

sandsynligheden for at få et udfald af type 2 osv.

Eksempel 6.24: Forestil dig, at vi slår 12 gange med en terning og observerer antallet af enere,

toere, treere, firere, femmere og seksere. Hvad er sandsynligheden for at slå

to af hver slags? Hvis vi lader Y1 angive antallet af enere, Y2 antallet af toere,

osv., så vil (Y1, Y2, Y3, Y4, Y5, Y6) være multinomialfordelt med p1 = 1/6,

p2 = 1/6, …, p6 = 1/6. Vi kan betragte hvert kast som en udtrækning fra po-

pulationen af terningslag, hvor sandsynligheden for at trække (slå) en ener er

1/6 osv. Dermed bliver sandsynligheden for to enere, to toere osv.:

1 2 1 2

!, ,..., ! ! !m m

n n

k k k k k k

= ⋅ ⋅ ⋅⋅ ,

hvor 1 2 ... mk k k n+ + + = . Baseret på det ovenstående eksempel kan vi skrive sandsynligheden for at udtrække k1 elementer af type 1, k2 af type 2 osv. i n uafhængige trækninger fra en population med m forskellige elementer som:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

hvor p1 er sandsynligheden for at få et udfald af type 1 i en udtrækning, p2 sandsynligheden for at få et udfald af type 2 osv.

Eksempel 6.24: Forestil dig, at vi slår 12 gange med en terning og observerer antallet af enere, toere, treere, firere, femmere og seksere. Hvad er sandsynligheden for at slå to af hver slags? Hvis vi lader Y1 angive antallet af enere, Y2 antallet af toere, osv., så vil (Y1, Y2, Y3, Y4, Y5, Y6) være multinomialfordelt med p1 = 1/6, p2 = 1/6, …, p6 = 1/6. Vi kan jo betragte hvert kast som en udtrækning fra populationen af terningslag, hvor sandsynligheden for at trække (slå) en ener er 1/6, osv. Dermed bliver sandsynligheden for to enere, to toere, osv.:

2 2 2 2 2 2

1 2 6

2 2 2 2 2 2 12

12 1 1 1 1 1 1( 2, 2,..., 2)2,2,2,2,2,2 6 6 6 6 6 6

12! 1 12! 1 0,00342!2!2!2!2!2! 6 2 2 2 2 2 2 6

P Y Y Y

+ + + + +

= = = =

= = = ⋅ ⋅ ⋅ ⋅ ⋅

[Eksempel slut]

Lad os slutte med at opsummere multinomialfordelingen i en boks:

Multinomialfordelingen, 1 2 1 2( , ,..., ) ~ ( , , ,..., )m mY Y Y M n p p p

Sandsynlighedsfunktion:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

MultinomialkoefficientenAntallet af kombinationer, hvorved n udfald kan resultere i k1 udfald af type 1, k2 udfald af type 2, …, og km udfald af type m, er givet ved:

1 2 1 2

!, ,..., ! ! !m m

n n

k k k k k k

= ⋅ ⋅ ⋅⋅ ,

hvor 1 2 ... mk k k n+ + + = . Baseret på det ovenstående eksempel kan vi skrive sandsynligheden for at udtrække k1 elementer af type 1, k2 af type 2 osv. i n uafhængige trækninger fra en population med m forskellige elementer som:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

hvor p1 er sandsynligheden for at få et udfald af type 1 i en udtrækning, p2 sandsynligheden for at få et udfald af type 2 osv.

Eksempel 6.24: Forestil dig, at vi slår 12 gange med en terning og observerer antallet af enere, toere, treere, firere, femmere og seksere. Hvad er sandsynligheden for at slå to af hver slags? Hvis vi lader Y1 angive antallet af enere, Y2 antallet af toere, osv., så vil (Y1, Y2, Y3, Y4, Y5, Y6) være multinomialfordelt med p1 = 1/6, p2 = 1/6, …, p6 = 1/6. Vi kan jo betragte hvert kast som en udtrækning fra populationen af terningslag, hvor sandsynligheden for at trække (slå) en ener er 1/6, osv. Dermed bliver sandsynligheden for to enere, to toere, osv.:

2 2 2 2 2 2

1 2 6

2 2 2 2 2 2 12

12 1 1 1 1 1 1( 2, 2,..., 2)2,2,2,2,2,2 6 6 6 6 6 6

12! 1 12! 1 0,00342!2!2!2!2!2! 6 2 2 2 2 2 2 6

P Y Y Y

+ + + + +

= = = =

= = = ⋅ ⋅ ⋅ ⋅ ⋅

[Eksempel slut]

Lad os slutte med at opsummere multinomialfordelingen i en boks:

Multinomialfordelingen, 1 2 1 2( , ,..., ) ~ ( , , ,..., )m mY Y Y M n p p p

Sandsynlighedsfunktion:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

hvor k1 + k2 + … + km = n.

2, 2, 1 2! – 2! · 1!

5 5!= = 30

multinomialfordeling. Antag nu, at andelen af ja-stemmer i populationen er 0,4, andelen, der stemmer nej, er 0,5, og andelen, der stemmer blankt (eller ikke stemmer), er 0,1. Hvad er da sandsynligheden for, at stikprøven kommer til at bestå af fx to ja-sigere (Y1 = 2), to nej-sigere (Y2 = 2) og en blank (Y3 = 1)? [Eksempel slut]

Når vi har at gøre med en multinomialfordeling, skal vi, som illustreret i eksempel 6.22, beregne sandsynligheden for tre eller flere stokastiske variabler, (Y1, Y2,…,Ym). Multinomialfordelingen er derfor en simultan fordeling. I eksempel 6.22 er der tale om en simultan fordeling for Y1, Y2 og Y3. Det næste eksempel viser, hvordan sandsynligheder i multinomialfordelingen fremkommer:

Eksempel 6.23: Baseret på populationsandelene fra eksempel 6.22 kan vi starte med at beregne sandsynligheden for først at møde to ja-sigere, dernæst to nej-sigere og til sidst én der stemmer blankt. Denne

sandsynlighed er givet ved: 0,4⋅0,4⋅0,5⋅0,5⋅0,1 = 0,004, fordi de enkelte udtrækninger er uafhængige, idet vi trækker med tilbagelægning. Tilsvarende er sandsynligheden 0,004 for at møde den samme kombination

af vælgere i en anden rækkefølge, fx 0,1⋅0,4⋅0,5⋅0,5⋅0,4 = 0,004.

For at finde den samlede sandsynlighed skal vi gange sandsynligheden 0,004 med det antal kombinationer af udfald, der resulterer i to ja-sigere, to nej-sigere og en blank stemme. Dette antal af kombinationer kan findes ved hjælp af formlen i nedenstående boks, som kaldes multinomialkoefficienten. Denne er en generalisering af binomialkoefficienten fra afsnit 6.2. I dette tilfælde giver den:

30!1!2!2

!51,2,2

5=

⋅⋅=

Dvs. der findes 30 forskellige kombinationer, hvorved man kan få to ja-sigere, to nej-sigere og en blank. Den samlede sandsynlighed for at

udtrække to ja-sigere, to nej-sigere og en blank er derfor 0,004⋅30 = 0,12. [Eksempel slut]

Multinomialkoefficienten Antallet af kombinationer, hvorved n udfald kan resultere i k1 udfald af type 1, k2 udfald af type 2, …, og km udfald af type m, er givet ved:

k1! · k2! · … · km!k1, k2, …, km

n!

1 2 1 2

!, ,..., ! ! !m m

n n

k k k k k k

= ⋅ ⋅ ⋅⋅ ,

hvor 1 2 ... mk k k n+ + + = . Baseret på det ovenstående eksempel kan vi skrive sandsynligheden for at udtrække k1 elementer af type 1, k2 af type 2 osv. i n uafhængige trækninger fra en population med m forskellige elementer som:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

hvor p1 er sandsynligheden for at få et udfald af type 1 i en udtrækning, p2 sandsynligheden for at få et udfald af type 2 osv.

Eksempel 6.24: Forestil dig, at vi slår 12 gange med en terning og observerer antallet af enere, toere, treere, firere, femmere og seksere. Hvad er sandsynligheden for at slå to af hver slags? Hvis vi lader Y1 angive antallet af enere, Y2 antallet af toere, osv., så vil (Y1, Y2, Y3, Y4, Y5, Y6) være multinomialfordelt med p1 = 1/6, p2 = 1/6, …, p6 = 1/6. Vi kan jo betragte hvert kast som en udtrækning fra populationen af terningslag, hvor sandsynligheden for at trække (slå) en ener er 1/6, osv. Dermed bliver sandsynligheden for to enere, to toere, osv.:

2 2 2 2 2 2

1 2 6

2 2 2 2 2 2 12

12 1 1 1 1 1 1( 2, 2,..., 2)2,2,2,2,2,2 6 6 6 6 6 6

12! 1 12! 1 0,00342!2!2!2!2!2! 6 2 2 2 2 2 2 6

P Y Y Y

+ + + + +

= = = =

= = = ⋅ ⋅ ⋅ ⋅ ⋅

[Eksempel slut]

Lad os slutte med at opsummere multinomialfordelingen i en boks:

Multinomialfordelingen, 1 2 1 2( , ,..., ) ~ ( , , ,..., )m mY Y Y M n p p p

Sandsynlighedsfunktion:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

1 2 1 2

!, ,..., ! ! !m m

n n

k k k k k k

= ⋅ ⋅ ⋅⋅ ,

hvor 1 2 ... mk k k n+ + + = . Baseret på det ovenstående eksempel kan vi skrive sandsynligheden for at udtrække k1 elementer af type 1, k2 af type 2 osv. i n uafhængige trækninger fra en population med m forskellige elementer som:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

hvor p1 er sandsynligheden for at få et udfald af type 1 i en udtrækning, p2 sandsynligheden for at få et udfald af type 2 osv.

Eksempel 6.24: Forestil dig, at vi slår 12 gange med en terning og observerer antallet af enere, toere, treere, firere, femmere og seksere. Hvad er sandsynligheden for at slå to af hver slags? Hvis vi lader Y1 angive antallet af enere, Y2 antallet af toere, osv., så vil (Y1, Y2, Y3, Y4, Y5, Y6) være multinomialfordelt med p1 = 1/6, p2 = 1/6, …, p6 = 1/6. Vi kan jo betragte hvert kast som en udtrækning fra populationen af terningslag, hvor sandsynligheden for at trække (slå) en ener er 1/6, osv. Dermed bliver sandsynligheden for to enere, to toere, osv.:

2 2 2 2 2 2

1 2 6

2 2 2 2 2 2 12

12 1 1 1 1 1 1( 2, 2,..., 2)2,2,2,2,2,2 6 6 6 6 6 6

12! 1 12! 1 0,00342!2!2!2!2!2! 6 2 2 2 2 2 2 6

P Y Y Y

+ + + + +

= = = =

= = = ⋅ ⋅ ⋅ ⋅ ⋅

[Eksempel slut]

Lad os slutte med at opsummere multinomialfordelingen i en boks:

Multinomialfordelingen, 1 2 1 2( , ,..., ) ~ ( , , ,..., )m mY Y Y M n p p p

Sandsynlighedsfunktion:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

· ·

Terningkast

· · · · · ·

1 2 1 2

!, ,..., ! ! !m m

n n

k k k k k k

= ⋅ ⋅ ⋅⋅ ,

hvor 1 2 ... mk k k n+ + + = . Baseret på det ovenstående eksempel kan vi skrive sandsynligheden for at udtrække k1 elementer af type 1, k2 af type 2 osv. i n uafhængige trækninger fra en population med m forskellige elementer som:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

hvor p1 er sandsynligheden for at få et udfald af type 1 i en udtrækning, p2 sandsynligheden for at få et udfald af type 2 osv.

Eksempel 6.24: Forestil dig, at vi slår 12 gange med en terning og observerer antallet af enere, toere, treere, firere, femmere og seksere. Hvad er sandsynligheden for at slå to af hver slags? Hvis vi lader Y1 angive antallet af enere, Y2 antallet af toere, osv., så vil (Y1, Y2, Y3, Y4, Y5, Y6) være multinomialfordelt med p1 = 1/6, p2 = 1/6, …, p6 = 1/6. Vi kan jo betragte hvert kast som en udtrækning fra populationen af terningslag, hvor sandsynligheden for at trække (slå) en ener er 1/6, osv. Dermed bliver sandsynligheden for to enere, to toere, osv.:

2 2 2 2 2 2

1 2 6

2 2 2 2 2 2 12

12 1 1 1 1 1 1( 2, 2,..., 2)2,2,2,2,2,2 6 6 6 6 6 6

12! 1 12! 1 0,00342!2!2!2!2!2! 6 2 2 2 2 2 2 6

P Y Y Y

+ + + + +

= = = =

= = = ⋅ ⋅ ⋅ ⋅ ⋅

[Eksempel slut]

Lad os slutte med at opsummere multinomialfordelingen i en boks:

Multinomialfordelingen, 1 2 1 2( , ,..., ) ~ ( , , ,..., )m mY Y Y M n p p p

Sandsynlighedsfunktion:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

1 2 1 2

!, ,..., ! ! !m m

n n

k k k k k k

= ⋅ ⋅ ⋅⋅ ,

hvor 1 2 ... mk k k n+ + + = . Baseret på det ovenstående eksempel kan vi skrive sandsynligheden for at udtrække k1 elementer af type 1, k2 af type 2 osv. i n uafhængige trækninger fra en population med m forskellige elementer som:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

hvor p1 er sandsynligheden for at få et udfald af type 1 i en udtrækning, p2 sandsynligheden for at få et udfald af type 2 osv.

Eksempel 6.24: Forestil dig, at vi slår 12 gange med en terning og observerer antallet af enere, toere, treere, firere, femmere og seksere. Hvad er sandsynligheden for at slå to af hver slags? Hvis vi lader Y1 angive antallet af enere, Y2 antallet af toere, osv., så vil (Y1, Y2, Y3, Y4, Y5, Y6) være multinomialfordelt med p1 = 1/6, p2 = 1/6, …, p6 = 1/6. Vi kan jo betragte hvert kast som en udtrækning fra populationen af terningslag, hvor sandsynligheden for at trække (slå) en ener er 1/6, osv. Dermed bliver sandsynligheden for to enere, to toere, osv.:

2 2 2 2 2 2

1 2 6

2 2 2 2 2 2 12

12 1 1 1 1 1 1( 2, 2,..., 2)2,2,2,2,2,2 6 6 6 6 6 6

12! 1 12! 1 0,00342!2!2!2!2!2! 6 2 2 2 2 2 2 6

P Y Y Y

+ + + + +

= = = =

= = = ⋅ ⋅ ⋅ ⋅ ⋅

[Eksempel slut]

Lad os slutte med at opsummere multinomialfordelingen i en boks:

Multinomialfordelingen, 1 2 1 2( , ,..., ) ~ ( , , ,..., )m mY Y Y M n p p p

Sandsynlighedsfunktion:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

1 2 1 2

!, ,..., ! ! !m m

n n

k k k k k k

= ⋅ ⋅ ⋅⋅ ,

hvor 1 2 ... mk k k n+ + + = . Baseret på det ovenstående eksempel kan vi skrive sandsynligheden for at udtrække k1 elementer af type 1, k2 af type 2 osv. i n uafhængige trækninger fra en population med m forskellige elementer som:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

hvor p1 er sandsynligheden for at få et udfald af type 1 i en udtrækning, p2 sandsynligheden for at få et udfald af type 2 osv.

Eksempel 6.24: Forestil dig, at vi slår 12 gange med en terning og observerer antallet af enere, toere, treere, firere, femmere og seksere. Hvad er sandsynligheden for at slå to af hver slags? Hvis vi lader Y1 angive antallet af enere, Y2 antallet af toere, osv., så vil (Y1, Y2, Y3, Y4, Y5, Y6) være multinomialfordelt med p1 = 1/6, p2 = 1/6, …, p6 = 1/6. Vi kan jo betragte hvert kast som en udtrækning fra populationen af terningslag, hvor sandsynligheden for at trække (slå) en ener er 1/6, osv. Dermed bliver sandsynligheden for to enere, to toere, osv.:

2 2 2 2 2 2

1 2 6

2 2 2 2 2 2 12

12 1 1 1 1 1 1( 2, 2,..., 2)2,2,2,2,2,2 6 6 6 6 6 6

12! 1 12! 1 0,00342!2!2!2!2!2! 6 2 2 2 2 2 2 6

P Y Y Y

+ + + + +

= = = =

= = = ⋅ ⋅ ⋅ ⋅ ⋅

[Eksempel slut]

Lad os slutte med at opsummere multinomialfordelingen i en boks:

Multinomialfordelingen, 1 2 1 2( , ,..., ) ~ ( , , ,..., )m mY Y Y M n p p p

Sandsynlighedsfunktion:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

1 2 1 2

!, ,..., ! ! !m m

n n

k k k k k k

= ⋅ ⋅ ⋅⋅ ,

hvor 1 2 ... mk k k n+ + + = . Baseret på det ovenstående eksempel kan vi skrive sandsynligheden for at udtrække k1 elementer af type 1, k2 af type 2 osv. i n uafhængige trækninger fra en population med m forskellige elementer som:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

hvor p1 er sandsynligheden for at få et udfald af type 1 i en udtrækning, p2 sandsynligheden for at få et udfald af type 2 osv.

Eksempel 6.24: Forestil dig, at vi slår 12 gange med en terning og observerer antallet af enere, toere, treere, firere, femmere og seksere. Hvad er sandsynligheden for at slå to af hver slags? Hvis vi lader Y1 angive antallet af enere, Y2 antallet af toere, osv., så vil (Y1, Y2, Y3, Y4, Y5, Y6) være multinomialfordelt med p1 = 1/6, p2 = 1/6, …, p6 = 1/6. Vi kan jo betragte hvert kast som en udtrækning fra populationen af terningslag, hvor sandsynligheden for at trække (slå) en ener er 1/6, osv. Dermed bliver sandsynligheden for to enere, to toere, osv.:

2 2 2 2 2 2

1 2 6

2 2 2 2 2 2 12

12 1 1 1 1 1 1( 2, 2,..., 2)2,2,2,2,2,2 6 6 6 6 6 6

12! 1 12! 1 0,00342!2!2!2!2!2! 6 2 2 2 2 2 2 6

P Y Y Y

+ + + + +

= = = =

= = = ⋅ ⋅ ⋅ ⋅ ⋅

[Eksempel slut]

Lad os slutte med at opsummere multinomialfordelingen i en boks:

Multinomialfordelingen, 1 2 1 2( , ,..., ) ~ ( , , ,..., )m mY Y Y M n p p p

Sandsynlighedsfunktion:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

1 2 1 2

!, ,..., ! ! !m m

n n

k k k k k k

= ⋅ ⋅ ⋅⋅ ,

hvor 1 2 ... mk k k n+ + + = . Baseret på det ovenstående eksempel kan vi skrive sandsynligheden for at udtrække k1 elementer af type 1, k2 af type 2 osv. i n uafhængige trækninger fra en population med m forskellige elementer som:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

hvor p1 er sandsynligheden for at få et udfald af type 1 i en udtrækning, p2 sandsynligheden for at få et udfald af type 2 osv.

Eksempel 6.24: Forestil dig, at vi slår 12 gange med en terning og observerer antallet af enere, toere, treere, firere, femmere og seksere. Hvad er sandsynligheden for at slå to af hver slags? Hvis vi lader Y1 angive antallet af enere, Y2 antallet af toere, osv., så vil (Y1, Y2, Y3, Y4, Y5, Y6) være multinomialfordelt med p1 = 1/6, p2 = 1/6, …, p6 = 1/6. Vi kan jo betragte hvert kast som en udtrækning fra populationen af terningslag, hvor sandsynligheden for at trække (slå) en ener er 1/6, osv. Dermed bliver sandsynligheden for to enere, to toere, osv.:

2 2 2 2 2 2

1 2 6

2 2 2 2 2 2 12

12 1 1 1 1 1 1( 2, 2,..., 2)2,2,2,2,2,2 6 6 6 6 6 6

12! 1 12! 1 0,00342!2!2!2!2!2! 6 2 2 2 2 2 2 6

P Y Y Y

+ + + + +

= = = =

= = = ⋅ ⋅ ⋅ ⋅ ⋅

[Eksempel slut]

Lad os slutte med at opsummere multinomialfordelingen i en boks:

Multinomialfordelingen, 1 2 1 2( , ,..., ) ~ ( , , ,..., )m mY Y Y M n p p p

Sandsynlighedsfunktion:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

1 2 1 2

!, ,..., ! ! !m m

n n

k k k k k k

= ⋅ ⋅ ⋅⋅ ,

hvor 1 2 ... mk k k n+ + + = . Baseret på det ovenstående eksempel kan vi skrive sandsynligheden for at udtrække k1 elementer af type 1, k2 af type 2 osv. i n uafhængige trækninger fra en population med m forskellige elementer som:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

hvor p1 er sandsynligheden for at få et udfald af type 1 i en udtrækning, p2 sandsynligheden for at få et udfald af type 2 osv.

Eksempel 6.24: Forestil dig, at vi slår 12 gange med en terning og observerer antallet af enere, toere, treere, firere, femmere og seksere. Hvad er sandsynligheden for at slå to af hver slags? Hvis vi lader Y1 angive antallet af enere, Y2 antallet af toere, osv., så vil (Y1, Y2, Y3, Y4, Y5, Y6) være multinomialfordelt med p1 = 1/6, p2 = 1/6, …, p6 = 1/6. Vi kan jo betragte hvert kast som en udtrækning fra populationen af terningslag, hvor sandsynligheden for at trække (slå) en ener er 1/6, osv. Dermed bliver sandsynligheden for to enere, to toere, osv.:

2 2 2 2 2 2

1 2 6

2 2 2 2 2 2 12

12 1 1 1 1 1 1( 2, 2,..., 2)2,2,2,2,2,2 6 6 6 6 6 6

12! 1 12! 1 0,00342!2!2!2!2!2! 6 2 2 2 2 2 2 6

P Y Y Y

+ + + + +

= = = =

= = = ⋅ ⋅ ⋅ ⋅ ⋅

[Eksempel slut]

Lad os slutte med at opsummere multinomialfordelingen i en boks:

Multinomialfordelingen, 1 2 1 2( , ,..., ) ~ ( , , ,..., )m mY Y Y M n p p p

Sandsynlighedsfunktion:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

1 2 1 2

!, ,..., ! ! !m m

n n

k k k k k k

= ⋅ ⋅ ⋅⋅ ,

hvor 1 2 ... mk k k n+ + + = . Baseret på det ovenstående eksempel kan vi skrive sandsynligheden for at udtrække k1 elementer af type 1, k2 af type 2 osv. i n uafhængige trækninger fra en population med m forskellige elementer som:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

hvor p1 er sandsynligheden for at få et udfald af type 1 i en udtrækning, p2 sandsynligheden for at få et udfald af type 2 osv.

Eksempel 6.24: Forestil dig, at vi slår 12 gange med en terning og observerer antallet af enere, toere, treere, firere, femmere og seksere. Hvad er sandsynligheden for at slå to af hver slags? Hvis vi lader Y1 angive antallet af enere, Y2 antallet af toere, osv., så vil (Y1, Y2, Y3, Y4, Y5, Y6) være multinomialfordelt med p1 = 1/6, p2 = 1/6, …, p6 = 1/6. Vi kan jo betragte hvert kast som en udtrækning fra populationen af terningslag, hvor sandsynligheden for at trække (slå) en ener er 1/6, osv. Dermed bliver sandsynligheden for to enere, to toere, osv.:

2 2 2 2 2 2

1 2 6

2 2 2 2 2 2 12

12 1 1 1 1 1 1( 2, 2,..., 2)2,2,2,2,2,2 6 6 6 6 6 6

12! 1 12! 1 0,00342!2!2!2!2!2! 6 2 2 2 2 2 2 6

P Y Y Y

+ + + + +

= = = =

= = = ⋅ ⋅ ⋅ ⋅ ⋅

[Eksempel slut]

Lad os slutte med at opsummere multinomialfordelingen i en boks:

Multinomialfordelingen, 1 2 1 2( , ,..., ) ~ ( , , ,..., )m mY Y Y M n p p p

Sandsynlighedsfunktion:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

1 2 1 2

!, ,..., ! ! !m m

n n

k k k k k k

= ⋅ ⋅ ⋅⋅ ,

hvor 1 2 ... mk k k n+ + + = . Baseret på det ovenstående eksempel kan vi skrive sandsynligheden for at udtrække k1 elementer af type 1, k2 af type 2 osv. i n uafhængige trækninger fra en population med m forskellige elementer som:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

hvor p1 er sandsynligheden for at få et udfald af type 1 i en udtrækning, p2 sandsynligheden for at få et udfald af type 2 osv.

Eksempel 6.24: Forestil dig, at vi slår 12 gange med en terning og observerer antallet af enere, toere, treere, firere, femmere og seksere. Hvad er sandsynligheden for at slå to af hver slags? Hvis vi lader Y1 angive antallet af enere, Y2 antallet af toere, osv., så vil (Y1, Y2, Y3, Y4, Y5, Y6) være multinomialfordelt med p1 = 1/6, p2 = 1/6, …, p6 = 1/6. Vi kan jo betragte hvert kast som en udtrækning fra populationen af terningslag, hvor sandsynligheden for at trække (slå) en ener er 1/6, osv. Dermed bliver sandsynligheden for to enere, to toere, osv.:

2 2 2 2 2 2

1 2 6

2 2 2 2 2 2 12

12 1 1 1 1 1 1( 2, 2,..., 2)2,2,2,2,2,2 6 6 6 6 6 6

12! 1 12! 1 0,00342!2!2!2!2!2! 6 2 2 2 2 2 2 6

P Y Y Y

+ + + + +

= = = =

= = = ⋅ ⋅ ⋅ ⋅ ⋅

[Eksempel slut]

Lad os slutte med at opsummere multinomialfordelingen i en boks:

Multinomialfordelingen, 1 2 1 2( , ,..., ) ~ ( , , ,..., )m mY Y Y M n p p p

Sandsynlighedsfunktion:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

2! · 2! · 2! · 2! · 2! · 2!

12!· ·

Page 21: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

Populære fordelinger 153

Lad os slutte med at opsummere multinomialfordelingen i en boks:

6.7 Beregning af sandsynligheder ved hjælp af Excel

Vi skal her se, hvordan vi kan anvende Excel til at beregne sandsynligheder i

binomialfordelingen, den hypergeometriske fordeling, Poissonfordelingen og

normalfordelingen. Dette gøres via en række korte eksempler. Der vil også

være nogle øvelser, som kan give dig rutine med at anvende Excel.

6.7.1 Binomialfordelingen

Lad X være binomialfordelt med n = 10 og p = 0,3. Man kan vha Excel finde

sandsynlighederne P(X=k) og P(X ≤ k), hvor k er en konstant. Lad os se, hvor-

dan det gøres for tilfældet, hvor k = 5. Som tidligere er der to mulige frem-

gangsmåder:

Man kan vælge BINOMIALFORDELING under Formler og Indsæt funk-tion… (se kapitel 5 for fremgangsmåden). Frem kommer følgende skærmbil-

lede:

Multinomialfordelingen, (Y1, Y2, …, Ym) ~ M(n, p1, p2, …, pm)

Sandsynlighedsfunktion:

1 2 1 2

!, ,..., ! ! !m m

n n

k k k k k k

= ⋅ ⋅ ⋅⋅ ,

hvor 1 2 ... mk k k n+ + + = . Baseret på det ovenstående eksempel kan vi skrive sandsynligheden for at udtrække k1 elementer af type 1, k2 af type 2 osv. i n uafhængige trækninger fra en population med m forskellige elementer som:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

hvor p1 er sandsynligheden for at få et udfald af type 1 i en udtrækning, p2 sandsynligheden for at få et udfald af type 2 osv.

Eksempel 6.24: Forestil dig, at vi slår 12 gange med en terning og observerer antallet af enere, toere, treere, firere, femmere og seksere. Hvad er sandsynligheden for at slå to af hver slags? Hvis vi lader Y1 angive antallet af enere, Y2 antallet af toere, osv., så vil (Y1, Y2, Y3, Y4, Y5, Y6) være multinomialfordelt med p1 = 1/6, p2 = 1/6, …, p6 = 1/6. Vi kan jo betragte hvert kast som en udtrækning fra populationen af terningslag, hvor sandsynligheden for at trække (slå) en ener er 1/6, osv. Dermed bliver sandsynligheden for to enere, to toere, osv.:

2 2 2 2 2 2

1 2 6

2 2 2 2 2 2 12

12 1 1 1 1 1 1( 2, 2,..., 2)2,2,2,2,2,2 6 6 6 6 6 6

12! 1 12! 1 0,00342!2!2!2!2!2! 6 2 2 2 2 2 2 6

P Y Y Y

+ + + + +

= = = =

= = = ⋅ ⋅ ⋅ ⋅ ⋅

[Eksempel slut]

Lad os slutte med at opsummere multinomialfordelingen i en boks:

Multinomialfordelingen, 1 2 1 2( , ,..., ) ~ ( , , ,..., )m mY Y Y M n p p p

Sandsynlighedsfunktion:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

Middelværdi og varians af Yi:

E(Yi) = n · pi og V(Yi) = n · pi · (1 – pi)

Fortolkning: •   n uafhængige udtrækninger fra en population med m forskellige typer af ele-

menter. •   Y1 angiver antal udfald af type 1, Y2 antal udfald af type 2, osv. i de n udtræknin-

ger.•   Der er konstante sandsynligheder, p1, p2,…, pm, for de m forskellige udfald i hver

udtrækning.

1 2 1 2

!, ,..., ! ! !m m

n n

k k k k k k

= ⋅ ⋅ ⋅⋅ ,

hvor 1 2 ... mk k k n+ + + = . Baseret på det ovenstående eksempel kan vi skrive sandsynligheden for at udtrække k1 elementer af type 1, k2 af type 2 osv. i n uafhængige trækninger fra en population med m forskellige elementer som:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

hvor p1 er sandsynligheden for at få et udfald af type 1 i en udtrækning, p2 sandsynligheden for at få et udfald af type 2 osv.

Eksempel 6.24: Forestil dig, at vi slår 12 gange med en terning og observerer antallet af enere, toere, treere, firere, femmere og seksere. Hvad er sandsynligheden for at slå to af hver slags? Hvis vi lader Y1 angive antallet af enere, Y2 antallet af toere, osv., så vil (Y1, Y2, Y3, Y4, Y5, Y6) være multinomialfordelt med p1 = 1/6, p2 = 1/6, …, p6 = 1/6. Vi kan jo betragte hvert kast som en udtrækning fra populationen af terningslag, hvor sandsynligheden for at trække (slå) en ener er 1/6, osv. Dermed bliver sandsynligheden for to enere, to toere, osv.:

2 2 2 2 2 2

1 2 6

2 2 2 2 2 2 12

12 1 1 1 1 1 1( 2, 2,..., 2)2,2,2,2,2,2 6 6 6 6 6 6

12! 1 12! 1 0,00342!2!2!2!2!2! 6 2 2 2 2 2 2 6

P Y Y Y

+ + + + +

= = = =

= = = ⋅ ⋅ ⋅ ⋅ ⋅

[Eksempel slut]

Lad os slutte med at opsummere multinomialfordelingen i en boks:

Multinomialfordelingen, 1 2 1 2( , ,..., ) ~ ( , , ,..., )m mY Y Y M n p p p

Sandsynlighedsfunktion:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

1 2 1 2

!, ,..., ! ! !m m

n n

k k k k k k

= ⋅ ⋅ ⋅⋅ ,

hvor 1 2 ... mk k k n+ + + = . Baseret på det ovenstående eksempel kan vi skrive sandsynligheden for at udtrække k1 elementer af type 1, k2 af type 2 osv. i n uafhængige trækninger fra en population med m forskellige elementer som:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

hvor p1 er sandsynligheden for at få et udfald af type 1 i en udtrækning, p2 sandsynligheden for at få et udfald af type 2 osv.

Eksempel 6.24: Forestil dig, at vi slår 12 gange med en terning og observerer antallet af enere, toere, treere, firere, femmere og seksere. Hvad er sandsynligheden for at slå to af hver slags? Hvis vi lader Y1 angive antallet af enere, Y2 antallet af toere, osv., så vil (Y1, Y2, Y3, Y4, Y5, Y6) være multinomialfordelt med p1 = 1/6, p2 = 1/6, …, p6 = 1/6. Vi kan jo betragte hvert kast som en udtrækning fra populationen af terningslag, hvor sandsynligheden for at trække (slå) en ener er 1/6, osv. Dermed bliver sandsynligheden for to enere, to toere, osv.:

2 2 2 2 2 2

1 2 6

2 2 2 2 2 2 12

12 1 1 1 1 1 1( 2, 2,..., 2)2,2,2,2,2,2 6 6 6 6 6 6

12! 1 12! 1 0,00342!2!2!2!2!2! 6 2 2 2 2 2 2 6

P Y Y Y

+ + + + +

= = = =

= = = ⋅ ⋅ ⋅ ⋅ ⋅

[Eksempel slut]

Lad os slutte med at opsummere multinomialfordelingen i en boks:

Multinomialfordelingen, 1 2 1 2( , ,..., ) ~ ( , , ,..., )m mY Y Y M n p p p

Sandsynlighedsfunktion:

1 21 1 2 2 1 2

1 2

( , ,..., ) ..., ,...,

mkk km m m

m

nP Y k Y k Y k p p p

k k k

= = = = ⋅ ⋅

· ·

Page 22: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

154 Indblik i statistik – for samfundsvidenskab

Ud for Tal_s skrives værdien af k, dvs. 5 i dette tilfælde. Ud for Forsøg skrives

værdien af n, dvs. 10, og ud for Sandsynlighed_s indsættes værdien af p, som

her er 0,3. I rubrikken ud for Kumulativ skrives FALSK, hvis vi ønsker

punktsandsynligheden, P(X=k), eller SAND, hvis vi ønsker den kumulative

sandsynlighed, P(X≤k). Det ønskede resultat findes derefter ved at trykke på OK.

Havde vi skrevet FALSK ud for Kumulativ, ville vi finde, at P(X=5) = 0,103.

Man kan også direkte indtaste kommandoen i en celle ved at skrive:

=BINOMIALFORDELING(5;10;0,3;FALSK). Herved finder man punktsand-

synligheden P(X=5). Hvis man i stedet for FALSK skrev SAND, ville man få

den kumulative sandsynlighed P(X≤5).

Øvelser: 1. Find P(X=10), når X~Bin(n=50, p=0,4).

2. Find P(X=50), når X~Bin(n=170, p=0,4).

3. Find P(X≤50), når X~Bin(n=170, p=0,4).

4. Find P(X>4), når X~Bin(n=10, p=0,7).

5. Find P(2<X≤5), når X~Bin(n=10, p=0,7).

6.7.2 Den hypergeometriske fordeling

Lad X være hypergeometrisk fordelt med N=52, M=4 og n=10. Vi kan da an-

vende Excel til at beregne punktsandsynligheden P(X=k). Antag, at vi ønsker

at finde denne, når k=2. Fremgangsmåden er stort set som ved binomialforde-

lingen:

Under Formler og Indsæt funktion… vælges HYPGEOFORDELING. I

det fremkomne skærmbillede indsættes værdien af k (her 2) ud for Udfald_s,

værdien af n (her 10) ud for Størrelse, værdien af M (her 4) ud for

Population_s, og endelig værdien af N (her 52) ud for Populationsstørrelse.

Se boksen nedenfor. Der sluttes af med at trykke OK.

Alternativt kan vi skrive =HYPGEOFORDELING(2;10;4;52) direkte i den

ønskede celle.

Page 23: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

Populære fordelinger 155

Øvelser: Find P(X=2), når X~Hyp(N=100, M=20, n=5)

Find P(X=3), når X~Hyp(N=20, M=5, n=18)

6.7.3 Poissonfordelingen

Excel kan også bruges til at finde punktsandsynligheder, P(Y=k), og kumula-

tive sandsynligheder, P(Y≤k), når Y er Poissonfordelt. Hvis fx Y~Poi(λ=5),

som i eksempel 6.15, og vi ønsker at finde P(Y≤9), gør vi følgende:

Under Formler og Indsæt funktion… vælges POISSON. I det fremkomne

skærmbillede indsættes værdien af k (her 9) ud for X, værdien af λ (her 5) ud

for Middelværdi, og ud for Kumulativ skrives SAND, fordi vi ønsker den ku-

mulative sandsynlighed. Resultatet bliver da: 0,968.

Alternativt kan vi skrive =POISSON(5;9;SAND) direkte i den ønskede celle.

Dermed bliver P(Y≥10)=1 – P(Y≤9)=1 – 0,968=0,032.

Øvelser: 1. Find P(X=30), når X~Poi(λ=8).

2. Find P(X≤3), når X~Poi(λ=1).

3. Find P(1<X<5), når X~Poi(λ=5,3).

4. Find P(X≤2,5), når X~Poi(λ=5,25).

Page 24: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

156 Indblik i statistik – for samfundsvidenskab

6.7.4 Normalfordelingen

Vi skal nu se, hvordan vi kan bruge Excel i forbindelse med normalfordelin-

gen. Lad derfor X være normalfordelt med µ=3 og σ 2=16. Vi kan nu finde

P(X≤k), hvor fx k=2, på følgende måder:

Under Formler og Indsæt funktion… vælges NORMFORDELING. I det

fremkomne skærmbillede indsættes værdien af k (her 2) ud for X, værdien af

µ (her 3) ud for Middelværdi, og værdien af σ (her 4, idet vi skal huske at det

skal være værdien af σ og ikke værdien af σ 2) ud for Standardafv. Ud for Ku-mulativ skrives SAND, fordi vi ønsker den kumulative sandsynlighed. Når vi

trykker på OK, får vi resultatet 0,401.

Alternativt kan vi skrive =NORMFORDELING(2;3;4; SAND) direkte i den

ønskede celle og trykke Return.

Havde vi skrevet FALSK i stedet for SAND ud for Kumulativ, havde vi fået

tætheden for X=2, dvs f(2). (NB! denne kaldes lidt fejlagtigt for punktsand-

synligheden i Excel. Punktsandsynligheden er dog altid nul for en normalfor-

delt variabel).2

Øvelser: 1. Find P(X≤2), når X er normalfordelt med middelværdi 1 og varians 0,5.

Find også tætheden for X=2.

2, Find P(X>1), når X~N(µ=0,38, σ 2=2).

3. Find P(–0,3<Z<0,2), når Z er standardnormalfordelt. Kontrollér dit re-

sultat ved hjælp af et tabelopslag.

2. Hvis man har en standardnormalfordelt variabel, kan man blot bruge funktionen STAN-DARDNORMFORDELING. Den returnerer den kumulative sandsynlighed, når man indsætter den ønskede værdi af k. Prøv selv!

Page 25: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

Populære fordelinger 157

6.8 Opgaver

1. Repetitionsspørgsmål:

a) Giv et eksempel på en Bernoullifordelt stokastisk variabel.

b) Hvad er sammenhængen mellem Bernoullifordelingen og binomial-

fordelingen?

c) Giv et eksempel på en stokastisk variabel, der er binomialfordelt.

d) Hvad er forskellen på binomialfordelingen og den hypergeometriske

fordeling?

e) Illustrér forskellen i d) med et eksempel.

f) Er en Poissonfordelt stokastisk variabel diskret eller kontinuert?

g) Giv et eksempel på et fænomen, der kan tænkes at være Poissonfor-

delt.

h) Er en normalfordelt stokastisk variabel diskret eller kontinuert?

i) Giv et eksempel på et fænomen, der kan tænkes at være normalfor-

delt.

j) Forklar forskellen på en normalfordelt og en standardnormalfordelt

stokastisk variabel.

k) Hvad er forskellen på multinomialfordelingen og binomialfordelin-

gen?

l) Hvad adskiller multinomialfordelingen fra de øvrige fordelinger i dette

kapitel?

m) Beskriv en situation (et eksperiment), hvor multinomialfordelingen

kunne være relevant.

2. Du har fået arbejde hos en bager. Bagermesteren fortæller, at der er plan-

lagt 12 nye slags kager til salg i de kommende år. Erfaringen har vist, at

60 % af kagerne i bageriet bliver en succes. Lad X være den stokastiske va-

riabel, der betegner antallet af succeskager blandt de 12 nye kager.

a) Hvilken fordeling beskriver, om en enkelt kage bliver en succes?

b) Hvilken fordeling følger X?

c) Bageren ønsker at gå på pension, såfremt ingen af de 12 kager bliver en

succes. Hvad er sandsynligheden for denne hændelse?

d) Bageren giver dig lønforhøjelse, hvis mindst 10 kager får succes. Find

sandsynligheden for dette.

e) Hvad er E(X) og V(X)?

f) Kontrollér dine svar i c) og d) vha. Excel.

Page 26: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

158 Indblik i statistik – for samfundsvidenskab

3. På en bilfabrik har man et problem: 25 % af de færdigproducerede biler

kan ikke starte. Der udtages nu en tilfældig stikprøve på 10 biler. X = antal

biler i stikprøven, der ikke kan starte.

a) Hvilken fordeling følger X?

b) Hvad er sandsynligheden for, at mere end 8 biler i stikprøven ikke kan

starte, P(X>8)?

c) Hvad er sandsynligheden for, at alle bilerne kan starte?

d) Hvad er det forventede antal biler, der ikke kan starte?

e) Kontrollér dine svar i b) og c) vha. Excel.

4. Du har ikke lavet de tre opgaver, som din lærer stillede i sidste statistikti-

me, og du overvejer nu, om du skal blive væk fra den time, hvor læreren vil

hive eleverne op til tavlen for at lade dem svare på opgaverne. Vi antager, at

læreren tilfældigt vælger én elev til hver opgave, samme elev kan altså godt

svare på alle stillede opgaver. Antag, at alle 50 elever på holdet møder op til

timen.

a) Hvad er sandsynligheden for, at du slipper for at skulle besvare en af

opgaverne?

b) Hvad er sandsynligheden for, at du skal besvare alle tre opgaver?

c) Kontrollér dine svar vha. Excel.

Forstil dig nu, at 20 af de andre elever heller ikke har lavet opgaverne, men al-

ligevel møder op. Hvis læreren kommer til at hive en af disse 20 elever op til

en opgave, er han derfor nødt til at sende vedkommende ned og kalde en ny

elev op. Sådan fortsætter han, indtil han har fundet en elev, der har lavet opga-

ven.

d) Hvad er nu sandsynligheden for, at du går fri? (Hint: Hvad betyder det,

om de 20 elever er til stede eller ej?)

5. På pensumlisten i statistik er der otte emner. Til eksamen vil der blive stil-

let opgaver inden for tre af disse emner. En af de studerende har valgt at

satse lidt og har derfor kun læst på fem af emnerne. Lad Y være den stoka-

stiske variabel, der angiver antallet af opgaver, som den studerende kan

svare på til eksamenen, hvis de tre emner til eksamenen udvælges tilfældigt

blandt de otte.

a) Hvordan er Y fordelt?

b) Opstil sandsynlighedsfunktionen for Y i en tabel?

c) Hvad er det forventede antal opgaver, som den studerende kan svare på?

Page 27: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

Populære fordelinger 159

6. Du er taget på kasino for at spille poker. Du har ikke mange penge tilbage

og vælger at satse alt på den næste runde. Du sidder derfor og regner lidt

på sandsynlighederne for din næste hånd (5 kort).

a) Hvis X angiver antal esser i din kommende hånd, hvordan er X da for-

delt?

b) Hvad er sandsynligheden for, at du får fire esser? Hvad er sandsynlig-

heden for, at du blot får tre?

c) Udregn sandsynligheden i b) vha. Excel.

d) Du sidder og drømmer lidt om en Royal Straight Flush (es, konge,

dame, knægt og tier, alle i hjerter). Hvad er sandsynligheden for at få

denne? (Hint: Tænk på de fem hjerter som succeser)

e) Du får nu rent faktisk tre esser og vælger derfor at bytte de sidste to

kort.

f) Hvad de sandsynligheden for, at du får det sidste es ved denne manøvre

(Hint: Husk, at parametrene i fordelingen nu er ændret).

7. Ole er på vej hjem fra byen og står nu og venter på en taxa. Han ved, at der

gennemsnitligt kommer én taxa hver tiende minut. Lad X = antal taxaer,

der passerer.

a) Hvilken fordeling kan vi antage, at X følger?

b) Visse egenskaber ligger til grund for den sandsynlighedsfordeling, som

X følger. Nævn og forklar disse.

c) Mens han står og venter, falder han i snak med en fornuftig ung dame

og glemmer alt om taxaer. Samtalen varer 1 time.

d) Hvor mange taxaer vil du forvente, der er kørt forbi?

e) Hvad er sandsynligheden for, at der er kørt 7 taxaer forbi?

f) Hvad er sandsynligheden for, at der er er kørt maksimalt 4 taxaer for-

bi.

g) Kontrollér dine svar vha. Excel.

8. Jens har fået nat-sommerarbejde på en fabrik, hvor han er sat til at holde

vandindslusningen fri for vandmænd med et fiskenet. Eftersom der ikke er

så mange at snakke med om natten, giver han sig til at anvende sin lom-

mestatistik på at beskrive sit nye arbejde. Han finder hurtigt ud af, at vand-

mændene bliver suget til indslusningen i en lind strøm. Fra han starter kl.

23 om aftenen, til han går kl. 7 om morgenen, kommer der gennemsnitligt

90 vandmænd i timen. Lad X angive den stokastiske variabel, der beskriver

antallet af tilstrømmede vandmænd i en periode på 1 minut.

a) Hvordan kan vi med rimelighed antage, at X er fordelt? Dvs. hvilken

fordeling følger X?

Page 28: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

160 Indblik i statistik – for samfundsvidenskab

b) Hvad er sandsynligheden for, at der svømmer to vandmænd til i en

periode på 1 minut?

c) Hvor mange vandmænd vil du forvente, at der svømmer til på 1 mi-

nut?

Lad Y angive den stokastiske variabel, der beskriver antallet af tilstrømmede

vandmænd i en periode på et kvarter.

d) Hvordan er Y fordelt?

e) Da han finder det dejligt afslappende, at kun få vandmænd skal fiskes

op, ønsker han at finde sandsynligheden for, at højst 2 vandmænd til-

strømmer i løbet af et kvarter. Hvad er denne sandsynlighed?

f) Find V(Y).

9. En normalfordelt variabel, X, har tæthedsfunktionen:2( 2)

81( ) e2 2

x

f xπ

−−=

a) Hvad er middelværdien af X? b) Hvad er variansen og standardafvigelsen af X?

10. Lad X~N(3,4). Beregn følgende sandsynligheder:

a) ( 3)P X ≤

b) ( 3)P X <

c) ( 1)P X ≤ −

d) ( 2)P X ≤

e) ( 5)P X ≥

f) ( 1 5)P X− ≤ ≤g) Skitsér ved hjælp af en tæthedsfunktion for X de arealer, der

svarer til sandsynlighederne i spørgsmål a)-f). h) Udregn også sandsynlighederne v.hj.a. Excel.

11, Den stokastiske variabel X er normalfordelt med middelværdi 1 og varians 9.

a) Hvilken fordeling følger 2 5Y X= + ? b) Standardisér X. c) Hvilken fordeling følger den standardiserede variabel?

12. ~ (1, 2)X N og ~ (2, 4)Y N er to uafhængige normalfordelte variabler.

a) Hvilken fordeling følger W1 = X+Z? b) Hvilken fordeling følger W2 = 3X+3+2Y?

13. En konsulentvirksomhed er ved at lave en undersøgelse af tilfredsheden blandt sine kunder. Derfor udvælger den 10 af sine tidligere kunder tilfældigt (og med tilbagelægning) og spørger, om de har været: i) meget tilfredse; ii) tilfredse; eller iii) utilfredse med den konsulentservice, de har modtaget. Lad X være antallet af meget

a) Hvad er middelværdien af X?

b) Hvad er variansen og standardafvigelsen af X?

10. Lad X~N(3, 4). Beregn følgende sandsynligheder:

a) P(X ≤ 3)

b) P(X < 3)

c) P(X ≤ –1)

d) P(X ≤ 2)

e) P(X ≥ 5)

f) P(–1 ≤ X ≤ 5)

g) Skitsér ved hjælp af en tæthedsfunktion for X de arealer, der svarer til

sandsynlighederne i spørgsmål a)-f).

h) Udregn også sandsynlighederne vha. Excel.

11. Den stokastiske variabel, X, er normalfordelt med middelværdi 1 og vari-

ans 9.

a) Standardisér X.

b) Hvilken fordeling følger den standardiserede variabel?

12. En konsulentvirksomhed er ved at lave en undersøgelse af tilfredsheden

blandt sine kunder. Derfor udvælger den 10 af sine tidligere kunder tilfæl-

digt (og med tilbagelægning) og spørger, om de har været: i) meget til-

2( 2)81( ) e

2 2

x

f xπ

−−=

a) Hvad er middelværdien af X? b) Hvad er variansen og standardafvigelsen af X?

10. Lad X~N(3,4). Beregn følgende sandsynligheder:

a) ( 3)P X ≤

b) ( 3)P X <

c) ( 1)P X ≤ −

d) ( 2)P X ≤

e) ( 5)P X ≥

f) ( 1 5)P X− ≤ ≤g) Skitsér ved hjælp af en tæthedsfunktion for X de arealer, der

svarer til sandsynlighederne i spørgsmål a)-f). h) Udregn også sandsynlighederne v.hj.a. Excel.

11, Den stokastiske variabel X er normalfordelt med middelværdi 1 og varians 9.

a) Hvilken fordeling følger 2 5Y X= + ? b) Standardisér X. c) Hvilken fordeling følger den standardiserede variabel?

12. ~ (1, 2)X N og ~ (2, 4)Y N er to uafhængige normalfordelte variabler.

a) Hvilken fordeling følger W1 = X+Z? b) Hvilken fordeling følger W2 = 3X+3+2Y?

13. En konsulentvirksomhed er ved at lave en undersøgelse af tilfredsheden blandt sine kunder. Derfor udvælger den 10 af sine tidligere kunder tilfældigt (og med tilbagelægning) og spørger, om de har været: i) meget tilfredse; ii) tilfredse; eller iii) utilfredse med den konsulentservice, de har modtaget. Lad X være antallet af meget

· ·

2( 2)81( ) e

2 2

x

f xπ

−−=

a) Hvad er middelværdien af X? b) Hvad er variansen og standardafvigelsen af X?

10. Lad X~N(3,4). Beregn følgende sandsynligheder:

a) ( 3)P X ≤

b) ( 3)P X <

c) ( 1)P X ≤ −

d) ( 2)P X ≤

e) ( 5)P X ≥

f) ( 1 5)P X− ≤ ≤g) Skitsér ved hjælp af en tæthedsfunktion for X de arealer, der

svarer til sandsynlighederne i spørgsmål a)-f). h) Udregn også sandsynlighederne v.hj.a. Excel.

11, Den stokastiske variabel X er normalfordelt med middelværdi 1 og varians 9.

a) Hvilken fordeling følger 2 5Y X= + ? b) Standardisér X. c) Hvilken fordeling følger den standardiserede variabel?

12. ~ (1, 2)X N og ~ (2, 4)Y N er to uafhængige normalfordelte variabler.

a) Hvilken fordeling følger W1 = X+Z? b) Hvilken fordeling følger W2 = 3X+3+2Y?

13. En konsulentvirksomhed er ved at lave en undersøgelse af tilfredsheden blandt sine kunder. Derfor udvælger den 10 af sine tidligere kunder tilfældigt (og med tilbagelægning) og spørger, om de har været: i) meget tilfredse; ii) tilfredse; eller iii) utilfredse med den konsulentservice, de har modtaget. Lad X være antallet af meget

2( 2)81( ) e

2 2

x

f xπ

−−=

a) Hvad er middelværdien af X? b) Hvad er variansen og standardafvigelsen af X?

10. Lad X~N(3,4). Beregn følgende sandsynligheder:

a) ( 3)P X ≤

b) ( 3)P X <

c) ( 1)P X ≤ −

d) ( 2)P X ≤

e) ( 5)P X ≥

f) ( 1 5)P X− ≤ ≤g) Skitsér ved hjælp af en tæthedsfunktion for X de arealer, der

svarer til sandsynlighederne i spørgsmål a)-f). h) Udregn også sandsynlighederne v.hj.a. Excel.

11, Den stokastiske variabel X er normalfordelt med middelværdi 1 og varians 9.

a) Hvilken fordeling følger 2 5Y X= + ? b) Standardisér X. c) Hvilken fordeling følger den standardiserede variabel?

12. ~ (1, 2)X N og ~ (2, 4)Y N er to uafhængige normalfordelte variabler.

a) Hvilken fordeling følger W1 = X+Z? b) Hvilken fordeling følger W2 = 3X+3+2Y?

13. En konsulentvirksomhed er ved at lave en undersøgelse af tilfredsheden blandt sine kunder. Derfor udvælger den 10 af sine tidligere kunder tilfældigt (og med tilbagelægning) og spørger, om de har været: i) meget tilfredse; ii) tilfredse; eller iii) utilfredse med den konsulentservice, de har modtaget. Lad X være antallet af meget

Page 29: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,

Populære fordelinger 161

fredse; ii) tilfredse; eller iii) utilfredse med den konsulentservice, de har

modtaget. Lad X være antallet af meget tilfredse kunder blandt de 10 ad-

spurgte kunder, Y antallet af tilfredse og Z antallet af utilfredse. Antag også,

at 40 % af alle virksomhedens kunder har været meget tilfredse, 30 % util-

fredse og 30 % tilfredse.

a) Hvilken fordeling følger X, Y og Z?

b) Hvad er sandsynligheden for, at andelene blandt de adspurgte bliver de

samme som andelene i populationen?

c) Hvad er sandsynligheden for, at ingen af de adspurgte er hverken til-

fredse eller meget tilfredse?

d) Hvad er sandsynligheden for, at halvdelen af de adspurgte er utilfredse,

mens den anden halvdel er meget tilfredse?

Page 30: 6 Populære fordelinger - Gyldendalifilserver.gyldendal.dk/attweb/attachment_15046_181_Indblik i statistik-kapitel 6.pdf136 Indblik i statistik – for samfundsvidenskab stiske variabel,