osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · farmacija,...

22
Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika Osnovni pojmovi iz kombinatorike, vjerojatnosti i statistike I. Kombinatorika Teorem o uzastopnom prebrojavanju (TUP ) Ako x 1 moˇ zemo birati na n 1 naˇ cina, ako x 2 moˇ zemo birati na n 2 naˇ cina, . . . . . . . . . . . . . . . ako x k moˇ zemo birati na n k naˇ cina, tada ure denu k-torku (x 1 ,x 2 ,...,x k ) moˇ zemo birati na n 1 · n 2 ··· n k naˇ cina. Primjeri 1. U razredu koji broji 30 uˇ cenika treba odabrati predsjednika, njegovog zamjenika i blagajnika. Na koliko naˇ cina je to mogu´ c uˇ ciniti? Rj. Prema TUP-u na 30 · 29 · 28 naˇ cina. 2. Iz grada A u grad B vode 4 ceste, a iz B u C vode 3 ceste. Na koliko naˇ cina moˇ zemo iz A sti´ ci u C preko B? Rj. Na 12 naˇ cina. 3. Koliko ima ˇ cetverozanamenkastih brojeva ˇ cije su svake dvije susjedne znamenke razliˇ cite? Rj. Ima ih 9 4 4. Koliko ima: (a) razliˇ citih sedmeroznamenkastih brojeva? (b) razliˇ citih sedmeroznamenkastih brojeva kojima su prve 3 znamenke neparne? (c) razliˇ citih sedmeroznamenkastih brojeva kojima su prve 2 znamenke jednake ? (d) razliˇ citih sedmeroznamenkastih brojeva kojima su sve znamenke razliˇ cite? Rj. (a) 9 · 10 6 (b) 5 3 · 10 4 (c) 9 · 10 5 (d) 9 · 9 · 8 · 7 · 6 · 5 · 4 5. Test ima 10 pitanja s odgovorima da i ne. Na koliko naˇ cina se test moˇ ze rijeˇ siti? Rj. 2 20 Permutacija nclanog skupa (ili permutacija od n elemenata) je svaka ure dena n-torka razliˇ citih elemenata tog skupa. Ponekad se naglaˇ sava da se radi o permutaciji bez ponavljanja budu´ ci da je svaki element ure dene n-torke razliˇ cit. Prema TUP-u ima toˇ cno n! permutacija nclanog skupa. 1

Upload: buitu

Post on 06-Feb-2018

289 views

Category:

Documents


18 download

TRANSCRIPT

Page 1: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

Osnovni pojmovi iz kombinatorike,vjerojatnosti i statistike

I. Kombinatorika

Teorem o uzastopnom prebrojavanju (TUP)Ako x1 mozemo birati na n1 nacina,ako x2 mozemo birati na n2 nacina,...

......

......

ako xk mozemo birati na nk nacina,tada uredenu k-torku (x1, x2, . . . , xk) mozemo birati na n1 · n2 · · ·nk nacina.

Primjeri

1. U razredu koji broji 30 ucenika treba odabrati predsjednika, njegovog zamjenika iblagajnika. Na koliko nacina je to moguc uciniti?

Rj. Prema TUP-u na 30 · 29 · 28 nacina.

2. Iz grada A u grad B vode 4 ceste, a iz B u C vode 3 ceste. Na koliko nacinamozemo iz A stici u C preko B?

Rj. Na 12 nacina.

3. Koliko ima cetverozanamenkastih brojeva cije su svake dvije susjedne znamenkerazlicite?

Rj. Ima ih 94

4. Koliko ima:

(a) razlicitih sedmeroznamenkastih brojeva?(b) razlicitih sedmeroznamenkastih brojeva kojima su prve 3 znamenke neparne?(c) razlicitih sedmeroznamenkastih brojeva kojima su prve 2 znamenke jednake ?(d) razlicitih sedmeroznamenkastih brojeva kojima su sve znamenke razlicite?

Rj. (a) 9 · 106 (b) 53 · 104 (c) 9 · 105 (d) 9 · 9 · 8 · 7 · 6 · 5 · 4

5. Test ima 10 pitanja s odgovorima da i ne. Na koliko nacina se test moze rijesiti?

Rj. 220

Permutacija n-clanog skupa (ili permutacija od n elemenata) je svaka uredenan-torka razlicitih elemenata tog skupa. Ponekad se naglasava da se radi o permutacijibez ponavljanja buduci da je svaki element uredene n-torke razlicit. Prema TUP-u imatocno n! permutacija n-clanog skupa.

1

Page 2: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

Primjeri

1. Na koliko nacina 6 ljudi moze stati u red?

Rj. 6!

2. Na koliko na koliko nacina moze 5 muskaraca i 5 zena sjesti u red od 10 sjedalaako osobe istog spola ne sjede skupa?

Rj. 2(5!)2

3. Na sastanku 4 covjeka (A,B,C i D) trebaju dati priopcenje. Na koliko nacina tomogu uciniti ako

(a) B mora govoriti nakon A?(b) B mora govoriti neposredno nakon A?

Rj. (a)4!

2(b) 3!

Kombinacija r-tog razreda od n-elemenata (r ≤ n) je svaki r-clani podskupnekog n-clanog skupa. Ima ih

n(n− 1) · · · (n− r + 1)

r(r − 1) · · · 1=

n!

r!(n− r)!=

(n

r

).

Pascalov trokut za racunanje binomnih koeficijenata

(n

r

)1

1 11 2 1

1 3 3 11 4 6 4 1

1 5 10 10 5 1

Primjeri

1. Kosarkaski tim ima 11 igraca. Na koliko nacina trener moze odabrati pocetnupostavu (5 igraca)?

Rj.

(11

5

)2. Iz spila od 52 karte slucajno izvlacimo 8 karata. Na koliko nacina je moguce izvuci

(a) tocno 3 asa? (b) barem 3 asa?

Rj. (a)

(4

3

)·(

48

5

)(b)

(4

3

)·(

48

5

)+

(4

4

)·(

48

4

)

2

Page 3: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

3. Na koliko nacina tri

(a) jednake (b) razlicite

knjige mozemo dati trojici ucenika ako ih je u razredu 20?

Rj. (a)

(20

3

)(b)

(20

3

)· 3! = 20 · 19 · 18

4. Od 100 mobitela 5 ih je s greskom. Na koliko nacina mozemo odabrati 10 mobitelatako da

(a) su svi ispravni,(b) je tocno jedan neispravan,(c) je barem jedan jedan neispravan?

Rj.

(a)

(95

10

),

(b)

(5

1

)·(

95

9

),

(c)

(5

1

)·(

95

9

)+

(5

2

)·(

95

8

)+

(5

3

)·(

95

7

)+

(5

4

)·(

95

6

)+

(5

5

)·(

95

5

)ili

(100

10

)−(

95

10

).

Binomni teorem:

(x+ y)n =

(n

0

)xny0 +

(n

1

)xn−1y1 +

(n

2

)xn−2y2 + · · ·+

(n

n

)x0yn =

n∑k=0

(n

k

)xn−kyk

3

Page 4: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

II. Vjerojatnost

Dva pristupa vjerojatnosti (Laplace, 19.st.)(a) klasicni (a priori)(b) statisticki (a posteriori).

U oba pristupa ukljucen je pojam slucajnog pokusa: pokus ciji ishod nije jed-noznacno odreden uvjetima pokusa (npr. bacanje igrace kocke, novcica, mjerenje vre-mena trajanja zarulje, ...). Suprotno slucajnom pokusu jest deterministicki pokus ciji jeishod jednoznacno odreden uvjetima.

Skup svih mogucih ishoda ili elementarnih dogadaja naziva se prostor ele-mentarnih dogadaja Ω.

Primjeri

• Slucajni pokus: bacanje kocke

Ω = 1, 2, 3, 4, 5, 6, |Ω| = 6

• Slucajni pokus: bacanje kocke 2 puta (ili bacanje dviju kocki)

Ω = (1, 1), (1, 2), . . . , (1, 6), (2, 1), . . . , (2, 6), . . . , (6, 6), |Ω| = 36

• Slucajni pokus: mjerenje trajanja zarulje

Ω = [0, 4000] u satima, Ω ⊂ R je neprebrojiv

• Slucajni pokus: bacanje novcica sve dok ne padne glava. Ishod je broj potrebnihbacanja.

Ω = 1, 2, 3, . . . = N, Ω je prebrojiv

Podjela pokusa s obzirom na kardinalni broj prostora Ω:

(a) diskretni: ako je Ω konacan ili prebrojiv

(b) kontinuirani: ako Ω sadrzi neki interval iz R

Dogadaj je podskup skupa Ω. Ako je Ω diskretan onda bilo koji podskup, a ako jekontinuiran onda gledamo samo neke podskupove, to jest govorimo o familiji F dogadaja(F ⊆ P(Ω)). Najprije cemo prouciti slucaj kada je prostor Ω konacan (|Ω| = n).

Statisticki pristup vjerojatnosti

Zelimo odrediti vjerojatnost nekog dogadaja A. Slucajni pokus ponavljamo N puta izabiljezimo da se dogadaj A realizirao NA puta (frekvencija dogadaja A). Relativna

frekvencija dogadaja A je kvocijentNA

N. Za neku seriju pokusa uocili bi da se relativna

frekvencija dogadaja A stabilizira oko broja kojeg nazivamo vjerojatnost dogadajaA, u oznaci p(A). Preciznije, vrijedi

p(A) = limN→∞

NA

N.

4

Page 5: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

PrimjerSlucajni pokus : bacanje novcicaDogadaj : A = palo je pismoOcekujemo

NA

N≈ 0.5

Klasicni pristup vjerojatnosti

Pretpostavimo da se prostor Ω sastoji od n elementarnih dogadaja koji su jednakovjerojatni. Vjerojatnost dogadaja A definira se kao

p(A) =|A||Ω|

=|A|n.

PrimjerSlucajni pokus : izvlacenje karte iz spila od 52 karteDogadaj : A = izvucen je as = AH , AK , AP , ATVjerojatnost dogadaja A: p(A) =

4

52= 7.7%

Osnovna svojstva vjerojatnosti

1. p(Ω) = 1

2. Za disjunktne dogadaje A i B (to jest takve da je A ∩ B = ∅ ili z dogadaje kojise iskljucuju) vrijedi

p(A ∪B) = p(A) + p(B).

Opcenito, ako su dogadaji A1, A2, ..., Ak u parovima disjunktni onda

p(A1 ∪ A2 ∪ · · · ∪ Ak) = p(A1) + p(A2) + · · ·+ p(Ak).

3. p(Ac) = 1− p(A)

4. Ako je A ⊆ B, onda

p(A) ≤ p(B), P (B\A) = p(B)− p(A)

5. Za dogadaje A i B vrijedi

p(A) = p(A ∩B) + p(A\B).

6. Ako su dogadaji A1, A2, ..., Ak medusobno disjunktni i vrijedi Ω =⋃k

i=1Ak, onda

p(A) = p(A ∩ A1) + p(A ∩ A2) + · · ·+ p(A ∩ Ak).

7. Formula ukljucivanja/iskljucivanja (FUI )

p(A ∪B) = p(A) + p(B)− p(A ∩B).

5

Page 6: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

Primjeri

1. Izvlacimo kartu iz spila od 52 karte. Odredite vjerojatnost da je izvucena karta

(a) desetka ili srce (b) niti as niti pik.

Rj. (a) A = izvucena je desetka, B = izvuceno je srceDogadaji A i B nisu disjunktni, vrijedi

A ∩B = 10S.

Znamo izracunati vjerojatosti dogadaja A, B i A ∩B:

p(A) =4

52=

1

13, p(B) =

13

52=

1

4, p(A ∩B) =

1

52.

Dakle,

p(A ∪B) =1

13+

1

13− 1

52=

4

13= 31%.

(b) C = izvucena je as, D = izvucen je pikVjerojatnosti dogadaja C i D su

p(C) =1

13, p(D) =

1

4.

Vrijedi

p(Cc ∩Dc) = p((C ∪D)c) = 1− p(C ∪D) = 1− p(C)− p(D) + p(C ∩D).

Vjerojatnost dogadaja C ∩D = izvucena je as pik je 1/52. Stoga je

p(Cc ∩Dc) =9

13= 69%.

2. U posudi sa nalazi 15 kuglica: 6 crvenih, 4 bijele i 5 plavih. Ako izvucemo jednukuglicu, odredite vjerojatnost da izvucena kuglica bude

(a) crvena (b) plava (c) bijela(d) crvena ili plava (e) nije crvena

Rj. (a) 615

= 40% (b) 515

= 33% (c) 415

= 27% (d) 1115

= 73% (e) 1− 615

= 60%

3. Odredi vjerojatnost da u 3 bacanja kocke padne

(a) bar jedna sestica (b) tocno jedna sestica.

Rj. (a) A = pala je bar jedna sestica, Ac = nije pala niti jedna sestica

Lako izracunamo vjerojatnost dogadaja Ac: p(Ac) =53

63. Stoga je

p(A) = 1− p(Ac) = 1− 53

63= 42%.

(b) B = pala je tocno jedna sestica, p(B) =3 · 52

63= 35%.

6

Page 7: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

4. U posudi se nalazi 8 crvenih, 3 bijele i 9 plavih kuglica. Iz posude izvucemo 3kuglice. Odredi vjerojatnost da

(a) su sve crvene (b) su sve bijele (c) je 1 bijela i 2 crvene(d) je bar jedna bijela (e) su razlicitih boja.

Rj. |Ω| =(

20

3

)(a) p(A) =

(83)

(203 )

= 5% (b) p(B) = 1

(203 )

= 0.09% (c) p(A) =(31)·(

82)

(203 )

= 7%

(d) p(Dc) =(17

3 )(20

3 )= 60%, p(D) = 40% (e) p(E) = 8·3·9

(203 )

= 19%

Uvjetna vjerojatnost

Primjer: Kolika je vjerojatnost da je pala sestica ako znamo da je pao paran broj?

A = pala je sestica, B = pao je paran broj

Trazimo vjerojatnost dogadaja A uz uvjet B. Tu vjerojatnost zovemo uvjetna i pisemop(A|B). Konkretno, ako znamo da je pao paran broj, to jest 2,4, ili 6, onda je

p(A|B) =1

3.

Opcenito, ako je p(B) > 0, onda uvjetnu vjerojatnost racunamo kao

p(A|B) =p(A ∩B)

p(B).

U slucaju jednako vjerojatnih ishoda (kao u navedenom primjeru) to je

p(A|B) =|A ∩B||B|

.

Lako se uocava da je u slucaju uvjetne vjerojatnosti B preuzeo ulogu prostora Ω.

Za dogadaje A i B kazemo da su nezavisni ako dogadaj B ne utice na vjerojatnostdogadaja vjerojatnost dogadaja A, to jest ako je

p(A|B) = p(A),

odnosnop(A ∩B) = p(A)p(B).

Primjeri

7

Page 8: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

1. Vjerojatnost da ce prvi strijelac pogoditi metu je 0.8, a drugi 0.9. Odredite vjero-jatnost da ce

(a) obojica (b) niti jedan (c) barem jedan pogoditi metu.

Rj. A = prvi strijelac je pogodio metu, B = drugi strijelac je pogodio metu(a) p(A ∩B) = p(A)p(B) = 72% jer se A i B nazavisni dogadaji

(b) p(Ac ∩ Bc) = p((A ∪ B)c) = 1− p(A ∪ B) = 1− (p(A) + p(B)− p(A ∩ B)) =0, 02 = 2%

Ili, p(Ac ∩Bc) = p(Ac)p(Bc) = 0.1 · 0.2 (jer su i Ac i Bc nazavisni dogadaji).

(c) p(A ∪B) = p(A) + p(B)− p(A ∩B) = 98%.

2. Kocka je bacena dva puta. Neka je

A = zbroj brojeva je 4, B = bar jedno bacanje je 3.

(a) Izracunajte p(A|B). (b) Jesu li A i B nezavisni dogadaji?

Rj. (a) p(A ∩B) =2

36, jerA∩B = (1, 3), (3, 1), p(B) =

11

36, p(A|B) =

p(A ∩B)

p(B)=

2

11.

(b) Ne, jer p(A) =3

36i p(A ∩B) 6= p(A)p(B)

3. Test ispituje je li osoba zarazena nekom rijetkom bolescu koja se pojavljuje jednomna 10 000 ljudi. Ako je osoba zarazena test je pozitivan s vjerojatnoscu 99%, a akoosoba nije zarazena test je negativan s vjerojatnoscu 98%. Drugim rujecima, laznoje negativan s vjerojatnoscu 1%, lazno je pozitivan s vjerojatnoscu 2%. Odreditevjerojatnost da je test pozitivan.

Rj. Oznacimo

Z = osoba je zarazena, Zc = osoba nije zarazena, T = test je pozitivan.

Vrijedip(Z|T ) = 99%, p(Zc|T ) = 2%.

Kako su dogadaji T ∩ Z i T ∩ Zc disjunkni vrijedi

p(T ) = p(T∩Z)+p(T∩Zc) = p(Z|T )p(Z)+p(Zc|T )p(Zc) = 0.991

10000+0.02

9999

10000,

pa je p(T ) = 0.020097. Ovo znaci da bi na 10 000 ljudi test bio pozitivan priblizno201 put, sto znaci da bi 200 ljudi bilo lano prikazano kao zarazenim. Ovaj testkvalificira se kao nekoristan.

Ideju koju smo koristili za rjesavanje prethodnog primjera mozemo generalizirati nasljedeci nacin: ako za u parovima disjunktne dogadaje H1, H2, ..., Hm (to jest Hi∩Hj = ∅za i 6= j) vrijedi

Ω = H1 ∪H2 ∪ · · · ∪Hm,

8

Page 9: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

onda vrijedi tzv. formula potpune vjerojatnosti (FPV)

p(A) = p(A|H1)p(H1) + p(A|H2)p(H2) + · · ·+ p(A|Hm)p(Hm).

Dogadaje H1, H2, ..., Hm s navedenim svojstima nazivamo potpun sistem dogadaja.

Primjeri

1. Na nastavu dolazio redovito 70% studenata, dok njih 30% ne. Studenti koji dolazena nastavu redovito poloze kolokvij s vjerojatnoscu 70%, a oni drugi s vjerojatnoscu40%.

(a) Kolika je vjerojatnost da student polozi kolokvij?(b) Ako je student polozio kolokvij, kolika je vjerojatnost da je student dolazio

redovito na nastavu?

Rj. (a) A = student je polozio,H1 = student je dolazio na nastavu, H2 = student nije dolazio na nastavu.Prema FPV

p(A) = p(A|H1)p(H1) + p(A|H2)p(H2) = 0.7 · 0.7 + 0.4 · 0.3 = 61%

(b)

p(H1|A) =p(H1 ∩ A)

p(A)=p(A|H1)p(H1)

p(A)=

0.7 · 0.70.61

= 80%

2. U tvornici lijekova dva stroja A i B pakiraju proizvedene tablete. Stroj A zapakira40% ukupne robe, a stroj B preostalo. Od 100 pakiranja koja nacini stroj A su2 pakiranja neispravna, a od 200 pakiranja kojih nacini stroj B su 3 pakiranjaneispravna. Odredite vjerojatnost da je slucajno izabrano pakiranje neispravno.

Rj. L = slucajno izabrano pakiranje neispravno,H1 = pakiranje nacinio stroj A, H2 = pakiranje nacinio stroj B. Prema FPVje

p(L) = p(L|H1)p(H1) + p(L|H2)p(H2) =2

100· 0.4 +

3

200· 0.6 = 1.7%

Diskretna slucajna varijablaNeka je Ω diskretni prostor elementarnih dogdaja i p vjerojatnost na njemu. Proizvoljna

funkcijaX : Ω→ R

diskretna slucajna varijabla. Skup svih vrijednosti koje poprima funkcija X, to jest slikafunkcije oznacava se s

R(X) = X(ω) : ω ∈ Ω.

Kako je Ω diskretan skup, to je i R(X) konacan ili prebrojiv. Svakoj vrijednosti xi ∈R(X) pridruzujmo pripadni dogadaj i njegovu vjerojatnost:

X = xi = ω ∈ Ω : X(ω) = xi, pi = p(X = xi).

9

Page 10: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

Za A ⊆ R koristimo oznaku

X ∈ A = ω ∈ Ω : X(ω) ∈ A, p(X ∈ A) =∑xi∈A

pi.

Slicno, za a, b ∈ R

X ≤ a = ω ∈ Ω : X(ω) ≤ a, a ≤ X ≤ b = ω ∈ Ω : a ≤ X(ω) ≤ b.

Primjer: Slucajna varijabla X broji koliko se puta pojavilo pismo u 3 bacanjanovcica.

Ω = PPP, PPG, PGP,GPP,GPG,GGP,GGG, R(X) = 0, 1, 2, 3.

P (X = 0 = P (GGG = 1/8P (X = 1 = P (PGG,GGP,GPG = 3/8P (X = 2 = P (PPG,GPP, PGP = 3/8P (X = 3 = P (PPP = 1/8.

Krace slucajnu varijablu X reprezentiramo tablicom distribucije(x1 x2 · · · xNp1 p2 · · · pN

),

za R(X) = x1, x2, . . . , xN. Uvijek vrijedi pi ≥ 0 i∑N

i=1 pi = 1.

Tablica distribucije za slucajnu varijablu X iz prethodnog primjera glasi(0 1 2 318

38

38

18

).

Ocekivanje diskretne slucajne varijable X definira se kao

E(X) = x1p1 + x2p2 + · · ·+ xNpN .

Varijanca diskretne slucajne varijable X je

V ar(X) =N∑i=1

(xi − E(X))2pi.

Za varijancu se jos koristi oznaka σ2, a za ocekivanje µ. Standardna devijacija je√V ar(X) = σ.

Izracunajmo te vrijednosti za slucajnu varijablu iz primjera:

µ = 0 · 1

8+ 1 · 3

8+ 2 · 3

8+ 3 · 1

8=

12

8= 1.5,

σ2 = (0− 1.5)2 · 1

8+ (1− 1.5)2 · 3

8+ (2− 1.5)2 · 3

8+ (3− 1.5)2 · 1

8= 0.75,

10

Page 11: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

σ = 0.87.

Varijanca se jednostavnije moze izracunati pomocu formule

V ar(X) = E(X2)− E(X)2,

gdje je X2 slucajna varijabla s tablicom distribucije(x21 x22 · · · x2Np1 p2 · · · pN

).

(Zaista,

V ar(X) =N∑i=1

x2i pi − 2E(X)N∑i=1

xipi + E(X)2N∑i=1

pi =N∑i=1

x2i pi − 2E(X)2 + E(X)2,

jer je E(X) =∑N

i=1 xipi i∑N

i=1 pi = 1.)

Ocekivanje shvacamo kao srednju vrijednost slucajne varijable, a standardna devi-jacija (ili varijanca) jest odstupanje slucajne varijable od ocekivanja - ako je σ mali ondasu vrijednosti slucajne varijable bliske ocekivanju.

Primjer: Igrac baca 3 novcica. Ako padnu 3 pisma dobiva 10 kuna, ako padnu 2pisma dobiva 5 kuna, ako padne 3 pismo dobiva 1 kunu, te ako ne padne ni jedno pismogubi 20 kuna. Zapisite tablicu distribucije, ocekivanje i standardnu devijaciju.

Rj. Tablica distribucije glasi

X =

(−20 1 5 10

18

38

38

18

).

µ = −20 · 1

8+ 1 · 3

8+ 5 · 3

8+ 10 · 1

8= 1,

pa ocekujemo da ce dobiti 1 kunu. Standardna devijacije govori o ”riziku”:

σ2 = E(X2)− E(X)2 = 400 · 1

8+ 1 · 3

8+ 25 · 3

8+ 100 · 1

8− 1 = 71, 25,

σ = 8.44.

Bernoullijeva slucajna varijabla je slucajna varijabla koja poprima tocno dvijevrijednosti: 1 - uspjehi 0 - neuspjeh i to s vjerojatnoscu p i q = 1−p. Tablica distribucijeglasi

X =

(0 1q p

).

Ocito je µ = p i σ2 = p− p2 = p(1− p) = pq.Primjer. X je pojavljivanje sestice u jednom bacanju kocke.

X =

(0 1

5/6 1/6

).

11

Page 12: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

µ = 1/6 = p, σ2 = 5/36.

Binomna slucajna varijabla ”broji uspjehe” u n nezavisnih ponavljanja pokusas tocno 2 ishoda uspjeh/neuspjeh (1/0) opisanih Bernoullijevom slucajnom varijablom.Dakle, tablica distribucije glasi

X =

(0 1 2 · · · nqn

(n1

)pqn−1

(n2

)p2qn−2 · · · pn

).

Da je X binomna slucajna varijabla zapisujemo krace X ∼ B(n, p). Vrijedi

µ = np, σ2 = npq.

Pocetni primjer s 3 bacanja novcica je X ∼ B(3, 12).

Zadatci

1. U kutiji se nalaze 24 kuglice: 20 crnih i 4 bijele. Kuglicu izvalacimo jednu za dru-gom dok ne izvucemo crnu. Slucajna varijabla jednaka je broju izvucenih kuglica.Odredite tablicu distribucije, ocekivanje i standardnu devijaciju.

Rj.

X =

(1 2 3 4 52024

424

2023

424

323

2022

424

323

222

2021

424

323

222

121

2020

),

X =

(1 2 3 4 5

0.833 0.145 0.02 0.0019 9.4 · 10−4

).

µ = 1.19, σ2 = 0.214, σ = 0.462.

2. U kutiji se nalaze 3 crne i 5 bijelih kuglica. Slucajna varijabla X jednaka je brojubijelih kuglica u 2 slucajna izvlacenja (bez vracanja). Odredite tablicu distribucije,ocekivanje i standardnu devijaciju.

Rj.

X =

(0 1 23827

23857

5847

),

µ = 1.25, σ2 = 0.402, σ = 0634.

3. Neka je X ∼ B(5, 0.3). Izracunajte p(1 ≤ X ≤ 3) i p(X ≥ 4).Rj. n = 5, p = 0.3, q = 0.7

p(1 ≤ X ≤ 3) =

(5

1

)pq4 +

(5

2

)p2q3 +

(5

3

)p3q2 = 0.8 = 80%.

p(X ≥ 4) =

(5

4

)p4q + p5 = 0.031 = 3.1%

12

Page 13: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

4. Odredite vjerojatnost dobivanja barem jedna sedmice u 3 bacanja para kocki.

Rj. p((1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)) = 636

= 16

X je binomna slucajna varijabla X ∼ B(3, 1/6), pa je

p(X ≥ 1) = 1− p(X = 0) = 1−(

3

0

)p0q3 = 42%.

5. Operacija uspjeva u 75% slucajeva. Kolika je vjerojatnost da

(a) tocno 75% od 8 pacijanata ima uspjelu operaciju?(b) barem 50% od 8 pacijanata ima uspjelu operaciju?

Rj. X ∼ B(8, 0.75)

(a) 75% · 8 = 6, p(X = 6) =

(8

6

)0.756 · 0.252 = 31%

(b) 50% · 8 = 4,

p(X ≥ 4) = 1−p(X ≤ 3 = 1−(

(8

0

)p0q8+

(8

1

)p1q7+

(8

2

)p2q6+

(8

3

)p3q5) = 97%

6. Ako je utvrdeno da je p = 0.8 vjerojatnost pojavljivanja neke kolonije mikroorga-nizama pod zadanim uvjetima, koja je vjerojatnost da se u 5 slucajeva ta kolonijane pojavi manje od 4 puta?

Rj. X ∼ B(5, 0.8)

p(X ≥ 4) =

(5

4

)p4q1 +

(8

5

)p5q0 = 73.7%.

7. Vjerojatnost realizacija dogadaja A u jednom pokusu iznosi 0.08. Za seriju od 1000pokusa, odredite ocekivanje, varijancu i standardnu devijaciju.

Rj. X ∼ B(1000, 0.08)

µ = np = 80, σ2 = npq = 73.6, σ = 8.6.

Neprekidna slucajna varijabla

X : Ω→ R je neprekidna slucajna varijabla ako

• slika R(X) sadrzi neki interval,

• postoji funkcija f : R→ R takva da za sve a, b ∈ R vrijedi

p(a ≤ X ≤ b) =

∫ b

a

f(x)dx.

13

Page 14: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

Funkciju f nazivamo funkcija gustoce slucajne varijable X.Za neprekidnu slucajnu varijablu definiramo jos sljedece pojmove

• funkcija distribucije, F : R→ R

F (x) =

∫ x

−∞f(t)dt,

• ocekivanje

µ = E(X) =

∫ ∞−∞

xf(x)dx,

• varijanca

σ2 = V ar(X) =

∫ ∞−∞

(x− µ)2f(x)dx,

• standardna devijacijaσ =

√V ar(X).

Normalna slucajna varijabla X, oznaka X ∼ N(µ, σ2), je slucajna varijabla cijaje funkcija gustoce

f(x) =1

σ√

2πe−

(x−µ)2

2σ2 ,

pri cemu je µ ∈ R i σ > 0. Pokazuje se da je µ ocekivanje i σ standardna devijacija oveslucajne varijable.

X ∼ N(0, 1) naziva se standardna normalna slucajna varijabla. Ako je X ∼N(µ, σ2), onda

X − µσ

∼ N(0, 1).

14

Page 15: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

III. Statistika

Deskriptivna (opisna) statistikasluzi predocavanje i opisivanje glavnih karakteristika sakupljenih podataka

x1, x2, . . . , xN

koji predstavljaju realizaciju varijable X.Popis osnovnih velicina i njihovih formula:

• Aritmeticka sredina ili prosjek je

x =x1 + x2 + · · ·xN

N.

• Frekvencija je broj pojavljivanja odredenog podatka, fi,

N∑i=1

fi = N,

frekvencija razreda je broj pojavljivanja odredenog razreda podatka ukoliko smopodatke podijelili u razred.

• Relativna frekvencija je kvocijent obicne frekvencije i broja podataka, fri ,

N∑i=1

fri = N,

• Medijan je vrijednost varijable X za koju je 50% ili vise podataka manje ili jednakood te vrijednosti i za koju je 50% ili vise podataka vece ili jednako od te vrijednosti.Ako podatke poredamo po velicini

x(1) ≤ x(2) ≤ · · · ≤ x(N),

i N neparan onda jem = x(N+1

2),

a ako je N paran onda je

m =1

2(x(N

2) + x(N

2+1)).

Umjesto da pamtimo formule za parni i neparni slucaj koristimo sljedecu formulu

x(mq) = x(k) +

r

q(x(k+1) − x(k)),

gdje je m = k + qr i 0 ≤ r < q (k i r postoje i jedinstveni su prema Teoremu odijeljenju s ostatkom). Prema tome medijan mozemo uvijek racunati kao

m = x(N+12

).

15

Page 16: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

• Raspon je razlika najveceg i najmanjeg podatka

d = x(N) − x(1).

• Kvartili dijele podatke u cetiri jednakobrojne skupine:

– prvi ili donji kvartil : ona vrijednost za koju vrijedi da je 25% svih podatakamanje ili jednako od nje (odnosno 75% svih podataka je vece ili jednako odnje),

q1 = x(N+14

),

– drugi kvartil : medijan,

– treci ili gornji kvartil : ona vrijednost za koju vrijedi da je 25% svih podatakavece ili jednako od nje (odnosno 75% svih podataka je manje ili jednako odnje),

q3 = x(3(N+1)

4).

Napomena: Postoji cak desetak razlicitih formula za racunanje kvartila. Naprimjer, gornja definicija ne poklapa se s onom iz Excela.

– Nulti i cetvrti kvartil odgovaraju minimalnoj x(1), odnosno maksimalnoj vri-jednosti x(N) uzorka.

Svih pet kvartila nazivaju se karakteristicna petorka uzorka.

• Interkvartil je jednak razlicidq = q3 − q1.

• Varijanca uzorka je prosjecno kvadratno odstupanje od prosjeka

(s′)2 =1

N

N∑i=1

(xi − x)2,

a pripadna standardna devijacija se oznacava s s′ i racuna kao drugi korijen izvarijance uzorka.

• Korigirana varijanca uzorka je

s2 =1

N − 1

N∑i=1

(xi − x)2

koja predstavlja dobar procjenitelj za varijancu σ2 slucajne varijable. Pripadnakorigirana standardna devijacija se oznacava sa s.

Napomenimo da raspon, interkvartil, varijanca i standardna devijacija spadaju utzv. mjere rasprsenja.

16

Page 17: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

• Centralni moment reda k (k ∈ N) danog uzorka racuna se kao

µk =1

N − 1

N∑i=1

(xi − x)k.

Centralni moment reda 1 jednak je nuli, a reda 2 korigiranoj varijanci uzorka. Cen-tralni moment reda 3 znacajan je odredivanje tzv. koeficijenta asimetrije uzorka:

α3 =µ3

s3.

Ako je α3 = 0, onda je uzorak simetrican. Za α3 > 0 je pozivno asimetrican, aα3 < 0 je negativno asimetrican. Koeficijent asimetrije je mjera oblika.

Na seminarima smo prikupili sljedece podatke na uzorku od 20 studenta:

seminar u 8h broj mobitela koji je student promijenio u posljednjih 5 godina:

3 3 1 2 2 2 1 4 2 2 3 3 3 2 3 2 3 3 4 4

seminar u 10h broj mobitela koji je student promijenio do sada:

5 5 6 2 3 4 5 4 5 5 6 6 8 9 11 4 5 6 6 5

seminar u 12h Koju ocjenu ocekujem iz Matematike sa statistckom analizom:

3 4 3 2 2 3 2 5 2 2 3 4 3 4 4 5 2 2 5 4

Analiza podataka:Seminar u 8h: Podatci poredani po velicini:

x(1) = 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 = x(20)

• Tablica frekvencija:

1 2 3 4

fi 2 7 8 3fri 0.1 0.35 0.4 0.15

• Kvartili

– q0 = x(1) = 1 minimum, q4 = x(20) = 4 maksimum, d = 4− 1 = 3 raspon

– m = q2 = 12(x(10) + x(11)) = 3 medijan

17

Page 18: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

– q1 = x(5) + 14(x(6) − x(5)) = 2 donji kvartil,

q3 = x(15) + 34(x(16) − x(15)) = 3 gornji kvartil, dq = 3− 2 = 1, interkvartil

• Mod je 3 (vrijednost uzorka koji se najvise pojavljuje).

• Aritmeticka sredina: x = 2.6

• Varijanca i standardna devijacija: (s′)2 = 0.74, s′ = 0.86

• Korigirana varijanca i korigirana standardna devijacija: s2 = 0.78, s = 0.88

• Centralni moment reda 3 i koeficijent asimetrije: µ3 = −0.051, α3 = −0, 073.

Seminar u 12h: Podatci poredani po velicini:

x(1) = 2 3 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 8 9 11 = x(20)

• Tablica frekvencija:

2 3 4 5 6 8 9 11

fi 1 1 3 7 5 1 1 1

U ovom slucaju preporuca se podatke rasporediti u razrede. Preporuceni brojrazreda je

√n. Znaci, u nasem slucaju je to 4 ili 5 razreda.

<4 4 5 6 >6

fi 2 3 7 5 3fri 0.1 0.15 0.35 0.25 0.15

• Kvartili

– q0 = x(1) = 2 minimum, q4 = x(20) = 11 maksimum, d = 9 raspon

– m = q2 = 12(x(10) + x(11)) = 5 medijan

– q1 = x(5) + 14(x(6) − x(5)) = 4.25 donji kvartil,

– q3 = x(15) + 34(x(16) − x(15)) = 6 gornji kvartil, dq, interkvartil

• Mod je 5 (vrijednost uzorka koji se najvise pojavljuje).

• Aritmeticka sredina: x = 5.5

• Varijanca i standardna devijacija: (s′)2 = 3.85, s′ = 1.96

• Korigirana varijanca i korigirana standardna devijacija: s2 = 4.05, s = 2.01

• Centralni moment reda 3 i koeficijent asimetrije: µ3 = 8.21, α3 = 1.01.

Seminar u 12h: Podatci poredani po velicini:

18

Page 19: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

x(1) = 2 2 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5 5 5 = x(20)

• Tablica frekvencija:

2 3 4 5

fi 7 5 5 3fri 0.35 0.25 0.25 0.15

• Kvartili

– q0 = x(1) = 2 minimum, q4 = x(20) = 5 maksimum, d = 3 raspon

– m = q2 = 12(x(10) + x(11)) = 3 medijan

– q1 = x(5) + 14(x(6) − x(5)) = 2 donji kvartil,

q3 = x(15) + 34(x(16) − x(15)) = 4 gornji kvartil, dq = 2, interkvartil

• Mod je 2 (vrijednost uzorka koji se najvise pojavljuje).

• Aritmeticka sredina: x = 3.2

• Varijanca i standardna devijacija: (s′)2 = 1.16, s′ = 1.08

• Korigirana varijanca i korigirana standardna devijacija: s2 = 1.22, s = 1.11

• Centralni moment reda 3 i koeficijent asimetrije: µ3 = 7.92, α3 = 7.17.

Sve izracunate vrijednosti bit ce puno jasnije pogledaju li se dijagrami!

Primjer: Popisan je prosjek 30 studenata (na jednu decimalu):

3.4, 3.0, 4.6, 2.5, 4.3, 3.9, 3.6, 4.1, 2.8, 4.2,3.9, 3.5, 3.4, 4.3, 4.5, 4.9, 3.9, 3.6, 3.6, 5.0,3.2, 4.3, 3.9, 5.0, 3.4, 4.2, 3.3, 4.1, 2.8, 3.6

U rastucem poretku imamo sljedeci uzorak i odmah ih grupiramo u intervale duljine0.5:

2.5, 2.8, 2.83.0, 3.2, 3.3, 3.4, 3.4, 3.4,

3.5, 3.6, 3.6, 3.6, 3.6, 3.9, 3.9, 3.9, 3.9,4.1, 4.1, 4.2, 4.2, 4.3, 4.3, 4.3,

4.5, 4.6, 4.9, 5.0, 5.0

• Tablica distibucije - rasporedit cemo podatke u ekvidistatne intervale

intervali [2.5, 3.0) [3.0, 3.5) [3.5, 4.0) [4.0, 4.5) [4.5, 5]

fi 3 6 9 7 5fri 0.1 0.2 0.3 0.23 0.17

19

Page 20: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

(a) Histogram (barchart)

(b) Strukturni krug(”pita”; piechart)

Slika 1: Broj mobitela koje je student promijenio u zadnjih 5 god.

(a) Histogram (barchart)

(b) Strukturni krug(”pita”; piechart)

Slika 2: Broj mobitela koje je student promijenio do sada

20

Page 21: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

(a) Histogram (barchart)

(b) Strukturni krug(”pita”; piechart)

Slika 3: Ocjena koju student ocekuje iz MSSA

• Iz

2.5, 2.8, 2.8,3.0, 3.2, 3.3, 3.4, 3.4, 3.4, 3.5, 3.6, 3.6, 3.6, 3.6, 3.9,3.9, 3.9, 3.9, 4.1, 4.1, 4.2, 4.2, 4.3, 4.3, 4.3, 4.5, 4.6, 4.9, 5.0, 5.0

odredimo: min = 2.5, max = 5.0, d = 2.5, mod = 3.9 (pojavljuje se 4 puta)

q1 = x( 314) = x(7+ 3

4) = x(7) +

3

4(x(8) − x(7)) = 3.4,

q3 = x( 934) = x(7+ 3

4) = x(23) +

1

4(x(24) − x(23)) = 4.3, dq = 0.9

• x = 3.82 (aritmeticka sredina na 2 decimale)

• (s′)2 = 0.41, s′ = 0.64, s2 = 0.42, s = 0.65

• µ3 = −0.00665, α3 = −0.024 (uzorak je prilicno simetrican!)

21

Page 22: Osnovni pojmovi iz kombinatorike, vjerojatnosti i ...fran/komb-vjer-stat.pdf · Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika ... U oba pristupa uklju cen

Farmacija, Medicinska biokemija Kombinatorika, vjerojatnost, statistika

(a) Histogram (barchart)

(b) Strukturni krug(”pita”; piechart)

Slika 4: Prosjek studenta

22