analiza jakosti statisti ckog testa - unios

of 35 /35
Sveuˇ ciliˇ ste J.J. Strossmayera u Osijeku Odjel za matematiku Ana Peji´ c Analiza jakosti statistiˇ ckog testa Diplomski rad Osijek, 2014.

Author: others

Post on 19-Oct-2021

4 views

Category:

Documents


0 download

Embed Size (px)

TRANSCRIPT

Ana Pejic
Ana Pejic
Osijek, 2014.
1 Uvod 2
2 Osnovni pojmovi 3 2.1 Statisticki test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2.2 Pogreske statistickog testa . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2.3 Kriticno podrucje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3 Jakost statistickog testa 6 3.1 Pojam jakosti statistickog testa . . . . . . . . . . . . . . . . . . . . . . . 6
3.1.1 Metoda kvocijenta vjerodostojnosti . . . . . . . . . . . . . . . . . 8
4 Analiza jakosti statistickog testa 12 4.1 Testiranje hipoteza o ocekivanju . . . . . . . . . . . . . . . . . . . . . . . 12 4.2 Testiranje hipoteza o vjerojatnosti dogadaja . . . . . . . . . . . . . . . . 21 4.3 Testiranje hipoteza o razlici populacijskih ocekivanja . . . . . . . . . . . 26
Literatura 31
Sazetak 32
Zivotopis 33
1 Uvod
Testiranje statistickih hipoteza jedna je od najcesce koristenih statistickih metoda. Pro- vodenje istrazivanja na cijeloj populaciji gotovo je nemoguce zbog ogranicenosti resursa. Stoga se odabire uzorak iz populacije. Na temelju podataka iz uzorka donose se zakljucci za danu populaciju. Prvi korak prilikom testiranja hipoteza je definiranje nulte i alter- nativne hipoteze, a na kraju je potrebno donijeti odluku o odbacivanju ili neodbacivanju nul-hipoteze. Nekada je najveci strah onih koji provode testiranje (u daljnjem tekstu istrazivaci) bila mogucnost odbacivanja nul-hipoteze kada je ona tocna, no danas se sve vise pozornosti obraca i na opasnosti pogreske ostajanja pri netocnoj nul-hipotezi.
Kako bi se mogle razumijeti i kontrolirati pogreske, potrebno je provesti opsezna is- trazivanja i analize podataka, no s obzirom na ogranicenost resursa analiza jakosti sta- tistickog testa dobiva svoj smisao.
Na pocetku rada, u drugom poglavlju, pojasnjeni su osnovni pojmovi vezani uz sta- tisticki test. Na konkretnom primjeru opisan je parametarski statisticki model. Zatim su opisane hipoteze koje cine statisticki test te pogreske statistickog testa. S obzirom na vaznost pogresaka koje nastaju prilikom testiranja, one su pojasnjene u posebnom potpoglavlju.
Nakon osnovnih pojmova, u trecem poglavlju, upoznajemo se s pojmom jakosti sta- tistickog testa. Dano je preslikavanje kojim je definirana funkcija jakosti testa te pripadna interpretacija.
U svrhu pronalazenja kriticnog podrucja statistickog testa dan je Neyman-Pearsonov teorem za slucaj jednostavnih hipoteza te na konkretnom primjeru pokazana je njegova primjena. S obzirom da je kriticno podrucje moguce odrediti pomocu funkcije vjero- dostojnosti, opisana je metoda kvocijenta vjerodostojnosti. Sve navedeno ilustirano je odgovarajucim primjerom.
Analiza jakosti statistickog testa dana je u cetvrtom poglavlju rada za odabrane sta- tisticke testove.
Analiza jakosti statistickog testa najvecu vaznost primjene nalazi u medicinskim is- trazivanjima, anketama te istrazivanjima u drustvenim znanostima.
2
2 Osnovni pojmovi
Mnoga obiljezja populacije modeliramo nekom slucajnom varijablom X. Obiljezja mogu biti diskretna i kontinuirana. Neka su slucajne varijable X1, X2, . . . , Xn medusobno ne- zavisne i jednako distribuirane kao slucajna varijabla X. Realizacija slucajnog vektora (X1, X2, . . . , Xn) kojim modeliramo uzorak iz obiljezja, je uredena n-torka (x1, x2, . . . , xn) ∈ Rn. Pri tome vrijedi da je xi realizacija slucajne varijable Xi, i = 1, . . . , n.
Definicija 2.1. Slucajan vektor (X1, X2, . . . , Xn) cije su komponente nezavisne i jednako distribuirane slucajne varijable naziva se jednostavan slucajan uzorak.
Definicija 2.2. Familija dozvoljenih funkcija distribucija koje se koriste u modeliranju podataka zove se statisticki model. Oznacava se s P.
Statisticki model moze biti parametarski i neparametarski. Sljedecim primjerom bit ce prikazan parametarski statisticki model.
Primjer 2.1. U tvornici se proizvodi neki proizvod s odredenim postotkom neispravnih proizvoda. Postotak nije poznat te ga oznacimo s θ pri cemu vrijedi θ ∈ [0, 1]. Treba odrediti pripadni parametarski statisticki model.
U tu svrhu potrebno je procijeniti θ. Stoga se nezavisno odabere n proizvoda s pro- izvodne trake. Odabrani proizvod moze biti ispravan ili neispravan. Ispravan proizvod oznacimo s 0, a neispravan s 1. Svaki rezultat izvlacenja proizvoda s proizvodne trake moze se modelirati Bernoullijevom slucajnom varijablom s tablicom distribucije
Xk =
1− θ θ
) pri cemu je P (Xk = 0) = 1− θ, P (Xk = 1) = θ.
(X1, X2, . . . , Xn) je slucajan vektor cije su komponente nezavisne Bernoullijeve slucajne varijable s parametrom θ. Dakle, radi se o jednostavnom slucajnom uzorku za koji je po- trebno odrediti funkciju distribucije. U tu svrhu uocimo da vrijedi:
P (Xk = x) = θx · (1− θ)(1−x), x ∈ {0, 1}.
Time se dobiva sljedece
= n∏ k=1
P (Xk = xk)
= n∏ k=1
(2.1)
F(X1,...,Xn)(x1, . . . , xn) = P (X1 ≤ x1, . . . , Xn ≤ xn) = Fθ(x1, . . . , xn) , θ ∈ [0, 1].

3
U Primjeru 2.1. θ je nepoznati parametar, a segment [0, 1] pripadni parametarski prostor.
Definicija 2.3. Parametarski prostor je skup svih dozvoljenih vrijednosti nekog nepoz- natog parametra. Oznacava se s Θ.
Familiju svih funkcija distribucija jednostavnog slucajnog uzorka za sve dozvoljene vrijednosti nepoznatog parametra, odnosno za sve vrijednosti parametra iz pripadnog pa- rametarskog prostora, naziva se parametarski statisticki model.
2.1 Statisticki test
Kako bi testirali statisticku hipotezu, prvo je potrebno slutnju koju zelimo testirati pretvoriti u statisticku hipotezu.
Statisticka hipoteza je formulirana u terminima distribucije slucajne varijable X, a oznacava se s H. Razlikujemo nultu hipotezu (nul-hipoteza) i alternativnu hipotezu. Nul-hipoteza, u oznaciH iliH0, je hipoteza koju je potrebno testirati, a u slucaju njezine neistine prihvaca se alternativna hipoteza koju oznacavamo s Hc ili H1.
Statisticka hipoteza je podskup statistickog modela te stoga vrijedi:
H0 ∪H1 = P
pri cemu su H0 i H1 disjunktne. Hipoteza moze biti:
• jednostavna - jednoznacno odreduje distribuciju slucajne varijable X,
• slozena - jednoznacno ne odreduje distribuciju slucajne varijable X.
Definicija 2.4. Preslikavanje τ : Rn → {0, 1} naziva se test.
Test se interpretira na sljedeci nacin:
• ako je τ(x) = 1 onda se odbacuje H0 u korist H1
• ako je τ(x) = 0 onda se ne odbacuje H0 u korist H1.
Testiranje koje se provodi je zapravo testiranje istinitosti nul-hipoteze, odnosno donosenje odluke hocemo li odbaciti ili ne odbaciti hipotezu H0. U slucaju odbacivanja hipoteze H0, prihvaca se alternativna hipoteza H1. Donosenje odluke moze rezultirati pogreskom, a u sljedecem potpoglavlju ce biti dan pregled pogresaka statistickog testa.
2.2 Pogreske statistickog testa
Prilikom testiranja nul-hipoteze govori se o njezinu odbacivanju ili ne odbacivanju jer se odlucivanje u statistickom testu provodi uz toleranciju malih vjerojatnosti pogresne odluke.
Razlikujemo dva tipa pogresaka:
• pogreska II. tipa.
Pogreska I. tipa znaci odbaciti hipotezu H0 ako je ona istinita, dok pogreska II. tipa znaci ne odbaciti hipotezu H0 ako je hipoteza H1 istinita.
Prilikom kreiranja statistickog testa bitno je voditi racuna o velicini vjerojatnosti pogreske I. tipa i pogreske II. tipa. Nije moguce kreirati test u kojem se mogu kontrolirati vjerojatnosti obje pogreske jer smanjivanjem vjerojatnosti pogreske I. tipa povecava se vjerojatnost pogreske II. tipa i obrnuto. Statisticki test je kreiran tako da dopusta istrazivacu izbor maksimalne vjerojatnosti pogreske I. tipa koju zeli prihvatiti. Navedena vjerojatnost oznacava se s α i naziva nivo signifikantnosti ili razina znacajnosti, a njezine najcesce vrijednosti su 0.01, 0.05 ili 0.1.
2.3 Kriticno podrucje
Za dani statisticki model P i hipotezu H0 skup svih realizacija uzorka oznacava se s X , a dijeli se na dva disjunktna skupa Cr i Crc. Cr ⊆ X je podrucje odbacivanja hipoteze H0. Ako realizacija uzorka upadne u Cr, hipoteza H0 se odbacuje. Skup Cr zove se kriticno podrucje hipoteze H0, a odabire se tako da sadrzi one tocke x ∈ Rn u kojima dolazi do znacajnog odstupanja od pretpostavljene hipoteze H0. Ako se Cr moze izraziti u terminima neke statistike T , onda tu statistiku zovemo test-statistika. Definicijom 2.5. dan je pojam statistike.
Definicija 2.5. Neka je X = (X1, . . . , Xn) slucajan vektor statistickog modela P, t : Rn → K, (K,F) izmjeriv prostor. Ako je t izmjeriva u paru (Bn,F), onda je t funkcija kojom mozemo definirati statistiku. Statistika je T = t(X1, . . . , Xn).
U radu se bavimo parametarskim hipotezama sto znaci da je potrebno hipotezu H0 iskazati u terminima nepoznatog parametra θ za poznati oblik funkcije distribucije slucajne varijable. Parametarski prostor Θ je oblika Θ = Θ0 ∪ Θ1, Θ0 ∩ Θ1 = ∅. Hipoteza H0 iskazuje se tako da se istakne odredeni podskup Θ0 ⊆ Θ, Θ0 6= ∅, te se zapisuje H0 : θ ∈ Θ0, Θ0 ⊆ Θ. Hipoteza H1 dana je s H1 : θ ∈ Θ1, Θ1 = Θ\Θ0.
Pretpostavimo da je θ ∈ Θ0. Pogreska bi bila da je realizacija uzorka upala u kriticno podrucje, x ∈ Cr. U tom slucaju radi se o pogresci I. tipa, odnosno odbacila bi se hipoteza H0 koja je istinita. Ako θ 6∈ Θ0 tada bi pogreska bila da x 6∈ Cr. U tom slucaju radi se o pogresci II. tipa, odnosno ne bi se odbacila hipoteza H0.
Uvodi se funkcija π : Θ→ [0, 1] definirana s
π(θ) = Pθ(X ∈ Cr)
5
3.1 Pojam jakosti statistickog testa
Definicija 3.1. Neka je X ∼ fθ(x), θ ∈ Θ. Preslikavanje π : Θ→ [0, 1] definirano s
π(θ) := Pθ(X ∈ Cr) (3.1)
zove se funkcija jakosti testa.
Vrijednost funkcije jakosti za dani parametar θ ∈ Θ zovemo jakost testa u θ. Izraz (3.1) interpretira se na sljedeci nacin: jakost testa u θ ∈ Θ je vjerojatnost odbacivanja hipoteze H0 kada je θ prava vrijednost nepoznatog parametra.
Na temelju funkcije jakosti testa moze se kontrolirati gornja granica vjerojatnosti pogreske I. tipa i gornja granica vjerojatnosti pogreske II. tipa.
Neka su H0 : θ ∈ Θ0
H1 : θ ∈ Θ1.
α(θ) := π(θ) = Pθ(X ∈ Cr)
α := sup θ∈Θ0
α(θ)
je znacajnost testa. Test ima razinu znacajnosti α ako mu je znacajnost manja ili jednaka α.
Preslikavanje β : Θ1 → [0, 1] definirano s
β(θ) : = 1− Pθ(X ∈ Ccr) = 1− π(θ)
je vjerojatnost pogreske II. tipa. Gornja granica vjerojatnosti pogreske II. tipa je
sup θ∈Θ1
Definicija 3.2. Uniformno najjaci test razine znacajnosti α za testiranje hipoteze H0 u modelu P je test s kriticnim podrucjem C∗r za koji vrijedi:
i) sup θ∈Θ0
πC∗r (θ) ≤ α
ii) πC∗r (θ) ≥ πCr(θ), ∀θ ∈ Θ1 cim je Cr neko drugo kriticno podrucje razine znacajnosti α.
6
Neka je dan statisticki model P i hipoteze H0 i H1 na sljedeci nacin:
P = {fθ(x) : θ ∈ {θ0, θ1}} H0 : θ = θ0
H1 : θ = θ1.
(3.2)
Teorem 3.1 (Neyman, Pearson). Neka je dan statisticki model P te H0 i H1 kao u (3.2).
Tada vrijedi: kriticno podrucje oblika Cr(k) = {x ∈ Rn : fθ0(x) ≤ k · fθ1(x)} za k > 0 je uniformno najjace kriticno podrucje razine znacajnosti α = Pθ0(X ∈ Cr(k)) za testiranje hipoteze H0.
Dokaz. (Vidi [6], str. 540-541).

Sljedecim primjerom bit ce pokazano odredivanje kriticnog podrucja jednostranog testa za ocekivanje normalne distribucije.
Primjer 3.1. Neka je X = (X1, . . . , Xn) jednostavan slucajan uzorak iz normalne dis- tribucije, tj. Xi ∼ N (µ, σ2) pri cemu je σ2 poznato, µ ∈ {µ0, µ1}. Potrebno je odrediti kriticno podrucje za testiranje hipoteze H0 : µ = µ0 prema H1 : µ = µ1, za µ1 > µ0.
Postavimo hipoteze:
H1 : µ = µ1. (3.3)
Pripadno kriticno podrucje za tako postavljene hipoteze odredit cemo pomocu Neyman- Pearsonova teorema. U tom slucaju ono je oblika Cr = {x ∈ Rn : fµ0(x) ≤ k fµ1(x)}, pri cemu se k bira tako da uz odabranu vrijednost α vrijedi Pµ0(X ∈ Cr) = α.
Izracunamo pripadnu nejednakost
∑n i=1(xi−µ1)2) ≤ k / ln
− 1
2σ2
(xi − µ1)2
) ≤ ln k
(3.4)
7
n∑ i=1
1) ≥ −2σ2 ln k
1) / : 2n
1)
2n
1
n
0 − µ2 1)
2n(µ1 − µ0) .
Ako je hipoteza H0 istinita tada X ima N ( µ, σ2
n
σ
istinitosti hipoteze H0. Tada je kriticno podrucje odredeno s
X − µ0
2nσ(µ1 − µ0)
√ n.
Oznacimo s k1 izraz s desne strane gornje nejednakosti. Velicinu k1 dobivamo iz uvjeta Pµ0(T (X) ≥ k1) = α. Izracunajmo k1:
Pµ0(T (X) ≥ k1) = α
Pµ0(T (X) ≤ k1) = 1− α Φ(k1) = 1− α,
pri cemu je Φ(x) funkcija distribucije N (0, 1). Iz toga proizlazi da je k1 = Φ−1(1 − α), odnosno k1 = zα.

3.1.1 Metoda kvocijenta vjerodostojnosti
Prilikom testiranja jednostavne hipoteze H0 : θ = θ0 u odnosu na slozenu alternativnu hipotezu H1 : θ ∈ Θ1, onda za svaki θ ∈ Θ1 funkcija vjerodostojnosti ima odredenu
vrijednost L(x; θ). U tom slucaju omjer L(x; θ0)
L(x; θ) je funkcija nepoznatog parametra θ.
8
L(x; θ) = L(x; θ1) onda je vrijednost omjera L(x; θ0)
L(x; θ1) u tocki x ∈ Rn
tocno odredeni broj. Ako je taj broj malen onda se tocka x ∈ Rn ukljucuje u kriticno podrucje (vidi [7]).
Definicija 3.1.1.1. Velicina
λ(x) = L(x; θ0)
max θ∈Θ
L(x; θ1) , (3.5)
zove se omjer vjerodostojnosti u tocki x ∈ Rn. Ako je nul-hipoteza slozena, tj. H0 : θ ∈ Θ0, i ako postoji max
θ∈Θ0
λ(x) = max θ∈Θ0
L(x; θ1) . (3.6)
Kako je λ(x) ≤ 1 moguce su dvije situacije. A to su:
• ako je λ(x) ≈ 1 tada tocka x ne bi trebala pripadati kriticnom podrucju za hipotezu H0
• ako je λ(x) ≈ 0 tada bi tocka x trebala pripadati kriticnom podrucju za hipotezu H0.
Iz prethodnog razmatranja moze se zakljuciti da ce se dobar test dobiti ako se u kriticno podrucje Cr ukljuce one tocke iz Rn za koje je (3.6) manje od nekog zadanog broja c, pri cemu je 0 < c ≤ 1.
Definicija 3.1.1.2. Ako kriticno podrucje Cr za testiranje parametarske hipoteze H0 : θ ∈ Θ0, u odnosu na alternativnu hipotezu H1 : θ ∈ Θ1 ima oblik
Cr = {x ∈ Rn : λ(x) ≤ c} (3.7)
onda kazemo da je test dobiven metodom omjera vjerodostojnosti (LR-test).
Pretpostavimo da nepoznati parametar ima konkretnu vrijednost θ ∈ Θ. Tada se govori o slucajnom vektoru X = (X1, X2, . . . , Xn) i statistici λ(X) kojoj pripada odgo- varajuca funkcija distribucije F (λ, θ) = Pθ(λ(X) ≤ λ), λ ∈ R. Statistiku λ(X) koja proizlazi iz omjera vjerodostojnosti nije jednostavno odrediti stoga je potrebno napra- viti transformaciju nejednakosti λ(x) ≤ c u ekvivalentnu nejednakost h(x) ≤ c0. Time se dobiva test-statistika h(X) = Yn cija je distribucija lakse odrediva. Pomocu omjera vjerodstojnosti pronalazimo funkciju h.
Kriticno podrucje Cr = {x ∈ Rn : h(x) ≤ c0} treba imati razinu znacajnosti α, a pripadna funkcija jakosti dana je s:
π(θ) = Pθ(h(X) ≤ c0) = Pθ(Yn ≤ c0) = F (c0, θ)
pri cemu je θ ∈ Θ. Konstantu c0 odredimo iz zahtjeva α = max
θ∈Θ0
9
Primjer 3.1.1.1. Neka je X = (X1, . . . , Xn) jednostavan slucajan uzorak iz normalne distribucije, tj. Xi ∼ N (µ, σ2) pri cemu je σ2 poznato. Potrebno je odrediti kriticno podrucje koristeci metodu kvocijenta vjerodostojnosti za dvostrani test o ocekivanju nor- malne distribucije.
U tu svrhu postavimo hipoteze:
H0 : µ = µ0
L(µ) = 1
2σ2 Σni=1(xi−µ)2 . (3.9)
Potrebno je odrediti tocku u kojoj funkcija vjerodostojnosti dana s (3.9) postize mak- simum. U nastavku je dan postupak trazenja maksimuma.
dL(µ)
dµ =
1
) e−
n∑ i=1
(xi − µ) = 0
n∑ i=1
xi − nµ = 0
xi.
max µ∈R
L(µ) = L(x) = 1
(2πσ2) n 2
λ(x) =
1
= e− n
e− n
e− n
x− µ0
≥ −2 ln c / √ ·.
Kako je 0 < c ≤ 1 slijedi da je ln c ≤ 0 i √ −2 ln c ≥ 0. Oznacimo
√ −2 ln c ≥ 0 s c0
cime dobivamo: x− µ0
Sada mozemo zapisati oblik kriticnog podrucja Cr, a ono glasi
Cr =
σ
n σ2), tada je Z ∼
N (0, 1). Potrebno je jos odrediti c0 prema zahtjevu α = max
θ∈Θ0
c0 = Φ−1 (
U sljedecim potpoglavljima bit ce prikazano odredivanje kriticnog podrucja i test-statistike za odabrane testove te dana analiza jakosti tih testova.
4.1 Testiranje hipoteza o ocekivanju
Primjer 4.1.1 (Jednostrani test za ocekivanje normalne distribucije). Neka je X = (X1, . . . , Xn) jednostavan slucajan uzorak iz normalne distribucije, tj. Xi ∼ N (µ, σ2) pri cemu je σ2 poznato. Potrebno je analizirati jakost testa za testiranje hipoteze H0 : µ = µ0
prema H1 : µ > µ0.
H1 : µ > µ0. (4.1)
U Primjeru 3.1. odredeno je pripadno kriticno podrucje. Ono je oblika
Cr =
π(µ) = Pµ(T (X) ≥ zα)
(4.3)
Kako bi izracunali π(µ) potrebno je znati distribuciju od T (X). Ukoliko je H0 istinita hipoteza µ = µ0 onda je T (X) ∼ N (0, 1) pa je π(µ0) = α jer je tako odabrano kriticno podrucje. U slucaju istinitosti hipoteze H1, prava vrijednost µ nije tocno odredena, a time ni distribucija od T (X).
Analizu funkcije jakosti testa u uvjetima istinitosti hipoteze H1 provodimo uz pretpos- tavku da je µ = µ1 prava vrijednost nepoznatog parametra, pri cemu je µ1 > µ0. Dakle,
za µ = µ1 test-statistika T (X) nema N (0, 1) distribuciju, nego X − µ1
σ
distribuciju. Oznacimo s Φ(x) funkciju distribucije N (0, 1).
Time dobivamo
= P
(4.4)
Vrijednost funkcije jakosti testa za dani µ1 iznosi π(µ1) = 1−Φ
( zα −
) .
Mozemo uociti da je π(µ1) neprekidna i monotono rastuca funkcija po µ1, za µ1 > µ0, sto znaci da najveca moguca vjerojatnost pogreske II. tipa moze biti jako velika, tj.
sup µ1>µ0
(1− π(µ1)) = 1− π(µ0) = 1− α.
To znaci da, ukoliko je prava vrijednost parametra µ blizu µ0 vjerojatnost pogreske ne odbacivanjem H0 moze biti jako velika.
Dodatne informacije o mogucem iznosu ocekivanja µ, koji suprotstavljamo vrijednosti u H0, ponekad omogucuju kontrolu velicine pogreske II. tipa. Pretpostavimo da dodatne informacije omogucuju postavljanje hipoteza:
H0 : µ = µ0
H1 : µ ≥ µ1, (4.5)
pri cemu je µ1 > µ0. Prethodna analiza jamci da je u tom slucaju najveca moguca vjerojatnost pogreske II.
tipa
(1− π(µ)) = 1− π(µ1).
U takvim slucajevima π(µ1) je koristan pokazatelj koji zovemo snaga testa i mozemo ga iskoristiti za odredivanje velicine uzorka potrebne za postizanje zeljene snage testa. Uocimo da je snaga testa gornja granica vjerojatnosti dobre odluke ukoliko je H1 istinita hipoteza.
Pretpostavimo da zeljena snaga testa iznosi γ te izrazimo razliku µ1−µ0 = kσ, k > 0. Kako bi odredili potrebnu velicinu uzorka postavimo π(µ1) = γ te dobivamo
1− Φ
√ n
zα − z1−γ
k .
(4.6)
13
Dakle, velicina uzorka n treba biti n ≥ (zα − z1−γ) 2
k2 .
U slucaju da je velicina uzorka poznata tada je potrebno odrediti k kako bi postojala
.

U Primjeru 4.1.1. pokazana je analiza jakosti statistickog testa za jednostrani test u slucaju poznate varijance, a sljedecim primjerom bit ce ilustrirana primjena u praksi.
Primjer 4.1.2. U razvijenim zemljama visoko produktivne osobe razvile su visok kvo- cijent inteligencije, no zbog nedostatka vremena zapostavili su svoje emotivno stanje. Potrebna im je strucna pomoc kako bi razjasnili svoje osjecaje.
Psiholog zeli testirati hipotezu da ljudi koji traze lijecenje zbog takvih problema, imaju veci kvocijent inteligencije nego opca populacija. U tu svrhu slucajnim odabirom odabire 40 klijenata. Provodenjem testiranja kvocijenta inteligencije na odabranih 40 klijenata dobio je ove rezultate:
110, 100, 105, 110, 100, 115, 105, 120, 100, 100, 115, 105, 110, 110, 105, 100, 105, 90, 105,
105, 110, 105, 130, 100, 105, 100, 100, 100, 95, 95, 95, 100, 110, 110, 105, 115, 95, 105, 100, 110.
Ocekivani kvocijent inteligencije za opcu populaciju iznosi 100, a za njegove klijente 105, pri cemu je σ = 15, α = 0.05.
Kolika je vjerojatnost da psiholog prihvati hipotezu H0, ako je ona zapravo neistinita? Koliko velik uzorak treba biti kako bi pri istoj razini znacajnosti vjerojatnost pogreske II. tipa bila manja od 0.20?
Pripadne hipoteze su:
H0 : µ = 100
H1 : µ = 105.
Testiranje hipoteza provodeno je u R-u. Dobivena realizacija test-statistike je 2.108185 te ukazuje na odbacivanje nul-hipoteze na razini znacajnosti 0.05, jer se realizacija test- statistike nalazi u intervalu [1.644854,∞. Sada izracunajmo jakost testa u µ1.
Uvrstavajuci podatke u izraz (4.4), jakost testa u µ1 = 105 iznosi:
π(µ1) = 1− Φ
( 1.64− 105− 100
= 0.6726.
Dakle, ako je stvarno ocekivanje 105, onda je vjerojatnost pogreske II. tipa 0.33.
14
Kako bi se postigla sto manja vjerojatnost donosenja pogresne odluke, na nju se moze utjecati povecanjem velicine uzorka. Ako psiholog zeli postici da jakost statistickog testa u µ1 iznosi 0.80, pri istoj razini znacajnosti, bit ce mu potrebni dodatni resursi zbog veceg broja osoba koje je potrebno testirati.
Koristeci prethodno izvedenu formulu za velicinu uzorka dobivamo
n ≥ (
n ≥ 56.48,
pri cemu je zα = 1.64, z1−γ = −0.841. Dakle, ako psiholog zeli smanjiti vjerojatnost donosenja pogresne odluke kada je µ1 =
105, dobiva se da je potreban uzorak od 57 osoba.
Sa Slike 4.1. mozemo iscitati koliko iznosi jakost testa u µ1 = 105 za svaku velicinu uzorka. Tako za n = 78, ona iznosi 0.80. Za n = 145 je π(µ1) = 0.99, a kako nije moguce postici vrijednost 1, nije potrebno dalje povecavati velicinu uzorka. Dosta vremena, ali i novca potrebno je utrositi u testiranje sto je ponekad nemoguce izvesti te se u praksi najcesce zahtjeva snaga testa od 0.80.
20 40 60 80 100 120 140 n
0.2
0.4
0.6
0.8
1.0
ΠHΜ1L
Slika 4.1. Prikaz odnosa velicine uzorka n i jakosti testa π(µ1)
Na Slici 4.2. prikazan je graf funkcije jakosti testa za testiranje H0 : µ = 100 prema H1 : µ = 105, za razlicite velicine uzorka. Mozemo uociti da prilikom testiranja postoji vjerojatnost od 0.05 da se odbaci hipoteza H0 kada je ona istinita. Takoder je moguce iscitati jakost testa u µ1 = 105 za navedene velicine uzorka. Vidljivo je da graf funkcije jakosti testa brze raste prema 1 sto je uzorak veci.
1Vrijednosti za zα i z1−γ mogu se iscitati iz tablica vrijednosti funkcije normalne distribucije (vidi [7]) ili izracunati koristenjem nekog statistickog programa.
15
n=145
n=78
n=57
n=40

Primjer 4.1.3 (Jednostrani test za ocekivanje normalne distribucije). Neka je X = (X1, . . . , Xn) jednostavan slucajan uzorak iz normalne distribucije, tj. Xi ∼ N (µ, σ2) pri cemu je σ2 nepoznato. Potrebno je analizirati jakost testa za testiranje hipoteze H0 : µ = µ0 prema H1 : µ > µ0.
Postavimo hipoteze:
Potrebno je prvo odrediti kriticno podrucje. Ono ce biti odredeno koristenjem metode kvocijenta vjerodostojnosti.
Kako su oba parametra nepoznata to znaci da je parametar θ vektorski parametar oblika θ = (µ, σ2). U tom slucaju skup dozvoljenih vrijednosti je Θ = {(µ, σ2) : µ ∈ R, σ2 > 0}.
Fiksiramo µ0. Time smo odredili skup Θ0 ⊆ Θ, a dan je s Θ0 = {(µ0, σ 2) : σ2 > 0}.
Sada je moguce testirati hipotezu H0 u odnosu na hipotezu H1. Funkcija vjerodostojnosti dana je s
L(µ, σ2) = 1
(2πσ2) n 2
2σ2 Σni=1(xi−µ)2 .
Potrebno je odrediti tocku u kojoj funkcija vjerodostojnosti postize maksimum. Kako je funkcija vjerodostojnosti jednakog oblika kao i u Primjeru 3.1.1.1, jedna komponetna te tocke je vec izracunata, a drugu komponentu dobivamo analogno.
Dakle, max θ∈Θ
L(θ) = L(θ1), pri cemu je θ1 = (x, s2 n), a s2
n = 1
(xi − x)2.
Kako bi smo mogli odrediti kvocijent vjerodostojnosti potrebno je odrediti i L(θ0), a
ono glasi max θ∈Θ0
L(θ) = max σ2>0
2 0), pri cemu je σ2
0 = 1
Raspisemo li kvocijent λ(x) = L(θ0)
L(θ1) dobivamo da je kriticno podrucje Cr odredeno s:(∑n
i=1(xi − µ0)2∑n i=1(xi − x)2
)−n 2
≤ c. (4.7)
Sredivanjem gornjeg izraza na sljedeci nacin∑n i=1(xi − µ0)2∑n i=1(xi − x)2
≥ c− 2 n
n · nµ2
0)
n∑ i=1
(xi − x)2 te je u tom slucaju s2 n = n−1
n s2 n.
Daljnjim sredivanjem dobivamo:
Cr =
sn
√ n, a ima t(n − 1) distribuciju
ukoliko je H0 istinita hipoteza. Konstantu c0 odredimo iz zahtjeva α = Pµ0(|T (X)| ≥ c0). Dobiva se sljedece:
α = Pµ0(T (X) ≥ c0)
= 1− Pµ0(T (X) ≤ c0)
= 1− F (c0)
pri cemu je F (x) studentova funkcija distribucije s n stupnjeva slobode. Iz toga proizlazi da je c0 = F−1 (1− α).
Analiziramo funkciju jakosti ovog statistickog testa
π(µ) = Pµ(T (X) ≥ tα)
(4.10)
Kako bi izracunali π(µ) potrebno je znati distribuciju od T (X). Ukoliko je H0 istinita hipoteza µ = µ0 onda je T (X) ∼ t(n− 1) pa je π(µ0) = α jer je tako odabrano kriticno podrucje. U slucaju istinitosti hipoteze H1, prava vrijednost µ nije tocno odredena, a time ni distribucija od T (X).
Analizu funkcije jakosti testa u uvjetima istinitosti hipoteze H1 analiziramo uz pret- postavku da je µ = µ1 prava vrijednost nepoznatog parametra, pri cemu je µ1 > µ0.
Dakle, za µ = µ1 test-statistika T (X) nema t(n − 1) distribuciju, nego X − µ1
sn
√ n ima
t(n− 1) distribuciju. Oznacimo s F (x) funkciju distribucije t(n− 1).
Time dobivamo
= P
(4.11)
Vrijednost funkcije jakosti testa za dani µ1 iznosi π(µ1) = 1−F ( tα −
µ1 − µ0
) .
Mozemo uociti da je π(µ1) neprekidna i monotono rastuca funkcija po µ1, za µ1 > µ0, sto znaci da najveca moguca vjerojatnost pogreske II. tipa moze biti jako velika, tj.
sup µ1>µ0
(1− π(µ1)) = 1− π(µ0) = 1− α.
To znaci da, ukoliko je prava vrijednost parametra µ blizu µ0 vjerojatnost pogreske ne odbacivanjem H0 moze biti jako velika.
Dodatne informacije o mogucem iznosu ocekivanja µ, koji suprotstavljamo vrijednosti u H0, ponekad omogucuju kontrolu velicine pogreske II. tipa. Pretpostavimo da dodatne informacije omogucuju postavljanje hipoteza:
H0 : µ = µ0
H1 : µ ≥ µ1, (4.12)
pri cemu je µ1 > µ0. Prethodna analiza jamci da je u tom slucaju najveca moguca vjerojatnost pogreske II.
tipa
U takvim slucajevima π(µ1) mozemo iskoristiti za odredivanje velicine uzorka po- trebne za postizanje zeljene snage testa.
Pretpostavimo da zeljena snaga testa iznosi γ te izrazimo razliku µ1−µ0 = ksn, k > 0. Kako bi odredili potrebnu velicinu uzorka postavimo π(µ1) = γ te dobivamo
1− F ( tα −
√ n
tα − t1−γ k
Dakle, velicina uzorka n treba biti n ≥ (tα − t1−γ)2
k2 .
U slucaju da je velicina uzorka poznata tada je potrebno odrediti k kako bi postojala
.

U Primjeru 4.1.4. na konkretnoj situaciji ilustrirana je analiza jakosti statistickog testa za jednostrani test postavljen u prethodnom primjeru.
Primjer 4.1.4. U nedavno obnovljenom ekskluzivnom restoranu, kapaciteta 55 mjesta, zaposleno je 5 konobara. U 12 dana zabiljezen je sljedeci broj gostiju u vecernjem ter- minu:
48, 42, 52, 29, 35, 32, 36, 46, 55, 45, 34, 38.
Vlasnik restorana zaposlit ce jos 2 konobara u slucaju da prosjecan broj gostiju bude veci od 35. S obzirom na jaku konkurenciju nije siguran moze li ocekivati takvu situaciju kroz cijelu sezonu. Ako se na osnovu 12 dana donese odluka o zaposljavanju novih kono- bara, koliko iznosi vjerojatnost da ce ispravno odbaciti hipotezu H0 na razini znacajnosti od 0.05? Koliko dana je potrebno pratiti broj gostiju u restoranu kako bi donosenje takve odluke rezultiralo vjerojatnoscu pogreske II. tipa od najvise 0.10, pri istoj razini znacajnosti?
Postavimo hipoteze:
H0 : µ = 35
H1 : µ = 41.
Testiranje hipoteza provodeno je u R-u. Dobivena realizacija test-statistike je 2.406772 te ukazuje na odbacivanje nul-hipoteze na razini znacajnosti 0.05, jer se realizacija test- statistike nalazi u intervalu [1.795885,∞, pri cemu je sn = 8.27. Uvrstavajuci podatke u (4.11), za µ1 = 41, neistinitu hipotezu odbacujemo s vjerojatnoscu
1− F ( tα −
= 0.7559,
0.76, na razini znacajnosti od 0.05. Vjerojatnost da vlasnik restorana ne uoci potrebu za dodatnim konobarima kada su oni stvarno potrebni iznosi 0.24. Ako ucini takvu pogresku, ustedjet ce na osoblju, no ugrozava reputaciju restorana zbog nekvalitetne usluge. Takvom odlukom ugrozava vlastiti posao jer gosti odlaze konkurentima.
20
Kako bi se smanjio rizik pogresne odluke potrebno je uzeti veci broj dana za analizu situacije. Kako bi vjerojatnost pogreske II. tipa sveli na 0.10, iz izracuna
n ≥ (tα − t1−γ)2
0.72552
≥ 18.96,

4.2 Testiranje hipoteza o vjerojatnosti dogadaja
Primjer 4.2.1. (Test za vjerojatnost dogadaja za veliki uzorak) Neka je X = (X1, . . . , Xn) jednostavan slucajan uzorak iz Bernoullijeve populacije. Potrebno je analizirati jakost testa o vjerojatnosti dogadaja za testiranje hipoteze H0 : p = p0 prema H1 : p < p0.
Postavimo hipoteze:
H0 : p = p0
H1 : p < p0.
Kako bi mogli provesti analizu potrebno je odrediti kriticno podrucje te pripadnu test- statistiku. Znamo da je X = (X1, . . . , Xn) jednostavan slucajan uzorak iz Bernoullijeve
distribucije s parametrom p0, p0 ∈ 0, 1. n∑ i=1
Xi ima B(n, p0) distribuciju, pri cemu je
E
Tada je X = p te vrijedi p as∼ 2N
( p0,
te se dobiva p− p0√ p0(1− p0)
√ n koja za velike n priblizno ima N (0, 1) distribuciju.
Dakle, pripadna test-statistika je
√ n, (4.14)
p0(1−p0) n
21
koja priblizno ima N (0, 1) distribuciju u uvjetima istinitosti hipoteze H0. Kriticno podrucje dano je s
Cr =
π(p) = Pp
(4.15)
Ukoliko je p prava vrijednost nepoznatog paramentra onda je izraz (4.15) priblizno jednak sljedecoj vjerojatnosti
P
√ n
) (4.16)
pri cemu je Z ∼ N (0, 1). Ukoliko je H1 istinita hipoteza,prava vrijednost p nije tocno odredena, a time ni distri-
bucija od Z. Analizu funkcije jakosti testa u uvjetima istinitosti hipoteze H1 analiziramo uz pretpostavku da je p = p1 prava vrijednost nepoznatog parametra, pri cemu je p1 < p0.
Dakle, za p = p1 Z nema N (0, 1) distribuciju, nego p− p1√ p1(1− p1)
√ n ima N (0, 1)
distribuciju. Oznacimo s Φ(x) funkciju distribucije N (0, 1).
Time dobivamo
≤ zα
( zα
) .
Pokazimo da je π(p1) monotono padajuca funkcija po p1, za p1 < p0. Radi jedno-
stavnijeg zapisa neka je x = zα
√ p0(1− p0)
p1(1− p1) +
cemo derivaciju funkcije π(p1):
√ n(p0−p1)
≤ 0,
dobivamo da je π(p1) monotono padajuca funkcija po p1 za p1 < p0. Dakle, najveca moguca vjerojatnost pogreske II. tipa moze biti jako velika, tj.
sup p1<p0
(1− π(p1)) = 1− π(p0) = 1− α.
To znaci da, ukoliko je prava vrijednost parametra p blizu p0 vjerojatnost pogreske ne odbacivanjem H0 moze biti jako velika.
23
Dodatne informacije o mogucem iznosu p, koji suprotstavljamo vrijednosti u H0, pone- kad omogucuju kontrolu velicine pogreske II. tipa. Pretpostavimo da dodatne informacije omogucuju postavljanje hipoteza:
H0 : p = p0
H1 : p ≤ p1, (4.18)
pri cemu je p1 < p0. Prethodna analiza jamci da je u tom slucaju najveca moguca vjerojatnost pogreske II.
tipa
U takvim slucajevima π(p1) mozemo iskoristiti za odredivanje velicine uzorka potrebne za postizanje zeljene snage testa.
Pretpostavimo da zeljena snaga testa iznosi γ. Iz izraza (4.17) dobivamo potrebnu velicinu uzorka n,
P

U sljedecem primjeru, za provedeni test, bit ce odredena vjerojatnost s kojom odba- cujemo neistinitu nul-hipotezu te odredena velicina uzorka kako bi se postigla zeljena snaga testa.
Primjer 4.2.2. U pokrajini koja obuhvaca 20 000 stanovnika pojavila se rijetka zarazna bolest. Vlasti tvrde da udio zarazenih osoba ne prelazi dozvoljenu stopu incidencije od 0.3. Na to podrucje poslan je tim strucnjaka koji treba utvrditi je li to istina, odnosno radi li se o potencijalnoj epidemiji.
Kao jedan od pokazatelja zarazenosti uzima se broj leukocita. Ukoliko je on manji od 4× 109 u jednoj litri krvi osoba se smatra zarazenom, a u slucaju epidemije potrebno je poslati poseban tim epidemiologa.
Na uzorku od 100 osoba zabiljezeni su sljedeci rezultati
2.1, 4.7, 4.3, 5.6, 5.3, 1.7, 3.2, 6.2, 8.2, 5.5, 6.2, 1.4, 9.4, 6.6, 2.3, 3.2, 6.6, 4.7, 4.8, 8.7, 4.8, 5.4,
5.7, 4.6, 2.8, 5.7, 2.9, 6.7, 5.6, 4.9, 7.8, 7.5, 4.6, 2.3, 4.3, 4.2, 5.4, 6.8, 7.6, 6.7, 4.7, 4.7, 4.2, 9.7,
8.6, 3.7, 4.7, 6.5, 5.6, 7.7, 4.3, 4.2, 5.4, 1.9, 5.7, 9.7, 4.2, 2.1, 6.6, 6.5, 4.6, 4.7, 8.5, 9.1, 7.4, 6.3,
4.2, 4.6, 5.7, 5.8, 8.6, 6.9, 4.9, 2.7, 4.1, 4.2, 4.7, 5.4, 3.2, 6.7, 4.2, 1.4, 1.2, 8.3, 2.1, 4.2, 4.1, 5.3,
4.2, 0.9, 4.7, 6.5, 6.8, 7.8, 5.6, 4.9, 7.7, 8.4, 9.1, 1.3,
24
odnosno 19 zarazenih osoba. Pretpostavimo da se broj leukocita podvrgava normalnoj distribuciji. Potrebno je pro-
vesti testiranje te u slucaju odbacivanja nul-hipoteze utvrditi s kolikom vjerojatnosti se odbacuje neistinita nul-hipoteza na razini znacajnosti 0.01. Kolika velicina uzorka je potrebna kako bi vjerojatnost pogreske ne odbacivanja nul-hipoteze bila manja od 0.10, uz razinu znacajnosti 0.01?
Postavimo hipoteze:
H0 : p = 0.3
H1 : p = 0.19.
Testiranje hipoteza provodeno je u R-u. Realizacija test-statistike je −2.400397, a s obzirom da se nalazi u intervalu −∞,−2.326348], znaci da odbacujemo hipotezu H0 na razini znacajnosti 0.01.
Neistinitu hipotezu H0, uvrstavajuci u (4.17), odbacujemo s vjerojatnoscu
P
= 0.53.
Vjerojatnost pogreske da se ne odbaci neistinita hipoteza H0 u ovom slucaju iznosi 0.47. Dakle, postoji velika vjerojatnost da se napravi pogreska angaziranja posebnog tima epidemiologa, a da to nije potrebno. Njihovo angaziranje moze dovesti do znatno vecih troskova, nego da se primjerice provede cijepljenje ostatka populacije. Stoga je potrebno odrediti velicinu uzorka za koju bi vjerojatnost te pogreske bila manja od 0.10.
Uvrstavanjem podataka u formulu (4.19), u Primjeru 4.2.1., dobiva se:
√ n =
1

4.3 Testiranje hipoteza o razlici populacijskih ocekivanja
Primjer 4.3.1. Neka su X = (X1, . . . , Xn1) te Y = (Y1, . . . , Yn2) dva jednostavna slucajna uzorka iz normalne distribucije, tj. Xi ∼ N (µ1, σ
2 1) i Yi ∼ N (µ2, σ
2 2), pri cemu
2 poznate i vrijedi σ2 1 = σ2
2 = σ2. Neka je d = µ1 − µ2. Potrebno je provesti analizu jakosti testa za testiranje hipoteze H0 : µ1 − µ2 = d0 prema H1 : µ1 − µ2 > d0.
Postavimo hipoteze:
H0 : µ1 − µ2 = d0
H1 : µ1 − µ2 > d0.
Prvo je potrebno odrediti kriticno podrucje te pripadnu test-statistiku. U tu svrhu
promatramo razliku X − Y , pri cemu je X ∼ N ( µ1,
σ2 1
Kako je σ2 1 = σ2
2 = σ2 te zbog nezavisnosti dobiva se da X−Y ima N ( µ1 − µ2, σ
2 (n1 + n2)
Ako se provede postupak standardizacije dobiva se pripadna test-statistika T (X,Y) = X − Y − d0
σ √
koja ima N (0, 1) distribuciju ako je H0 istinita.
Tada je kriticno podrucje odredeno je s
Cr =
σ √
π(d) = Pd
σ √
) .
Kako bi izracunali π(d) potrebno je znati distribuciju od T (X,Y). Ukoliko je H0
istinita hipoteza µ1 − µ2 = d0, tada je T (X,Y) ∼ N (0, 1) pa je π(d0) = α jer je tako odabrano kriticno podrucje.
26
Ako je H1 istinita hipoteza, tada prava vrijednost d nije tocno odredena, a time ni distribucija od T (X,Y). Analizu funkcije jakosti testa u uvjetima istinitosti hipoteze H1 analiziramo uz pretpostavku da je d = d1 prava vrijednost nepoznatog parametra, pri cemu je d1 > d0. Dakle, za d = d1 test-statistika T (X,Y) nema N (0, 1) distribuciju, nego X − Y − d1
σ √
n1n2
ima N (0, 1) distribuciju. Oznacimo s Φ(x) funkciju distribucije N (0, 1).
Time dobivamo
π(d1) = Pd
σ √
Vrijednost funkcije jakosti za dani d1 iznosi π(d1) = 1−Φ
( zα −
) .
Mozemo uociti da je π(d1) neprekidna i monotono rastuca funkcija po d1, za d1 > d0, sto znaci da najveca moguca vjerojatnost pogreske II. tipa moze biti jako velika, tj.
sup d1>d0
(1− π(d1)) = 1− π(d0) = 1− α.
To znaci da, ukoliko je prava vrijednost parametra d blizu d0 vjerojatnost pogreske ne odbacivanjem H0 moze biti jako velika.
Dodatne informacije o mogucem iznosu razlike ocekivanja d, koji suprotstavljamo vri- jednosti u H0, ponekad omogucuju kontrolu velicine pogreske II. tipa. Pretpostavimo da dodatne informacije omogucuju postavljanje hipoteza:
H0 : d = d0
H1 : d ≥ d1, (4.20)
pri cemu je d1 > d0. Prethodna analiza jamci da je u tom slucaju najveca moguca vjerojatnost pogreske II.
tipa
27
U takvim slucajevima π(d1) mozemo iskoristiti za odredivanje velicine uzorka potrebne za postizanje zeljene snage testa.
Pretpostavimo da zeljena snaga testa iznosi γ te izrazimo razliku d1−d0 = kσ, k > 0. Kako bi odredili potrebnu velicinu uzorka postavimo π(d1) = γ te dobivamo
1− Φ
Neka je n1 = n2 = n.
.
Ukoliko je potrebno odrediti velicinu uzorka n iz prethodnog racuna dobiva se
n ≥ 2
.

U Primjeru 4.3.2. bit ce odredena vjerojatnost pogreske ne odbacivanja neistinite nul-hipoteze te odredena velicina uzorka kako bi se ta vjerojatnost smanjila.
Primjer 4.3.2. Farma muznih krava zeli povecati proizvodnju mlijeka prelaskom na nov nacin prehrane. U tu svrhu na slucajan nacin odabrano je 40 krava koje ce biti podvrgnute novom nacinu prehrane te 40 krava koje ce ostati na starom nacinu prehrane. Tijekom 3 tjedna za svaku kravu se mjeri dnevni prinos mlijeka.
Zabiljezeni su sljedeci prosjecni dnevni prinosi mlijeka za svaku kravu s novom prehranom:
45, 52, 33, 38, 47, 56, 39, 42, 46, 52, 58, 47, 38, 32, 44, 49, 43, 52, 53, 45,
47, 52, 56, 53, 42, 37, 39, 41, 46, 56, 48, 42, 52, 51, 49, 43, 52, 39, 37, 45
sa starom prehranom:
41, 38, 42, 44, 39, 47, 37, 41, 46, 45, 43, 39, 46, 42, 46, 38, 42, 36, 46, 42,
39, 47, 49, 50, 39, 37, 28, 33, 39, 43, 39, 38, 48, 42, 48, 46, 38, 42, 47, 52.
28
Potrebno je provesti testiranje kako bi se utvrdilo je li nov nacin prehrane povecao prinos mlijeka, uz razinu znacajnosti testa od 0.05. Kolika je u tom slucaju vjerojatnost pogreske da ne uoce razliku s novim nacinom prehrane, a ona stvarno postoji? Koliko je ukupno krava potrebno uzeti u oba uzorka, ako se zahtjeva da snaga testa iznosi 0.90 uz istu razinu znacajnosti?
Neka je X slucajna varijabla kojom modeliramo prosjecni dnevni prinos mlijeka krava hranjenih na nov nacin te Y slucajna varijabla kojom modeliramo prosjecni dnevni prinos mlijeka krava hranjenih na stari nacin. Pretpostavimo da su one normalno distribuirane s istom varijancom koja iznosi 8.63.
Postavimo hipoteze: H0 : µ1 − µ2 = 0
H1 : µ1 − µ2 = 3.85.
S obzirom da je µ1 = µ2, test-statistika poprima oblik T (X,Y) = X − Y σ
√ n
2 ∼
N (0, 1). Provede li se testiranje u R-u dobiva se realizacija test-statistike koja iznosi 1.995101,
a nalazi se u intervalu [1.644854,∞. Dakle, odbacujemo nul-hipotezu na razini znacajnosti 0.05.
Kako bi se izracunala vjerojatnost pogreske da ne uoce razliku s novim nacinom pre- hrane kada ona stvarno postoji racunamo jakost testa u µ1 − µ2 = 3.85
1− Φ
= 0.6387
te dobivamo da vjerojatnost takve pogreske iznosi 1 − 0.64 = 0.36. Dakle, vjerojatnost pogreske II. tipa je 0.36. U slucaju donosenja pogresne odluke nece biti iskoristen puni kapacitet proizvodnje te takva odluka u buducnosti moze rezultirati smanjenjem kon- kurentnosti. Stoga se nastoji povecati vjerojatnost donosenja dobre odluke povecanjem velicine uzorka.
Uz zahtjev da snaga testa testa iznosi 0.90, pri istoj razini znacajnosti, uvrstavajuci podatke u odgovarajucu formulu iz Primjera 4.3.1., dobiva se da je velicina potrebnog uzorka barem
29
≥ 85.73,

30
Literatura
[1] B. Barker Bausell, Yu-Fang Li, Power Analysis for Experimental Research, Cambridge, New York, 2002.
[2] B. Basrak, Testiranje statistickih hipoteza, PMF - Matematicki odsjek, Zagreb, http://web.math.pmf.unizg.hr/nastava/stat/files/StatTestovi1.pdf, 20.02.2014.
[3] M. Bensic, N. Suvak, Primijenjana statistika, Odjel za matematiku, Osijek, 2013.
[4] K. K. Himmelreich, K. Smoljak, Testiranje sta- tistickih hipoteza, Tekstilno-tehnoloski fakultet, Zagreb, http://www.ttf.unizg.hr/b-news/news upload files/2009/vijest 27-02-
2009 49a83133421c0/Statisticki testovi.pdf, 20.02.2014.
[5] D. C. Howell, Statistical Methods for Psychology, Duxbury, USA, 2002.
[6] R. C. Mittelhammer, Mathematical Statistics for Economics and Business, Springer-Verlag, New York, 1996.
[7] Z. Pause, Uvod u matematicku statistiku, Skolska knjiga, Zagreb, 1993.
[8] I. Pavlic, Statisticka teorija i primjena, Tehnicka knjiga, Zagreb, 1985.
[9] S. M. Ross, Introduction to Probability and Statistics for Engineers and Scientists, Elsevier, 2004.
[10] N. Sarapa, Teorija vjerojatnosti, Skolska knjiga, Zagreb, 1986.
31
Sazetak
U ovom radu pokazali smo analizu jakosti statistickog testa za odabrana testiranja hipoteza te ukazali na njezinu vaznost. Obuhvacena su testiranja hipoteza o: ocekivanju populacije, vjerojatnosti dogadaja te razlici populacijskih ocekivanja. Za razumijevanje problema analize jakosti statistickog testa dan je pregled osnovnih pojmova. Testira- nja hipoteza provedena su pomocu kriticnog podrucja. U radu je pokazano odredivanje kriticnog podrucja pomocu Neyman-Pearsonova teorema te metode kvocijenta vjerodos- tojnosti. U analizi je odreden eksplicitan oblik funkcije jakosti statistickog testa te za odabranu razinu znacajnosti odredeno kriticno podrucje. Analizirana je vjerojatnost pogreske ostajanja pri netocnoj nul-hipotezi. Kako bi se postigla zeljena snaga testa po- trebno je odrediti odgovarajucu velicinu uzorka. Snaga testa je maksimalna vjerojatnost dobre odluke ukoliko je alternativna hipoteza istinita. Ograniceni resursi postavljaju eticki prihvatljivu razinu snage testa na 0.80-0.90. Uz taj zahtjev na funkciju jakosti testa odredena je potrebna velicina uzorka. Na konkretnim primjerima nastojalo se ukazati na vaznost pomnog planiranja u istrazivanju.
Kljucne rijeci: statisticki test, nul-hipoteza, alternativna hipoteza, kriticno podrucje, Neyman-Pearsonov teorem, funkcija jakosti statistickog testa.
Statistical power analysis and summary
In this paper, we introduced the analysis of the power of the statistical test for selected hypothesis testing, and we pointed out its importance. The following hypothesis testing were included: hypothesis about the population mean, hypothesis about the population proportion and hypothesis about the difference in two population means. For understanding the problem of analyzing the power of statistical test a review of the basic concepts was given. Hypothesis testing was conducted using critical region. In this paper critical region was determined with Neyman-Pearson theorem and likelihood ratio test. In the analysis the explicit form of the power function of the statistical test was determined, and for the chosen significance level critical region was defined. We analyzed the probability of failing to reject the false null hypothesis. In order to achieve the desired statistical power it is necessary to determine sample size. Statistical power is the maximum probability of making the correct decision if the alternative hypothesis is true. Limited resources determine ethically acceptable level of statistical power at 0.80-0.90. With this specific request necessary sample size was determined. Concrete examples were used to point out the importance of careful planning in research.
Key words: statistical test, null hypothesis, alternative hypothesis, critical region, Neyman-Pearson theorem, power function of the statistical test.
32
Zivotopis
Rodena sam 31. svibnja 1989. godine u Nasicama. U razdoblju od 1996. godine do 2004. godine pohadala sam Osnovnu skolu Dore Pejacevic u Nasicama. Ondje sam zavrsila svih osam razreda s odlicnim uspjehom. Godine 2004. upisala sam Srednju skolu Isidora Krsnjavoga u Nasicama, zanimanje ekonomist, i maturirala 2008. godine s odlicnim uspjehom. Iste godine upisala sam Preddiplomski studij matematike na Odjelu za matematiku u Osijeku. Zavrsila sam ga u roku te stekla naziv prvostupnice mate- matike. Godine 2011. upisala sam Diplomski studij Financijske i poslovne matematike na istom fakultetu i trenutno sam apsolventica tog studija. Godine 2013. odobreno mi je polaganje razlike ispita za dovrsenje Sveucilisnog nastavnickog studija matematike i informatike na istom fakultetu. Razlika ispita uspjesno je polozena u 2013./2014. aka- demskoj godini. Tijekom treceg i cetvrog razreda srednje skole primala sam stipendiju na temelju uspjeha i brojnih aktivnosti. Tijekom studija, primala sam stipendiju dvije godine na temelju uspjeha.
33