8. metoda uzoraka

29
8. METODA UZORAKA

Upload: keiki

Post on 06-Jan-2016

56 views

Category:

Documents


2 download

DESCRIPTION

8. METODA UZORAKA. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 8. METODA UZORAKA

8. METODA UZORAKA

Page 2: 8. METODA UZORAKA

• Prikupljanje podataka o obilježjima svih jednica statističkog skupa često je preskupo ili zahtijeva previše vremena, a katkad nije ni moguće, ako je on npr. beskonačan – u takvim slučajevima vrši se reprezentativno promatranje kojim se obuhvaća samo dio jedinica statističkog skupa

• Pojava koja se želi upoznati ili istražiti tom metodom zove se populacija ili osnovni skup, a njezin dio koji se u tu svrhu ispituje zove se uzorak

• Uzorak je reprezentativan ako po svojim osnovnim karakteristikama nalikuje na osnovni skup (umanjena slika osnovnog skupa)

Page 3: 8. METODA UZORAKA

• Nužno je sastaviti jasan i precizan plan odabira elemenata u uzorak

• Plan sadrži:

– ciljeve istraživanja,

– određivanje statističkih skupova - utvrditi što je jedinica skupa, opseg skupa, definirati skup pojmovno, prostorno i vremenski

– određivanje okvira izbora:

• popis jedinica osnovnog skupa iz kojeg se izabire uzorak, npr. registri poslovnih subjekata ili

• popis jedinica izbora uzoraka koje obuhvaćaju više elemenata osnovnog skupa, npr., istražujemo li pomoću uzorka stavove punoljetnog pučanstva, jedinica izbora može biti osoba, ali i kućanstvo ili stambena zgrada

Page 4: 8. METODA UZORAKA

– podatke koje treba prikupiti,

– model uzorka (nacrt, dizajn):

• troškovi,

• osobitosti osnovnih skupova,

• način izbora elemenata u uzorak za svaki izbor

• utvrđuju se izrazi za statističko-analitičke veličine iz uzorka, među kojima su i izrazi za veličine pogrešaka zbog primjene uzorka

– raspoloživa sredstva,

– postupke prikupljanja podataka

Page 5: 8. METODA UZORAKA

• Uzorkom se dolazi do procjene karakteristika osnovnog skupa, a statističkom metodom određuje se pouzdanost i preciznost te procjene – svi ti postupci čine metodu koja se zove metoda uzoraka ili reprezentativna metoda

• S obzirom na način izbora jedinica, razlikuje se:

NAMJERNI UZORAK

– izabiru se jedinice prema odluci istraživača (anketara)

– ispituju se dostupni članovi skupa

– izabiru se jedinice u sklopu kvota

Ne može se brojčano izraziti veličina pogreške, pa se

primjenjuju metode deskriptivne statistike

Page 6: 8. METODA UZORAKA

SLUČAJNI UZORAK

– svaki član skupa ima vjerojatnost izbora u uzorak veću od nule

– podaci se analiziraju prema načelima inferencijalne statistike (procjenjuju se nepoznati parametri i testiraju hipoteze o njima i oblicima rasporeda osnovnih skupova)

– mogu se izračunati pogreške nastale primjenom uzorka – važno za prosudbu kakvoće zaključivanja

Page 7: 8. METODA UZORAKA

METODA UZORAKA

PROCJENA PARAMETARA POPULACIJE

POMOĆU UZORKA

TESTIRANJE HIPOTEZA O NEKIM

KARAKTERISTIKAMA

•projektiranje veličine uzorka•interval procjene AS populacije

•interval procjene totala populacije•interval procjene proporcije populacije

•testiranje hipoteze o nepoznatoj AS•ispitivanje jednakosti AS dvaju populacija•testiranje hipoteza o nepoznatoj proporciji•testiranje hipoteze o jednakosti dvaju ili

više populacija s pomoću 2 - testa

Page 8: 8. METODA UZORAKA

PROCJENA ARITMETIČKE SREDINE OSNOVNOG SKUPA

• AS osnovnog skupa μ je parametar koji se procjenjuje:

– Brojem npr. zanimaju li nas prosječna primanja stanovnika nekog područja, možemo izabrati uzorak od n stanovnika tog područja, izračunati AS uzorka i zaključiti da su ona istovjetna prosječnim primanjima stanovnika cijelog područja

– Intervalomformiramo interval određene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. veća je vjerojatnost da će se u njemu naći AS osnovnog skupa

Page 9: 8. METODA UZORAKA

• Interval procjene AS populacije gradimo tako da AS uzorka s jedne strane dodamo, a s druge strane oduzmemo stanoviti broj

zi standardnih pogrešaka procjene – broj ovisi o željenoj pouzdanosti intervalne procjene

• Broj zi se naziva koeficijent pouzdanosti procjene (koeficijent povjerenja)

• Najčešće se formiraju intervali procjene s 95%-tnom pouzdanosti, a u tom slučaju koeficijent povjerenja iznosi 1.96 (očitava se iz tablice površine ispod normalne krivulje: 0.95 : 2 = 0.4750)

Page 10: 8. METODA UZORAKA

• Interval procjene AS glasi:

Središnja točka intervala je AS uzorka x oko koje se gradi

interval, sa željom da se u njemu nađe AS populacije μ

P = pouzdanost

γ (gama) = vjerojatnost pogreške u procjeni AS populacije

(1 γ) = pouzdanost intervalne procjene

2 2

1x x

P x z x z

Page 11: 8. METODA UZORAKA

Osim koeficijenta povjerenja, mora se izračunati i standardnapogreška AS. U izrazima za njezino računanje koriste se sljedeći simboli:

= standardna pogreška procjene AS populacije

σ = standardna devijacija populacije (ako je otprilike poznata)

s = standardna devijacija uzorka

= standardna devijacija populacije procijenjena pomoću uzorka

N = opseg populacije

n = opseg uzorka

f = frakcija izbora. To je odnos veličine uzorka i veličine

populacije, tj. f = n / N. Recipročna vrijednost frakcije

izbora N / n zove se korak izbora

x

Page 12: 8. METODA UZORAKA

Izraz za standardnu pogrešku aritmetičke sredine populacije

Uvjeti za primjenu izraza

x n

σ poznata i f < 0.05

1x

N n

Nn

σ poznata i f ≥ 0.05

ˆx n

σ nije poznata i f < 0.05

ˆ

1x

N n

Nn

σ nije poznata i f ≥ 0.05

1x

s

n

σ nije poznata i f < 0.05

11x

s N n

Nn

σ nije poznata i f ≥ 0.05

Page 13: 8. METODA UZORAKA

• za uzorke veće od 30 jedinica koeficijent pouzdanosti z uzimamo

iz tablice površina ispod normalne razdiobe:

z = 1.96 (uz 95% pouzdanosti procjene)

z = 2.58 (uz 99% pouzdanosti procjene)

• za uzorke manje od 30 jedinica koeficijent pouzdanosti z ne

možemo uzeti iz tablice površina ispod normalne razdiobe već ga

uzimamo iz Studentove tablice za k = n 1 stupnjeva slobode,

uz željenu vjerojatnost procjene (najčešće 0.95 ili 0.99)

Page 14: 8. METODA UZORAKA

• studentova distribucija tabelirana je tako da se iz tablice očitava koeficijent t za određenu proporciju jedinica koje se odbacuju s njezina desnog kraja

• u pretkoloni tablice su navedeni stupnjevi slobode, a u zaglavlju su koeficijenti t za proporcije jedinica 0.10, 0.05, 0.025, 0.01 i 0.005 smještenih na desnom kraju distribucije

• želimo li npr. napraviti intervalnu procjenu AS populacije s 95% pouzdanosti, moramo formirati interval takve širine da se u njemu nađe proporcija od 0.95 jedinica Studentove distribucije. U tom je slučaju proporcija preostalih jedinica smještenih na krajevima distribucije 1 0.95 = 0.05. Na desnom kraju distribucije se tada nalazi proporcija jedinica 0.05 : 2 = 0.025 pa ćemo traženi koeficijent pouzdanosti naći u stupcu t.025 i u retku koji odgovara broju stupnjeva slobode u konkretnom slučaju (veličini uzorka umanjenoj za jedan)

Page 15: 8. METODA UZORAKA

• želimo li npr. intervalnu procjenu s 95%-tnim povjerenjem, a uzorak je veličine 20, traženi se koeficijent pouzdanosti (povjerenja) nalazi u tabeli Kritične vrijednosti t, Studentove distribucije na presjeku 19. retka i stupca t.025 i iznosi 2.093

Page 16: 8. METODA UZORAKA

PRIMJER 1. Na otoku koji ima 1620 domaćinstava slučajno smo izabrali 100 domaćinstava i zabilježili za svako od njih koliko hektara obradive zemlje posjeduje. Izračunali smo aritmetičku sredinu tog uzorka koja je iznosila 1.83 ha. Pomoću standardne devijacije tog uzorka procijenili smo standardnu devijaciju populacije i dobili s = 1.36 ha. Izračunajte s 99% pouzdanosti kolika je prosječna površina obradive zemlje svih domaćinstava na tom otoku.

N = 1620, n = 100, x = 1.83, = 1.36,

99% pouzdanosti z = 2.58

1000.06

1620

n

N > 0.05

Page 17: 8. METODA UZORAKA

Traženi je interval procjene:

ˆ 1.36 1620 1000.13

1 1620 1100x

N n

Nn

2 2

1x x

P x z x z

1.83 2.58 0.13 1.83 2.58 0.13 0.99P

1.49 2.17 0.99P

Prosječna površina obradive zemlje na promatranom otoku nalazi se između 1.49 ha i 2.17 ha uz 99% pouzdanosti

Page 18: 8. METODA UZORAKA

PRIMJER 2. Od 186 elemenata jednog osnovnog skupa slučajno smo izabrali 20 jedinica. Aritmetička sredina tog uzorka iznosi 2.5, a standardna devijacija je 1.204. Uz 95% pouzdanosti procijenite aritmetičku sredinu promatrane populacije.

N = 186, n = 20, x = 2.5, s = 1.36,

95% pouzdanosti t = 2.093

200.11

186

n

N > 0.05

Page 19: 8. METODA UZORAKA

Traženi je interval procjene:

AS promatrane populacije nalazi se između 1.96 i 3.04 uz 95% pouzdanosti

1.204 186 200.26

1 186 11 20 1x

s N n

Nn

2 2

1x x

P x t x t

2.5 2.093 0.26 2.5 2.093 0.26 0.95P

1.96 3.04 0.95P

Page 20: 8. METODA UZORAKA

PROCJENA TOTALA OSNOVNOG SKUPA

• Total T je zbroj vrijednosti numeričke varijable konačnog

osnovnog skupa. Ako konačni osnovni skup ima N elemenata,

tada je AS populacije:

odatle slijedi da se u procjeni totala populacije može pogriješiti

N puta onoliko koliko se griješi u procjeni njezine AS

1

N

ii

xT

N N

T N

Page 21: 8. METODA UZORAKA

• kao procjena totala populacije brojem (simbol ) služi nam AS

uzorka pomnožena opsegom populacije, tj.

• za intervalnu procjenu totala potrebna je i standardna pogreška

totala (simbol )

T

T N x

T

ˆ xTN

Page 22: 8. METODA UZORAKA

• interval procjene totala osnovnog skupa glasi:

ili, za mali uzorak (n < 30):

ˆ ˆ2 2

ˆ ˆ 1T T

P T z T T z

ˆ ˆ2 2

ˆ ˆ 1T T

P T t T T t

Page 23: 8. METODA UZORAKA

PRIMJER 3. U svrhu ispitivanja vremena potrebnog za dolazak na rad, od 915 djelatnika jedne tvrtke anketirano je 150 osoba. Pomoću tog uzorka dobiveni su ovi rezultati: prosječno vrijeme je 47 minuta, a standardna pogreška AS uzorka 0.0747. Izračunajte 99% pouzdan interval procjene totala osnovnog skupa, tj. ukupno vrijeme potrebno za dolazak na rad svih djelatnika promatrane tvrtke.

N = 915, n = 150, x = 47, = 0.0747

99% pouzdanosti z = 2.58

x

ˆ 915 47 43005T N x

Page 24: 8. METODA UZORAKA

Interval procjene:

ˆ 915 0.0747 68.35xT

N

ˆ ˆ2 2

ˆ ˆ 1T T

P T z T T z

43005 2.58 68.35 43005 2.58 68.35 0.99P T

42829 43181 0.99P T

Ukupno vrijeme potrebno za dolazak na rad svih djelatnika promatrane tvrtke nalazi se između 42829 minuta i 43181 minuta uz 99% pouzdanosti

Page 25: 8. METODA UZORAKA

• Proporcija konačnog osnovnog skupa je parametar koji

označava omjer članova skupa s određenim oblikom obilježja M

i opsega skupa N, tj.

• proporciju preostalih N M jedinica koje nemaju traženo

obilježje označavamo sa q:

PROCJENA TOTALA OSNOVNOG SKUPA

Mp

N

N Mq

N

Vrijedi: p + q = 1

Page 26: 8. METODA UZORAKA

• procjenitelj proporcije osnovnog skupa brojem je proporcija

uzorka: , gdje je m broj članova uzorka s određenim

oblikom obilježja, a n veličina uzorka

• Standardna pogreška računa se pomoću izraza:

ˆm

pn

ˆn m

qn

ˆ

ˆ ˆ

1p

p q

n

ako je f < 0.05

ˆ

ˆ ˆ

1 1p

p q N n

n N

ako je f ≥ 0.05

Page 27: 8. METODA UZORAKA

• interval procjene proporcije za velike uzorke:

• za male uzorke procjenjivanje na ovakav način nije moguće

• kao kriterij za dovoljnu veličinu uzorka može se primijeniti pravilo:

ˆ ˆ2 2

ˆ ˆ 1p pP p z p p z

ˆ ˆn p q > 9

Page 28: 8. METODA UZORAKA

PRIMJER 4. Građevinski poduzetnik treba preuzeti pošiljku od 5000 keramičkih pločica. Među 200 pločica, izabranih na slučajan način iz pošiljke, nađeno je 40 pločica druge klase. Uz pouzdanost od 90% procijenite proporciju pločica druge klase u cijeloj pošiljci.

Kako je tražena pouzdanost 90% , iz tablice za površinu ispod

normalne krivulje treba očitati koeficijent pouzdanosti z za

površinu koja iznosi polovinu pouzdanosti, tj. za 0.90 : 2 = 0.45.

Među površinama navedenim u tablicama nema površine koja

iznosi točno 0.45, pa ćemo potražiti onu koja je najbliža tom

broju. U ovom su slučaju to dvije površine: 0.4495 i 0.45053, pa

se možemo odlučiti ili za z = 1.64 ili z = 1.65

40ˆ 0.2

200p

Page 29: 8. METODA UZORAKA

• Konstruirat ćemo interval pouzdanosti s koeficijentom z = 1.64

• interval pouzdanosti:

2000.04

5000

nf

N < 0.05

ˆ

ˆ ˆ 0.2 0.80.028

1 200 1p

p q

n

ˆ ˆ2 2

ˆ ˆ 1p pP p z p p z

0.2 1.64 0.028 0.2 1.64 0.028 0.90P p

0.172 0.228 0.90P p

Uz pouzdanost 90% procjenjujemo da se udio pločica druge klase u cijeloj pošiljci kreće između 17.2 i 22.8%