ocenjivanje aritmeticke sredine osnovnog skupa

21
1. UVOD Reč statistika je prvi put objavljena u prvoj polovini XVIII veka u radovima Gottfried Achenwall-a, profesora univerziteta u Getingenu. On je uveo u praksu naziv statistika i smatrao je da taj naziv dolazi od italijanske reči stato, što znači država. Statistika se prvobitno odnosila na skup numeričkih podataka o stanju posmatrane pojave. Otuda se kao poreklo reči statistika navodi i latinska reč status, što znači stanje, a statistika bi bila opisivanje stanja. Osnovni zadatak statističkih akcija svodio se u početku na prikupljanje podataka o brojnom stanju o brojnom stanju stanovnika, vojnika, poreskih obveznika, imovine, jer su vladari oduvek želeli da znaju kolika je njihova vojna i finansijska moć. Prvi začeci statistike datiraju nekoliko vekova pre naše ere. Prva prebrojavanja, za koja se zna, sprovedena su u Kini još 4000 godina, a u Egiptu 3000 godina pre naše ere. Prvi organizovaniji popisi slobodnih građana rimske republike već su značili nešto za razvoj statistike, a vršeni su svake pete godine, u određeno vreme na određenom mestu. Prvi takav popis izvršen je 550. godine za vladu Servija Tulija. Taj popis Rimljani su nazvali cenzus kako su se kasnije u mnogim zemljama nazivala potpuna statistička snimanja – cenzusi. Začeci statistike, kao naučne discipline nastali su skoro istovremeno u Nemačkoj i Engleskoj u XVII veku, kada se javljaju dve statističke koncepcije. Po jednoj, koju je zastupala Nemačka „Univerzitetska statistika“ inspirisana radovima H. Conring-a i njegovih sledbenika od kojih su najpoznatiji od kojih su najpoznatiji M. Schmeitzel i G. Achenwall, zadatak statistike je sistematizacija podataka o stanovništvu i privredi u cilju vođenja državne politike, bez pretenzija na otkrivanje zakonitosti. Zadatak statistike zasnivao se uglavnom na opisu, 1

Upload: k-vragu-dragana

Post on 12-Aug-2015

175 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Ocenjivanje Aritmeticke Sredine Osnovnog Skupa

1. UVOD

Reč statistika je prvi put objavljena u prvoj polovini XVIII veka u radovima Gottfried Achenwall-a, profesora univerziteta u Getingenu. On je uveo u praksu naziv statistika i smatrao je da taj naziv dolazi od italijanske reči stato, što znači država.

Statistika se prvobitno odnosila na skup numeričkih podataka o stanju posmatrane pojave. Otuda se kao poreklo reči statistika navodi i latinska reč status, što znači stanje, a statistika bi bila opisivanje stanja. Osnovni zadatak statističkih akcija svodio se u početku na prikupljanje podataka o brojnom stanju o brojnom stanju stanovnika, vojnika, poreskih obveznika, imovine, jer su vladari oduvek želeli da znaju kolika je njihova vojna i finansijska moć.

Prvi začeci statistike datiraju nekoliko vekova pre naše ere. Prva prebrojavanja, za koja se zna, sprovedena su u Kini još 4000 godina, a u Egiptu 3000 godina pre naše ere. Prvi organizovaniji popisi slobodnih građana rimske republike već su značili nešto za razvoj statistike, a vršeni su svake pete godine, u određeno vreme na određenom mestu. Prvi takav popis izvršen je 550. godine za vladu Servija Tulija. Taj popis Rimljani su nazvali cenzus kako su se kasnije u mnogim zemljama nazivala potpuna statistička snimanja – cenzusi.

Začeci statistike, kao naučne discipline nastali su skoro istovremeno u Nemačkoj i Engleskoj u XVII veku, kada se javljaju dve statističke koncepcije. Po jednoj, koju je zastupala Nemačka „Univerzitetska statistika“ inspirisana radovima H. Conring-a i njegovih sledbenika od kojih su najpoznatiji od kojih su najpoznatiji M. Schmeitzel i G. Achenwall, zadatak statistike je sistematizacija podataka o stanovništvu i privredi u cilju vođenja državne politike, bez pretenzija na otkrivanje zakonitosti. Zadatak statistike zasnivao se uglavnom na opisu, deskripciji, pa je kasnije ovaj pravac nazvan još i deskriptivna škola ili državopis.

Značajan podstrek bržem razvoju i široj primeni statistike tokom druge polovine XX veka predstavljao je nesumnjivo i nagli razvoj sistema elektronskih računara, koji velikom brzinom absorbuju, prerađuju i emituju informacije. Usavršeni telekomunikacioni sistemi prebacuju čitave blokove sa jednog na drugi kraj sveta, sačinjavajući tako bazu infrastrukture savremenog društva.

Statistika se danas do te mere razvila da i sam njen naziv više ne odgovara savremenoj sadržini. Pomoću statističkih metoda vrše se procene, odmeravaju rizici, istražuju tendencije, analiziraju odnosi i faktori koji ih određuju. Ona se još uvek bavi i kvantitativnom deskripcijom stanja, ali stanja shvaćenog u smislu trenutka ili tačke na dinamičnoj liniji razvoja.

Pod statistikom se danas podrazumeva trostruki sadržaj. Pored statistike u užem smislu ili deskriptivne statistike, ona obuhvata statističku analizu i statističku teoriju.

Statistika u užem smislu ili deskriptivna statistika usmerena je na prikupljanje, obradu i prezentaciju podataka.

Statistička analiza podrazumeva skup statističkih metoda kvantitativne analize pojava i njihovih odnosa, koji omogućuju pribavljanje numeričkih informacija, njihovu kvalitativnu interpretaciju, donošenje zaključaka i formulisanje zakonitosti ponašanja posmatranih pojava.

Statistička teorija iznalazi statističke metode, objašnjava ih, dokazuje i usavršava.

1

Page 2: Ocenjivanje Aritmeticke Sredine Osnovnog Skupa

2. STATISTIČKO ZAKLJUČIVANJE

Statističko zaključivanje predstavlja postupak donošenja zaključaka o vrednostima parametara osnovnog skupa, na osnovu informacija dobijenih iz uzoraka. Statističko zaključivanje se sastoji iz statističkog ocenjivanja i testiranja statističkih hipoteza. Izbor postupka koji ćemo primeniti zavisi od raspoloživih informacija o nepoznatom parametru osnovnog skupa, pre izbora uzorka.

Ako ne raspolažemo podacima na osnovu kojih bismo mogli da pretpostavimo vrednost određenog parametra skupa (najčešće su to aritmetička sredina, proporcija, varijansa, odnosno standardna devijacija skupa), ovu vrednost ćemo oceniti postupkom statističkog ocenjivanja. Budući da numeričku vrednost parametra ocenjujemo na osnovu informacije iz uzorka, ne možemo biti potpuno sigurni u ispravnost donetog zaključka. Zbog toga, zaključak ocenjivanja prihvatamo sa pouzdanošću manjom od 100%.

S druge strane, ako nam je neka od osobina osnovnog skupa poznata ili pretpostavljamo njenu vrednost (vrednost parametra skupa, oblik njegovog rasporeda i sl.), primenićemo postupak testiranja hipoteze. Testiranjem hipoteze ispitujemo da li je došlo do promene vrednosti parametra, odnosno, da li je polazna pretpostavka prihvatljiva. Drugim rečima, ispitujemo da li informacija iz uzorka protivreči ili podržava naše početno uverenje o karakteristici osnovnog skupa. Pošto ne možemo biti potpuno sigurni u ispravnost donetog zaključka, pretpostavku ćemo prihvatiti ili je odbaciti uz određeni rizik da smo pogrešili.

Oblasti statističkog zaključivanja lakše ćemo i deskriptivnije prikazati slikom.

NE DA

Ocenjujemo nepoznati parametar Testiramo hipotezu

2

Osnovni skup

Prost slučajnu uzorak

Da li imamo neku

informaciju

o parametru

Ocenjenu vrednost

parametra izražavamo brojem ili intervalom

Pretpostavljenu vrednost

parametra prihvatamo ili odbacujemo sa

određenim rizikom

Page 3: Ocenjivanje Aritmeticke Sredine Osnovnog Skupa

3. OCENE I NJIHOVE OSOBINE

U postupku statističkog ocenjivanja, zaključak o nepoznatoj vrednosti parametra skupa donosimo odgovarajuće statistike uzorka: nepoznatu vrednost konstante ocenjujemo na osnovu odgovarajuće slučajne promenljive, odnosno na osnovu njene realizovane vrednosti u uzorku, koja je ponovo konstanta. U opštem slučaju, nepoznati parametar skupa obeležavamo sa Statistiku uzorka kojom ocenjujemo taj parametar nazivamo ocenom parametra i

obeležavamo sa , a realizovanu vrednost ocene u izabranom uzorku nazivamo ocenjenom

vrednošću parametra i obeležavamo je sa ’.

Ocenjena vrednost parametra je jedan broj, tj. predstavlja tačku na numeričkoj skali. Zato ’

nazivamo tačkastom ili brojnom vrednošću, a odgovarajuću ocenu, , nazivamo tačkastom

ocenom. Tačkasta ocena je funkcija, predstavljena je algebarskim izrazom (formulom), a numerička vrednost te funkcije, za date vrednosti u uzorku, je tačkasta ocenjena vrednost parametra skupa.

Tabela 1. Parametri skupa i njihove ocene1

Parametar

(konstanta)

Ocena

(slučajna promenljiva)

Ocenjena vrednost

(konstanta)

Me me Pr p S s

Ocenjivanje je postupak kojim se numerička vrednost ili vrednosti dodeljuju parametru osnovnog skupa, na osnovu informacija dobijenih iz uzorka. Vrednost(i) koje se dodeljuju parametru osnovnog skupa, a koja se bazira na vrednosti statistike uzorka se naziva ocenjena

1 Žižić M., Lovrić M., Pavličić D., METODI STATISTIČKE ANALIZE, Ekonomski fakultet, Beograd, 2001. str. 173. 3

Page 4: Ocenjivanje Aritmeticke Sredine Osnovnog Skupa

vrednost parametra skupa.2 Na primer, pretpostavimo da menadžer uzme uzorak od 40 novih radnika i nađe da je prosečno vreme, x, potrebno da oni nauče posao 5,5 sati. Ako on ili ona dodeli ovu vrednost aritmetičkoj sredini skupa, onda se 5,5 sati naziva ocenjena vrednost od . Statistika uzorka korišćena za ocenu parametra skupa se naziva ocena. Tako aritmetička sredina uzorka, X, je ocena aritmetičke sredine skupa , a proporcija uzorka P, je ocena proporcije skupa p.

Postupak ocenjivanja uključuje sledeće etape:

1) Izbor uzoraka.2) Prikupljanje neophodnih informacija od jedinice uzorka.3) Izračunavanje vrednosti statistike uzorka.4) Dodela vrednosti odgovarajućem parametru skupa.

Među brojnim osobinama ocena, u statističkoj literaturi najčešće se govori o nepristrasnosti, efikasnosti, konzistentnosti i dovoljnosti ocene.

Ocena je nepristrasna ocena parametra ako je njena očekivana vrednost (aritmetička

sredina) jednaka parametru :

E ( ) =

Isto tako, aritmetička sredina aritmetičkih sredina uzoraka jednaka aritmetičkoj sredini osnovnog skupa:

E (X) = pa zaključujemo da jeX nepristrasna ocena parametra . Mada vrednostix pojedinih uzoraka najčešće nisu jednake aritmetičkoj sredini skupa, prosek aritmetičkih sredina svih mogućih uzoraka veličine n jednak je parametru .

Ako u svakom prostom slučajnom uzorku izračunamo medijanu (me), zatim formiramo raspored medijana uzoraka i izračunamo očekivanu vrednost ovog rasporeda, dobijamo jednakost:

E (Me) = .Dakle, i medijana uzorka je nepristrasna ocena aritmetičke sredine osnovnog skupa. Takođe

važi:E (Pr) = ,

pa je proporcija uzorka nepristrasna ocena proporcije skupa.

Za razliku od navedenih ocena, varijansa uzorka, ako bismo je računali po formuli:

2 Prem S. Mann, UVOD U STATISTIKU, 2008. str. 370.4

Page 5: Ocenjivanje Aritmeticke Sredine Osnovnog Skupa

ne bi zadovoljila ovaj uslov. Varijabilitet u uzorcima je po pravilu manji od varijabiliteta u osnovnom skupu. Zbog toga su i varijanse većine uzoraka (veličine n) manje od 2. Budući da je E (s2) ≠ 2, varijansa s2 je pristrasna ocena varijanse 2, a kako je E (s2) < 2, kažemo da s2

potcenjuje vrednost varijanse skupa; ovo posebno važi kada ocenjivanje vršimo pomoću malih uzoraka.

Osobina nepristrasnosti, ma kako potrebna, nije dovoljna da bi ocena parametra bila

valjana. Na primer, ocena može da bude istovremeno nepristrasna i da istovremeno ima veliku

varijansu. Tada ocenjene vrednosti ’ u pojedinim uzorcima značajno odstupaju od vrednosti

parametra pa se u zaključku može javiti velika slućajna greška. Zato, pored nepristrasnosti, dobru ocenu treba da karakteriše što manji varijabilitet. Kažemo da je jedna nepristrasna ocena efikasnija od druge ako ima manju varijansu, odnosno standardnu grešku, za istu veličinu uzorka.

Budući da su X i Me obe nepristrasne ocene aritmetičke sredine skupa, izabraćemo onu sa manjom varijansom. Međutim, odnos između varijansi ovih ocena nije stabilan već se menja u zavisnosti od rasporeda osnovnog skupa. Ako je osnovni skup normalno raspoređen, između varijansi ove dve ocene važi sledeća relacija:

2Me = 1,572

X

Dakle,X je 57% efikasnija ocena od Me. Ali, ako osnovni skup ima raspored više spljošten od normalnog (kod kojeg su mogućnosti javljanja velikih vrednosti velike), Me je efikasnija ocena u odnosu naX.

Ocena je konzistentna ako sa povećanjem veličine uzorka ona teži parametru Kako n

raste, realizovane vrednosti ’ u uzorcima sve se više koncetrišu oko a za n = poklapaju se

sa vrednošću parametra. Na primer, statistikaX je konzistentna ocena aritmetičke sredine .X je nepristrasna, a sa povećanjem uzorka njena varijansa, 2

X = 2/n, teži nuli, tj. realizovane vrednostixu uzorcima teže da se izjednače sa .

I s2 je konzistentna ocena varijanse 2, što znači da konzistentna ocena ne mora biti nepristrasna. Iako znamo da je s2 pristrasna ocena varijanse skupa, sa porastom n njena pristrasnost nestaje, a njena varijansa teži nuli.

Ocena je dovoljna ako koristi sve informacije koje uzorak sadrži o tom parametru.X je dovoljna ocena parametra , dok Me nije (ne zavisi od vrednosti svih elemenata u uzorku, već prestavlja pozicionu srednju vrednost). Takođe, proporcija uzorka Pr, predstavlja dovoljnu ocenu proporcije skupa.

5

Page 6: Ocenjivanje Aritmeticke Sredine Osnovnog Skupa

Navedene osobine predstavljaju kriterijume za poređenje više ocena istog parametra. Na osnovu ovih kriterijuma biramo najbolju ocenu, kojom ocenjujemo nepoznatu vrednost parametra Poređenjem osobinaX i Me, aritmetičku sredinu skupa ocenjivaćemo najčešće pomoćuX. Pored toga što zavoljava navedene osobine, aritmetička sredina uzorka je tzv. linearna ocena

parametra . Osobina linearnosti znači da ocena predstavlja linearnu funkciju n opservacija u

uzorku, tj:

= a1X1 + a2X2 + ... + aiXi +...+ anXn,

gde konstante ai ne zavise od Xi. Aritmetičku sredinu možemo da prikažemo u sledećem obliku:

X = (1/n)X1 + (1/n)X2 + ... + (1/n)Xi + ... + (1/n)Xn;

sve konstante ai ovde su jednake 1/n. Za razliku odX, medijana uzorka nije linearna ocena aritmetičke sredine skupa.

Na osnovu osobina ocena ostalih parametara skupa, nepoznata vrednost proporcije ocenjuje se pomoću proporcije Pr, dok se varijansa 2 ocenjuje pomoću s2.3

4. OCENJIVANJE ARITMETIČKE SREDINE OSNOVNOG SKUPA

Ocenjene vrednosti mogu biti tačkaste ili intervalne. Ako izaberemo uzorak i izračunamo vrednost statistike uzorka za ovaj uzorak, onda ova vrednost predstavlja tačkastu ocenjenu vrednost odgovarajućeg parametra skupa.

Na primer, pretpostavimo da Popisni biro ocenjuje prosečne mesečne izdatke za kulturu četvoročlanih domaćinstava u Beogradu, i da u prostom slučajnom uzorku od 200 domaćinstava, oni iznose 6000 dinara. Prihvatimo li ovu vrednostx, kao ocenjenu vrednost parametra , onda bi Popisni biro mogao da tvrdi, da prosečni mesečni izdaci, za sva domaćinstva, iznose oko 6000 dinara. Ali, izvesno je da će biro pogrešiti, jer je većina aritmetičkih sredina uzoraka bliska, ali retko jednaka aritmetičkoj sredini skupa. Ako je biro pri tom izabrao još i redak uzorak koji, u odnosu na , ima malu ili veliku aritmetičku sredinu, dobićemo deformisanu sliku o osnovnom skupu. Pored toga, ako iz jednog skupa biro izabere više uzoraka iste veličine, njihove aritmetičke sredine će se razlikovati među sobom, pri čemu se ne može odrediti koja od njih je najbliža prosečnoj vrednosti skupa. Neophodan je podatak o preciznosti tačkaste ocene.4

Preciznije podatke dobijamo kada, umesto jednom vrednošću, aritmetičku sredinu skupa ocenimo intervalom vrednosti, formiranim okoX. Takvu ocenu nazivamo intervalnom ocenom, a

3 Žižić M., Lovrić M., Pavličić D., METODI STATISTIČKE ANALIZE, Ekonomski fakultet, Beograd, 2001. str. 173-176.

4 Prem S. Mann, UVOD U STATISTIKU, 2008. str. 371.6

Page 7: Ocenjivanje Aritmeticke Sredine Osnovnog Skupa

interval okoX intervalom pouzdanosti (ili intervalom poverenja). U slučaju intervalnog ocenjivanja, umesto pridruživanja jedne vrednosti parametru osnovnog skupa, konstruiše se interval oko tačkaste ocenjene vrednosti za koji se veruje da sadrži odgovarajući parametar skupa. Ovaj interval bi trebao da bude toliko širok da, uzimajući u obzir slučajna kolebanja aritmetičkih sredina uzoraka oko artimetičke sredine skupa, on obuhvati i stvarnu vrednost . Ali, ako bismo formirali veoma širok interval koji bi sigurno sadržao vrednost , on ne bi bio informativan. S druge strane, ako formiramo uzak interval, on ne mora da sadrži vrednost aritmetičke sredine skupa, odnosno, postoji rizik da je zaključak pogrešan. Ipak, na osnovu rezultata teorije verovatnoće, veličinu ovog rizika možemo da kontrolišemo ukoliko koristimo slučajan uzorak.

Što se tiče primera o prosečnim izdacima za kulturu četvoročlanih domaćinstava u Beogradu, umesto da kažemo da oni mesečno po domaćinstvu iznose 6000 dinara, možemo formirati interval oduzimanjem nekog broja od 6000 dinara i dodavanjem istog broja na 6000 dinara. Onda tvrdimo da ovaj interval sadrži aritmetičku sredinu skupa, . Pretpostavimo da oduzimamo 2500 dinara od 6000 dinara i da dodajemo 2500 dinara broju 6000 dinara. Kao posledicu dobijamo inetrval (6000din – 2500din) do (6000din + 2500din), ili interval od 3500 dinara do 8500 dinara. Onda tvrdimo da interval od 3500 dinara do 8500 dinara verovatno sadrži aritmetičku sredinu skupa , što znači da su prosečni mesečni izdaci za kulturu, za sva četvoročlana domaćinstva u Beogradu, između 3500 dinara i 8500 dinara. Ovaj postupak se zove intervalno ocenjivanje. Vrednost od 3500 dinara predstavlja donju granicu intervala, a 8500 dinara predstavlja gornju granicu intervala. Broj koji se oduzima i dodaje na tačkastu ocenjenu vrednost zove se marginalna greška. Grafički je interval predstavljen na Slici 1.

Slika 1: Intervalno ocenjivanje5

x

x = x = 6000din

3500din 8500din

5 Prem S. Mann, UVOD U STATISTIKU, 2008. str. 372.7

Page 8: Ocenjivanje Aritmeticke Sredine Osnovnog Skupa

Nameće se sledeće pitanje: Koji broj bi trebalo da oduzmemo i dodamo tačkastoj ocenjenoj vrednosti, da bismo dobili intervalnu ocenjenu vrednost? Odgovor na ovo pitanje zavisi od:

1) Standardne devijacije X aritmetičke sredine uzorkaX (ili standardne greške)2) Nivoa pouzdanosti, koji je pripisan intervalu

Prvo, što je veća standardna devijacija odX, veći je broj koji oduzimamo i dodajemo tačkastoj ocenjenoj vrednosti. Prema tome, očigledno je da ukoliko je raspon vrednosti kojeX može uzeti veći, to interval formiran oko aritmetičke sredine uzorka, mora biti širi da obuhvati . Drugo, veličina koja je oduzeta i dodata mora biti veća ukoliko želimo interval veće pouzdanosti. Intervalnom ocenjivanju uvek pripisujemo određeno tvrđenje iz teorije verovatnoće, koje se iskazuje preko nivoa pouzdanosti. Interval konstruisan uz određeni nivo pouzdanosti je interval pouzdanosti, koji se određuje na sledeći način:

Tačkasta ocenjena vrednost Marginalna greška

Nivo pouzdanosti koji je pridružen intervalu poverenja pokazuje koliko možemo biti sigurni da ovaj interval sadrži pravu vrednost parametra skupa. Nivo pouzdanosti se označava sa (1-α)100% Kada nije izražen u procentima, zove se koeficijent pouzdanosti i obeležava sa 1 – α.

Iako se bilo koja vrednost nivoa pouzdanosti može izabrati za konstrukciju intervala poverenja, najčešće vrednosti su 90%, 95% i 99%. Odgovarajući koeficijenti pouzdanosti su 0,90, 0,95 i 0,99.6

5. OCENJIVANJE ARITMETIČKE SREDINE OSNOVNOG SKUPA KADA JE STANDARDNA DEVIJACIJA SKUPA POZNATA

Postoje tri moguća slučaja:

Slučaj I. Ako su ispunjena sledeća tri uslova: 1) Standardna devijacija skupa je poznata2) Veličina uzorka je mala (tj. n < 30)3) Osnovni skup iz koga se uzima uzorak ima normalnu raspodelu,

onda koristimo normalnu raspodelu za određivanje intervala poverenja za , jer je uzoračka raspodela odX normalna sa aritmetičkom sredinom i standardnom devijacijom X = / n, ako je n / N ≤ 0,05.

6 Prem S. Mann, UVOD U STATISTIKU, 2008. str. 373.8

Page 9: Ocenjivanje Aritmeticke Sredine Osnovnog Skupa

Slučaj II. Ako su ispunjena sledeća dva uslova:1) Standardna devijacija skupa je poznata2) Veličina uzorka je velika (tj. n ≥ 30),

opet koristimo normalnu raspodelu za određivanje intervala poverenja za , jer prema centralnoj graničnoj teoremi, uzoračka raspodela odX je (približno) normalna sa aritmetičkom sredinom i standardnom devijacijom X = / n, ako je n / N ≤ 0,05.

Slučaj III. Ako su ispunjena sledeća tri uslova:1) Standardna devijacija skupa je poznata2) Veličina uzorka je mala (tj. n < 30)3) Osnovni skup iz koga se uzima uzorak nema normalnu raspodelu (ili je njegova raspodela

nepoznata),onda koristimo neparametarski metod za određivanje intervala poverenja za .

Sledeći dijagram sažeto prikazuje tri gore pomenuta slučaja.

je poznato

Slučaj I Slučaj II Slučaj III1. Osnovni skup ima normalnu raspodelu n ≥ 30 1. Osnovni skup nema normalnu raspodelu 2. n < 30 2. n < 30

Korišćenje normalne Korišćenje neparametarskog raspodele za ocenu metoda za ocenu

Interval poverenja za : (1 – α)100% interval poverenja za u gore pomenutim slučajevima I i II je

x zX

gde je X = / n

Vrednost z se dobija iz tablice standardizovane normalne raspodele, za zadati nivo pozdanosti. Vrednost zX u formuli intervala poverenja zove se marginalna greška i označava sa E. Marginalna greška je vrednost koja je oduzeta i dodata vrednosti x, kako bi se dobio interval poverenja za . Znači: E = zX

6. OCENJIVANJE ARITMETIČKE SREDINE OSNOVNOG SKUPA KADA STANDARDNA DEVIJACIJA SKUPA NIJE POZNATA

9

Page 10: Ocenjivanje Aritmeticke Sredine Osnovnog Skupa

Postoje tri moguća slučaja:

Slučaj I. Ako su ispunjena sledeća tri uslova: 1) Standardna devijacija skupa nije poznata2) Veličina uzorka je mala (tj. n < 30)3) Osnovni skup iz koga se uzima uzorak ima normalnu raspodelu,

onda koristimo t raspodelu za određivanje intervala poverenja za .

Slučaj II. Ako su ispunjena sledeća dva uslova:1) Standardna devijacija skupa nije poznata2) Veličina uzorka je velika (tj. n ≥ 30),

onda, opet koristimo t raspodelu za određivanje intervala poverenja za .

Slučaj III. Ako su ispunjena sledeća tri uslova:1) Standardna devijacija skupa nije poznata2) Veličina uzorka je mala (tj. n < 30)3) Osnovni skup iz koga se uzima uzorak nema normalnu raspodelu (ili je njegova raspodela

nepoznata),onda koristimo neparametarski metod za određivanje intervala poverenja za .

Sledeći dijagram sažeto prikazuje tri gore pomenuta slučaja.

nije poznato

Slučaj I Slučaj II Slučaj III3. Osnovni skup ima normalnu raspodelu n ≥ 30 1. Osnovni skup nema normalnu raspodelu 4. n < 30 2. n < 30

Korišćenje t raspodele Korišćenje neparametarskog za ocenu metoda za ocenu

6.1. t RASPODELA

10

Page 11: Ocenjivanje Aritmeticke Sredine Osnovnog Skupa

t raspodelu je formulisao W.S. Gosset 1908. i objavio je u radu pod pseudonimom Student. Zbog toga se t raspodela još zove i Studentova t raspodela. t raspodela je donekla slična normalnoj raspodeli. Poput krive normalne raspodele, kriva t raspodele je simetrična oko aritmetičke sredine i nikada se ne spaja sa horizontalnom osom. Ukupna površina ispod krive t raspodele je 1 ili 100%. Međutim, kriva t raspodele je više spljoštena od krive standardizovane normalne raspodele. Drugim rečima, kriva t raspodele je manje izdužena i ima veću raspršenost (veću standardnu devijaciju) od standardizovane normalne raspodele. Međutim, kako se veličina uzorka povećava, t raspodela se približava standardizovanoj normalnoj raspodeli. Jedinice t raspodele se obeležavaju sa t.

Oblik krive t raspodele zavisi od broja stepeni slobode df, koji je jednak razlici veličine uzorka i jedinice tj.

df = n – 1

Broj stepeni slobode je jedini parametar za t raspodelu. Svaki broj stepeni slobode određuje različitu t raspodelu. Kao i kod standardizovane normalne raspodele, aritmetička sredina t raspodele je 0. Ali za razliku od standardizovane normalne raspodele, čija standardna devijacija

iznosi 1, standardna devijacija t raspodele je što je uvek veće od 1. Znači da je standardna devijacija t raspodele veća od standardne devijacije standardizovane normalne raspodele.

Kada su ispunjeni uslovi u slučajevima I i II, koristimo t raspodelu za konstrukciju intervala poverenja za aritmetičku sredinu skupa . Kada standardna devijacija skupa nije poznata, onda je zamenjujemo standardnom devijacijom uzorka S, koja je njena ocena. Iz toga sleda da umesto standardne greške (tj. umesto X = / n) koristimo njenu ocenu:

SX =

Realizovanu vrednost ocene obeležavamo sa sX; ona je tačkasta ocenjena vrednost od X.

Interval poverenja za korišćenjem t raspodele: (1 – α)100% interval poverenja za je

x tsX

gde je

sX =

11

Page 12: Ocenjivanje Aritmeticke Sredine Osnovnog Skupa

t vrednost je dobijena iz tablice t raspodele za n – 1 stepeni slobode i za dati nivo pouzdanosti. Ovde je tsX marginalna greška ocene tj.7

E = tsX

7 Prem S. Mann, UVOD U STATISTIKU, 2008. str. 385-388.12

Page 13: Ocenjivanje Aritmeticke Sredine Osnovnog Skupa

7. EMPIRIJSKI POSTUPAK

Komercijalna banka sprovela je anketu na uzorku od 1600 domaćinstava i utvrdila da je prosečni dug domaćinstva, na kreditnoj kartici, iznosio 8452 dinara u 2008. godini. Standardna devijacija tih dugova, za sva domaćinstva, u 2007. godini bila je 2480 dinara. Zadatak je da se formira 99% interval poverenja, za prosečni dug na kreditnoj kartici u 2007. godini, za sva domaćinstva.

n = 1600

x = 8452

= 2480

nivo pouzdanosti = 99% ili 0,99

U ovom zadatku poznata nam je standardna devijacija skupa . Iako nam je oblik raspodele osnovnog skupa nepoznat, uzorak je veliki (n > 30), što znači da je u pitanju slučaj II. Da bismo odredili interval poverenja za , prvo izražavamo standardnu devijaciju odX.

X = = = 62 dinara

Da bismo pronašli z za nivo pouzdanosti od 99%, prvo izračunamo površinu na krajevima raspodele, koja iznosi (1 – 0,99) / 2 = 0,0050. U tablici normalne raspodele, potražimo vrednosti 0,0050 i 0,0050 + 0,99 = 0,9950 i dobijamo dve vrednosti za z. Te dve vrednosti su -2,58 i 2,58. Dalje ćemo u formuli za izračunavanje intervala poverenja koristiti da je z = 2,58.

Interval poverenja za biće:

x zX = 8452 2,58*62 = 8452 159,96 = od 8292,04 din. do 8611,96 din.

Marginalna greška je 159,96 dinara, a sa pouzdanošću od 99% možemo tvrditi da je prosečni dug domaćinstavau 2008. godini, na kreditnoj kartici, bio između 8292, 04 dinara i 8611,96 dinara.

Širina intervala poverenja zavisi od toga kolika je marginalna greška zX, koja zavisi od vrednosti z, i n, jer je X = / n. Međutim, vrednost nije pod kontolom istraživača. Znači, širina intervala poverenja zavisi od:

1) vrednosti z, koja je određena nivoom pouzdanosti2) veličine uzorka n

Nivo pouzdanosti određuje vrednost z, a ona određuje veličinu marginalne greške. Kako se nivo pouzdanosti povećava, to se povećava i vrednost z, a kako se nivo pouzdanosti smanjuje i

Page 14: Ocenjivanje Aritmeticke Sredine Osnovnog Skupa

vrednost z se menja. Na primer, vrednost z je približno 1,65 za nivo pouzdanosti od 90%, 1,96 za nivo pouzdanosti od 95% i približno 2,58 za nivo pouzdanosti od 99%. Prema tome, što je nivo pouzdanosti veći, širi je interval poverenja, ako ostale vrednosti ostaju nepromenjene.

Za istu vrednost , povećanje veličine uzorka dovodi do smanjenja vrednosti X, što ima za posledicu smanjenje marginalne greške, ako je nivo pouzdanosti nepromenjen. Stoga, povećanjem veličine uzorka smanjuje se širina intervala poverenja.

Tako, ako hoćemo da smanjimo širinu intervala poverenja imamo dve mogućnosti:1) da smanjimo nivo pouzdanosti2) povećamo veličinu uzorka

Smanjenje nivoa pouzdanosti nije dobar izbor, jer niži nivo pouzdanosti može da da manje pouzdane rezultate. Zato bi uvek trebalo da povećamo veličinu uzorka ako želimo da smanjimo širinu intervala poveranja.

Nivo pouzdanosti i širina intervala poverenjaAko u prethodnom primeru smanjimo nivo pouzdanosti na 95%, iz tablice normalne

raspodele z je tada 1,96, pa je

x zX = 8452 1,96*62 = 8452 121,52 = od 8330,48 din. do 8573,52 din.

Poredeći ovaj interval poverenja sa onim dobijenim u prethodnom primeru, vidimo da je širina intervala poverenja za nivo pouzdanosti od 95% manja od one za nivo pouzdanosti od 99%.

Veličina uzorka i širina intervala poverenjaPretpostavimo da je u prethodnom primeru izvršena promena veličine uzoraka i da je on

sada 3600, a ostali podaci su isti. Izračunavamo standardnu devijaciju aritmetičke sredine uzorka za n = 3600:

X = = = 41,33 dinara

Onda je 99% interval poverenja za jednak:

x zX = 8452 2,58*41,33 = 8452 106,81 = od 8345,19 din. do 8558,81 din.

Poredeći dobijeni interval poverenja sa onim koji je izračunat u ranijem primeru, možemo da primetimo da je širina 99% intervala poverenja za n = 3600 manja od širine 99% intervala poverenja kada je n = 1600.

Page 15: Ocenjivanje Aritmeticke Sredine Osnovnog Skupa

LITERATURA:

[1] Žižić M., Lovrić M., Pavličić D., METODI STATISTIČKE ANALIZE, Ekonomski fakultet, Beograd, 2001.

[2] Prem S. Mann, UVOD U STATISTIKU, 2008.

[3] http://sr.wikipedia.org/sr-el/ statistika