definicija masovne pojave definicije osnovnih pojmova...
TRANSCRIPT
5/22/2017
1
1
Definicije osnovnih pojmova, statističko istraživanje i prikupljanje
podataka
Definicija masovne pojave
• Pojava koja se manifestuje na velikom broju objekata.
• Primjeri masovnih pojava:
• proizvodnja,
• uvoz i izvoz,
• prodaja,
• poslovni rezultat,
• trajanje bankarske transakcije.2
Definicija statistike
• Statistika - grupa naučnih metoda ...
• Statistika - nauka ...
• Statistika - skup ureñenih numeričkihpodataka...
3
UVIJEK U VEZI SA MASOVNOM POJAVOM.
Definicija statističke jedinice i populacije
• Statistička jedinica - element koji posjedujeobilježja na osnovu kojih se istražuju varijacijemasovne pojave.
• Populacija (osnovni skup) - skup statističkih
jedinica.• Veličina populacije - broj statističkih jedinica koje
sačinjavaju jednu populaciju (N).4
5/22/2017
2
Tipovi varijabli, distribucije frekvencija i grafikoni
Prodiskutujmo zajedno...
• Sigurno ste nekada mjerili svoju (ili nečiju) težinu, kao i brojali koliko osoba u vašoj užoj porodici ima plavu ili smeñu ili crnu kosu.
• Šta mislite, u čemu je osnovna razlika izmeñu pojmova (varijabli!) “težina” i “boja kose”?
• Kako izražavamo (koje vrijednosti mogu da uzmu) varijable “težina” i “boja kose”?
Definicija statističke varijable
• Osobina ili karakteristika po kojoj se razlikuju jedinicepopulacije
• Matematski: Funkcija koja svakoj statističkoj jedinicikao elementu populacije pridružuje jednu vrijednost.
• Sinonim - obilježje
• Modalitet – vrijednost koju može uzeti statističkavarijabla.
Tipovi mjernih skala –nominalna mjerna skala
• Mjerne skale definišu pravila pridruživanja za formiranjestatističke varijable.
• Nominalna mjerna skala• Atributivno (opisno) data lista obilježja po kojima se razlikuju
statističke jedinice.
• Poredak modaliteta je nebitan.
• Svaki modalitet ima isti relativni značaj, te njihovo uporeñivanje ilirangiranje nije moguće prema objektivnom kriteriju.
• Nisu dozvoljene matematičke operacije.
• Jedino je moguće izvršiti prebrojavanje u kontekstu formiranjadistribucije frekvencija.
5/22/2017
3
Tipovi mjernih skala – ordinalna mjerna skala
• Ordinalna mjerna skala• Modaliteti opisno izraženi, moguće ih je porediti i
rangirati prema nekom logičnom redosljedu iobjektivnom kriteriju.
• Poredak bitan, nemaju svi modaliteti isti značaj.
• Dozvoljeno prebrojavanje i logičke operacijeporeñenja (<,=,>), ali ne i matematičke operacije.
• Moguće opisno date modalitete zamijeniti rangovima(1., 2., 3., ...).
Tipovi mjernih skala – intervalna mjerna skala
• Intervalna mjerna skala• Numerički dati modaliteti, ali položaj nule se
arbitrarno odreñuje.
• Nula ne znači odsustvo pojave (nije “prirodna” već“dogovorena” nula).
• Razlike u mjernim osobinama elemenata supredstavljene razlikama brojeva na intervalnoj skali.
• Dozvoljeno prebrojavanje, poreñenje i oduzimanje.
Tipovi mjernih skala – metrička mjerna skala
• Metrička mjerna skala
• Numerički dati modaliteti i posjeduje “prirodnu” nulu.
• Nula znači odsustvo pojave (“prirodna” nula).
• Dopuštene sve logičke i matematičke operacije.
• Omogućava najprecizniju i najopširniju analizu.
Tipovi statističkih varijabli prema tipu mjerne skale
• Kvalitativna statisti čka varijabla
• Nominalna ili atributivna
• odgovara joj nominalna mjerna skala
• npr. boja automobila
• Ordinalna
• odgovara joj ordinalna mjerna skala
• npr. zvanje univerzitetskog radnika
5/22/2017
4
Tipovi statističkih varijabli prema tipu mjerne skale, cont.
• Kvantitativna statisti čka varijabla
• Prekidna
• može uzeti samo neke ili odreñene vrijednosti iz zadanogintervala
• npr. ocjena na ispitu iz Markeinga, broj prisutnih studenata napredavanju
• Neprekidna
• teoretski može uzeti bilo koju vrijednost iz zadanog intervala
• npr. visina ili težina studenta I godine, dužina proizvoda
Primjer Kojeg su tipa varijable pomoću kojih izražavamo:
• Navršene godine jedne osobe
• Temperaturu u amfiteatru
• Ljubaznost neke osobe
• Bračno stanje
• Način pla ćanja potroša ča u tržnom centru (gotovina,kreditna kartica, ček, potroša čka kartica, ostalo)
Razmislite i prodiskutujmo zajedno...
• Zasigurno ste nekada bili u situaciji da diskutujete o gender strukturi neke grupe.
• Kako ste to radili?
• Prvi korak je bio: izbrojali ste koliko je u grupi pripadnika muškog spola a koliko pripadnica ženskog spola.
• Šta ste vi zapravo uradili?
Frekvencije
• Apsolutna frekvencija - brojpojavljivanja (ponavljanja)datog modaliteta xi.
• Relativna frekvencija -proporcija jedinica statističkogskupa koje imaju istimodalitet.
1
,=
=∑n
i ii
f f N
1
, 1=
= =∑n
ii i
i
fp p
N
5/22/2017
5
Kumulativne apsolutne frekvencije
Rastuća apsolutna kumulanta - koliko podatakaima vrijednost manju ili jednaku vrijednostimodaliteta xi na kojoj se trenutno nalazimo.
1
i
i jj
S f=
=∑
Kumulativne relativne frekvencije
Rastuća relativna kumulanta - koliki je % podatakakoji imaju vrijednost manju ili jednaku vrijednostimodaliteta xi na kojoj se trenutno nalazimo (akopomnožimo sa 100%).
1
i
i jj
F p=
=∑
Primjer
U populaciji od 15 studenata proveli smo anketu sapitanjem: “Koji žanr filma najviše volite?” i dobilisljedeće odgovore:
dramu, triler, komediju, horor, triler, dramu,komediju, triler, akciju, dramu, komediju, akciju,dramu, komediju, dramu
Formirati odgovarajuću distribuciju frekvencija.
Rješenje – osnovni statistički pojmovi
• Populacija?
• Statistička jedinica?
• Veličina populacije
• Varijabla?
• Tip varijable?
• Modaliteti?
5/22/2017
6
Rješenje – distribucija frekvencija
Modaliteti – Filmski žanr
Apsolutne frekvencije - Broj studenata
Akcija 2 Drama 5 Horor 1 Komedija 4 Triler 3 Ukupno 15
Primjer
Na osnovu ispitivanja 35 gradova dobili smo podatke obroju osnovnih škola u jednom gradu:
1, 1, 2, 3, 5, 6, 1, 2, 2, 4, 2, 6, 2, 3, 4, 1, 2, 7, 2, 2, 4, 4, 3,4, 2, 2, 3, 4, 3, 3, 5, 3, 1, 5, 2
Uporediti i komentarisati statističku seriju sa brutopodacima, ureñenu statističku seriju i statističkudistribuciju frekvencija.
Primjer - pitanja
• Izračunati i objasniti relativne frekvencije.
• Izračunati i objasniti apsolutne kumulativne frekvencije.
• Izračunati i objasniti relativne kumulativne frekvencije.
Rješenje – osnovni statistički pojmovi
• Populacija
• gradovi
• Statistička jedinica
• grad
• Veličina populacije
• N=35
• Varijabla
• broj osnovnih škola u gradu
• Tip varijable
• kvantitativna prekidna
• Modaliteti
• 1,2,3,4,5,6,7
5/22/2017
7
Rješenje – ureñena serija
• Serija koju imamo u postavci zadatka je statisti čka serijasa bruto podacima , to je baza podataka u koju smoupisivali podatke za svaki grad („nesreñeni ili nabacanipodaci“).
• Da bismo dobili ureñenu statisti čku seriju moramo sortiratipodatke po veličini:
1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4,4, 4, 4, 4, 4, 5, 5, 5, 6, 6, 7
Rješenje – distribucija frekvencija
Krajnji oblik grupisanja podataka je statisti čkadistribucija frekvencija , kada svakom modalitetuvarijable (modaliteta ima n jer je riječ o prekidnojvarijabli sa malim brojem modaliteta) pridružimonjemu odgovarajuću apsolutnu frekvenciju:
• - i- ti modalitet posmatrane varijable
• - apsolutna frekvencija i -tog modaliteta
• n - broj modaliteta
ix
if
Rješenje – radna tabela (neintervalno grupisanje)
Rastuća apsolutna kumulanta - S
5
16
23
29
32
34
35
Broj osnovnih škola - x
Apsolutna frekvencija - f
1 5
2 11
3 7
4 6
5 3
6 2
7 1
Σ 351
i
i jj
S f=
= ∑
Rastuća apsolutna kumulanta
Rješenje – radna tabela (neintervalno grupisanje), cont.
Rastuća relativna kumulanta - F
0,1429
0,4571
0,6571
0,8286
0,9143
0,9714
1,0000
Broj osnovnih škola - x
Relativna frekvencija –p=f/N
1 5/35=0,1429
2 11/35=0,3143
3 7/35=0,2000
4 6/35=0,1714
5 3/35=0,0857
6 2/35=0,0571
7 1/35=0,0286
Σ 1,0000 1
i
i jj
F p=
=∑
Rastuća relativna kumulanta
5/22/2017
8
Primjer
Za 25 domaćinstava imamo informacije o veličini zemljišnog posjeda (u ha):
12,3 13,4 14,8 8,3 13,6 12,4 12,0 12,8 11,2 13,8 15,0 13,2 16,2 12,7 11,7 13,9 13,0 9,5 14,5 12,7 16,0 13,5 10,2 9,6 14,8
• Formirati statističku distribuciju frekvencija (širina intervala2).
• Odrediti centre intervala.
Rješenje – osnovni statistički pojmovi
• Populacija • zemljišni posjedi
• Statistička jedinica
• posjed
• Veličina populacije• N=25
• Varijabla
• veličina posjeda
• Tip varijable• kvantitativna neprekidna (kontinuirana)
Rješenje – odreñivanje širine intervala
• N=25,
•
• Formiramo intervale širine (veličine, amplitude)l=2 i za date intervale (n=5) odreñujemoapsolutne frekvencije na osnovu prebrojavanjabruto podataka.
min max8,3 16,2x x= =
Radna tabela – distribucija frekvencija (intervalno grupisanje)
iR -
intervali if -
apsolutne frekvencije
8-10 3 10-12 3 12-14 13 14-16 4 16-18 2
25
5/22/2017
9
Radna tabela – intervalno grupisanje, centri intervala
ci
9
11
13
15
17
Ri fi8-10 3
10-12 3
12-14 13
14-16 4
16-18 2
25
1 2
2j j
i
L Lc
+=
PrimjerZa zadanu distribuciju frekvencija:
• Odrediti relativne frekvencije.
• Odrediti relativne rastuće kumulativne frekvencije.
• Objasniti:• apsolutnu frekvenciju drugog intervala.
• relativnu frekvenciju petog intervala
• relativnu rastuću kumulativnu frekvenciju trećeg intervala.
Broj opravki Broj dana 25-30 2 30-35 6 35-40 9 40-45 8 45-50 5 suma 30
Rješenje – radna tabela
iR if ii
fp
N= iF
25-30 2 0,0667 0,0667 30-35 6 0,2000 0,2667 35-40 9 0,3000 0,5667 40-45 8 0,2667 0,8334 45-50 5 0,1666 1,0000 suma 30 1,0000
Grafičko predstavljanje statističkih varijabli
• Korištenje grafikona predstavlja odličan način da se pojednostavi prikazivanje i razumijevanje obimnog i složenog materijala kao što su poreñenja, obrasci i trendovi u podacima.
• Na primjer, umjesto da analizirate nekoliko kolona brojeva radnog lista, možete koristiti grafikon da biste na prvi pogled uporedili promjene u dinamici upisa u škole izmeñu djevojčica i dječaka u odreñenom vremenskom periodu.
• Izbor grafikona direktno zavisi od tipa statističke varijable.
SLIKA VRIJEDI KOLIKO HILJADU RIJEČI!
5/22/2017
10
Grafičko predstavljanje kvalitativne varijable
• Kvalitativna varijabla može se predstaviti pomoću:
• jednostavnih stubaca
• strukturnog stubca
• strukturnog kruga ili polukruga
• Ako je nominalna varijabla poredak nije bitan, ako jeordinalna varijabla poredak stubaca je bitan i ne smije semijenjati.
• U slučaju kombinovanja više varijabli koristi se:
• strukturni - razdijeljeni stubac
• razdvojeni ili višestruki stupci
• razdijeljeni stupci
• Kod geografske serije moguće je nacrtati i kartogram.
Primjer
Na kursu za manekenke koji je pohañalo 58 djevojakazabilježili smo njihovu boju očiju i dobili sljedećudistribuciju frekvencija:
Grafički predstaviti ovu distribuciju. Analizirati strukturu.
boja očiju broj djevojaka na kursu za manekenke
plava 12 smeña 23 crna 14 zelena 9
Rješenje – osnovni statistički pojmovi
• Riječ je o nominalnoj kvalitativnoj varijabli “boja očiju”.
• Populacija su djevojke sa kursa za manekenke.
• N=58
• Koristićemo sljedeće grafikone:• stupce
• strukturni krug
• strukturni stubac
Rješenje - grafikon stubaca
12
23
14
9
0
5
10
15
20
25
plava smeña crna zelena
bro
j dje
voja
ka
boja o čiju
Možemo mijenjati poredak stubaca , jer je riječ o nominalnoj varijabli .
5/22/2017
11
Rješenje - strukturni krug
21%
40%
24%
15%
plava
smeña
crna
zelena
Rješenje - strukturni stubac
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
zelena
crna
smeña
plava
Rješenje - analiza strukture
Na osnovu prezentiranih strukturnog kruga istrukturnog stupca možemo zaključiti da:
• 39,6% djevojaka imalo je smeñe oči
• 24,1% djevojaka imalo je crne oči
• 20,7% djevojaka imalo je plave oči
• 15,6% djevojaka imalo je zelene oči.
Primjer
Analizirali smo strukturu nastavnog osoblja jednog fakultetaprema naučnom zvanju i dobili informaciju:
Nacrtati grafikon stubaca.
zvanje zaposlenog broj zaposlenih asistent 15 viši asistent 9 docent 10 vanredni profesor 12 redovni profesor 14 ∑ 60
5/22/2017
12
Rješenje – osnovni statistički pojmovi
• Riječ je o ordinalnoj kvalitativnoj varijabli “naučnozvanje”.
• Populaciju čini nastavno osoblje
• N=60
• Ne smijemo prilikom konstruisanja grafikonastubaca mijenjati poredak dat u tabeli, jer je riječ oordinalnoj varijabli.
Rješenje - grafikon stubaca
15
910
1214
0
2
4
6
8
10
12
14
16
asistent viši asistent docent vanredni profesor redovni profesor
bro
j zap
osl
enih
zvanje zaposlenog
Grafičko predstavljanje kvantitativne varijable
Kvantitativna varijabla može se predstaviti zavisno od tipa:
• mali broj podataka, negrupisana serija:• Tukey-ev stablo - list dijagram (S-L)
• x – osa
• grupisana serija ili distribucija frekvencija:• razdijeljeni stupci (prekidna serija, nema intervala)
• strukturni stubac
• strukturni krug
• histogram - spojeni stupci (neprekidna serija, intervali)
• poligon apsolutnih frekvencija
• poligon kumulanti
• linijski dijagram (prekidna neintervalno grupisana serija)
Rješenje
• Numeričko obilježje, mali broj podataka, nema grupisanja
• Podatke prezentujemo na x-osi
27, 14, 22, 8, 12, 25, 18, 5, 22, 19, 30, 4
5/22/2017
13
Rješenje, S-L dijagram
• Stablo – desetice, listovi – jedinice
27, 14, 22, 8, 12, 25, 18, 5, 22, 19, 30, 4
Ili sortirano: 4, 5, 8, 12, 14, 18, 19, 22, 22, 25, 27, 30
Primjer
Broj rasprodaja Broj prodavnica 0 1 1 20 2 23 3 20 4 15 5 12 6 9
Za 100 slučajno odabranih prodavnica pratili smo “brojrasprodaja u toku godine”:
Grafički predstaviti.
Rješenje - grafikon stubaca Rješenje - strukturni krug
1%20%
23%
20%
15%
12%
9% 0
1
2
3
4
5
6
5/22/2017
14
Rješenje - poligon apsolutnih frekvencija
Primjer
Mjesečno primanje (u 100 KM) za 40 radnika bilo je:
Konstruisati: histogram i poligon apsolutne rastuće kumulante.
mjesečno primanje broj radnika 3,5-4,5 3 4,5-5,5 5 5,5-6,5 6 6,5-7,5 10 7,5-8,5 8 8,5-9,5 6 9,5-10,5 2
Rješenje - histogram
3
5
6
10
8
6
2
0
2
4
6
8
10
12
3,5-4,5 4,5-5,5 5,5-6,5 6,5-7,5 7,5-8,5 8,5-9,5 9,5-10,5
broj
radn
ika
mjesečna primanja
Rješenje - poligon apsolutne rastuće kumulante
5/22/2017
15
Deskriptivna statistika – mjere centralne tendencije i mjere
varijabiliteta Mjere srednje vrijednosti
Mjere srednje vrijednosti
• Kod mjerenja mnogih pojava možemo primjetiti da se rezultati grupišu oko jedne karakteristične vrijednosti -mjere srednje vrijednosti
• Sinonim – mjere centralne tendencije
• Srednja vrijednost je konstanta kojom se predstavlja niz varijabilnih podataka.
• Podatak oko kojeg se grupišu ostali podaci u nizu
• Mogu biti:
• Računske (potpune) – uzimaju u obzir sve podatke u nizu
• Pozicione (nepotpune) – uzimaju u obzir samo podatke koji se nalaze na odreñenoj poziciji u nizu
Izbor mjere srednje vrijednosti prema mjernoj skali
Mjerna skala Potpune
mjere srednje
vrijednosti
Medijana Mod
Nominalna NE NE DA
Ordinalna NE NE DA
Numerička DA DA DA
5/22/2017
16
Aritmetička sredina
Aritmetička sredina
• Predstavlja najznačajniju mjeru centralne tendencije.
• Potpuna ili računska mjera centralne tendencije.
• Jednaka je količniku zbira svih observacija i veličine serije.
• Ne preporučuje se njeno korištenje ako u nizu imapodataka koji “kvare” niz, jer je sklona “ekstremima”
• “Osjetljiva” je na promjenu bilo kog podatka iz niza.
Formule za izračunavanje
• Negrupisani podaci
• Neintervalno grupisanipodaci
• Intervalno grupisanipodaci
1
1 1
n nX x f x pi i i iN i i
= ⋅ ⋅ = ⋅∑ ∑= =
1
1 1c c
n nX f pi i i iN i i
= ⋅ ⋅ = ⋅∑ ∑= =
1
1
N
NX xii
= ⋅ ∑=
Osobine - I
• Ako imamo niz podatakakoji su svi jednaki nekojkonstanti c, tada jearitmetička sredina takvogniza jednaka toj konstanti.
• Aritmetička sredina senalazi izmeñu najmanje inajveće vrijednosti u nizu. min maxx X x≤ ≤
const. , 1,ix c i n= = ∀ =
1 1
N N
ii i
x cc N
X cN N N
= = ⋅= = = =∑ ∑
5/22/2017
17
Osobine - II
• Suma odstupanja observacija odaritmetičke sredine je 0.
• Osobina agregiranja aritmetičkesredine.
• Zbir kvadratnih odstupanjavrijednosti numeričke varijable odaritmetičke sredine je minimalan.
( )
( )1
1
0
N
ii
n
i ii
x X
x X f
=
=
− =
= − ⋅ =
∑
∑
1
1
m
j jj
m
jj
N X
XN
=
=
⋅=∑
∑
( ) ( )2 2
1 1
N N
i ii i
x X x a= =
− ≤ −∑ ∑
Osobine - III
• Ako svaku observacijupomnožimo istomkonstantom, aritmetičkasredina novoformiranevarijable jednaka jeproizvodu te konstante iaritmetičke sredine polaznevarijable.
• Ako svakoj observacijidodamo istu konstantu,aritmetička sredinanovoformirane varijablejednaka je zbiru te konstantei aritmetičke sredine polaznevarijable.
i iy b x Y b X= ⋅ ⇒ = ⋅
i iy a x Y a X= + ⇒ = +
Primjer
U uzorak je uzeto 10 turističkih centara i ispitivan je brojturista koji u toku sezone posjete te centre. Podaci susljedeći (izraženi u 1000 turista):
5, 7, 11, 17, 9, 4, 14, 3, 8, 5
Koliko u prosjeku ljudi posjeti turističke centre u tokusezone?
Rješenje
• Mali broj podataka, ostaje negrupisana serija.
• Populacija – turistički centri.
• Turističke centre u toku sezone u prosjeku posjeti 8300turista.
3,88310
11 10
1
=⋅=⋅= ∑=i
ixN
X
5/22/2017
18
Primjer
Sprovedeno je ispitivanje koliko neispravan automobilu prosjeku čeka na popravak i dobiveni rezultati:
• Pomoću histograma predstaviti pojavu.
• Izračunati prosječno vrijeme čekanja na popravak.
vrijeme čekanja (u h) broj automehaničarskih radnji 0-0,5 3 0,5-1 8 1-1,5 11 1,5-2 9 2-2,5 6 2,5-3 3
Rješenje – histogram apsolutnih frekvencija
• neprekidna varijabla
0
2
4
6
8
10
12
0-0,5 0,5-1 1-1,5 1,5-2 2-2,5 2,5-3
broj
aut
omeh
aničar
skih
ra
dnji
vrijeme čekanja
Rješenje - radna tabela, aritmetička sredina
Prosječno vrijeme čekanja na popravak iznosi 1,45 h.
6
1
1i i
i
X c fN =
= ⋅ ⋅∑
ix if
0-0,5 3 0,5-1 8 1-1,5 11 1,5-2 9 2-2,5 6 2,5-3 3 ∑ 40
ix if ic
0-0,5 3 0,25 0,5-1 8 0,75 1-1,5 11 1,25 1,5-2 9 1,75 2-2,5 6 2,25 2,5-3 3 2,75 ∑ 40
ix if ic i ic f⋅
0-0,5 3 0,25 0,75 0,5-1 8 0,75 6 1-1,5 11 1,25 13,75 1,5-2 9 1,75 15,75 2-2,5 6 2,25 13,5 2,5-3 3 2,75 8,25 ∑ 40 58
581,45
40= = Pozicione mjere srednje
vrijednosti – mod, medijana, kvartili, decili i centili
5/22/2017
19
Prodiskutujmo zajedno...
• Šta mislite, koji broj godina ima najviše osoba u ovoj prostoriji? 18? 19? Kako ćete to ustanoviti?
• Prebrojavanjem ćemo ustanoviti koji broj godina se najveći broj puta pojavio. Drugim riječima, koji broj godina ima najveću frekvenciju.
• Vjerovali ili ne, na ovaj način smo odredili mod za varijablu starost osoba u ovoj prostoriji.
Mod (dominantna vrijednost)• Centar aktivnosti ili podatak koji se najčešće javlja.
• Kod nominalnog ili ordinalnog niza to je najčešći modalitet,
• Kod numeričkog niza to je najčešća vrijednost
• Podatak koji ima najveću apsolutnu ili relativnu frekvenciju.
• Mod nije najviša frekvencija, već modalitet koji se veže uznajvišu frekvenciju!!!
• Ne može se odrediti ako ne postoje bar dvije jednakevrijednosti varijable - računa se samo za statističkudistribuciju (grupisanu seriju)
• Grafički se odreñuje na histogramu.
• Mod može imati više različitih vrijednosti, te distribucija možebiti:
• unimodalna
• višemodalna
Odreñivanje (izračunavanje) moda
• Za neintervalno grupisanu distribuciju na osnovunajveće frekvencije ( ) čita se modalnipodatak.
• Za intervalno grupisanu distribuciju frekvencija iz pročitanogintervala naspram najveće frekvencije mod se odreñuje nabazi formule:
oMff =max
( ) ( )1
1
1 1
o o
o o
o o o o
M M
o M M
M M M M
f fM L a
f f f f
−
− +
−= + ⋅
− + −
Prednosti i nedostaci moda
• Prednosti
• Može se odrediti i za kvalitativnu varijablu
• Jednostavno se odreñuje
• Nije osjetljiv na “outliere”
• Nedostaci
• Ne može se uvijek odrediti
• Osjetljiv je na način kako se formira statististička serija i njeni intervali
• Nepouzdan kod asimetričnih distribucija
5/22/2017
20
Medijana (centralna vrijednost)
• Vrijednost obilježja koja u seriji ureñenoj po veličinizauzima centralnu poziciju (rang).
• Dijeli statističku seriju na dva jednaka dijela (u svakomdijelu je po 50% podataka iz niza).
• Odreñuje se na osnovu rastuće kumulante.
• Za razliku od aritmetičke sredine:
• Nije osjetljiva na prisustvo “outliera”.
• Ne reaguje na sve promjene vrijednosti podataka unizu.
Odreñivanje (izračunavanje) medijane
• Prvi modalitet ili interval kod kog je zadovoljeno jemedijana ili interval gdje se nalazi medijana. Ako je riječ ointervalu tada medijanu odreñujemo na bazi formule:
2 Me
NS≤ ↑
1
12
( )
e
e e
e
M
e M MM
NS
M L af R
−− ↑= + ⋅
Kvartili
• Označavaju se sa Q1, Q2 i Q3.
• Vrijednosti varijable koji distribuciju ureñenu po veličini dijele na 4 jednaka dijela
• U svakom dijelu 25% podataka
• Prvi kvartil Q1 jednak vrijednosti varijable od koje 25% elemenata skupa ima jednaku ili manju vrijednost i 75% elemenata skupa ima veću vrijednost posmatranog obilježja.
• Medijana je jednaka drugom kvartilu Me=Q2.
• 75% observacija prethode Q3 i 25% observacija se nalaze poslije Q3.
• Računanje kao kod medijane, sa teorijskim pozicijama: (N/4), (2N/4) i (3N/4).
Primjer 6
Data je distribucija osoba na privremenom radu uinostranstvu, prema starosti stanovništva:
God. starosti Br. osoba 15 – 20 20083 20 – 25 52860 25 – 30 41249 30 – 35 38252 35 – 40 30499 40 – 45 20113 45 – 50 10273 50 – 55 3079 55 - 60 2706
5/22/2017
21
Primjer, cont.
• Odrediti najčešću starost osoba na privremenomradu u inostranstvu.
• Odrediti medijanu. Objasniti.
Rješenje – radna tabela
Ri fi iS ↑
15 – 20 20.083 20.083 20 – 25 52.860 72.943 25 – 30 41.249 114.192 30 – 35 38.252 152.444 35 – 40 30.499 182.943 40 – 45 20.113 203.056 45 – 50 10.273 213329 50 – 55 3.079 216.408 55 - 60 2.706 219.114
∑ 219.114
2 Me
NS≤ ↑
maxf =
Rješenje - mod
Najčešća starost osoba na privremenom radu uinostranstvu iznosi 23,69 godina.
[ [max o52.860 20 25f M= ⇒ ∈ −
( ) ( )
( ) ( )
11
1 1
52.860 20.08320 5 23,69
52.860 20.083 52.860 41.249
o o
o o
o o o o
M M
o M M
M M M M
f fM L a
f f f f
−
− +
−= + =
− + −
−= + =− + −
Rješenje – mod, grafičko odreñivanje
0
10.000
20.000
30.000
40.000
50.000
60.000
15 – 20 20 – 25 25 – 3030 – 35 35 – 40 40 – 4545 – 50 50 – 55 55 - 60
starost
broj o
soba
Modalni stubac
Mo
5/22/2017
22
Rješenje – medijana
[ [219.114109.557 114.192 25 30
2 2 e
NM= = ≤ ⇒ ∈ −
1
1
109.557 72.9432 25 5 29,4441.249
e
e e
e
M
e M MM
NS
M L af
−− ↑ −= + = + ⋅ =
50% osoba na privremenom radu u inostranstvu ima manjeili jednako 29,44 godina, dok 50% osoba na privremenomradu u inostranstvu ima više od 29,44 godina.
Rješenje - medijana, grafičko odreñivanje
0
50.000
100.000
150.000
200.000
250.000
15 20 25 30 35 40 45 50 55 60
gornje granice intervala
apso
lutn
a ra
stuća
kum
ulan
ta
N/2=109.557
Me
Primjer
Sedmične zarade zaposlenih u kompaniji ''ABC'' datesu u tabeli:
Odrediti mod i medijanu. Objasniti.
Zarada u KM Broj zaposlenih 155 8 165 10 175 16 185 17 195 9 205 5 215 2
Rješenje – radna tabela
ix if iS ↑
155 8 8 165 10 18 175 16 34 185 17 51 195 9 60 205 5 65 215 2 67
∑ 67
2 Me
NS≤ ↑
maxf
5/22/2017
23
Rješenje - mod
• Iznos sedmične zarade zaposlenih u kompaniji''ABC'‘ koji se najčešće pojavljuje u analiziranojdistribuciji je 185 KM.
• Navedeno možemo pokazati i na dijagramustubaca.
max 17 185of M= ⇒ =
Rješenje – mod na grafiku stubaca
0
2
4
6
8
10
12
14
16
18
broj zaposlenih
155 165 175 185 195 205 215
zarada u KM
• Najviši stubac odgovara zaradi 185 KM.
Rješenje - medijana
• Kako nema velikog odstupanja stvarne od teorijskemedijalne kumulante, tumačimo da 50% zaposlenihima sedmičnu zaradu 175 KM ili manje, dok 50%zaposlenih ima sedmičnu zaradu višu od 175 KM.
3 2
6733,5 34 175
2 2 e
NS Q M= = ≤ = ↑ ⇒ = =
Mjere varijabiliteta
5/22/2017
24
Zašto su korisne mjere varijabiliteta?
• Na prvoj godini studija, jedan student Ekonomskogfakulteta imao je prosječnu ocjenu 7,5. Na drugoj godinistudija taj student je imao prosječnu ocjenu 8.
• Na kojoj godini studija je student pokazao bolji uspjeh?
• Odgovor na ovo pitanje ne možemo dati sve dok nemamoinformaciju u kojem su obimu varirale ocjene drugihstudenata na prvoj i drugoj godini studija i kolika jeprosječna ocjena ostvarena na svakoj godini studija.
Mjere varijabiliteta
• Nose informaciju o obimu variranja podataka iz niza oko izračunate mjere srednje vrijednosti.
• Ukazuju na postojanje outliera.
• Mogu biti:
• Apsolutne – izražene u jedinici mjere posmatrane varijable
• Relativne – neimenovani broj ili %
Apsolutne mjere varijabiliteta
Apsolutne mjere varijabiliteta
• Raspon variranja
• Prosje čno apsolutno odstupanje
• Interkvartilno apsolutno odstupanje
• Varijansa
• Standardna devijacija
5/22/2017
25
Apsolutne mjere varijabiliteta, cont.
• Raspon variranja
• Najjednostavnija za izračunavanje (ali i najnetačnija i najmanje precizna) mjera grupisanja rezultata oko neke srednje vrijednosti, jer uzima u obzir samo najviši i najniži podatak u nizu
• Bilo koji “osamljeni” ekstremni rezultat (ili “outlier”) značajno povećava raspon variranja a da se grupacija rezultata oko aritmetičke sredine ipak nije bitno promijenila
• Osnovni nedostatak raspona variranje je što je on obično timveći što je veći broj mjerenja neke pojave.
minmax xxR −=
Apsolutne mjere varijabiliteta, cont.
• Varijansa je mjera varijabiliteta podataka iz niza oko aritmetičke sredine.
• Jedinica mjere za varijansu? Tumačenje?
• Standardna devijacija
( ) ( )
( ) ( )
( ) ( )
2 22 2
1 1
2 22
1 1
2 22
1 1
1 1
1 1
N N
i ii i
n n
i i i ii i
n n
i i i ii i
x X x XN N
x X f x f XN N
x X p x p X
σ= =
= =
= =
= ⋅ − = ⋅ − =
= ⋅ − ⋅ = ⋅ ⋅ − =
= − ⋅ = ⋅ −
∑ ∑
∑ ∑
∑ ∑
2σ=σ
Osobine varijanse
• Ukoliko svaki podatak u nizu uvećamo za istu konstantu, varijansa ostaje nepromjenjena.
• Ukoliko svaki podatak u nizu pomnožimo istom konstantom, varijansa se množi sa konstanta2.
2 2,i i y x y xy x a i σ σ σ σ= + ∃ ⇒ = ⇒ =
2 2 2,i i y x y xy b x i b bσ σ σ σ= ⋅ ∃ ⇒ = ⋅ ⇒ = ⋅
Empirijsko pravilo za interpretaciju standardne devijacije
• Ukoliko empirijska distribucija teži “normalnoj distribuciji”, to jeste ima oblik zvona:
– Oko 68% vrijednosti će biti obuhvaćene intervalom (prosjek -/+1 S.D.)
– Oko 95% vrijednosti će biti obuhvaćene intervalom (prosjek -/+2 S.D.)
– Oko 99,7% vrijednosti će biti obuhvaćene intervalom (prosjek -/+3 S.D.)
5/22/2017
26
Upotrebljivost empirijskog pravila• Ako su prosječna primanja u BiH 600 KM sa standardnom
devijacijom 260 KM, to znači da oko 68% populacije u BiH imaprimanja izmeñu 340 i 860 KM i oko 95% populacije ima platu od80 do 1120 KM.
• Ako prosječan Bosanac ili Hercegovac provede 3 sata poredtelevizora dnevno sa standardnom devijacijom od 1 sat, to značida oko 68% bosansko-hercegovačke populacije provodi poredTV-a izmeñu 2 i 4 sata i 95% populacije gleda TV izmeñu 1 i 5sati.
• Ako je prosječna ocjena na Likertovoj skali od 1-5 za političaraXY jednaka 3,0 sa standardnom devijacijom 1,6, to znači da ovogpolitičara 68% populacije ocjenjuje ocjenom od 1,4 do 4,6.
Primjer
Ispit iz predmeta Statistika položilo je 40 studenata. Uslučajno izabranom uzorku od 25 studenata dobijene susljedeće ocjene:
Ocjena Broj studenata
6 7
7 9
8 49 3
10 2
Odrediti i protumačiti apsolutne mjere varijacije.
Rješenje – aritmetička sredina
• Aritmetička sredina 1847,36
25= =
x f x�f6 7 42
7 9 63
8 4 32
9 3 27
10 2 20
Σ 25 184
i ix fX
N
⋅= ∑
x f
6 7
7 9
8 4
9 3
10 2
Σ 25
Rješenje – kvartili
ix if
6 7 7 9 8 4 9 3
10 2 Σ 25
ix if
rastuća apsolutna kumulativna frekvencija -
iS ↑
6 7 7 7 9 16 8 4 20 9 3 23
10 2 25 Σ 25
Za izračunavanje kvartila potrebna nam je rastuća kumulativna frekvencija:
N/4=6,25<7⇒Q1=6
3N/4=18,75<20⇒Q3=8
5/22/2017
27
Rješenje – raspon varijacije, prosječno apsolutno odstupanje
• Raspon varijacije10 6 4= − =
max minRV x x= −
x f
6 7
7 9
8 4
9 3
10 2
Σ 25
Rješenje – varijansa
Prosje čno kvadratno odstupanje podataka od aritmetičke sredine iznosi 1,5104.
37,771,5108
25= =
( )5 22 2
1
1i i
i
x f XN
σ=
= ⋅ ⋅ −
∑
( )5 2
2
1
1i i
i
x X fN
σ=
= ⋅ − ⋅
∑ x f
6 7
7 9
8 4
9 3
10 2
Σ 25
213927,36 1,5104
25= − =
x f (x-xbar)2�f
6 7 12,95
7 9 1,17
8 4 1,64
9 3 8,07
10 2 13,94
Σ 25 37,77
x f (x-xbar)2�f x2�f
6 7 12,95 252
7 9 1,17 441
8 4 1,64 256
9 3 8,07 243
10 2 13,94 200
Σ 25 37,77 1392
Rješenje – standardna devijacija i interkvartilno odstupanje
• Standardna devijacija
Prosje čno linearno odstupanje podataka od aritmetičke sredine iznosi 1,229.
2 1,5104 1,229σ σ= = =
Pitanje
Varijansa plata u preduzeću «XY» za mjesec januar 2007. iznosila je 50 KM2. Zbog dobrog poslovanja preduzeća, menadžment je odlučio da platu svakog radnika za mjesec februar poveća za 10 KM.
Varijansa plata u mjesecu februaru iznosi:a) 40 KM2
b) 50 KM2
c) 10 KM2
d) 60 KM2
5/22/2017
28
Pitanje
Standardna devijacija koncentracije ugljen monoksida u junu iznosila je 10. Uključivanjem postrojenja za centralno grijanje, koncentracija ugljen monoksida u zraku je u januaru bila za 50% veća u odnosu na juni.
Kolika je standardna devijacija koncentracije ugljen monoksida u januaru?
a) 10
b) 15c) 50
Pitanje
Vrijednosti standardne devijacije i varijanse:
1. Nikada nisu negativne
2. Uvijek su pozitivne
3. Nikada nisu jednake nuli
Pitanje
Cijene svih fakultetskih udžbenika slijede “normalnu” distribuciju sa aritmetičkom sredinom 85 KM i standardnom devijacijom 20 KM.
Koristeći empirijsko pravilo odrediti:
A. Procenat fakultetskih udžbenika čija se cijena kreće u intervalu 65 do 105 KM
B. Interval u kojem se nalaze cijene za 99,7% fakultetskih udžbenika
68%
25 – 145 KM
Relativne mjere varijabiliteta
5/22/2017
29
Relativne mjere varijabiliteta
• Relativni (u vidu relativnog broja ili %,daju mogućnost za poreñenjevarijabiliteta serija sa različitimjedinicama mjere)
• koeficijent varijacije
• koeficijent interkvartilnog odstupanja
• z vrijednost
Koeficijent varijacije
• Koeficijent varijacije je relativna mjera varijabiliteta kojumožemo koristiti za uporeñivanje serija sa različitimjedinicama mjere, jer je neimenovani broj.
• Može služiti i za poreñenje nizova gdje su aritmetičkesredine različite.
(%)100⋅σ=X
V
Standardizovane varijable (z-vrijednosti)
• Utvrñivanje relativnog položaja modalitetavarijable u seriji.
• Pogodna za uporeñivanja položaja podataka urazličitim serijama.
, 1,2,...,ii
x Xz i N
σ−= =
Primjer, cont.
• Na prethodnom času smo za varijablu “ocjena na ispituiz Statistike” odredili apsolutne mjere varijacije.
• Izračunali smo:
• Izračunati i objasniti koeficijent varijacije.
1 37,36; 1,229; 6; 8X Q Qσ= = = =
5/22/2017
30
Koeficijent varijacije
• Relativno izraženo variranje podataka oko aritmetičke sredine iznosi 16,7%.
1,229100 100 16,7%
7,36V
X
σ= ⋅ = ⋅ =
Primjer
Za varijablu “dužina radnog staža”, izračunali smo:
Izračunajte i i objasnite koeficijent varijacije.
12,3; 6,16;X σ= =
Rješenje
• Koeficijent varijacije
• Relativno izraženo variranje podataka oko aritmetičke sredine iznosi 50,09%.
6,16100 100 50,09%
12,3V
X
σ= ⋅ = ⋅ =
Primjer
• Student je na prvoj godini studija imao prosječnu ocjenu A=8,2 a na drugoj godini studija B=8,4. Na kojoj godini je ostvario bolji uspjeh?
• Prvoj
• Drugoj
• Ne znam
5/22/2017
31
Rješenje
• Da bismo odgovorili na ovo pitanje potražili smo dodatneinformacije i saznali da je prosječna ocjena na prvoj godinibila 7,3 sa standardnom devijacijom 1,5, dok je na drugojgodini prosječna ocjena bila 8,64 sa standardnomdevijacijom 1,2.
• Već sada vidimo da je na prvoj godini student imao“nadprosječan” uspjeh dok je na drugoj godini imao“ispodprosječan” uspjeh.
Matematski...
8,2 7,30,6 0
1,5AA
A Az
σ− −= = = >
8,4 8,640,2 0
1,2BB
B Bz
σ− −= = = − <
A Bz z>
Pitanje
• Koji pokazatelj ćemo upotrijebiti ako želimo saznati relativnu mjeru variranja podataka oko aritmetičke sredine?
• Koeficijent interkvartilnog odstupanja
• Standardnu devijaciju
• Koeficijent varijacije
• Varijansu
Razmislite i zapišite vaš odgovor:
• Na ispit iz Statistike izašlo je 5 studenata. Izračunali smonjihovu prosječnu ocjenu i standardnu devijaciju. Od svakeocjene smo oduzeli aritmetičku sredinu i dobivenu razlikupodijelili sa standardnom devijacijom. Dobili smo niz odnovih 5 podataka.
• Kako nazivamo novodobivene podatke?
• Kolika je njihova:
• Aritmetička sredina?
• Varijansa?
• Standardna devijacija?
0
1
1
5/22/2017
32
Izvori
• Curwin J. and Slater R., Quantitative Methods for Business Decisions, Thomson Learning – fifth edition 2002.
• Dumičić, K., Bahovec V., at al., Poslovna statistika, Sveučilište u Zagrebu, Element, Zagreb 2011.
• Resić, E., Delalić, A., Balavac, M., Abdić, A., Statistics in Economics and Management, Ekonomski fakultet u Sarajevu, Sarajevo, 2010.
• Resić E., Zbirka zadataka iz statistike, Ekonomski fakultet u Sarajevu, Sarajevo 2006.
• Somun-Kapetanović R., Statistika u ekonomiji i menadžmentu, Ekonomski fakultet u Sarajevu, Sarajevo 2006.