osnovni pojmovi u statistici skripta 1 1

18
24.4.2015. 1 Osnovni pojmovi u statistici KOLEGIJ: Primjenjena statistika MEV Čakovec 1. Statistika Što je statistika? U svakodnevnom životu: prikupljanje, registriranje i prikaz podataka o nekom fenomenu (cijene na tržnici, broj postignutih golova tijekom nogometne sezone, broj ostvarenih noćenja u nekom hotelu tijekom mjeseca, uspjeh studenata na pismenom ispitu iz statistike ...) Statistika se bavi analizom dobivenih podataka te metodama izvođenja zaključaka o promatranom fenomenu na osnovi takve analize. Zaključci izvedeni statističkom analizom nesigurni? zasnivaju na nepotpunim podacima (npr. “rejting” političke stranke pred izbore procjenjuje se ispitivanjem uzorka od nekoliko tisuća ljudi) ili na podacima koji u sebi sadrže slučajnu komponentu (npr. rast biljaka u različitim uvjetima). Statistika se prvenstveno bavi situacijama u kojima se pojavljivanje nekog događaja ne može sa sigurnošću predvidjeti. Što je statistika? Statistika je znanstvena disciplina koja se bavi prikupljanjem, selekcijom, grupiranjem, prezentacijom i analizom podataka te interpretiranjem rezultata provedene analize u svrhu realizacije postavljenih istraživačkih ciljeva. skup ideja i metoda Elementi istraživanja 1. Specikacija cilja npr. istraživanje koliko studenti prosječno potroše novaca za izlaske tijekom tjedna 2. Sakupljanje podataka Sakupljamo podatke koji numerički mjere neke karakteristike. 3. Analiza podataka Pažljiva analiza podataka osnova je za potvrdu neke i vrednovanje zaključaka.

Upload: valentina-novak

Post on 18-Dec-2015

54 views

Category:

Documents


3 download

DESCRIPTION

+

TRANSCRIPT

  • 24.4.2015.

    1

    Osnovni pojmovi u statistici

    KOLEGIJ: Primjenjena statistika

    MEV akovec

    1. Statistika

    to je statistika?

    U svakodnevnom ivotu:

    prikupljanje, registriranje i prikaz podataka o nekom fenomenu (cijene na trnici, broj postignutih golova tijekom nogometne sezone, broj ostvarenih noenja u nekom hotelu tijekom mjeseca, uspjeh studenata na pismenom ispitu iz statistike ...)

    Statistika se bavi analizom dobivenih

    podataka temetodama izvoenja

    zakljuaka o promatranom

    fenomenu na osnovi takve analize.

    Zakljuci izvedeni statistikom analizom

    nesigurni? zasnivaju na nepotpunim podacima (npr. rejting

    politike stranke pred izbore procjenjuje se ispitivanjem uzorka od nekoliko tisua ljudi)

    ili na podacima koji u sebi sadre sluajnu komponentu

    (npr. rast biljaka u razliitim uvjetima).

    Statistika se prvenstveno bavi situacijama u kojimase pojavljivanje nekog dogaaja ne moe sa sigurnou predvidjeti.

    to je statistika?

    Statistika je znanstvena disciplina koja se bavi prikupljanjem, selekcijom, grupiranjem,

    prezentacijom i analizom podataka te interpretiranjem rezultata provedene analize u

    svrhu realizacije postavljenih istraivakih ciljeva.

    skup ideja i metoda

    Elementi istraivanja

    1. Specikacija ciljanpr. istraivanje koliko studenti prosjeno potroe novaca

    za izlaske tijekom tjedna

    2. Sakupljanje podatakaSakupljamo podatke koji numeriki mjere neke

    karakteristike.

    3. Analiza podatakaPaljiva analiza podataka osnova je za potvrdu neke i

    vrednovanje zakljuaka.

  • 24.4.2015.

    2

    Deskriptivna statistika (descriptive statistics) ili opisna statistika

    je grana statistike koja se bavi predoavanjem i opisivanjem glavnih karakteristika sakupljenih podataka (tablice, grakoni, histogrami, srednje vrijednosti,...)

    Inferencijalna statistika (inferential statistics) ili statistiko zakljuivanje

    je vrednovanje informacija sadranih u podacima i ocjenanovog znanja dobivenog iz tih podataka (procjena parametara promatrane populacije, testiranje statistikihhipoteza,...)

    Podjela statistike (II)

    Teorijska statistika se ne bavi stvarnim podacima,

    ve definira i nadograuje ope pojmove i znanstvene okvire.

    Primijenjena statistika koristi teorijske i znanstvene

    statistike pojmove u analizi stvarnih podataka iz razliitih podruja.

    Statistike metode i tehnike temelj su za provoenje analize

    prirodnih i drutvenih pojava.

    Zadaa statistike uoiti zakonitosti u masovnim i sluajnim pojavama, iskazati ih brojano.

    Masovne pojave su skupine istovrsnih elemenata koji imaju jedno ili vie zajednikih svojstava. Takvu skupinu nazivamo statistikom masom

    ili statistikim skupom.

    Pri definiranju statistikog skupa potrebna je velika preciznost (pripadnost skupu).

    Statistiki skup potrebno je definirati pojmovno, prostorno i vremenski.

    Pojmovno- odrediti pojam ili svojstvo svakog elementa promatranog skupa.

    Prostorno- odrediti prostor na koji se odnosi ili kojemu pripadaju elementi statistikog skupa.

    Vremenski- odrediti vremenski trenutak ili razdoblje kojim e se promatrati svi elementi koji ulaze u statistiki skup.

    Primjer 1.

    Statistiki skup:

    studenti 1. godine MEV-a u akovcu, u akademskoj godini 2013./2014., upisanih 1. 10. 2013. godine

    Pojmovno- odrediti pojam ili svojstvo svakog elementa promatranog skupa.

    Prostorno- odrediti prostor na koji se odnosi ili kojemu pripadaju elementi statistikog skupa.

    Vremenski- odrediti vremenski trenutak ili razdoblje kojim e se promatrati svi elementi koji ulaze u statistiki skup.

    Definiranost

    Statistika obiljeja

    = ope karakteristike elemenata statistikog skupa, po kojima su ti elementi meusobno slini i po kojima se meusobno razlikuju

    npr. spol studenata, dob studenata, mjesto prebivalita studenata, prosjena ocjena poloenih ispita tijekom 1. semestra, visina studenata, socijalni status

    Statistika obiljejakvalitativna

    - mogu poprimiti razliite oblike, ali se izraavaju opisnoAko se modalitetima ovog obiljeja sluajno pridrue

    brojevi, s njima nisu doputene nikakve raunske operacije.

    Kvantitativna(numerika stat. obiljeja)

    - izraavaju se brojano

    Nominalna statistika obiljeja(atributivna statistika obiljeja)

    - izraavaju se opisno (npr.: spol, nacionalnost,brano stanje, )Nominalna obiljeja koja mogu poprimiti samo 2 modaliteta nazivaju se alternativna obiljeja.(npr. spol=M/)Zemljopisna statistika obiljeja - prostor s kojim su elementi statistikog skupa u vezi.npr.: mjesto roenja, mjesto stanovanja,mjesto studiranja, lokacija podrunica tvrtke prema regijama

    Redoslijedna statistika obiljeja- obiljeja koja se mijenjaju prema intenzitetu ili rangu.

    npr. uspjeh na ispitu iz predmeta

    Statistika (ovdje se javljaju modaliteti ovog obiljeja od 1 do 5, ali se s njima

    ne vre nikakve raunske operacije, ve se pomou njih elementi skupa, odnosno studenti, mogu rangirati),

    struna sprema zaposlenih u nekom poduzeu

  • 24.4.2015.

    3

    Statistika obiljejakvalitativna

    - mogu poprimiti razliite oblike, ali se izraavaju opisnoAko se modalitetima ovog obiljeja sluajno pridrue

    brojevi, s njima nisu doputene nikakve raunske operacije.

    Kvantitativna (numerika stat. obiljeja)

    - izraavaju se brojano

    neprekidna ili kontinuirana statistika obiljeja

    -numerika obiljeja koja mogu poprimiti neprebrojivo (beskonano mnogo) vrijednosti (npr. u skupu realnih brojeva, na zatvorenom intervalu od 150 do 210).

    Npr. visina, teina, duljina, starost

    prekidna ili

    diskontinuirana statistika obiljeja

    - obiljeja koja mogu poprimiti prebrojivo beskonano mnogo vrijednosti(npr. u skupu cijelih brojeva koji je

    beskonaan na zatvorenom intervalu od 1 do 2 ima prebrojivo mnogo elemenata

    tog skupa, tj. 2).

    npr. broj djece u obitelji, broj studenata u grupi, starost u godinama (godine se

    mogu prebrojati),

    Kod intervalne skale poloaj nule je unaprijed dogovoren ali ne znai nepostojanje promatrane pojave.

    Na primjeru numerikog obiljeja "temperatura zraka" nula (0C) ne upuuje na nepostojanje temperature, ve upuuje da je hladno. Vrijednosti ove skale se ne mogu dijeliti jer temperatura od 50C na

    nekom podruju u odnosu na temperaturu od 150C na nekom drugom podruju ne znai da je na jednom mjestu bilo tri puta hladnije u odnosu na drugo mjesto.

    Kod omjerne skale nula podrazumijeva nepostojanje pojave.

    Na primjeru numerikog obiljeja "visina uteevine" nula (0 kn) upuuje na nepostojanje uteevine. Ako netko ima uteevinu od 20 000 kn, moe se rei da je ona dva puta vea od uteevine od 10 000 kn.

    Kvantitativna statistika obiljeja su vezana za intervalnu ili omjernu skalu.

    Vremenska statistika obiljeja

    - oznaavaju trenutak ili vremenski interval s kojim su elementi statistikog skupa u svezi

    2. Statistiki podaci

    Osnovne faze statistikog istraivanja

    a) statistiko promatranje

    b) grupiranje (tabelarno i grafiko prikazivanje statistikih

    podataka)

    c) statistika analiza i interpretacija rezultata provedene analize

    Statistiko promatranje je organizirano prikupljanje statistikih podataka.

    Slijedi nakon precizne definicije zadatka, cilja i predmeta istraivanja tj.

    statistikog skupa

    Nepotpune i neistinite prikupljene informacije konaan rezultat statistikog istraivanja sadri pogeku.

    Pogreka moe biti sistematska i sluajna.

    Sistematsku pogreku (npr. neispravnost odreenog mjernog instrumenta, neistinito izjanjavanje ispitanika) lake ju je uoiti

    Sluajnu pogreku teko je precizno identificirati - ne javlja se kod svakog mjerenja i ne uvijek istim intenzitetom (pretpostavljamo da

    e se njen utjecaj globalno ponititi).

    Vano: uspjenost,objektivnost

    Statistiko promatranje uvjetuje kvalitetu

    rezultata ostalih

    faza statistikog istraivanja

  • 24.4.2015.

    4

    U ovisnosti o karakteru izvora podataka, statistiki podaci se dijele na:

    Sekundarne podatkePrimarne podatke

    Primarni podaci prikupljaju se neposrednim promatranjem

    svojstava elemenata statistikog skupa u skladu s unaprijed definiranim ciljevima statistikog istraivanja.

    Prikupljanje ovih podataka zahtjeva definiranje statistikog skupa, izbor obiljeja koja se ele istraiti, odreivanje modaliteta promatranog obiljeja, pripremanje anketnih upitnika i/ili prateih formulara te organiziranje i provoenje samog prikupljanja podataka.

    U ovisnosti o karakteru izvora podataka, statistiki podaci se dijele na:

    Sekundarne podatkePrimarne podatke

    Sekundarni podaci su oni koji se pribavljaju iz ve postojeih baza podataka razliitih ustanova. Takvi se podaci prikupljaju sustavno

    na odgovarajui nain, a njihov opseg ne ovisi o donoenju neke poslovne odluke ili zadanom cilju nekakvog istraivanja.

    Takve podatke u Hrvatskoj prikupljaju: Dravni zavod za statistiku, Hrvatska narodna banka, Hrvatska gospodarska komora, te neke druge specijalizirane agencije. Jedan od

    najee koritenih sekundarnih izvora podataka u Hrvatskoj je Statistiki ljetopis Hrvatske u izdanju Hrvatskog zavoda za statistiku. U svjetskim okvirima poznat je World Statistical

    Yearbook, a putem Internet-a su danas dostupne mnoge baze sekundarnih podataka (na primjer: Eurostat, U.S: Census Bureau i slino). Na razini

    poduzea, raznovrsna specifina izvjea o poslovanju imaju sekundarni karakter. Sekundarni podaci su uglavnom brojani. Predoeni su tablicama, a vrlo esto i

    grafikim prikazima.

    Statistiki uzorak

    Vrlo esto istraivanja koja se odnose na svaki lan statistikog skupa zahtijevaju velike trokove, stoga se podaci prikupljaju za podskup osnovnog skupa, odnosno za uzorak.

    Takvo promatranje se naziva reprezentativno promatranje.

    Promatranje

    Prema vremenu promatranje se moe podijeliti na jednokratno, periodino i tekue.

    Jednokratno promatranje provodi se jednom i nema ponavljanja.

    Periodino promatranje se ponavlja nakon jednakih vremenskih razdoblja (npr. bilanca uspjeha u poduzeu).

    Za tekue promatranje mjerenje je kontinuirano (npr. proizvodnja mlijeka).

    Prikupljanje primarnih podataka moe se vriti i pomou statistikih pokusa.

    Statistikim pokusom se vri mjerenje vrijednosti obiljeja nastalih u kontroliranim uvjetima. Vrlo estu primjenu statistiki pokus ima u marketinkom istraivanju trita.

    Npr., eli se istraiti kako boja pakiranja okolade ima utjecaja na kupnju. U takvom sluaju istraiva e u pokusu odrediti razliite boje pakiranja (vrijednosti kontroliranog obiljeja) i u njima e izloiti proizvod. U odreenom vremenu vriti e se mjerenje opsega prodaje.

    Na taj nain dobiveni statistiki podaci su primarni.

    Prikupljanje podatakaPojedinane metode statistikog promatranja su:

    a) mjerenje b) brojanje c) ocjenjivanje d) evidentiranje e) anketiranje

  • 24.4.2015.

    5

    Mjerenje - jedan od naina statistikog promatranja i prikupljanja podataka (npr. urod krumpira po jedinici poljoprivredne povrine, teina proizvoda, visina stanovnitva nekog podruja)

    Brojanjem se moe doi do podataka o broju zaposlenih u nekoj ustanovi, broju upisanih uenika u srednje kole, broj noenja unutar turistike sezone itd.

    Ocjenjivanjem se procjenjuje kvaliteta provoenja odreenih radnji, stoga se taj statistiki postupak obino vee za redoslijedna obiljeja statistikog skupa.Ocjenjuju se i rangiraju studenti na testu iz statistike, ocjenjuje se usluga nekog

    hotelskog poduzea,

    Evidentiranje podataka podrazumijeva kontinuirano praenje kretanja neke pojave u nekom vremenskom razdoblju.

    Evidencija se provodi obrascima . Npr. obrazac za evidenciju radnog vremena

    zaposlenika: sadre ime i prezime, vrijeme dolaska i odlaska s radnog mjesta, vrijeme izostanka, razlog izostanka.

    Evidentiranje se moe vriti umreenim raunalima, optikim itaima, ureajimaza brojenje npr. putnika i drugo.

    Anketa ili intervju je metoda kojom se prikupljaju podaci uz pomo unaprijed pripremljenih upitnika, na kojima ispitanici svojim

    odgovorima daju informacije o promatranim obiljejima statistikog skupa.

    Da bi anketa uspjela potrebno je veliku pozornost obratiti sastavljanju upitnika.

    Sastavlja je statistiar, a moe se konzultirati i psiholog. Upiti moraju biti kratki, precizni i jasni. Moraju biti postavljeni tako da ne

    sugeriraju odgovor.

    Broj pitanja ne smije biti velik da ne zamara one koji odgovaraju. Pri

    provoenju ankete pristup ispitaniku, odnosno jedinici statistikog skupa moe biti izravan i neizravan.

    Biljan-August M., Pivac S., tambuk A. (2009): Uporaba statistike u ekonomiji, II izdanje; Ekonomski

    fakultet Sveuilita u Rijeci

    Izravan pristup ostvaruje se kada osoba ili tim koji provodi anketu izlaze na teren i u direktnom kontaktu s ispitanicima prikupljaju odgovore na pitanja iz upitnika.

    Neizravan pristup ostvaruje se putem pote, telefonom i elektronikom potom. Prednost: smanjenje trokovaNedostatak: velik postotak ne odaziva i velik postotak nevaljano i nepotpuno popunjenih upitnika (ispitaniku nije na raspolaganju osoba koja e mu pojasniti nejasna pitanja).

    Ovisno o obimu istraivanja organizaciju prikupljanja podataka moe provoditi jedna osoba, skupina istraivaa ili itavo osoblje neke specijalizirane ustanove kojoj je to osnovna djelatnost.

    Prije poetka obrade prikupljenih podataka potrebno je izvriti kontrolu sirove statistike grae.

    Preventivna kontrola obavlja se tijekom samog postupka prikupljanja

    statistikih podataka.

    Pri provoenju ankete to podrazumijeva kontrolu upitnika pri njegovom preuzimanju od ispitanika. Kontrolira se da li su dani odgovori na sva

    pitanja i da li su pravilno popunjena predviena mjesta za traene odgovore.

    Kontrola

    Naknadna kontrola prikupljenih podataka obavlja se nakon postupka prikupljanja.

    Formalnom kontrolom se usporeuje realizirani broj prikupljenih podataka s onim planiranim obuhvatom statistikog skupa. Npr. ako je anketa vrena neizravnim putem, na primjer potom, usporeuje se broj odaslanih upitnika s brojem vraenih upitnika.

    Materijalnom kontrolom ispituje se potpunost i tonost sadraja prikupljenih podataka. Na primjeru ankete to podrazumijeva kontrolu

    potpunosti i loginosti danih odgovora.

    Formiranje statistikih nizovaRadi preglednosti prikupljene podatke treba urediti.

    Ako se urede prikupljeni statistiki podaci prema nekom obiljeju ili karakteristici dobit emo statistiki niz.

    Jedna od najvanijih metoda ureivanja podataka je metoda grupiranja.

    Grupiranje statistikih podataka je postupak diobe statistikog skupa na odreeni broj podskupova prema prethodno utvrenim modalitetima promatranog obiljeja i uz potivanje naela iskljuivosti i iscrpnosti.

    Naelo iskljuivosti podrazumijeva da svaki element statistikog skupa istovremeno moe pripadati samo jednoj grupi tj. podskupu.Naelo iscrpnosti podrazumijeva da postupkom grupiranja trebaju biti obuhvaeni svi elementi statistikog skupa.

    Ureivanje podataka i tabeliranje

  • 24.4.2015.

    6

    Statistika obiljeja, odnosno ope karakteristike elemenata statistikog skupa openito se oznaavaju s

    Skup ureenih parova modaliteta promatranog obiljeja i njima pripadajuih apsolutnih frekvencija je statistiki niz.

    kixi ,...,1 , Postoji k modaliteta promatranog obiljeja.

    Broj elemenata statistikog skupa koji pripadaju odreenoj grupi, tj. jednom modalitetu promatranog obiljeja naziva se apsolutna frekvencija.Oznaka za apsolutnu frekvenciju je

    kifi ,...,1 ,

    Zbroj svih elemenata statistikog skupa naziva se opseg statistikog skupa. Zbog principa iskljuivosti i iscrpnosti taj broj odgovara i zbroju svih apsolutnih frekvencija to je i prikazano izrazom

    Nfffffk

    i

    ik 1

    321 ...

    ii fx ,

    Grupiranjem statistikih podataka veliki se broj pojedinanih podatakarazvrstava u manji broj, ovisno o broju grupa obiljeja. Ako se podaci grupiraju prema modalitetima samo jednog obiljeja, tada je rije o jednodimenzionalnom grupiranju, a ako se statistiki podaci grupiraju prema modalitetima dvaju ili vie obiljeja radi se o dvodimenzionalnom ili viedimenzionalnom grupiranju.

    Nominalni podaci s odgovarajuom frekvencijom navode se abecednim redom, prema padajuoj vrijednosti frekvencija, prema nomenklaturi ili nekim drugim definiranim pravilom.

    Redosljedni podaci s odgovarajuom frekvencijom navode se prema intenzitetu svojstva, najee od najmanjeg prema najveem.

    Nizovi kvalitativnih podatakaNominalni statistiki nizovi formiraju se grupiranjem elemenatastatistikog skupa prema modalitetima odgovarajueg nominalnogobiljeja.

    Modaliteti nominalnog obiljeja izraavaju se pomou atributa,kategorija i slovnih oznaka, a mogu se navoditi abecednim redom, prema

    veliini apsolutnih frekvencija, dogovorno ili zakonski utvrenim popisima. Npr. slubena statistika koristi: SMTK ili Standardnu meunarodnutrgovinsku klasifikaciju i NKD ili Nacionalnu klasifikaciju djelatnosti.

    Zemljopisni statistiki nizovi formiraju se grupiranjem elemenatastatistikog skupa prema modalitetima odgovarajueg zemljopisnog iliprostornog obiljeja.Modaliteti prostornog obiljeja najee odgovaraju teritorijalnoadministrativnoj podjeli odreenog geografskog prostora, na primjer: gradovi, upanije, regije, drave, kontinenti. Grupe ovog obiljeja mogu biti poredane po abecednom redu, po veliinama apsolutnih frekvencija ili po geografskom poloaju. Ako se zbog vee preglednosti nekoliko modaliteta stavi zajedno u grupu "ostalo", ona obino dolazi na kraju statistikog niza.

    Tabeliranje= postupak svrstavanja grupiranih prikupljenihstatistikih podataka u tablice

    Statistika tablica mora potivati 3 naela: preglednost, potpunost i jasnou.

    Dodatne oznake:Vrste tablica

    Statistike tablice mogu se podijeliti na:1) ope ili izvjetajne statistike tablice i2) analitike ili sumarne statistike tablice

    Ope statistike tablice prikazuju veliki broj statistikih podataka o nekome promatranom statistikom skupu.Analitike statistike tablice konstruiraju se za neku posebnu analizu i one su u pravilu preglednije.

    Prikazuju li se prikupljeni statistiki podaci u tablici prema jednom ili vie statistikih obiljeja i prikazuje li se jedan ili vie statistikih skupova razlikujemo:

    1) jednostavne statistike tablice i2) sloene statistike tablice koje se mogu podijeliti na:

    skupne statistike tablice, i kombinirane statistike tablice.

  • 24.4.2015.

    7

    Za vrijednosti koje se pojavljuju manje puta formiraju se zajednike grupe ili "razredi". U razredima se nalaze elementi skupa s vrijednostima obiljeja koje se nalaze izmeu donje i gornje granice razreda.

    Na taj nain formiranjem razreda postie se vea preglednost, ali se gubi na preciznosti i potpunosti informacija.

    U sluaju diskontinuiranog numerikog obiljeja donja granica slijedeeg (i+1.) razreda razlikuje se od gornje granice prethodnog (i.) razreda za jedinicu mjere

    promatranog obiljeja.

    Ove originalne granice razreda nazivaju se jo i nominalne granice.

    Prije provoenja statistike analize potrebno je nominalne granice zamijenitipreciznim ili pravim granicama.

    To se najee radi na nain da se donja granica slijedeeg (i+1) nominalnog razreda umanji, a gornja granica prethodnog (i) nominalnog razreda uvea za polovinu razlike izmeu tih granica. Ponekad se precizne granice formiraju jednostavno na nain da se sve gornje granice uveaju za jednu jedinicu obiljeja i tako izjednae sa svojom sljedeom donjom granicom ili da se sve donje granice umanje za jednu jedinicu obiljeja i tako izjednae sa svojom prethodnom gornjom granicom.

    Kontinuirano ili neprekidno statistiko obiljeje moe poprimiti vrijednosti iz nekog intervala, pa se njegovi modaliteti formiraju kao razredi.

    Skup ureenih parova razreda obiljeja i njima pripadajuih frekvencija

    je distribucija frekvencija promatranog neprekidnog numerikog obiljeja.

    U sluaju kontinuiranog numerikog obiljeja donja granica sljedeeg (i+1) razreda jednaka je gornjoj granici prethodnog (i) razreda, pa ovdje nije

    potrebno raunati precizne ili prave granice.

    Greke

    Veliina razreda (i) je razlika izmeu gornje i donje granice razreda:

    Sredina razreda (sredXi) je aritmetika sredina donje i gornje granice razreda:

    Pravilo o broju i veliini razreda (Sturgesovo pravilo)

    Broj razreda k za grupiranje N numerikih podataka priblino je jednak

    Nk 10log3.31 u praksi izmeu 5 i 15

    Ponekad se u statistikoj analizi statistikih nizova eli utvrditi kolikoelemenata (apsolutno i/ili relativno) promatranog statistikog numerikog niza ima vrijednost obiljeja manju ili veu od neke vrijednosti.

    Odgovor na to pitanje moe se dobiti formiranjem odgovarajuih nizova kumulativnih apsolutnih i relativnih frekvencija.

    Postoje:

    a) Kumulativni niz apsolutnih frekvencija "manje od"

    b) Kumulativni niz apsolutnih frekvencija "vie od"c) Kumulativni niz relativnih frekvencija "manje odd) Kumulativni niz relativnih frekvencija "vie od".

    Kumulativni niz apsolutnih frekvencija "manje od" dobije se postupnim ili sukcesivnim zbrajanjem vrijednosti apsolutnih frekvencija poevi od prve u nizu prema posljednjoj. Frekvencije kumulativnog niza apsolutnih frekvencija "manje od" pokazuju koliki broj elemenata promatranog statistikog skupa ima vrijednost obiljeja manju od gornje granice pripadajueg razreda.

    Kumulativni niz apsolutnih frekvencija "vie od" dobije se postupnim ili sukcesivnim zbrajanjem vrijednosti apsolutnih frekvencija poevi od posljednje u nizu prema prvoj. Frekvencije kumulativnog niza apsolutnih frekvencija "vie od" pokazuju koliki broj elemenata promatranog statistikog skupa ima vrijednost obiljeja veu ili jednaku od donje granice pripadajueg razreda.

    Kumulativni niz relativnih frekvencija "manje od" dobije se postupnim ili sukcesivnim zbrajanjem vrijednosti relativnih frekvencija poevi od prve u nizu prema posljednjoj. Frekvencije kumulativnog niza relativnih frekvencija "manje od" pokazuju koliki udio (ili postotak ako su izraene u %) elemenata romatranog statistikog skupa ima vrijednost obiljeja manju od gornje granice pripadajueg razreda.

    Kumulativni niz relativnih frekvencija "vie od" dobije se postupnim ili sukcesivnim zbrajanjem vrijednosti relativnih frekvencija poevi od posljednje u nizu prema prvoj. Frekvencije kumulativnog niza relativnih frekvencija "vie od" pokazuju koliki udio (ili postotak ako su izraene u %) elemenata promatranog statistikog skupa ima vrijednost obiljeja veu ili jednaku od donje granice pripadajueg razreda.

  • 24.4.2015.

    8

    Grafikoni

    Grafikonima se na jednostavan i pregledan nain uz pomo razliitih geometrijskih likova prezentiraju osnovne karakteristike statistikih nizova.

    Oznake na grafikonu moraju biti takve da onaj tko ita sliku moe jasno raspoznati koji su elementi i koja je pojava prikazana.

    Grafikoni sadre naslov, jedinice mjere promatranog obiljeja, oznake modaliteta obiljeja, izvor podataka i po potrebi kazalo ili tuma oznaka

    Postoje tri skupine grafikih prikaza:1) povrinski grafikoni2) linijski grafikoni3) kartogrami

    Dijagram s tokamaDijagram stablo-list (S-L)

    HistogramPoligon frekvencija

    KumulantaParetov dijagram

    Primjeri: Programska potpora za statistiku analizu

    STATISTICA, SAS, SPSS (Statistical Package for the Social Sciences)

    Microsoft Excel

    Analiza podataka metodama deskriptivne statistike

    1. Definiranje zadatka, cilja i predmeta istraivanja, tj. statistikog skupa

    2. Promatranje i analiza prikupljenih podataka

    3. Grupiranje, tabelarno i grafiko prikazivanje podataka

    4. a) Za podatke koji potpuno obuhvaaju statistiki skup koriste se metode i tehnike deskriptivne ili opisne statistike

    4. b) Za podatke koji obuhvaaju dio tj. sluajni uzorak statistikog skupa koriste se metode i tehnike inferencijalne statistike

    5. Interpretacija rezultata i zakljuci provedene analize

    3. Mjere centralne tendencije, disperzije, koncentracije, asimetrije i zaobljenost

  • 24.4.2015.

    9

    Mjere centralne tendencije

    Srednja vrijednost je vrijednost statistikog obiljeja oko koje se grupiraju podaci statistikog niza.

    Srednje vrijednosti mogu se podijeliti na:

    1. Potpune srednje vrijednosti raunaju se upotrebom svih podataka u statistikom nizu.

    Potpune srednje vrijednost su:

    a) aritmetika sredinab) harmonijska sredina

    c) geometrijska sredina.

    2. Poloajne srednje vrijednosti odreuju se poloajem podataka u nizu.

    Najvanije poloajne srednje vrijednosti su :a) medijan

    b) mod.

    Aritmetika sredina

    Aritmetika sredina spada u potpune srednje vrijednosti i rauna se upotrebom svih podataka u statistikom nizu.

    Aritmetika sredina je omjer zbroja svih vrijednosti numerikog obiljeja jednog niza i broja elemenata tog niza.

    Ako se radi o negrupiranom statistikom numerikom nizu raunase jednostavna aritmetika sredina:

    Primjer:

    Ako se radi o grupiranom statistikom numerikom nizu rauna se sloena, vagana ili ponderirana aritmetika sredina.Poznato je da apsolutne frekvencije oznaavaju broj elemenata skupa koji pripadaju odreenom modalitetu promatranog statistikog obiljeja. Iz toga se moe zakljuiti da je vanost svake vrijednosti obiljeja ovisna o frekvenciji jer vea frekvencija znai vei udio tog oblika obiljeja u promatranom skupu.

    Zato se frekvencija jo naziva teinski faktor ili ponder kod grupiranih nizova.

    Vagana ili ponderirana aritmetika sredina rauna se premaformuli:

    S obzirom da su relativne frekvencije upravno proporcionalneapsolutnim frekvencijama, aritmetika sredina se moe izraunati i pomou njih:

    Nazivnik jednadbe moe biti 1 ili 100, to ovisi o tome jesu lirelativne frekvencije dane u decimalnom obliku ili u postotcima.

    Ako su veliine razreda grupiranog numerikog niza razliite od 1, za raunanje vagane ili ponderirane aritmetike sredine, potrebno je izvriti aproksimaciju pomou sredine razreda.

  • 24.4.2015.

    10

    Ako neki numeriki niz sadri ekstremno male ili velike vrijednostiobiljeja, aritmetika sredina kao prosjena vrijednost gubi na svojojreprezentativnosti. Taj problem je dodatno izraen kada u distribuciji postoje razredi s otvorenom donjom, odnosno gornjom granicom obiljeja, i kada nije mogue te granice objektivno procijeniti.

    Harmonijska sredinaHarmonijska sredina spada u potpune srednje vrijednosti i rauna se upotrebom svih podataka u statistikom nizu.

    Harmonijska sredina je reciprona vrijednost aritmetike sredine recipronih vrijednosti numerikog obiljeja u jednom nizu.

    Ako se radi o negrupiranom statistikom numerikom nizu rauna se jednostavna harmonijska sredina:

    Ako se radi o grupiranom statistikom numerikom nizu rauna se sloena ili vagana harmonijska sredina:

    Harmonijska sredina rijetko se primjenjuje u praksi. Specifinopodruje njene primjene je izraunavanje srednjih vrijednosti relativnihbrojeva koordinacije.

    Relativni brojevi koordinacije (Ri) pokazuju odnos dviju pojavakoje ima smisla usporeivati (Ai i Bi).

    Geometrijska sredina

    Geometrijska sredina spada u potpune srednje vrijednosti i rauna se upotrebom svih podataka u statistikom nizu.

    Geometrijska sredina je N-ti korijen umnoka svih vrijednosti negrupiranog numerikog obiljeja jednog niza.

    U izrazu dana je jednostavna geometrijska sredina koja se koristi za negrupirane statistike numerike nizove. Ako su nizovi grupirani po razredima rauna se sloena ili vagana geometrijska sredina:

    Zadatak: Izraunaj AS, GS, HS podataka u nizu

    2 2 0 3 1 1 0 2 1 4 2 1 1 2 5 0 2 1 2 1

    0 0 0 1 1 1 1 1 1 1 2 2 2 2 2 2 2 3 4 5

    Medijan= vrijednost statistikog obiljeja koja statistiki niz dijeli na dva jednaka dijela.

    Medijan se moe primijeniti na redoslijedne i kvantitativne statistikenizove, a spada u poloajne srednje vrijednosti. Medijan se ne primjenjuje kod nominalnih nizova jer poredak oblika ovog obiljeja moe biti proizvoljan.

    Kod negrupiranog, a ureenog niza, medijan je vrijednost obiljeja koja pripada elementu statistikog niza koji se nalazi u sredini niza. Ako je broj elemenata statistikog niza paran, onda se za medijan uzima jednostavan prosjek vrijednosti obiljeja dvaju lanova koji se nalaze na sredini statistikog niza.

  • 24.4.2015.

    11

    Podaci grupirani u razredeAko su veliine razreda obiljeja razliite od 1, medijan se rauna po izrazu: Ako je statistiki niz zadan pomou relativnih frekvencija,

    medijalna vrijednost ili razred se odreuje pomou prve frekvencije kumulativnog niza koja u sebi sadri 0,5 ili 50%.

    U statistikim distribucijama postoji samo jedan medijan i on se nalazi izmeu najvee i najmanje vrijednosti obiljeja.

    Prednost medijana jest da na njega ne utjeu ekstremno male ili velike vrijednosti obiljeja, stoga je primjerena srednja vrijednost i kod izrazito asimetrinih distribucija.

    Mod

    Mod se moe primijeniti na kvalitativne i kvantitativne statistikenizove, a spada u poloajne srednje vrijednosti.

    Kod nominalnih obiljeja mod se odreuje brojanjem, trai sevrijednost obiljeja u nizu koja se najee javlja.

    Ako je niz grupiran, trai se najvea apsolutna frekvencija. Vrijednost obiljeja kojoj pripada ta najvea apsolutna frekvencija je mod.

    = vrijednost statistikog obiljeja koja se najee javlja unekom nizu, tj. vrijednost obiljeja kojoj pripada najvea frekvencija.

    Kod kvantitativnih statistikih obiljeja vrijednost moda odgovaravrijednosti obiljeja kojoj pripada najvea korigirana frekvencija. Ako suveliine razreda ili grupa numerikog obiljeja jednake nije potrebno korigirati frekvencije, ve se radi s originalnim apsolutnim frekvencijama. Ukoliko se vrijednost moda ne moe tono odrediti primjenjuje se sljedei izraz za izraunavanje moda:

    Osim unimodalnih nizova koji imaju samo jedan mod, postoje

    statistiki nizovi u kojima se dvije ili vie vrijednosti obiljeja mogu pojavljivati ee u odnosu na ostale modalitete obiljeja. U tom sluaju kae se da su to bimodalni ili multimodalni nizovi.

    Kvantilisu vrijednosti statistikog obiljeja koje statistiki niz dijele na q jednakih dijelova.

    Kvartili su vrijednosti statistikog obiljeja koje statistiki niz dijele na 4 jednaka dijela.

    Razlikujemo

    a) donji kvartil (Q1)

    b) gornji kvartil (Q3) .

    Donji kvartil dijeli statistiki niz na etiri jednaka dijela u omjeru1:3, odnosno 25% elemenata statistikog skupa ima vrijednost obiljejamanju od donjeg kvartila, a 75% elemenata statistikog skupa imavrijednost obiljeja veu od donjeg kvartila.

    Gornji kvartil dijeli statistiki niz na etiri jednaka dijela u omjeru3:1, odnosno 75% elemenata statistikog skupa ima vrijednost obiljejamanju od donjeg kvartila, a 25% elemenata statistikog skupa imavrijednost obiljeja veu od gornjeg kvartila

  • 24.4.2015.

    12

    Kvartili se, slino kao i medijan, mogu primijeniti na redoslijedne ikvantitativne statistike nizove, a odreuju se poloajem u nizu.

    Ne primjenjuju se kod nominalnih nizova.

    Kod negrupiranog, a ureenog niza (po veliini vrijednosti obiljeja),

    donji kvartil je vrijednost obiljeja koja pripada elementu statistikog niza iji rang (r) tj. mjesto u nizu odgovara:

    gornji kvartil je vrijednost obiljeja koja pripada elementu statistikog niza iji rang (r) tj. mjesto u nizu odgovara

    Kad su podaci grupirani u razrede Kad su podaci grupirani u razrede

    Decili dijele statistiki niz na 10 dijelovaCentili dijele statistiki skup na 100 dijelova

    Odnosi meu srednjim vrijednostima

    a) za nominalna obiljeja moe se raunati: mod (Mo)

    b) za redoslijedna obiljeja moe se raunati: mod (Mo) i medijan (Me)

    c) za numerika obiljeja moe se raunati: mod (Mo), medijan (Me), aritmetika sredina (X), geometrijska sredina (G) i harmonijska sredina (H).

    Elementi numerikog statistikog niza mogu biti i negativni. U tomsluaju moe se raunati samo geometrijska (G) i harmonijska (H) sredina.

    Kod numerikih statistikih nizova sa strogo pozitivnim vrijednostima vrijedi sljedei odnos izmeu harmonijske, geometrijske i aritmetike sredine:

  • 24.4.2015.

    13

    Mjere disperzije

    Moe se dogoditi da dva statistika skupova imaju jednakearitmetike sredine, a da su njihovi elementi potpuno razliiti. To znai da je raspored elemenata u tim skupovima razliit.

    Informaciju o rasporedu elemenata daju mjere

    rasprenosti ili disperzije elemenata numerikogstatistikog skupa.

    Postoje apsolutne i relativne mjere rasprenosti.

    Apsolutni pokazatelji izraeni su u originalnim jedinicama mjere i omoguavaju usporedbu nizova prema istom obiljeju. To su raspon varijacije, interkvartil, varijanca i standardna

    devijacija.

    Usporedbu rasprenosti elemenata nizova s razliitom mjernom jedinicom omoguuju relativni pokazatelji, koji su najee izraeni u postocima. To su: koeficijent kvartilne devijacije i koeficijent varijacije).

    a) nepotpune mjere rasprenosti: raspon varijacije, interkvartil i koeficijent kvartilne devijacije

    b) potpune mjere rasprenosti: varijanca, standardna, devijacija i koeficijent varijacije.

    Nepotpune mjere rasprenosti: Raspon varijacije, interkvartilni raspon i koeficijent kvartilne devijacije

    Raspon varijacije je najjednostavnija mjera disperzije, a

    predstavlja razliku izmeu najvee i najmanje vrijednosti numerikog obiljeja promatranog niza.

    Nije precizna mjera rasprenosti elemenata niza, osobito u sluaju postojanja ekstremno malih i/ili ekstremno velikih vrijednosti obiljeja.

  • 24.4.2015.

    14

    Problem preciznosti rjeava interkvartilni raspon ili interkvartil.

    Interkvartil je apsolutna, nepotpuna mjera rasprenosti, koja pokazuje disperziju srednjih 50% elemenata ureenog numerikog niza.

    Interkvartil predstavlja razliku gornjeg i donjeg kvartila.

    Na taj nain se eliminira 25% ekstremno malih i 25% ekstremno velikih vrijednosti obiljeja u nizu.

    Koeficijent kvartilne devijacije je relativna nepotpuna mjera rasprenosti. Predstavlja relativnu disperziju srednjih 50% elemenata numerikog niza.

    Rauna se na temelju samo dvije vrijednosti obiljeja, a to su donji i gornji kvartil.

    Ovaj pokazatelj je jednak 0 samo u sluaju kada nema disperzije. Ako se njegova vrijednost pribliava 1, to znai da je rasprenost vrijednosti obiljeja vea.

    S obzirom da je ovo relativni pokazatelj, pomou njega je mogue usporeivati rasprenost srednjih 50% elemenata razliitih numerikihdistribucija s razliitim jedinicama mjere.

    Potpune mjere rasprenosti:

    varijanca standardna devijacija koeficijent varijacije

    Varijanca

    Varijanca je prosjeno kvadratno odstupanje vrijednosti numerikog obiljeja od aritmetike sredine.

    spada u potpune mjere rasprenosti (obuhvaa sve elemente odabranog numerikog statistikog niza).

    Mjeri odstupanja, tj. rasprenost elemenata skupa od aritmetike sredine.

    Standardna devijacija

    = pozitivan korijen iz varijance izraena je u originalnim jedinicama mjere

    Definicija: Standardna devijacija je prosjeno odstupanje vrijednosti numerikog obiljeja od aritmetike sredine.

    Varijanca i standardna devijacija kao apsolutne mjere disperzije

    ne omoguuju usporedbu disperzije vrijednosti obiljeja koje imaju razliitu jedinicu mjere.

    Mogu uputiti na pogrean zakljuak pri usporedbi disperzije obiljeja nizova s razliitim pojedinanim vrijednostima obiljeja.

    U tom sluaju se moe raunati:a) standardizirano obiljejeb) relativni pokazatelji disperzije

  • 24.4.2015.

    15

    Standardizirano obiljeje (zi) je linearna transformacija originalnih vrijednosti numerikog obiljeja xi, a pokazuje odstupanje vrijednosti obiljeja od aritmetike sredine u standardnim devijacijama.

    Vrijede sljedea svojstva standardiziranog obiljeja:a) aritmetika sredina standardiziranog obiljeja je uvijek jednaka 0b) standardna devijacija standardiziranog obiljeja je jednaka 1

    usporedbu relativnih poloaja elemenatanumerikih nizova

    Teorem (ebiev):

    NORMALNA RAZDIOBA

    Koeficijent varijacije

    spada u potpune relativne mjere rasprenosti jer obuhvaa sve elemente odabranog numerikog statistikog niza, a izraava se u postotcima (%).

    Koeficijent varijacije je postotak standardne devijacije od aritmetike sredine.

    Ovaj pokazatelj rasprenosti omoguava usporedbu disperzije numerikih nizova s razliitim jedinicama mjere.

    %

    Mjere koncentracije

    Pomou pokazatelja koncentracije mjeri se nain raspodjele zbroja vrijednosti numerike varijable (ili neke druge veliine) po elementima statistikog skupa ili po modalitetima promatranog statistikog obiljeja.

    Mjere koncentracije se mogu podijeliti na:a) apsolutne mjere koncentracijeb) relativne mjere koncentracije.

    Apsolutne mjere koncentracije su: koncentracijski omjer i Herfindahlov (Hischmanov) indeks.

    Relativna mjera koncentracije je: Ginijev koeficijent koncentracije.

    Koncentracijski omjerKoncentracijski omjer rauna se za ureen statistiki niz po veliini vrijednosti promatranog obiljeja poevi od najvee vrijednosti prema najmanjoj:

    (pozitivne vrijednosti)

  • 24.4.2015.

    16

    Herfindahlov indeks Ginijev koeficijent koncentracije

    Momenti numerikih nizova- mogu biti glavni i pomoni

    Glavni (ili centralni) momenti numerikih nizova

    Pomoni momenti numerikih nizova (momenti oko nule):

    Mjere asimetrije

  • 24.4.2015.

    17

    Mjere asimetrije

    Mjerama asimetrije mjeri se nain rasporeda podataka obzirom na jednu od srednjih vrijednosti; aritmetiku sredinu, medijan ili mod.

    Asimetrija distribucije podrazumijeva nagnutost distribucije na lijevu ili desnu stranu (u odnosu na normalnu distribuciju).

    Pearsonov koeficijent (SKEWNESS)

    U sluaju izrazito asimetrinih distribucija ovaj koeficijent moe poprimiti i vrijednosti izvan tog intervala.

    0 2-2 pozitivna ili desnostrana asimetrija

    negativna ili ljevostrana asimetrija

    simetrina distribucija

    Pearsonova mjera asimetrije

    Za umjereno asimetrine distribucije vrijedi da je Pearsonova mjera asimetrije:

    Bowleyeva mjera asimetrijezasnovana je na odnosu medijana ikvartila:

    Npr. mjesena primanja

    Npr. broj umirovljenika obzirom na godine starosti

    Za simetrinu distribuciju sve su mjere asimetrije jednake nula.

    Za negativno asimetrinu distribuciju sve su mjere asimetrije manje od nula.

    Za pozitivno asimetrinu distribuciju sve su mjere asimetrije vee od nula.

    Mjere asimetrije

  • 24.4.2015.

    18

    3 - potpuna mjera asimetrije, daje najuvjerljiviju sliku o asimetriji

    3 , Sk i Skq - neusporedive

    Mjere asimetrije

    Mjere zaobljenosti

    Mjere zaobljenosti

    - mjere zaobljenost vrha krivulje distribucije

    frekvencija

    Primjer 1.

    Primjer 2.

    Primjer 3.