statistika - referada.hr...skripte koje nađeš kod nas nisu naše autorsko djelo. to su razne...
TRANSCRIPT
STATISTIKA
MALA SKRIPTA
TEORIJA ZA USMENI
ID: 10501
1
Bok!
Drago nam je što si odabrao SKRIPTARNICU za pronalazak materijala koji će ti pomoći u učenju.
Što je SKRIPTARNICA?
Skriptarnica je projekt Štreberaj tima i Urbana, a nastala je u želji da ti olakšamo studiranje. Sve
skripte možeš pogledati na stranici www.referada.hr, a kupiti u SKRIPTARNICI u Urbanu. Sjedi na kavu
i uz svoju narudžbu naruči i skriptu. Simple as that!
Tko je napisao skripte?
Skripte koje nađeš kod nas nisu naše autorsko djelo. To su razne skripte koje nam studenti donesu.
Mi smo ih samo malo uredili, da ti je ljepše učiti iz njih.
Želimo ti puno sreće s učenjem!
Štreberaj instrukcije
Ako negdje zapneš s učenjem, mi ti možemo pomoći.
Prijavi se na naše instrukcije i položi teške ispite bez muke.
Sve info možeš pronaći na www.referada.hr/instrukcije.
2
1. UVOD
Statistika – znanstvena metoda koja se bavi prikupljanjem, analiziranjem i tumačenjem podataka
različite vrste.
Podaci – promotrena kvalitativna i kvantitativna svojstva objekata, stvari, osoba, procesa...
Svrha primjene statističkih metoda – donošenje suda o osobitosti promatranih pojava, ispitivanje
različitih pretpostavki, predviđanje razine i stanja pojava.
Metode deskriptivne statistike – sastoje se u primjeni postupaka uređivanja, grupiranja, tabeliranja,
grafičkog prikazivanja statističkih podataka; podaci se ne poopćavaju.
Metode inferencijalne statistike – polaze od uzorka iz realne i konačne populacije čije se realizacije
mogu smatrati uzorkom procesa; njima se također donose vjerojatnosni sudovi o cjelini.
1.1. Statistički skup
Statistički skup – sastoji se od jedinica kojima se ispituje jedno ili više svojstava koja od jedinice do
jedinice očituju statističku promjenljivost
Opseg skupa – broj jedinica
~ prema opsegu skupa statistički skupovi se dijele na konačne i beskonačne
Konačan skup – ima konačan broj elemenata
Beskonačan skup – ima beskonačno mnogo elemenata
Skup podataka ili osnovni skup – podaci o danoj varijabli za svaki element statističkog skupa
Populacija može biti:
realna
hipotetična
konačna
beskonačna
Uzorak – podskup statističkog skupa
~ u svakom statističkom istraživanju realni statistički skupovi se definiraju pojmovno, prostorno i
vremenski
Pojmovno – određuje se pripadnost skupu
Prostorno – određuje se kojem skupu pripadaju sve jedinice stat. skupa
Vremenski – određuje se vremenski interval ili vremenska točka za koje su vezane
sve jedinice skupa
3
1.2. Vrste i izvori statističkih podataka
Statistički podaci – rezultati mjerenja svojstava jedinica statističkih skupova, njihovih podskupova ili
eksperimentalnih jedinica
Statistička varijabla ili obilježje – svojstvo koje oblikom ili stupnjem varira od jedinice do jedinice
skupa; po njemu se elementi skupa razlikuju ili jedni drugima nalikuju
Skala
Skup modaliteta varijable
Razlikujemo:
nominalnu
ordinalnu
intervalnu
omjernu
Nominalna skala – dana je u obliku nenumeričkog skupa, odnosno liste naziva; redoslijed
odabran po volji; nisu dopuštene brojčane operacije (npr. po abecedi)
Ordinalna skala – pridružuje slovne oznake, simbole ili brojeve elementima skupa prema
intenzitetu mjerenog svojstva (npr. po rangu (ocjene))
Intervalna skala – pridružuju se jedinicama brojevi sukladno intenzitetu mjerenog svojstva;
ima definiranu mjernu jedinicu i dogovorno utvrđenu nulu; moguće su osnovne računske
operacije osim dijeljenja (npr. temperaturna skala)
Omjerna skala – pridružuju se brojevi jedinicama statističkog skupa sukladno intenzitetu
mjerenog svojstva; ima definiranu mjernu jedinicu i nulu koja označuje nepostojanje svojstva;
moguće su osnovne računske operacije
Numerička varijabla
To varijabla mjerena na numeričkoj skali (intervalnoj i omjernoj)
diskretna num. varijabla – poprima konačan broj vrijednosti
kontinuirana num. varijabla – može poprimiti bilo koju vrijednost iz nekog intervala
1.3. Uređivanje podataka
Svrha uređivanja stat. podataka – omogućiti donošenje osnovnih sudova o danoj pojavi; njihovim
uređenjem nastaju statistički nizovi.
Nominalni niz – nastaje uređenjem podataka o modalitetima nominalne varijable
4
Redoslijedni niz – nastaje uređenjem podataka o rang-varijabli
Numerički niz – formira se sređivanjem podataka koji predočuju vrijednosti numeričke varijable
Vremenski niz – kronološko nizanje podataka o nekoj pojavi
Jednostavna tabela – prikazuje se jedan stat. niz
Skupna tabela – prikazuje se više nizova nastalih sređivanjem podataka prema modalitetima iste
varijable
Tabela kontingence – prikazuju se podaci grupirani istodobno prema modalitetima dviju li više
varijabli
Relativni brojevi – pomoću njih se provodi elementarna analiza podataka u sklopu deskriptivne
statistike (postoci, proporcije, relativne frekvencije, indeksi i relativni brojevi koordinacije)
1.4. Niz kvalitativnih podataka
Kvalitativni podaci – oblici nominalne ili redoslijedne varijable
Grupiranjem se skup podataka koji se odnose na jedinice stat. skupa raščlanjuju u podskupove koji
se međusobno ne preklapaju
Frekvencija – broj podataka istog oblika varijable
Relativna frekvencija pi – omjer je frekvencije i ukupnog broja podataka
Postotna relativna frekvencija Pi – relativna frekvencija pomnožena sa 100
𝑝𝑖 =𝑓𝑖
𝑁 𝑃𝑖 =
𝑓𝑖
𝑁∙ 100
~ grupirani podaci se uobičajeno prikazuju tabelom kontigence, koja se sastoji od predstupca,
zaglavlja, polja tabele, marginalnog retka i marginalnog stupca
5
2. NUMERIČKI NIZOVI I DISTRIBUCIJA
FREKVENCIJA
Numerički nizovi nastaju uređenjem kvantitativnih podataka. Pojedinačni numerički podaci
predočavaju se dijagramom s točkama i dijagramom stablo list
Ako je riječ o velikom broju podataka, o numeričkoj kontinuiranoj varijabli ili ako diskretna numerička
varijabla poprima velik broj različitih vrijednosti, distribucija frekvencija formira se grupiranjem na
temelju razreda; svaki razred ima svoju gornju i donju granicu.
Frekvencija razreda
broj istih i sličnih vrijednosti numeričke varijable
formiranju distribucije prethodi određivanje broja razreka k i veličina razreda; broj razreda k
za grupiranje N vrijednosti numeričke varijable aproksimira se izrazom 𝑘 ≈ 1 + 3.3𝑙𝑜𝑔𝑁 –
Sturgesovo pravilo
Distribucija frekvencija prikazuje se histogramom i poligonom frekvencija
Histogram – površinski grafikon
Poligon frekvencija – linijski grafikon
2.1. Srednje vrijednosti statističkog niza
Aritmetička sredina
najvažnija i najraširenija srednja vrijednost
određuje se tako da se zbroje vrijednosti numeričke varijable i podijele s njihovim brojem
�̅� =1
𝑁∑𝑥𝑖
𝑁
𝑖=1
Svojstva:
zbroj odstupanja vrijednosti numeričke varijable od njezine aritmetičke sredine jednak je nuli
zbroj kvadrata odstupanja vrijednosti numeričke varijable od njezine sredine minimalan je
aritmetička sredina nalazi se između najmanje i najveće vrijednosti niza za koji je izračunana
Aritmetička sredina aritmetičkih sredina
izračunava se kao vagana sredina u kojoj se za pondere uzima broj podataka za koje su
računane pojedine sredine
�̅� =1
𝑁∑𝑁𝑖�̅�
𝑘
𝑖=1
6
Aritmetička sredina relativnih brojeva koordinacije i aritmetička sredina postotaka
izračunavaju se kao vagane sredine u kojima su ponderi osnovice tih brojeva
𝑅𝑖 =𝑣𝑖
𝐵𝑖 𝑃𝑖 =
𝐷𝑖
𝐶𝑖∙ 100
Geometrijska sredina Geometrijska sredina N vrijednosti numeričke varijable X jest N-ti korijen iz produkta njezinih
vrijednosti
𝐺 = √𝑥1 ∙ 𝑥2 ∙ … 𝑥𝑖 …𝑥𝑁𝑁
Za grupirane podatke, geometrijska sredina dana je izrazom 𝐺 = √𝑥1
𝑓1 ∙ 𝑥2𝑓2 ∙ … 𝑥𝑖
𝑓𝑖 ∙ … 𝑥𝑁𝑓𝑁𝑁
Harmonijska sredina
Harmonijska sredina N vrijednosti numeričke varijable X recipročna je vrijednosti aritmetičke sredine
njezinih recipročnih vrijednosti. 𝐻 =
𝑁
∑1𝑥𝑖
𝑁𝑖=1
Mod
Mod je položajna srednja vrijednost; najčešća vrijednost ili modalitet koji se pojavljuje u nizu. Postoji
ako su u nizu barem dva jednaka podatka.
Mod distribucije frekvencija s razredima aproksimira se pomoću izraza:
𝑀𝑜 = 𝐿1 +
(𝑏 − 𝑎)
(𝑏 − 𝑎) + (𝑏 − 𝑐)∙ 𝑖
b-najveća (korigirana) frekvencija; modalni razred je onaj sa najvećom kor. frekvencijom
Medijan. Kvantili
Medijan je položajna srednja vrijednost koja numerički niz uređen po veličini dijeli na dva jednaka
dijela
ako je broj podataka neparan, medijan je vrijednost središnjeg člana uređenog po veličini
ako je broj podatak paran, medijan je jednak poluzbroju vrijednosti varijable središnjih dvaju
članova uređenog niza
Medijan u distribuciji frekvencija s razredima aproksimira se pomoću izraza:
𝑀𝑒 = 𝐿1 +
𝑁2 −
∑𝑓1
𝑓𝑚𝑒𝑑∙ 𝑖
7
fmed-frekvencija medijalnog razreda (medijalni je onaj razred čija kumulativna frekvencija prvi put
uključuje vrijednost N/2
Medijan se ubraja u kvantile. Kvantili su vrijednosti numeričke varijable ili modaliteti rang-varijable
koji uređen numerički ili redoslijedni niz dijele na jednakobrojne dijelove. Dijele li kvantili na četiri
jednakobrojna dijela riječ je o kvartilima, na 10 dijelova decilima, na 100 dijelova percentilima.
2.2. Mjere disperzije
Mjerama disperzije brojčano se opisuje stupanj varijabilnosti statističkih podataka; najjednostavnija
mjera disperzije je raspon varijacije. Među pokazatelje varijabilnosti ubrajaju se interkvartil i
koeficijent kvartilne devijacije; najvažnija mjera disperzije je varijanca te iz nje izvedena standardna
devijacija i koeficijent varijacije; rabi se i srednje apsolutno odstupanje (MAD)
Raspon varijacije. Interkvartil
Raspon varijacije je najjednostavnija približna mjera disperzije; izražen je u mjernim jedinicama
obilježja;
𝑅𝑥 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
Interkvartil je apsolutna mjera disperzije; raspon varijacije središnjih 50 % članova niza uređenih
parova
𝐼𝑄 = 𝑄3 − 𝑄1
Varijanca. Standardna devijacija. Koeficijent varijacije
Varijanca je aritmetička sredina kvadrata odstupanja vrijednosti numeričke varijable od njezine
aritmetičke sredine
𝜎2 =1
𝑁∑ (𝑥𝑖 − �̅�)
𝑁
𝑖=1
Standardna devijacija je pozitivni drugi korijen iz varijance
𝜎 = √1
𝑁∑(𝑥𝑖 − �̅�)2𝑁
𝑖=1
Varijanca i standardna devijacija distribucije frekvencija:
𝜎2 =1
𝑁∑ 𝑓𝑖(𝑥𝑖 − �̅�)2𝑘𝑖=1 𝜎 = √
1
𝑁∑ 𝑓𝑖(𝑥𝑖 − �̅�)2𝑘𝑖=1
Koeficijent varijacije je omjer standardne devijacije i aritmetičke sredine pomnožen sa 100
𝑉 =𝜎
�̅�100
8
Ovo je samo pregled, a cijela skripta (25 str.) te čeka u
našoj SKRIPTARNICI!