statistika - referada.hr...skripte koje nađeš kod nas nisu naše autorsko djelo. to su razne...

9
STATISTIKA MALA SKRIPTA TEORIJA ZA USMENI ID: 10501

Upload: others

Post on 21-Jan-2020

10 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: STATISTIKA - Referada.hr...Skripte koje nađeš kod nas nisu naše autorsko djelo. To su razne skripte koje nam studenti donesu. Mi smo ih samo malo uredili, da ti je ljepše učiti

STATISTIKA

MALA SKRIPTA

TEORIJA ZA USMENI

ID: 10501

Page 2: STATISTIKA - Referada.hr...Skripte koje nađeš kod nas nisu naše autorsko djelo. To su razne skripte koje nam studenti donesu. Mi smo ih samo malo uredili, da ti je ljepše učiti

1

Bok!

Drago nam je što si odabrao SKRIPTARNICU za pronalazak materijala koji će ti pomoći u učenju.

Što je SKRIPTARNICA?

Skriptarnica je projekt Štreberaj tima i Urbana, a nastala je u želji da ti olakšamo studiranje. Sve

skripte možeš pogledati na stranici www.referada.hr, a kupiti u SKRIPTARNICI u Urbanu. Sjedi na kavu

i uz svoju narudžbu naruči i skriptu. Simple as that!

Tko je napisao skripte?

Skripte koje nađeš kod nas nisu naše autorsko djelo. To su razne skripte koje nam studenti donesu.

Mi smo ih samo malo uredili, da ti je ljepše učiti iz njih.

Želimo ti puno sreće s učenjem!

Štreberaj instrukcije

Ako negdje zapneš s učenjem, mi ti možemo pomoći.

Prijavi se na naše instrukcije i položi teške ispite bez muke.

Sve info možeš pronaći na www.referada.hr/instrukcije.

Page 3: STATISTIKA - Referada.hr...Skripte koje nađeš kod nas nisu naše autorsko djelo. To su razne skripte koje nam studenti donesu. Mi smo ih samo malo uredili, da ti je ljepše učiti

2

1. UVOD

Statistika – znanstvena metoda koja se bavi prikupljanjem, analiziranjem i tumačenjem podataka

različite vrste.

Podaci – promotrena kvalitativna i kvantitativna svojstva objekata, stvari, osoba, procesa...

Svrha primjene statističkih metoda – donošenje suda o osobitosti promatranih pojava, ispitivanje

različitih pretpostavki, predviđanje razine i stanja pojava.

Metode deskriptivne statistike – sastoje se u primjeni postupaka uređivanja, grupiranja, tabeliranja,

grafičkog prikazivanja statističkih podataka; podaci se ne poopćavaju.

Metode inferencijalne statistike – polaze od uzorka iz realne i konačne populacije čije se realizacije

mogu smatrati uzorkom procesa; njima se također donose vjerojatnosni sudovi o cjelini.

1.1. Statistički skup

Statistički skup – sastoji se od jedinica kojima se ispituje jedno ili više svojstava koja od jedinice do

jedinice očituju statističku promjenljivost

Opseg skupa – broj jedinica

~ prema opsegu skupa statistički skupovi se dijele na konačne i beskonačne

Konačan skup – ima konačan broj elemenata

Beskonačan skup – ima beskonačno mnogo elemenata

Skup podataka ili osnovni skup – podaci o danoj varijabli za svaki element statističkog skupa

Populacija može biti:

realna

hipotetična

konačna

beskonačna

Uzorak – podskup statističkog skupa

~ u svakom statističkom istraživanju realni statistički skupovi se definiraju pojmovno, prostorno i

vremenski

Pojmovno – određuje se pripadnost skupu

Prostorno – određuje se kojem skupu pripadaju sve jedinice stat. skupa

Vremenski – određuje se vremenski interval ili vremenska točka za koje su vezane

sve jedinice skupa

Page 4: STATISTIKA - Referada.hr...Skripte koje nađeš kod nas nisu naše autorsko djelo. To su razne skripte koje nam studenti donesu. Mi smo ih samo malo uredili, da ti je ljepše učiti

3

1.2. Vrste i izvori statističkih podataka

Statistički podaci – rezultati mjerenja svojstava jedinica statističkih skupova, njihovih podskupova ili

eksperimentalnih jedinica

Statistička varijabla ili obilježje – svojstvo koje oblikom ili stupnjem varira od jedinice do jedinice

skupa; po njemu se elementi skupa razlikuju ili jedni drugima nalikuju

Skala

Skup modaliteta varijable

Razlikujemo:

nominalnu

ordinalnu

intervalnu

omjernu

Nominalna skala – dana je u obliku nenumeričkog skupa, odnosno liste naziva; redoslijed

odabran po volji; nisu dopuštene brojčane operacije (npr. po abecedi)

Ordinalna skala – pridružuje slovne oznake, simbole ili brojeve elementima skupa prema

intenzitetu mjerenog svojstva (npr. po rangu (ocjene))

Intervalna skala – pridružuju se jedinicama brojevi sukladno intenzitetu mjerenog svojstva;

ima definiranu mjernu jedinicu i dogovorno utvrđenu nulu; moguće su osnovne računske

operacije osim dijeljenja (npr. temperaturna skala)

Omjerna skala – pridružuju se brojevi jedinicama statističkog skupa sukladno intenzitetu

mjerenog svojstva; ima definiranu mjernu jedinicu i nulu koja označuje nepostojanje svojstva;

moguće su osnovne računske operacije

Numerička varijabla

To varijabla mjerena na numeričkoj skali (intervalnoj i omjernoj)

diskretna num. varijabla – poprima konačan broj vrijednosti

kontinuirana num. varijabla – može poprimiti bilo koju vrijednost iz nekog intervala

1.3. Uređivanje podataka

Svrha uređivanja stat. podataka – omogućiti donošenje osnovnih sudova o danoj pojavi; njihovim

uređenjem nastaju statistički nizovi.

Nominalni niz – nastaje uređenjem podataka o modalitetima nominalne varijable

Page 5: STATISTIKA - Referada.hr...Skripte koje nađeš kod nas nisu naše autorsko djelo. To su razne skripte koje nam studenti donesu. Mi smo ih samo malo uredili, da ti je ljepše učiti

4

Redoslijedni niz – nastaje uređenjem podataka o rang-varijabli

Numerički niz – formira se sređivanjem podataka koji predočuju vrijednosti numeričke varijable

Vremenski niz – kronološko nizanje podataka o nekoj pojavi

Jednostavna tabela – prikazuje se jedan stat. niz

Skupna tabela – prikazuje se više nizova nastalih sređivanjem podataka prema modalitetima iste

varijable

Tabela kontingence – prikazuju se podaci grupirani istodobno prema modalitetima dviju li više

varijabli

Relativni brojevi – pomoću njih se provodi elementarna analiza podataka u sklopu deskriptivne

statistike (postoci, proporcije, relativne frekvencije, indeksi i relativni brojevi koordinacije)

1.4. Niz kvalitativnih podataka

Kvalitativni podaci – oblici nominalne ili redoslijedne varijable

Grupiranjem se skup podataka koji se odnose na jedinice stat. skupa raščlanjuju u podskupove koji

se međusobno ne preklapaju

Frekvencija – broj podataka istog oblika varijable

Relativna frekvencija pi – omjer je frekvencije i ukupnog broja podataka

Postotna relativna frekvencija Pi – relativna frekvencija pomnožena sa 100

𝑝𝑖 =𝑓𝑖

𝑁 𝑃𝑖 =

𝑓𝑖

𝑁∙ 100

~ grupirani podaci se uobičajeno prikazuju tabelom kontigence, koja se sastoji od predstupca,

zaglavlja, polja tabele, marginalnog retka i marginalnog stupca

Page 6: STATISTIKA - Referada.hr...Skripte koje nađeš kod nas nisu naše autorsko djelo. To su razne skripte koje nam studenti donesu. Mi smo ih samo malo uredili, da ti je ljepše učiti

5

2. NUMERIČKI NIZOVI I DISTRIBUCIJA

FREKVENCIJA

Numerički nizovi nastaju uređenjem kvantitativnih podataka. Pojedinačni numerički podaci

predočavaju se dijagramom s točkama i dijagramom stablo list

Ako je riječ o velikom broju podataka, o numeričkoj kontinuiranoj varijabli ili ako diskretna numerička

varijabla poprima velik broj različitih vrijednosti, distribucija frekvencija formira se grupiranjem na

temelju razreda; svaki razred ima svoju gornju i donju granicu.

Frekvencija razreda

broj istih i sličnih vrijednosti numeričke varijable

formiranju distribucije prethodi određivanje broja razreka k i veličina razreda; broj razreda k

za grupiranje N vrijednosti numeričke varijable aproksimira se izrazom 𝑘 ≈ 1 + 3.3𝑙𝑜𝑔𝑁 –

Sturgesovo pravilo

Distribucija frekvencija prikazuje se histogramom i poligonom frekvencija

Histogram – površinski grafikon

Poligon frekvencija – linijski grafikon

2.1. Srednje vrijednosti statističkog niza

Aritmetička sredina

najvažnija i najraširenija srednja vrijednost

određuje se tako da se zbroje vrijednosti numeričke varijable i podijele s njihovim brojem

�̅� =1

𝑁∑𝑥𝑖

𝑁

𝑖=1

Svojstva:

zbroj odstupanja vrijednosti numeričke varijable od njezine aritmetičke sredine jednak je nuli

zbroj kvadrata odstupanja vrijednosti numeričke varijable od njezine sredine minimalan je

aritmetička sredina nalazi se između najmanje i najveće vrijednosti niza za koji je izračunana

Aritmetička sredina aritmetičkih sredina

izračunava se kao vagana sredina u kojoj se za pondere uzima broj podataka za koje su

računane pojedine sredine

�̅� =1

𝑁∑𝑁𝑖�̅�

𝑘

𝑖=1

Page 7: STATISTIKA - Referada.hr...Skripte koje nađeš kod nas nisu naše autorsko djelo. To su razne skripte koje nam studenti donesu. Mi smo ih samo malo uredili, da ti je ljepše učiti

6

Aritmetička sredina relativnih brojeva koordinacije i aritmetička sredina postotaka

izračunavaju se kao vagane sredine u kojima su ponderi osnovice tih brojeva

𝑅𝑖 =𝑣𝑖

𝐵𝑖 𝑃𝑖 =

𝐷𝑖

𝐶𝑖∙ 100

Geometrijska sredina Geometrijska sredina N vrijednosti numeričke varijable X jest N-ti korijen iz produkta njezinih

vrijednosti

𝐺 = √𝑥1 ∙ 𝑥2 ∙ … 𝑥𝑖 …𝑥𝑁𝑁

Za grupirane podatke, geometrijska sredina dana je izrazom 𝐺 = √𝑥1

𝑓1 ∙ 𝑥2𝑓2 ∙ … 𝑥𝑖

𝑓𝑖 ∙ … 𝑥𝑁𝑓𝑁𝑁

Harmonijska sredina

Harmonijska sredina N vrijednosti numeričke varijable X recipročna je vrijednosti aritmetičke sredine

njezinih recipročnih vrijednosti. 𝐻 =

𝑁

∑1𝑥𝑖

𝑁𝑖=1

Mod

Mod je položajna srednja vrijednost; najčešća vrijednost ili modalitet koji se pojavljuje u nizu. Postoji

ako su u nizu barem dva jednaka podatka.

Mod distribucije frekvencija s razredima aproksimira se pomoću izraza:

𝑀𝑜 = 𝐿1 +

(𝑏 − 𝑎)

(𝑏 − 𝑎) + (𝑏 − 𝑐)∙ 𝑖

b-najveća (korigirana) frekvencija; modalni razred je onaj sa najvećom kor. frekvencijom

Medijan. Kvantili

Medijan je položajna srednja vrijednost koja numerički niz uređen po veličini dijeli na dva jednaka

dijela

ako je broj podataka neparan, medijan je vrijednost središnjeg člana uređenog po veličini

ako je broj podatak paran, medijan je jednak poluzbroju vrijednosti varijable središnjih dvaju

članova uređenog niza

Medijan u distribuciji frekvencija s razredima aproksimira se pomoću izraza:

𝑀𝑒 = 𝐿1 +

𝑁2 −

∑𝑓1

𝑓𝑚𝑒𝑑∙ 𝑖

Page 8: STATISTIKA - Referada.hr...Skripte koje nađeš kod nas nisu naše autorsko djelo. To su razne skripte koje nam studenti donesu. Mi smo ih samo malo uredili, da ti je ljepše učiti

7

fmed-frekvencija medijalnog razreda (medijalni je onaj razred čija kumulativna frekvencija prvi put

uključuje vrijednost N/2

Medijan se ubraja u kvantile. Kvantili su vrijednosti numeričke varijable ili modaliteti rang-varijable

koji uređen numerički ili redoslijedni niz dijele na jednakobrojne dijelove. Dijele li kvantili na četiri

jednakobrojna dijela riječ je o kvartilima, na 10 dijelova decilima, na 100 dijelova percentilima.

2.2. Mjere disperzije

Mjerama disperzije brojčano se opisuje stupanj varijabilnosti statističkih podataka; najjednostavnija

mjera disperzije je raspon varijacije. Među pokazatelje varijabilnosti ubrajaju se interkvartil i

koeficijent kvartilne devijacije; najvažnija mjera disperzije je varijanca te iz nje izvedena standardna

devijacija i koeficijent varijacije; rabi se i srednje apsolutno odstupanje (MAD)

Raspon varijacije. Interkvartil

Raspon varijacije je najjednostavnija približna mjera disperzije; izražen je u mjernim jedinicama

obilježja;

𝑅𝑥 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛

Interkvartil je apsolutna mjera disperzije; raspon varijacije središnjih 50 % članova niza uređenih

parova

𝐼𝑄 = 𝑄3 − 𝑄1

Varijanca. Standardna devijacija. Koeficijent varijacije

Varijanca je aritmetička sredina kvadrata odstupanja vrijednosti numeričke varijable od njezine

aritmetičke sredine

𝜎2 =1

𝑁∑ (𝑥𝑖 − �̅�)

𝑁

𝑖=1

Standardna devijacija je pozitivni drugi korijen iz varijance

𝜎 = √1

𝑁∑(𝑥𝑖 − �̅�)2𝑁

𝑖=1

Varijanca i standardna devijacija distribucije frekvencija:

𝜎2 =1

𝑁∑ 𝑓𝑖(𝑥𝑖 − �̅�)2𝑘𝑖=1 𝜎 = √

1

𝑁∑ 𝑓𝑖(𝑥𝑖 − �̅�)2𝑘𝑖=1

Koeficijent varijacije je omjer standardne devijacije i aritmetičke sredine pomnožen sa 100

𝑉 =𝜎

�̅�100

Page 9: STATISTIKA - Referada.hr...Skripte koje nađeš kod nas nisu naše autorsko djelo. To su razne skripte koje nam studenti donesu. Mi smo ih samo malo uredili, da ti je ljepše učiti

8

Ovo je samo pregled, a cijela skripta (25 str.) te čeka u

našoj SKRIPTARNICI!