statistiČle i grafiČke metode u geografiji- skripta

30
STATISTIKA o Statistika – znanost o prikupljanju brojčanih podataka o njihovom uređenju, metodama analize i tumačenju o Statistika – znanstveno-analitička metoda istraživanja masovnih pojava pomoću brojčanih izražavanja o Statistika – skup uređenih brojčanih podataka o različitim prirodnim i društvenim pojavama koje prikupljaju i objavljuju statističke, stručne, znanstvene u druge ustanove o Masovna pojava – pojava s masom elemenata o Podjela statistike: o deskriptivna statistika – obuhvaća postupke uređenja i analize većeg broja informacija o svim jedinicama statističkog skupa o inferencijalna statistika (matematička, analitička) – postupci kojima se pomoću dijela uzorka (informacija) donose sudovi o karakteristikama cjeline – populacija; temelji se na vjerojatnosti o Masovna pojava koja je predmet statističkog istraživanja zove se statistički skup – skup istovrsnih, ali varijabilnih elemenata o Statistički skup treba definirati pojmovno, prostorno i vremenski pojmovna definicija – utvrđuje pripadnost skupu s obzirom na pojam jedinice, odnosno određuje uvjete koji moraju biti ispunjeni da bi se neka jedinica smatrala članom skupa prostorna definicija – određuje prostor kojem pripadaju sve jedinice skupa vremenska definicija – određuje vrijeme (trenutak ili razdoblje) za koje su vezane sve jedinice skupa o Svaki skup u kojem se nalaze jedinice koje odgovaraju definicijama skupa naziva se homogeni skup i jedino takav skup može biti predmet statističkog istraživanja OBILJEŽJA o Obilježja – svojstva po kojima jedinice statističkog skupa jedna drugoj nalikuju ili se međusobno razlikuju (varijabilnost) pojavljuju se u više modaliteta o Vrste obilježja: o nominalno obilježje – kvalitativno obilježje atributivno – svojstva jedinice skupa izražena su atributima ili kategorijama (spol, djelatnost) geografsko – veza jedinica skupa s određenim prostorom o redoslijedno obilježje – obilježje ranga, kvalitativno obilježje modaliteti pokazuju intenzitet svojstva o numeričko obilježje – kvantitativno obilježje

Upload: brightcrystal1

Post on 13-Aug-2015

459 views

Category:

Documents


5 download

DESCRIPTION

Sažetak predavanje zimski semestar

TRANSCRIPT

Page 1: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

STATISTIKA

o Statistika – znanost o prikupljanju brojčanih podataka o njihovom uređenju, metodama analize i tumačenju

o Statistika – znanstveno-analitička metoda istraživanja masovnih pojava pomoću brojčanih izražavanja

o Statistika – skup uređenih brojčanih podataka o različitim prirodnim i društvenim pojavama koje prikupljaju i objavljuju statističke, stručne, znanstvene u druge ustanove

o Masovna pojava – pojava s masom elemenata

o Podjela statistike:

o deskriptivna statistika – obuhvaća postupke uređenja i analize većeg broja informacija o svim jedinicama statističkog skupa

o inferencijalna statistika (matematička, analitička) – postupci kojima se pomoću dijela uzorka (informacija) donose sudovi o karakteristikama cjeline – populacija; temelji se na vjerojatnosti

o Masovna pojava koja je predmet statističkog istraživanja zove se statistički skup – skup istovrsnih, ali varijabilnih elemenata

o Statistički skup treba definirati pojmovno, prostorno i vremenski

pojmovna definicija – utvrđuje pripadnost skupu s obzirom na pojam jedinice, odnosno određuje uvjete koji moraju biti ispunjeni da bi se neka jedinica smatrala članom skupa

prostorna definicija – određuje prostor kojem pripadaju sve jedinice skupa

vremenska definicija – određuje vrijeme (trenutak ili razdoblje) za koje su vezane sve jedinice skupa

o Svaki skup u kojem se nalaze jedinice koje odgovaraju definicijama skupa naziva se homogeni skup i jedino takav skup može biti predmet statističkog istraživanja

OBILJEŽJA

o Obilježja – svojstva po kojima jedinice statističkog skupa jedna drugoj nalikuju ili se međusobno razlikuju (varijabilnost)

pojavljuju se u više modaliteta

o Vrste obilježja:

o nominalno obilježje – kvalitativno obilježje

atributivno – svojstva jedinice skupa izražena su atributima ili kategorijama (spol, djelatnost)

geografsko – veza jedinica skupa s određenim prostorom

o redoslijedno obilježje – obilježje ranga, kvalitativno obilježje

modaliteti pokazuju intenzitet svojstva

o numeričko obilježje – kvantitativno obilježje

diskontinuirano – izraženo najčešće cijelim brojem (broj djece po obitelji)

kontinuirano – izraženo cijelim ili decimalnim brojem (duljina, udaljenost između susjednih vrijednosti)

o vremensko obilježje – ukazuje na trenutak ili razdoblje s kojim su povezane jedinice skupa

trenutačno – trenutak s kojim su povezane sve jedinice skupa

intervalno – vremenski period s kojim su povezane sve jedinice skupa

o Uređenjem statističkog skupa prema jednom obilježju nastaje statistički niz koji može biti nominalni, redoslijedni, numerički i vremenski

Page 2: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

IZVORI PODATAKA

o Primarni izvori podataka – sadrže podatke prikupljene u skladu s postavljenim ciljevima istraživanja nekom od sljedećih metoda:

brojanje (kišni dani u mjesecu)

mjerenje (dubina, vodostaj)

ocjenjivanje (oblačnost)

evidentiranje

anketiranje ili intervjuiranje

o Sekundarni izvori podataka – sadrže podatke koje su prikupile određene službe ili ustanove (statistički zavodi, ministarstva, banke…) te ih dale na korištenje (statističke publikacije, različite baze podataka, bilteni…)

o prilikom korištenja sekundarnih izvora podataka treba proučiti metodološka objašnjenja

o prednosti: dostupnost, niski troškovi pribavljanja

o nedostaci: struktura možda ne odgovara našim potrebama, otežana prosudba (pouzdanost)

SISTEMATIZACIJA GRAFIČKIH METODA

o Grafičke metode – zoran način prikazivanja među veličinama ili pojavama

o Grafičke metode:

crteži i slike u ravnini crteži u ravnini

o jednostavni crtežio dijagrami

nestrukturni dijagrami stigmodijagrami

o dijagram rasipanjao triangularni dijagram

linijski dijagramio LD u 2D pravokutnom koordinatnom sustavuo LD u polarnom koordinatnom sustavu

površinski dijagramio NPD sa stupcimao NPD s krugovima, polukrugovima i kvadratimao NPD s pravokutnicima

stereogrami kombinirani dijagrami ostali nestrukturni dijagrami

strukturni dijagrami strukturni linijski dijagrami strukturni površinski dijagrami

o strukturni dijagrami sa stupcimao strukturni krugovi i polukrugovi

blok-dijagramio profilio mrežeo tematske karte

slike u ravninio obične snimkeo zračne snimke

modeli u prostoru prostorni blok-dijagrami reljefni modeli

Page 3: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

0

5

10

15

20

25

30

35

Sij Vlj Ožu Tra Svi Lip

Hrana

Plin

Motel

Sl. 1. Izdvajanja za hranu, plin i motel u Hrvatskoj u prvoj polovici 2002. godine

Izvor: Statističke informacije 2003., Državni zavod za statistiku, Zagreb

Izdvajanje u kn

tematski modeli ostali modeli

o Dijagram – grafička predodžba kojom se pomoću točaka, linija, geometrijskih likova ili geometrijskih tijela u odgovarajućem koordinatnom sustavu razmjerno i točno prema podacima prikazuju stanja, strukture, veze, procesi i odnosi

o Tematske karte – vrsta geografskih karata kojima se na odgovarajućem dijelu opće geografske osnove prikazuju i ističu:

neki od elemenata opće geografske osnove

posebni tematski sadržaji

OSNOVNE ZAKONITOSTI IZRADE GRAFIČKOG IZRAZA

o Osnovne zakonitosti izrade grafičkog izraza vežu se uz naslov, izvore podataka i osnovnu grafičku strukturu

NASLOV

o Stoji ispod slike i duljinski odgovara duljini donje stranice slike i može biti podijeljen na redove

o Sadrži oznaku (Sl.), redni broj metode i detaljni opis sadržaja iz kojeg nedvosmisleno treba biti jasno što se prikazuje, na koji se prostor i vrijeme prikaz odnosi i u kojim jedinicama se prikazuje sadržaj

o U naslovu nije potrebno navoditi tip grafičkog izraza

o Ako je u grafička metoda u cijelosti preuzeta bez modificiranja od drugog autora, poslije naslova u uglatoj zagradi je potrebno navesti ime i prezime autora i potpuni bibliografski podatak rada u kojem je metoda objavljena

IZVOR PODATAKA

o Stoji ispod naslova, pisan je manjim fontom od naslova i duljinski odgovara duljini donje stranice slike i može biti podijeljen na redove

o Navodi se ako nema popratne tablice s konkretnim podacima prema kojima je prikaz izrađen

o Sadrži potpunu informaciju o tome gdje se nalaze pohranjeni originalni statistički podaci na osnovi kojih je izrađena metoda (dakle, naslov dokumentacije, broj dokumentacije, ustanova i mjesto izdavanja, godina i stranice na kojima se podaci nalaze)

OSNOVNA GRAFIČKA STRUKTURA

o Osnovna grafička struktura formira zamišljeni okvir grafičkog izraza unutar kojeg se nalaze sve sastavnice grafičkog izraza

o Sastoji se od sustava izrade metode, obilježja predmeta metode, mjerila, kratkog opisa mjerila i obilježja, legende, mreže i od konkretnog grafičkog oblika

o Sustav izrade metode

površinski sustavi

pravokutni koordinatni sustav

polarni koordinatni sustav

Page 4: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

mjerilo

obilježje

71.02

aa

b

41.12 bba

Zaposleni u 1000

Djelatnostipoljoprivreda uslužne

djelatnosti

muškiženski

triangularni koordinatni sustav

trodimenzionalni pravokutni sustav na dvodimenzionalnoj podlozi

o Obilježja predmeta metode

nominalno obilježje – najčešće se prikazuje stupcima (međusobno jednako udaljenim)

redoslijedno obilježje

numeričko obilježje – najčešće se prikazuje stupcima koji se naslanjaju jedan na drugi, a površina stupca mora biti proporcionalna dijelu obilježja koje prikazuje (korigirana frekvencija)

numeričko obilježje s nekoliko oblika

numeričko obilježje s većim brojem oblika

numeričko obilježje s velikim brojem oblika

vremensko obilježje – najčešće se prikazuje linijom koja povezuje određene točke u koordinatnom sustavu

trenutni vremenski niz

intervalni vremenski niz

o Mjerilo – odnos dužina na osi i veličina koje prikazuje

aritmetičko mjerilo – jednaki odsječci na osi prikazuju jednake apsolutne razmake

logaritamsko mjerilo – jednaki odsječci na osi prikazuju jednake relativne razmake

o Kratki opis mjerila i obilježja

obilježja moraju biti pune riječi

ako je naziv obilježja predug, on se piše u više redova

o Objašnjenje i legenda – stavlja se u gornji desni kut

o Mreža sustava

crta se kad smatramo da ima smisla (kako bi pomogla u očitavanju)

isključivo se crta iz točaka na osima i paralelno s osima

linije moraju biti tanke

o Konkretan grafički oblik

točka – stigmodijagram

Page 5: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

crta – linijski dijagram

geometrijski lik – površinski dijagram

geometrijsko tijelo – stereogram

FORMIRANJE, TABLIČNO I GRAFIČKO PRIKAZIVANJE NIZOVA

o Uređenjem statističkog skupa prema jednom obilježju nastaje statistički niz

o Najvažnije metode uređenja statističkih skupova su grupiranje i kronološko uređenje

o Grupiranjem prema oblicima nominalnog, redoslijednog ili numeričkog obilježja nastaje nominalni, redoslijedni ili numerički niz

o Kronološkim uređenjem statističkog skupa nastaje vremenski niz

o Grupiranje – postupak raščlanjivanja statističkog skupa na dva ili više podskupova koji se međusobno ne preklapaju, tako da se u jednoj skupini nađu jedinice skupa koje imaju isti ili sličan oblik obilježja prema kojem je izvršeno grupiranje

o Grupiranje jedinica mora biti isključivo (tako da svaka jedinica prema obilježju može pripadati smo jednoj grupi) i iscrpno (tako da svaka jedinica mora biti obuhvaćeno jednom od predviđenih grupa)

o Ako postoje jedinice za koje nije poznata informacija o obilježju prema kojem se vrši grupiranje, onda takve jedinice ulaze u zajedničku grupu pod nazivom ''nepoznato''

o Opseg podskupa je broj jedinica u jednoj grupi koji se naziva frekvencija

o Zbroj apsolutnih frekvencija jednak je opsegu osnovnog skupa

o Skup uređenih parova modaliteta obilježja s pripadajućim frekvencijama zove se statistički niz

o Razdioba frekvencija po modalitetima danog obilježja predstavlja strukturu pojave prema tom obilježju

o Osim apsolutnim, struktura se često prikazuje i relativnim frekvencijama (najčešće %) koje su proporcionalne apsolutnim frekvencijama

NOMINALNI I REDOSLIJEDNI NIZ

o Ako se nominalno obilježje pojavljuje u nešto većem broju oblika, onda se broj grupa može smanjiti tako da se oni oblici obilježja koji se pojavljuju rjeđe sjedine u jednu grupu kojoj se dade naziv ''ostalo''

o Radi usporedivosti podataka iz različitih izvora za neka atributna obilježja koja se pojavljuju u mnogo oblika izdaju se službeni popisi mogućih oblika – nomenklature (proizvodi, zanimanja, vrste djelatnosti)

o Grupe u nominalnom nizu mogu se poredati na različite načine: po abecedi, prema veličini frekvencija, prema uobičajenom redoslijedu itd.

o Grupe ''ostalo'' i ''nepoznato'' stavljaju se na posljednja mjesta u nizu

o Poredak grupa u redoslijednom nizu je prema stupnju ili intenzitetu obilježja što ga izražavaju pojedini oblici obilježja – od većeg prema manjem ili obrnuto

o Statistički podaci radi preglednosti prikazuju se u statističkoj tablici

o Posebni znakovi u tablicama:

– nema pojave

… ne raspolaže se podatkom

0 podatak manji od 0.5 jedinica

Ø prosjek

( ) nepotpuni ili nedovoljno provjeren podatak

x1 oznaka za napomenu ispod tablice (fusnota)

←↑→↓ obuhvaćen podatkom u smjeru strelice

Page 6: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

o Ako se statističkom tablicom prikazuje samo jedan statistički niz, onda se radi o jednostavnoj statističkoj tablici

o Ako dvije ili više jednostavnih tablica spojimo u jednu radi lakše usporedbe podataka, dobivamo skupnu statističku tablicu

o U skupnoj tablici prikazuju se dva ili više statističkih nizova koji su nastali grupiranjem više različitih skupova prema modalitetima istog obilježja

o Statistički nizovi mogu biti izvorni i izvedeni

o Jednostavna i skupna tablica temelje se na grupiranju prema jednom obilježju

o Istodobnim grupiranjem na temelju dva ili više obilježja nastaje kombinirana statistička tablica

o Najjednostavniji oblik kombinirane tablice je onaj u kojem je izvršeno grupiranje prema dva obilježja i takva se tablica zove tablica s dva ulaza jer se konstruira tako da se u zaglavlje stave modaliteti jednog obilježja, a u predstupac modaliteti drugog obilježja

o U kombiniranoj tablici zbroj redova i stupaca daju istu veličinu tj. opseg čitavog skupa

o Prikazivanjem statističkih podataka u tablici postiže se preglednost podataka, a zornost se postiže grafičkim prikazom

o Grafičkim prikazom količinski se odnosi prikazuju geometrijskim likovima koji olakšavaju stvaranje predodžbi o tim količinama

o Grafičko prikazivanje služi prezentaciji statističkih rezultata, rješavanju praktičnih zadataka i kao metoda znanstvenog istraživanja

o Za svaku od tih namjena grafički prikaz mora biti jednostavan, jasan i pregledan

o Grafičke metode su brojne i raznolike pa je važno odabrati onu vrstu koja najbolje odgovara prikazu neke pojave

o Načini prikazivanja nominalnih i redoslijednih nizova: jednostavni stupci, razdjelni stupci, višestruki stupci, kvadrati ili krugovi, strukturni stupci, strukturni krugovi

o Za prikaz nominalnih i redoslijednih nizova najčešće se koriste površinski dijagrami s jednostavnim stupcima, baze stupaca su jednake pa se usporedba frekvencija vrši uspoređivanjem visine stupaca

o Za prikaz geografskih obilježja često se koriste različite tematske karte

o Ako se u grafičkom prikazu jednostavnim stupcima želi istaknuti jedan dio svake frekvencije niza, koriste se razdjelni stupci

o Ako se žele grafički urediti dva niza grupirana prema istom obilježju, to će se izvesti pomoću dvostrukih stupaca

o Višestruki stupci – do pet stupaca jedan do drugoga

o Ako treba grafički prikazati ili usporediti samo dvije ili tri veličine, za to su najprimjerenije površine kvadrata ili krugova

o Budući da se površinama prikazuju frekvencije, stranicu kvadrata ili polumjer kruga vrlo je jednostavno izračunati

o Ako želimo istaknuto dio prikazane frekvencije umjesto već spomenutih razdijeljenih stupaca (gdje je usporedba otežana različitim visinama stupaca) mogu se upotrijebiti sektori kruga gdje se usporedba olakšava veličinom kuta koja je uvijek razmjerna površini odsječka kruga kojeg kut zatvara

Page 7: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

o Osim jednostavnim stupcima, razdioba frekvencijama po modalitetima danog obilježja tj. struktura pojave, često se prikazuje strukturnim stupcima i strukturnim krugovima

o Za grafičku usporedbu strukture dviju pojava koriste se i sučelice postavljeni strukturni polukrugovi

NUMERIČKI NIZ

o Oblici u kojima se pojavljuje numeričko obilježje nazivaju se vrijednostima numeričkog obilježja

o Uređenjem vrijednosti numeričkog obilježja nastaju numerički nizovi

o Najjednostavniji način uređenja vrijednosti numeričkog obilježja je njihovo nizanje po veličini čime se dobiva uređeni skup pojedinačnih vrijednosti

o Kad je pojedinačnih vrijednosti puno, donošenje zaključaka o karakteristikama numeričkog niza je otežano pa se pristupa grupiranju (koje se vrši u statističkoj tablici)

o Grupiranjem nastaje distribucija frekvencija

o Pojedinačni par u distribuciji frekvencija (vrijednost numeričkog obilježja i pripadajuća frekvencija) predstavlja numeričku grupu tj. broj (apsolutna frekvencija) ili udjel (relativna frekvencija) istih ili sličnih vrijednosti numeričkog obilježja

o Numeričke grupe nižu se od manjih vrijednosti prema većima (rijetko obrnuto)

o Numeričko obilježje koje može poprimiti konačan broj vrijednosti naziva se diskontinuiranim

o diskontinuirano obilježje najčešće je cjelobrojno

o Numeričko obilježje je kontinuirano ako može teorijski poprimiti bilo koju vrijednost iz nekog intervala

o kontinuirano obilježje može biti izraženo cijelim ili decimalnim brojem

o Kad se kontinuirano numeričko obilježje pojavljuje u samo nekoliko oblika, tj. kada može zauzeti samo nekoliko vrijednosti, onda se grupiranje vrši na taj način da se u jednu grupu svrstaju sve jedinice koje imaju istu vrijednost numeričkog obilježja

o Ako diskontinuirano numeričko obilježje može zauzeti veći broj vrijednosti, ali većina jedinica zauzima samo prvih nekoliko vrijednosti, tada se za vrijednosti obilježja s većom koncentracijom jedinica grupiranje vrši na isti način kao u prethodnom slučaju, a za sve ostale vrijednosti formira se posebna grupa ''više od …''

o Kad numeričko obilježje, kontinuirano ili diskontinuirano, zauzima veliki broj različitih vrijednosti, tada se raspon između najmanje i najveće vrijednosti podijeli u više podintervala koji se međusobno ne preklapaju – to su razredi u kojima se nalaze jedinice s istim i susjednim vrijednostima obilježja

o Broj razreda obično je između 5 i 10, rijetko iznad 15, a za približno određivanje broja razreda primjenjuje se Sturgesovo pravilo – treba postići optimalan kompromis između pretjeranog uopćavanja i prevelikog broja razreda

o Ako je distribucija vrijednosti unutar raspona varijacije ravnomjerna, mogu se formirati razredi jednakih veličina

o Ako je distribucija nepravilna, treba formirati veći boj manjih razreda u području veće koncentracije jedinica, a manje većih razreda u dijelu skupa gdje je manje jedinica – tako da ne bude velikog odstupanja u koncentraciji jedinica po razredima

o Svaki razred u pravilu ima donju i gornju granicu

o Kada u distribuciji frekvencija prvi razred nema donje granice ili posljednji razred nema gornje granice, takav je razred otvoren

o prije grafičkog prikazivanja ili brojčane analize nužno je procijeniti granice otvorenih razreda, inače se ne mogu odrediti veličina razreda i razredna frekvencija niti korigirati frekvencije

Page 8: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

o otvoreni razred smije imati samo manji broj atipičnih vrijednosti

o Kod diskontinuiranog obilježja razredi se formiraju tako da je donja granica za 1 veća od gornje granice prethodnog razreda

o Takve, nominalne granice prije brojčane analize i grafičkog prikazivanja obavezno se zamjenjuju preciznim ili pravim granicama koje se dobivaju polovljenjem vrijednosti susjedne gornje i donje granice

o Ako se diskontinuirano obilježje javlja u velikom broju oblika, tretira se kao da se radi o kontinuiranom obilježju

o Kod kontinuiranog obilježja donja granica razreda trebala bi biti jednaka gornjoj granici prethodnog razreda (prave granice)

o Kako bi se izbjegla dvojba oko pripadnosti graničnih vrijednosti, i kod kontinuiranog obilježja često se navode nominalne granice razreda, ali ih prije brojčane analize i grafičkog prikazivanja obavezno treba zamijeniti pravima

o prave granice razreda trebaju biti vrijednosti 1,10,100,… ili neke standardne vrijednosti kao npr. višekratnici brojeva 2 i 5

o U razredima s pravim granicama (L1 – donja, L2 – gornja) vrijednosti mogu biti svrstane na dva načina:

o dvojba oko pripadnosti graničnih vrijednosti može se otkloniti odgovarajućim znakovima u otvorenim razredima (<, ≤, ≥, >)

o U analizi distribucije frekvencija treba poznavati način određivanja veličine razreda i razredne sredine

o Veličina razreda jednaka je razlici donje granice toga i sljedećeg razreda, bez obzira radi li se o pravim ili nominalnim granicama

o kod pravih granica veličina razreda jednaka je razlici njegove gornje i donje granice

o Razredna sredina jednaka je poluzbroju prave donje i gornje granice razreda (kod diskontinuiranog obilježja isto ispada i s nominalnim granicama, ali kod kontinuiranog ne)

o Za jedinice koje se nalaze u jednom razredu ne zna se točna vrijednost numeričkog obilježja, već samo raspon u kojem se ta vrijednost nalazi

o često će u statističkoj obradi i grafičkom prikazivanju biti potrebno izračunati vrijednost numeričkog obilježja koja reprezentira sve pojedinačne vrijednosti u razredu i to je razredna sredina

o Reprezentativnost razredne sredine temelji se na pretpostavci da je u istom razredu podjednak broj jedinica manjih i većih od razredne sredine pa će se odstupanja od sredine razreda kompenzirati; ako je distribucija simetrična, takva će pretpostavka biti realna

o Kod asimetričnih distribucija, greška će biti manja ako su granice razreda uže i ako je broj jedinica u razredu veći; zato se asimetrične distribucije grupiraju u nejednake razrede

o Razredna sredina služi za procjenu ukupne sume numeričkog obilježja (total)

o Ta se procjena dobiva tako da se razredna sredina pomnoži brojem jedinica u razredu (ponderirana frekvencija)

o Kada numerički niz sadrži frekvencije koje pripadaju nejednakim razredima, kvantitativni odnosi se ne mogu uspoređivati neposredno, prema izvornim frekvencijama

o Korigirana frekvencija – svođenje frekvencija na istu veličinu razreda na dva načina:

o dijeljenje izvorne frekvencije veličinom razreda – jednostavno, ali ponekad rezultira vrijednostima neprikladnim za grafičko prikazivanja i numeričku obradu

o određivanje jediničnog razreda (najmanji ili najčešći) – veličinu razreda treba podijeliti veličinom jediničnog razreda – tim brojem treba podijeliti izvornu frekvenciju

o Kumulativni niz distribucije frekvencija nastaje postupnim zbrajanjem frekvencija

o izračunava se iz izvornih frekvencija (apsolutnih ili relativnih)

Broj zaposlenih

Broj trgovinaSredina

razreda (x)Ukupno

zaposlenih fx

4-6 9 5 45

Page 9: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

o grafički se obično prikazuje linijskim dijagramom

o Kumulativni niz ''manje od'' predstavlja zbroj svih frekvencija do pojedinog mjesta u nizu

o u grafičkom prikazivanju ima stalni uzlazni trend

o kumulirana frekvencija unosi se na gornju pravu granicu razreda

o Kumulativni niz ''više od'' predstavlja zbroj svih vrijednosti niza, ali izračunat s dna tablice

o u grafičkom prikazivanju ima stalni silazni trend

o kumulirana frekvencija unosi se na donju pravu granicu razreda

o Distribucija frekvencija grafički se prikazuje linijskim dijagramom – poligon frekvencija, i površinskim dijagramom, tj. spojenim stupcima ili pravokutnicima – histogram

o Pravila duljine ordinate i apscise kod histograma i poligona frekvencija

o duljina apscise = duljina ordinate 1.41∙

o prekršeno pravilo: duljina apscise = duljina ordinate : 1.41

o Distribucija frekvencija za diskontinuirano obilježje s nekoliko oblika

o vrijednosti obilježja pišu se na sredini ispod baze stupaca

o visina stupaca određena je originalnim frekvencijama

(grafikon prema tablici 3)

o Distribucija frekvencija za diskontinuirano obilježje s većim brojem oblika

o pojedinačne vrijednosti prikazuju se kao u prethodnom slučaju

o razred se prikazuje pravokutnikom čija je širina proporcionalna veličini razreda, a visina određena korigiranom frekvencijom

(grafikon prema tablici s brojem obitelji prema broju djece)

o Kod linijskog dijagrama vrijednosti diskontinuiranog obilježja upisuju se između oznaka na apscisi, a ordinate se dižu sa sredine razmaka između oznaka

o Distribucija frekvencija za kontinuirano obilježje i diskontinuirano obilježje s velikim brojem oblika

o granice razreda se pišu ispod oznaka na apscisi

o kod histograma osnovice pravokutnika proporcionalne su veličini razreda, visina ovisi o frekvenciji

ako su veličine razreda različite, potrebno je korigirati frekvenciju

korigiranje frekvencija nužno je jer površina pravokutnika mora predstavljati numeričku vrijednost frekvencije, a zbroj površina zbroj frekvencija

o kod poligona frekvencija apscisa predstavlja razrednu sredinu, a ordinata korigiranu frekvenciju

VREMENSKI NIZ

o Vremensko obilježje označava trenutak ili razdoblje s kojim su jedinice statističkog skupa u nekoj vezi

o Skup kronološki uređenih vrijednosti čini vremenski niz

o Vrijednosti koje tvore niz nazivaju se frekvencija

o S obzirom na način postanka frekvencija razlikuju se intervalni i trenutačni niz

o Frekvencije intervalnog niza nastaju zbrajanjem jedinica unutar određenih vremenskih razdoblja (intervala)

o i same frekvencije toga niza mogu se zbrajati jer dobiveni zbrojevi imaju smisleno tumačenje

o intervalni niz ima svojstva kumulativnosti (samo ''odozgo prema dolje'')

o Frekvencije trenutačnog niza predstavljaju stanje pojave u odabranim vremenskim točkama

o trenutačni niz nema svojstvo kumulativnosti

Page 10: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

o Vremenski nizovi mogu biti izvorni i izvedeni

o u izvornom nizu frekvencije su izraz izravnog mjerenja veličine pojave

o izvedeni niz nastaje kronološkim uređenjem vrijednosti nastalih brojčanim operacijama nad jednim ili više vremenskih nizova

o Statistička analiza pojave u vremenu provodi se na temelju konzistentnog vremenskog niza – frekvencije niza međusobno su usporedive jer u promatranom rasponu vremena nije promijenjena pojmovna i prostorna definicija pojave

o Intervalni niz najčešće se prikazuje linijskim dijagramom, ponekad i površinskim dijagramom

o ako intervali promatranja nisu jednaki, treba korigirati frekvenciju

o Promjena strukture kroz vrijeme prikazuje se strukturnim linijskim dijagramom

o Za isticanje i usporedbu relativnih promjena koristi se polulogaritamski dijagram

o aritmetičko mjerilo na ordinati – samo za pojave čije su frekvencije izražene u istim mjernim jedinicama, i to ako među frekvencijama nisu velike brojčane razlike

o Sezonske oscilacije prikazuju se polarnim dijagramom

o Polarni koordinatni sustav:

o elementi su pol (0) i polarna os (x)

o kroz pol prolazi teorijski bezbroj, u praksi do 12 radijus-vektora (r)

puni krug dijeli se s potrebnim brojem radijus-vektora i time se dobiva kut između njih

o polarna os najčešće je u horizontalnom položaju (desno) ili okomitom (gore)

o na polarnu os ucrtava se mjerilo – kroz oznake mjerila na polarnoj osi ucrtavaju se koncentrične kružnice koje zajedno s radijus-vektorima čine mrežu sustava

o položaj točke u ravnini određen je udaljenošću od pola tj. dužinom radijus-vektora i kutom što ga radijus-vektor zatvara s polarnom osi (ti se kutovi uvijek mjere u smjeru kazaljke na satu)

o broj radijus-vektora ovisi o broju modaliteta obilježja (mjeseci u godini, stanje svijeta, određeni pokazatelji, itd.)

o modaliteti obilježja na radijus-vektorima označavaju se u smjeru kazaljke na satu počevši od okomitog

o polarni sustav najpogodniji je za prikazivanje struktura (strukturni krug) i sezonskih oscilacija pojava (polarni dijagram)

o ostale grafičke forme su: ruža vjetrova, tipogrami

RELATIVNI BROJEVI

o U statističkoj analizi važno mjesto pripada uspoređivanju pri čemu apsolutne vrijednosti mogu navesti na pogrešne zaključke

o Da bi se odredilo koja je veličina relativno veća ili manja, treba prije svega odabrati drugu veličinu prema kojoj će se izvršiti raspoređivanje

o Izbor te veličine vrlo je važan jer ona služi kao mjerilo, odnosno kao baza usporedbe

o To znači da je relativni broj logičan izraz mjerenja kojim se neka veličina mjeri drugom

o Ovisno o tome koja je veličina baza usporedbe, razlikujemo nekoliko vrsta relativnih brojeva: proporcija, relativni broj koordinacije, indeksi, stope

o Svi se relativni brojevi (R) računaju na isti način, tj. tako da se broj koji se želi usporediti (V) dijeli brojem koji služi kao baza usporedbe (B)

radi preglednosti se ponekad množi s 10, 100 ili 1000

Page 11: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

PROPORCIJE

o Proporcije (P) se određuju omjerom dijela i cjeline

o Grafičko prikazivanje proporcija:

strukturni dijagrama

triangularni dijagrami

stereogrami

Triangularni koordinatni sustav

o Koristi se za pojave koje imaju trodijelnu strukturu (sektori djelatnosti, dobne skupine, stručna sprema)

o Naročito pogodan za prikaz struktura u većem broju jedinica (prikaz drugim tipovima dijagrama iziskuje više prostora, ovdje se lakše uočavaju određene zakonitosti…)

o Kao izražajno sredstvo koristi se točka – stigmogram (nestrukturni dijagram)

o Određuju ga tri osi (x,y,z), kut od 60° među osima, podjela osi na postotke – najčešće od 1 do 100%

o Triangularni koordinatni dijagram koristi koordinatni sustav zatvoren površinom jednakostraničnog trokuta

o Više načina ucrtavanja i očitavanja položaja točki od kojih su dva najčešća i njihove zajedničke značajke su:

o jednakostranični trokut u kojem je vodoravna os x, a y i z se nastavljaju u smjeru kazaljke na satu (položaj osi x i y je kao i kod pravokutnog koordinatnog sustava)

o osnovna podjela na postotke (0-100%) s desetičnim oznakama

o mreža unutar trokuta – obavezna

o oznake osi zamjenjuju se modalitetima obilježja

Način I (prema Štercu)

o Oznake na osima za podjelu na postotke ucrtavaju se paralelno s prethodnom osi (na osi y su paralelne s osi x, dakle vodoravne, na osi z su paralelne s osi y, a na osi x su paralelne s osi z)

o Osi se numeriraju u smjeru kazaljke na satu:

o os x ima vrijednost 0% s desne, odnosno 100% s lijeve strane

o os y nastavlja se na x: odozdo počinje s 0%, a završava sa 100% na vrhu

o os z nastavlja se na y: počinje s 0% na vrhu, a završava sa 100% kod x = 0%

o Položaj točaka:

vrijednost koordinate točke tumači se kao njena udaljenost od pojedine osi

vrijednost koordinate očitava se na sljedećoj osi (koordinata x na osi y, koordinata y na osi z, koordinata z na osi x)

o Linije koje spajaju 50% na pojedinim osima mogu se označiti debljom linijom – koordinatni sustav time je podijeljen na 4 manja jednakostranična trokuta

o Sve točke koje su u središnjem trokutu nemaju prevlast niti jedne komponente

točke koje su u gornjem trokutu imaju natpolovičnu prevlast komponente x

točke koje su u donjem desnom trokutu imaju prevlast komponente y

točke koje su u donjem lijevom trokutu imaju prevlast komponente z

Način II

Page 12: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

o Oznake na osima za podjelu na postotke crtaju se paralelno sa sljedećom osi (na osi x su paralelne s osi y, na osi y sa osi z, na osi z sa osi x)

o Osi se numeriraju u smjeru obrnutom od kazaljke na satu

o os x počinje s 0% s lijeve strane, a završava sa 100% s desne strane

o os z se nastavlja na os x: odozdo počinje sa 0%, a završava sa 100% na vrhu

o os y se nastavlja na os z: počinje s 0% na vrhu, a završava sa 100% kod x = 0%

o Položaj točaka:

o vrijednost koordinate očitava se na istoj osi, a položaj oznaka uz osi pokazuje smjer pri ucrtavanju i očitavanju

o točke s istim položajem imat će drugačije koordinate nego u prethodnom načinu

Prostorni koordinatni sustav

o Određuju ga:

tri osi (x – apscisa, y – ordinata, z – aplikata)

ishodište – presjecište osi x, y i z

pravi kut među osima

desna orijentacija – suprotno od kazaljke na satu

o Prostorni koordinatni sustav služi za prikaz triju međusobno povezanih pojava

o na svakoj osi prikazuje se jedna vrijednost (veličina) – trodimenzionalnost

o izražajno sredstvo je geometrijsko tijelo – kvadar

o Stereogram – površinski dijagram (na dvodimenzionalnoj podlozi) s prostornim oblicima

može biti strukturni i nestrukturni

svaka dimenzija nešto prikazuje

o Poredak članova skupa ovisi o položaju osi – treba osigurati vidljivost svih tijela

o Članovi niza rangiraju se prema jednoj od veličina – najbolje onoj na osi x

o desna perspektiva – poredati od većeg prema manjem

o lijeva perspektiva – poredati od manjeg prema većem

RELATIVNI BROJ KOORDINACIJE

o Relativni broj koordinacije – broj koji pokazuje odnos dviju koordiniranih (međusobno povezanih) veličina

o Izračunava se kao i svi relativni brojevi tj. dijeljenjem veličine koja se uspoređuje (V) veličinom koja služi kao baza usporedbe (B)

o Primjer: gustoća cestovne mreže (R) = duljina ceste u km (V) : površina površinske jedinice u km2 (B)

Varzarov znak

o Površinski dijagram s pravokutnicima

o Na os y unosi se relativni broj koordinacije

o Širina stupca (x) predstavlja vrijednost s kojom se dijeli

o Površina stupca predstavlja vrijednost koja se dijeli

Page 13: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

o Varzarov znak je prikaz triju veličina u dvodimenzionalnom pravokutnom koordinatnom sustavu

o Primjer:

INDEKSI

o Indeksi – relativni brojevi kojima se uspoređuje smjer i intenzitet varijacija jednog ili više statističkih nizova

o Vrijednost koja služi kao baza usporedbe označava se sa 100

o Formula za izračunavanje indeksa u nominalnim nizovima:

o Primjer:

ZemljaUvoz (mil. $)

Indeks (UK=100)

Indeks (NL=100)

BiH 136.8 72.4 80.4Češka 207.7 110.0 122.1Japan 139.4 73.8 82.0Libija 133.4 70.6 78.4Mađarska 238.5 126.3 140.2Nizozemska 170.1 90.0 100.0Švedska 147.4 78.0 86.7Švicarska 212.7 112.6 125.0UK 188.9 100.0 111.1

o Vremenski indeksi omogućuju prikaz relativnih promjena kroz vrijeme

o Formule za izračunavanje indeksa u vremenskim nizovima:

o o indeks na stalnoj bazi

o lančani indeks

o Primjer:

Logaritamsko mjerilo

OpćinaBroj

stanovnikaDohodak (tis. kn)

Dohodak PC (kn)

Donja Stubica 9337 10232 1096Klanjec 3481 4542 1305Krapina 7624 11335 1487Pregrada 5022 12464 2482Zabok 10771 15090 1401Zlatar 9701 13408 1382UKUPNO 45936 67071 1460

GodinaProizvodnja

u 1000 tIndeks

(1984.=100)Lančani indeks

1984. 1361 100.0 –1985. 1130 83.0 83.01986. 1078 79.2 95.41987. 1274 93.6 118.21988 1434 105.4 112.61989. 1288 94.6 89.81990. 1602 117.7 124.4

Page 14: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

o Da bi jednake relativne promjene bile prikazane jednakim razmacima trebalo bi logaritmirati sve frekvencije što je nespretno i za izradu i za očitavanje crteža

o Umjesto toga na osi y uvodi se logaritamsko mjerilo

o dužinski razmaci jedinica mjerila ne odgovaraju njihovim razlikama nego razlikama njihovih logaritama

o jednaki razmaci bit će među članovima s jednakim relativnim razlikama (npr. između 1 i 2, između 2 i 4, između 4 i 8, između 5 i 10)

o Logaritamsko mjerilo ne može početi od 0 jer je log 0 = –∞, no može početi bilo kojom vrijednošću većom od 0

o Jedan ciklus mjerila završava 10 puta većom vrijednošću nego što počinje – to je jedinična veličina

o log 1 = 0 log 10 = 1

o zbog toga je pogodno da duljina ciklusa bude 10 cm (za papire veličine A4)

o Po potrebi završetak jednog ciklusa može biti početak sljedećeg (npr. 1-10 i 10-100 itd.)

o Razmaci se interpoliraju prema vrijednostima logaritama

o vrijednost 2 bit će na 0.3 veličine cijelog raspona (jer je log 2 = 0.30103), vrijednost 3 bit će na 0.447 veličine cijelog raspona (jer je log 3 = 0.47712)

o Radi točnijeg ucrtavanja ponekad je potrebno ucrtati i podjelu nižeg reda

o 1-2, 2-3, 3-4 na deset dijelova

o 4-5, 5-6 na pet dijelova

o ostalo na dva dijela

STOPE

o Uz indekse među osnovne pokazatelje dinamike pojave ubrajaju se pojedinačne razlike frekvencija niza – u uzastopnim razdobljima ili u odnosu na neko fiksno razdoblje – u apsolutnom i relativnom iznosu

Kretanje pojave u uzastopnim razdobljima

o Pojedinačne apsolutne promjene u uzastopnim razdobljima zovu se prve diferencije niza

o promjene su izražene u istim mjernim jedinicama kao i frekvencije (y)

o pokazuju za koliko se apsolutno promijenila razina pojave u određenoj vremenskoj jedinici u odnosu na prethodnu vremensku jedinicu

o kako su ovisne o mjernim jedinicama i veličini frekvencija, nisu uvijek prikladne za donošenje sudova o razvoju pojave, niti se njima mogu usporediti varijacije raznorodnih pojava – tih nedostataka nemaju relativni pokazatelji

o Prva relativna diferencija naziva se pojedinačna stopa promjene

o pokazuje za koliko se postotaka promjeni razina pojave u određenoj vremenskoj jedinici u odnosu na prethodnu vremensku jedinicu

o Diferencije, i apsolutne i relativne, mogu poslužiti i kao pomoćno sredstvo za prepoznavanje nekih oblika modela trenda

o Ako su prve diferencije frekvencija vremenskog niza približno jednake, to pokazuje da je osnovna tendencija kretanja pojave linearna (linearni trend – na grafu slično pravcu)

o Ako su pojedinačne stope promjene frekvencija vremenskog niza podjednake, to znači da se pojava od razdoblja do razdoblja mijenja za približno isti relativni iznos (eksponencijalni trend – na grafu slično zakrivljenoj liniji)

o Osim pojedinačnih diferencija i stopa mogu se izračunati i prosječna diferencija i stopa vremenskog niza

Page 15: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

o u njihovom se izračunavanju upotrebljavaju samo dvije frekvencije – posljednja i prva u nizu, dok ostale frekvencije ne utječu na veličinu prosjeka odnosno prosječne stope

o zato će ti pokazatelji biti reprezentativni samo ako pojedinačne diferencije odnosno stope imaju isti predznak i ako između njih postoje velike brojčane razlike

o Za vremenske nizove s nejednakim intervalima promatranja (npr. kretanje stanovništva po popisima: 1948., 1953., 1961., 1971. itd.) računaju se prosječni apsolutni i relativni pokazatelji promjene za svaki pojedini interval

Kretanje pojave u odnosu na fiksno (bazno) razdoblje

o Apsolutna promjena:

o Relativna promjena:

o Apsolutne promjene su izražene u mjernim jedinicama niza, a relativne u postotku odstupanja frekvencije baznog razdoblja (vremenske jedinice)

SREDNJE VRIJEDNOSTI

o Grupiranjem, tabličnim i grafičkim prikazivanjem sažima se veći broj podataka u manji broj njih

o Promatranjem uređenih varijacija (tj. statističkog niza) ili grafičkog prikaza dobiva se dojam o prirodi raspoređivanja podataka (tj. distribucije frekvencija)

o Numeričkim metodama deskriptivne statistike dolazi se do svodnih pokazatelja i dalje redukcije informacija

o Pokazatelji kojima se opisuju gomilanje podataka oko neke vrijednosti nazivaju se srednjim vrijednostima ili mjerama centralne tendencije

o Srednje vrijednosti dijele se na potpune i položajne

o U izračunavanju potpune srednje vrijednosti sudjeluje svaka vrijednost niza (aritmetička, geometrijska i harmonijska sredina)

o Položajna srednja vrijednost određena je mjestom u nizu (mod i medijan te kvantili)

o Možemo reći da je srednja vrijednost konstanta kojom se predstavlja niz varijabilnih podataka

o to znači da ona zamjenjuje svaku pojedinačnu vrijednost u nizu i niz u cjelini

ARITMETIČKA SREDINA

o Svojstva aritmetičke sredine:

o zbroj odstupanja pojedinačnih vrijednosti niza od aritmetičke sredine jednak je nuli

o zbroj kvadrata odstupanja pojedinačnih vrijednosti niza od aritmetičke sredine je minimalan, tj. manji je od zbroja kvadrata odstupanja vrijednosti niza od bilo koje druge vrijednosti

o Jednostavna aritmetička sredina računa se za statistički niz od pojedinačnih vrijednosti

o Ponderirana aritmetička sredina računa se za statistički niz u kojem se nalaze grupirane pojedinačne vrijednosti

o Aritmetička sredina aritmetičkih sredina (zajednička aritmetička sredina)

kod već grupiranih aritmetičkih sredina

Page 16: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

o Aritmetička sredina relativnih brojeva koordinacije

B – baza relativnog broja; R – relativni broj koordinacije

o Aritmetička sredina postotaka

P – postotak; C – baza postotka

MOD

o Mod (Mo) – najčešći modalitet obilježja (nužno se u obilježju javlja više puta)

o Ako se radi o grupiranim članovima skupa, onda je to modalitet s najvećom frekvencijom

o Primjeri: 127, 88, 92, 65, 118, 145, 93, 153, 58, 121, 65

→ mod je 65 (pojavljuje se najviše, 2 puta)

Broj učenika Broj odjeljenja28 1229 1130 1231 1332 11

Page 17: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

→ mod je 31 (pojavljuje se najviše, 13 puta)

Page 18: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

o Ostali oblici distribucije:

Gaussova ili zvono distribucija

desno asimetrična ili J distribucija

lijevo asimetrična ili L distribucija

o Određivanje moda za vrijednosti grupirane u razrede:

L1 – donja granica modalnog razreda i – veličina modalnog razreda a – frekvencija razreda prije modalnog b – frekvencija modalnog razreda c – frekvencija razreda iza modalnog

o Grafičko određivanje moda za vrijednosti grupirane u razrede:

o radi krupnijeg mjerila, dovoljno je stupcima nacrtati samo ispredmodalni, modalni i poslijemodalni razred (a, b i c)

o ako razredi nisu iste veličine, ucrtavaju se korigirane frekvencije, a stupci nisu iste širine

o linijom se spoji donja granica modalnog razreda s donjom granicom poslijemodalnog razreda, a gornja granica modalnog razreda s gornjom granicom ispredmodalnog razreda

o iz presjecišta linija spusti se okomica na os x i približno očita vrijednost moda

o Primjer:

Površina (m2)

Broj dućanaVeličina razreda

Korigirana frekvencija

5-10 7 5 7010-20 16 10 8020-30 19 10 9530-50 26 20 65

50-100 32 50 32100-150 22 50 22150-200 15 50 15

UKUPNO 137 - 379

MEDIJAN

o Medijan (Me) – vrijednost numeričkog obilježja koja niz uređen po veličini dijeli na dva jednakobrojna dijela

o Izračunavanje medijana za pojedinačne vrijednosti i vrijednosti grupirane tako da se u jednoj grupi nalaze jedinice s jednakom vrijednošću obilježja:

o Primjeri: 34, 18, 22, 6, 14, 10, 19, 11, 20 → 6, 10, 11, 14, 18, 19, 20, 22, 34 → medijan je 18

34, 18, 22, 6, 14, 10, 19, 20 → 6, 10, 14, 18, 19, 20, 22, 34 → medijan je 18.5

o Izračunavanje medijana za vrijednosti grupirane u razrede:

L1 – donja granica medijalnog razreda i – veličina medijalnog razreda ∑f1 – zbroj frekvencija do medijalnog razreda fmed – frekvencija medijalnog razreda N – broj članova niza

o Grafičko određivanje medijana za vrijednosti grupirane u razrede:

o na dijagram se ucrtavaju kumulativni niz ''manje od'' i kumulativni niz ''više od''

o iz presjecišta linija se spusti okomica na os x i približno se odredi vrijednost medijana

Page 19: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

KVANTILI

o Kvantili – članovi niza uređenog po veličini koji taj niz dijele na x jednakih (jednakobrojnih) dijelova

o Medijani su kvantili drugog reda, a kvartili su kvantili četvrtog reda

o Izračunavanje kvartila za pojedinačne vrijednosti i vrijednosti grupirane tako da se u jednoj grupi nalaze jedinice s jednakom vrijednošću obilježja:

Izračunavanje kvartila za vrijednosti grupirane u razrede:

L1 – donja granica kvartilnog razreda i – veličina kvartilnog razreda ∑f1 – zbroj frekvencija do kvartilnog razreda fkvart – frekvencija kvartilnog razreda N – broj članova niza

MJERE DISPERZIJE

o Mjere disperzije pokazuju stupanj varijabilnosti obilježja

o Raspon varijacije (R) – stupanj raspršenosti vrijednosti numeričke varijable, odnosno razlika između najveće i najmanje vrijednosti

o Interkvartil (IQ) omogućuje smanjivanje raspona iz kojeg se izračunava varijacija tako što uzima samo jedinice između prvog i trećeg kvartila

o Koeficijent kvartilne devijacije (VQ) koristi se za usporedbu stupnja disperzije podataka između prvog i trećeg kvartila

VARIJANCA

o Srednje (prosječno) apsolutno odstupanje:

o Moment oko sredine – aritmetička sredina obilježja pojedinih vrijednosti obilježja od aritmetičke sredine tog obilježja potenciranih nekom potencijom

o Varijanca (σ2) – aritmetička sredina kvadrata odstupanja vrijednosti numeričke varijable X od njezine aritmetičke sredine

o varijanca je drugi moment oko sredine

o Standardna devijacija (σ) – prosječno odstupanje od prosjeka izraženo mjernom jedinicom

o standardna devijacija je pozitivni drugi korijen iz varijance

o Koeficijent varijacije (V) – prosječno odstupanje od prosjeka izraženo postotkom

o Moment oko nule (mr):

Z-OBILJEŽJE

o Standardizirano obilježje (z) pokazuje odstupanje pojedinih jedinica statističkog skupa od aritmetičke sredine, izraženo u jedinicama standardnih devijacija

o Z-obilježje koristi se za usporedbu jedinica različitih statističkih skupova s različitim aritmetičkim sredinama

Page 20: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

MJERE KONCENTRACIJE

o Mjerama koncentracije pokazuje se ne/ravnomjernost razdiobe totala po članovima statističkog skupa

o Primjeri: raspodjela ukupne plaće po zaposlenicima nekog poduzeća

raspodjela ukupne površine prodajnog prostora po dućanima

o Koncentracija se grafički prikazuje Lorenzovom krivuljom

o Lorenzova krivulja može se nacrtati temeljem distribucije frekvencija jednog ili dvaju statističkih nizova po modalitetima nominalnog obilježja – tako se Lorenzova krivulja može primijeniti u analizi prostorne koncentracije i specijalizacije

o Izrada Lorenzove krivulje:

o prvo se ucrtava dijagonala koja predstavlja idealnu hipotetičku raspodjelu koncentracije

o krivulja se dobiva spajanjem ishodišne točke (0) i točaka svakog pojedinog obilježja dobivenih zbrajanjem prethodnih kumuliranih vrijednosti

o na osi x ucrtava se rang, a na osi y vrijednost kumulativnog niza

o Čitanje Lorenzove krivulje:

o što je veći otklon krivulje, veća je koncentracija pojave

o krivulja otkriva samo stanje, a ne i posljedično-uzročne veze

o krivulja otkriva samo stupanj, ali ne i strukturu pojave

o Kod prikaza dviju Lorenzovih krivulja za dvije različite pojave na istom dijagramu modaliteti su za različite pojave različito poredani pa ista jedinica ranga ne označava isti modalitet

o GIK – grubi indeks koncentracije dobiven konačnim zbrojem kumuliranih vrijednosti

o GIKmin – grubi minimalni indeks koncentracije dobiven pretpostavkom kumuliranja potpuno jednakih postotnih udjela svakog modaliteta

o GIKmax – grubi maksimalni indeks koncentracije dobiven pretpostavkom da jedan modalitet ima 100-postotan udjel, dok su ostali modaliteti bez udjela

o Intenzitet koncentracije I:

A – grubi indeks koncentracije za manju prostornu jedinicu R – grubi indeks koncentracije za veću prostornu jedinicu M – minimalni grubi indeks koncentracije

o Indeks koncentracije izračunava se iz grafički određenih vrijednosti

o iz znaka 10%, 20%... 100% na osi x podiže se okomica do linije koncentracije, a vrijednost točke očitava se na osi y

o tako se dobivaju vrijednosti c1, c2 … c10 (c10 uvijek iznosi 100) čiji zbroj daje vrijednost c

o Primjer: stanovništvo RH po županijama

ŽupanijaStanovništvo 1971. Stanovništvo 2001.

broj % broj %

Zagrebačka 232 836 5.3 309 696 7.0Krapinsko-zagorska 161 247 3.6 142 432 3.2Sisačko-moslavačka 258 643 5.8 185 387 4.2Karlovačka 195 096 4.4 141 787 3.2Varaždinska 184 380 4.2 184 769 4.2Koprivničko-križevačka 138 994 3.1 124 467 2.8Bjelovarsko-bilogorska 157 806 3.6 133 084 3.0Primorsko-goranska 270 660 6.1 305 505 6.9Ličko-senjska 106 433 2.4 53 677 1.2Virovitičko-podravska 116 314 2.6 93 389 2.1Požeško-slavonska 101 750 2.3 85 831 1.9Brodsko-posavska 164 065 3.7 176 765 4.0Zadarska 190 356 4.3 162 045 3.7Osječko-baranjska 351 164 7.9 330 506 7.4Šibensko-kninska 161 199 3.6 112 891 2.5Vukovarsko-srijemska 217 115 4.9 204 768 4.6Splitsko-dalmatinska 389 277 8.8 463 676 10.4Istarska 175 199 4.0 206 344 4.7Dubrovačko-neretvanska 108 131 2.4 122 870 2.8Međimurska 115 660 2.6 118 426 2.7Grad Zagreb 629 896 14.2 779 145 17.6

Republika Hrvatska

4 426 226 100.0 4 437 460100.0

RangŽupanija

1 Grad Zagreb2 Splitsko-dalmatinska3 Osječko-baranjska4 Primorsko-goranska5 Sisačko-moslavačka6 Zagrebačka7 Vukovarsko-srijemska8 Karlovačka9 Zadarska

10 Varaždinska11 Istarska12 Brodsko-posavska13 Krapinsko-zagorska14 Šibensko-kninska15 Bjelovarsko-bilogorska16 Koprivničko-križevačka17 Virovitičko-podravska18 Međimurska19 Dubrovačko-neretvanska

Page 21: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA
Page 22: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

LINEARNI TREND

o Pojave koje mogu biti predmet statističke analize su pojave koje imaju različite dimenzije razvoja kroz vrijeme

o Trend – osnovna tendencija kretanja, može biti linearni i krivolinijski

o Linearni trend pokazuje da je za svako jednako razdoblje jednak smjer i jačina promjena

o Graf linearnog trenda:

o

o

o

o Primjer:

Godina Broj doseljenih1992. 27251993. 22841994. 22401995. 1750

Page 23: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

1996. 1690Ukupno 10689

o Potrebno je izračunati u kojoj mjeri trend reprezentira stvarno kretanje pojave

KORELACIJA I REGRESIJA

o Korelacija – međusobna povezanost pojava (ali ne nužno i dokaz uzročnosti)

o Veze među pojavama različite su po:

o smjeru: pozitivne veze – porastom vrijednosti jedne pojave rastu i vrijednosti druge pojave

negativne veze – porastom vrijednosti jedne pojave smanjuju se vrijednosti druge pojave

o jakosti: funkcionalne veze – vrijednosti pojave y ovise isključivo o vrijednostima pojave x (i ni o čemu drugome) – svakoj vrijednosti x odgovara točno određena vrijednost y

statističke veze – vrijednosti pojave y ovise među ostalim o vrijednostima pojave x (ali i o drugim pojavama)

o obliku: linearna veza – za jednaku promjenu varijable x, y se mijenja uvijek za isti iznos

krivolinijska veza – za jednaku promjenu varijable x, y se mijenja za različit iznos ovisno o tome na kojem dijelu linije se promjena promatra

o Korelacija može biti bivarijantna (dvije pojave) i multivarijantna (tri ili više pojava)

o Bivarijantna korelacija – ako je odnos x i y takav da za dane vrijednosti x možemo reći da je y funkcija od x (x je tada nezavisna, a y zavisna varijabla)

o Najjednostavnija funkcija je f(x)=a+bx tj. y=a+bx – opći oblik jednadžbe pravca

o Primjer: visina meteorološke postaje (x) i količina padalina (y)

podaci se ucrtavaju u dijagram rasipanja

vrijednosti nezavisne varijable ucrtavaju se na os x, a zavisne na os y

radi lakše orijentacije, linijom se ucrtavaju vrijednosti prosječnog x i prosječnog y

raspored točaka pokazuje pravilnost: s porastom nadmorske visine povećava se količina padalina

točke se nalaze približno duž jednog pravca → između promatranih pojava postoji linearna veza

pravac koji se najbolje ''uklapa'' među ucrtane točke zove se linija regresije

zakonitost na grafu: stanice na ispodprosječnim visinama imaju ispodprosječnu količinu padalina (donji lijevi kvadrant) dok stanice na iznadprosječnim visinama imaju iznadprosječnu količinu padalina (gornji desni kvadrant)

iako pojedine točke odstupaju od pravca, on pokazuje opći odnos pojava x i y odnosno prosječnu vezu među tim pojavama

o Za liniju regresije ŷ=a+bx treba izračunati parametre a i b

o a – vrijednost varijable y ako je nezavisna varijabla x=0

o b – koeficijent progresije

Page 24: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

pokazuje kako i koliko će se promijeniti varijabla y ako se varijabla x promjeni za jednu jedinicu (predznakom pokazuje smjer korelacije, a veličinom intenzitet promjene y-a)

prosječna prostorna promjena vrijednosti y za jediničnu promjenu vrijednosti

o za svaku vrijednost xi (kao i za bilo koju vrijednost x) može se izračunati pripadajuća vrijednost y na pravcu odnosno vrijednost regresije (ŷi)

o za definiranje pravca dovoljno je izračunati ŷ za dvije točke, najbolje što udaljenije (xmin i xmax)

o pravac regresije uvijek prolazi presjecištem srednje vrijednosti x-a i y-a

o sve točke xi i ŷi nalaze se na pravcu regresije

o zbroj svih pretpostavljenih vrijednosti y-a jednak je zbroju svih stvarnih vrijednosti y-a

MJERE PRECIZNOSTI

o Mjere preciznosti – procjene zavisne varijable pomoću linije regresije

o Kao mjera preciznosti služi standardna devijacija izračunata na bazi odstupanja originalnih vrijednosti zavisne varijable (y) od procijenjenih vrijednosti pomoću linije regresije (ŷ) – ta odstupanja predstavljaju greške procjene

Graf korelacije i regresije

- odstupanje pojedine vrijednosti y od prosječnog y (ukupno odstupanje)

- protumačeno odstupanje (zbog veze koja postoji među pojavama x i y)

- neprotumačeno odstupanje – udaljenost od idealnog y-a koji bi x-u pripadao po jednadžbi regresije

- razlika stvarnih vrijednosti y i očekivanih vrijednosti (ŷ) za svaki x i – to je zapravo greška procjene odnosno rezidualno odstupanje

o Veličina rezidualnih odstupanja pokazuje koliko je dobra procjena veze

kod funkcionalne veze sve originalne vrijednosti y-a nalaze se na pravcu regresije → nema rezidualnog odstupanja → regresijske vrijednosti su potpuno precizna procjena zavisne varijable

kod slabije veze, što su rezidualna odstupanja veća, to je procjena manje precizna

rezidualno odstupanje može biti dobra mjera preciznosti procjene

o Odstupanja ima koliko i parova vrijednosti u regresijskoj analizi (yi i ŷi)

o treba naći pokazatelj izražen jednim brojem

o budući da je broj odstupanja originalnih y-a od regresijskog y-a jednak 0, računa se sredina kvadrata tih odstupanja → varijanca regresije

o iz varijance regresije se iznosi standardna greška procjene – regresijska standardna devijacija

o regresijska standardna devijacija pokazuje koliko je stvarno odstupanje stvarnih vrijednosti od regresijskih (izračunatih korelacijom), a izražava se u jedinicama y-a (apsolutna mjera)

o regresijska standardna devijacija govori koliki prosječni dio varijable y ovisi o drugim faktorima, a ne o varijabli x

o Koeficijent varijacije regresije – relativni pokazatelj koji pokazuje omjer standardne devijacije regresije i prosječnih vrijednosti varijable y

MJERE JAKOSTI VEZE

o Za svaku pojedinu točku vrijedi:

o Za sve točke isto vrijedi:

o Kao mjera jakosti veze koristi se omjer kvadrata protumačenog dijela odstupanja i kvadrata ukupnog odstupanja odnosno koeficijent determinacije (r2)

Page 25: STATISTIČLE I GRAFIČKE METODE U GEOGRAFIJI- SKRIPTA

vrijednost mu se kreće između 0 i 1 ako su sve točke na pravcu, veza je potpuna (r2=1) ako veze uopće nema, tj. promjenom vrijednosti x-a vrijednost y-a se ne mijenja: linija regresije poklapa

se s linijom prosječnog y-a (r2=0) dakle, što je vrijednost r2 bliža 1, veza je jača i što je linija sličnija dijagonali, veza je jača

o Množenjem koeficijenta determinacije sa 100 dobiva se postotak protumačenog odstupanja

o Ako se koeficijent determinacije (r2) ''vrati'' u prvi stupanj dobiva se Pearsonov koeficijent korelacije

može biti pozitivan i negativan – dodjeljuje mu se predznak koeficijenta regresije kao značajna veza među pojavama smatra se ona kod koje je r≥0.80 – to znači da je protumačeno 2/3

odstupanja (točnije 64%)

o Ovi pokazatelji vrijede za linearnu vezu – ako je jakost veze po ovim pokazateljima mala, to ne znači da među promatranim pojavama ne postoji neki drugi oblik veze (npr. krivolinijska) i to možda vrlo jak