osnovni statisticki koncepti 1

34
OSNOVNI POJMOVI Statistika: - Deskriptivna (eng. Descriptive st.) - Statističko zaključivanje (eng. Statistical inference) Predmet statističkog istraživanja su varijabilne pojave. Da bismo precizno sagledali pravilnosti u njihovom ponašanju poželjno je da obuhvatimo sve slučajeve na kojima se one ispoljavaju. Skup svih elemenata na kojima se izvesna pojava ispoljava i

Upload: dragannikolic

Post on 02-Oct-2015

247 views

Category:

Documents


5 download

DESCRIPTION

statistika

TRANSCRIPT

2

32snovi Statistike Analize

OSNOVNI POJMOVI

Statistika:

Deskriptivna (eng. Descriptive st.)

Statistiko zakljuivanje (eng. Statistical inference)

Predmet statistikog istraivanja su varijabilne pojave. Da bismo precizno sagledali pravilnosti u njihovom ponaanju poeljno je da obuhvatimo sve sluajeve na kojima se one ispoljavaju.

Skup svih elemenata na kojima se izvesna pojava ispoljava i statistiki posmatra naziva se osnovni skup ili populacija (eng. population)U zavisnosti od cilja istraivanja, osnovni skup se moe sastojati od ljudi, bia, predmeta ili dogaaja.

Elementi skupa nazivaju se jedinicama skupa ili jedinicama posmatranja Sve jedinice osnovnog skupa moraju imati barem jednu zajedniku (konstitutivnu) osobinu koja ih ini elementima datog skupa. Ipak, one nikada nisu meu sobom identine; savreno homogen skup nije predmet statistikog posmatranja jer bismo analizom samo jednog elementa dobili eljene informacije o karakteristikama svih elemenata u skupu. Predmet statistikog istraivanja su varijabilne pojave, to znai da nas interesuju samo one karakteristike po kojima se jedinice skupa meu sobom razlikuju.

Promenljiva i njene vrednosti

Obeleje i modaliteti obeleja

Jedinice osnovnog skupa se esto meu sobom razlikuju po brojnim karakteristi-kama, koje u konkretnom istraivanju nema-ju isti znaaj. Zato, u zavisnosti od cilja istraivanja, panju usmeravamo samo na jednu, dve ili manji broj ovakvih osobina.

Osobine po kojima se jedinice osnovnog skupa meu sobom razlikuju, a koje su predmet statistikog istraivanja, nazivamo obelejima, promenljivim ili varijablama (eng. variable).

Razliiti vidovi u kojima se jedno obeleje moe javiti nazivaju se modalitetima obeleja.

Obeleja se meu sobom razlikuju po brojnim karakteristikama, od kojih se svakako najvanija razlika zasniva na stepenu merljivosti njihovih modaliteta. Po tom osnovu razlikujemo:

Atributivna, kvalitativna ili kategorijska obeleja, i

Numerika, kvantitativna obeleja Atributivna obejeja su one karakteristike elemenata skupa iji se modaliteti izraavaju opisno (reima). Varijabilitet po datom obeleju se ispoljava kroz broj njegovih modaliteta, tj. kroz pripadnost elemenata jednoj od kategorija datog obeleja. Broj modaliteta varira u zavisnosti od prirode obeleja.Numerika obeleja su osobine jedinica skupa ije vrednosti dobijamo merenjem ili prebrojavanjem i prikazujemo ih brojevima. Unutar ove grupe razlikujemo:

Prekidna ili diskretna numerika obeleja Neprekidna, kontinuirana numerika obeleja

Prekidna obeleja su numerike karakteristike koje mogu uzimati samo izolovane vrednosti na mernoj skali. Vrednosti modaliteta prekidnih numerikih obeleja odreujemo prebrojavanjem.

Neprekidna obeleja predstavljaju numerike karakteristike jedinica skupa koje mogu uzeti bilo koju vrednost unutar nekog intervala. Svako neprekidno numeriko obeleje ima beskonano mnogo modaliteta. Jasno, u praksi ne teimo uvek savreno preciznom merenju, ve preciznost prilagoavamo prirodi pojave koju posmatramo i potrebama istraivanja. Vrednosti modaliteta neprekidnih numerikih obeleja dobijamo merenjem i izraavamo ih u tradicionalno usvojenim jedinicama mere.

Zaljuimo na kraju da svako obeleje (nezavisno od vrste kojoj pripada i broja moguih modaliteta u kojima se javlja) predstavlja jednu promenljivu ili varijablu, koja od elementa do elementa skupa moe uzimati razliite vrednosti. Zato emo ove termine koristiti kao sinonime.

VRSTE PODATAKA PREMA MERLJIVOSTI

U zavisnosti od vrste obeleja na koje se odnose (atributivne ili numerike), podaci mogu biti:

- kvalitativni, ili

- kvantitativni.

Da bismo preciznije objasnili neophodnost strogog razlikovanja kvalitativnih i kvantitativnih podataka, upoznaemo se ukratko sa osobinama etiri osnovne merne skale na kojima merimo veinu promenljivih.

Nominalnu skalu koristimo za merenje strogo atributivnih obeleja. Brojevi koje pripisujemo pojedinim modalitetima slue iskljuivo za njihovu identifikaciju i jednostavnije klasifikovanje. Veliina brojeva i njihova meusobna razlika su potpuno irelevantani.

Jasno je, otuda, da bismo primenom matematikih operacija na numerike podatke sa nominalne skale dobili potpuno besmislene rezultate. Sve to je u ovakvim sluajevima opravdano uraditi jeste izbrojati elemente unutar svake kategorije, nai njihovo relativno uee u skupu, odrediti modalitet koji se najee javlja i slino.Ordinalnu skalu koristimo za merenje atributivnih obeleja ije modalitete moemo meusobno porediti po intenzitetu ili znaaju, odnosno, povezati ih relacijom vei od, i tako formirati njihov poredak rang listu. U ovu grupu atributivnih obeleja spadaju, na primer, znanje kandidata, kvalitet hotelske usluge, lakoa upravljanja vozilom, atraktivnost lokacije za poslovni prostor i sl. Modalitetima ovih obeleja pripisujemo brojeve koji ureuju (rangiraju) elemente po intenzitetu posmatranog obeleja, pri emu po pravilu vei broj pripisujemo veem intenzitetu. Brojevi na ordinalnoj skali otkrivaju samo redosled elemenata po intenzitetu posmatranog obeleja, ali ne i stepen njihovog razlikovanja. Ordinalna skala je informativnija od nominalne. Ipak, primena veine aritmetikih operacija na ordinalno merljive podatke nema smisla, jer njima dobijamo besmislene rezultate.

Na intervalnoj skali merimo numerika obeleja ija nulta vrednost ne znai odsustvo pojave, ve predstavlja samo proizvoljno izabrani poetak. Ako je pojava merljiva na intervalnoj skali, onda je mogue meusobno precizno porediti intervale - razlike izmeu parova vrednosti, ali ne i individualne vrednosti.

Njene osobine emo objasniti na temperaturnim skalama - Celzijusovoj i Farenhajtovoj koje imaju razliitu nultu taku i jedinicu mere ali su meu sobom povezane funkcijama 0F=(9/5)0C+32,0C=(5/9)(0F-32)

100C, 200C i 400C,poredimo razlike - intervale izmeu svake dve vrednosti (otuda i naziv intervalna skala).

Porast temperature sa 200C na 400C je dvostruko vei od porasta sa 100C na 200C, odnosno:

Posmatrane temperature na Farenhajtovoj skali imaju numerike vrednosti :

500F, 680F i 1040F ali poreenjem njihovih razlika dobijamo iste odnose:

.

Tzv. Likertove skale (sa 5, 7 ili 9 taaka) koje se koriste u anketama se esto tretiraju kao intervalne.

Razmernu skalu (skalu odnosa) koristimo samo za merenje numerikih obeleja koja imaju prirodno odreenu nulu (kada nula pokazuje da pojave nema). U ovu grupu spadaju, na primer, prihod, uee karta, teina, broj proizvoda itd. Isto obeleje ponekad moemo meriti na vie skala, koje u ovom sluaju imaju zajedniku nulu i razlikuju se samo po jedinici mere. Merne jedinice su meu sobom povezane funkcijama, to omoguuje lako prevoenje vrednosti obeleja iz jedne merne jedinice u drugu. Na primer, prihode izraavamo u brojnim valutama i apoenima: dinarima, milionima dinara, evrima, engleskim funtama itd, pri emu ih primenom deviznih kurseva (funkcija) lako prevodimo u druge merne jedinice (na primer, 1=80din). Slino, teinu moemo izraavati u kilogramima, ali i u funtama (1lb=454gr.), duinu u kilometrima ili miljama (1ml=1,6km) itd.

Merljivost na razmernoj skali doputa precizno merenje i meusobno poreenje svih nivoa jednog obeleja (odnosno, izraunavanje relativnih odnosa). Na podatke merljive na skali odnosa moemo da primenimo sve vrste matematikih operacija jer, zbog zajednike nule, razliite merne jedinice ne utiu na konaan rezultat. Budui da veina numerikih obeleja ima prirodno odreenu nulu, skala odnosa se u praksi i najee koristi za njihovo merenje.

Vrstu skale na kojoj merimo jedno obeleje ne biramo sasvim proizvoljno, jer merljivost ne zavisi od dobre volje ili potreba analitiara, ve je ona determinisana prirodom posmatranog obeleja.

Precizno odreivanje stepena merljivosti podataka je od izuzetnog znaaja za njihovu dalju matematiku obradu. U okviru statistike metodologije razlikujemo dve grupe metoda: tzv. parametarske metode i neparametarske metode koji se, pored ostalog, meu sobom razlikuju i po vrstama podataka na koje se primenjuju. Parametarske metode koristimo ako raspolaemo kvantitativnim, precizno merljivim podacima (na intervalnoj skali ili skali odnosa), dok neparametarske metode primenjujemo i na kvalitativne podatke (podatke merljive na nominalnoj ili ordinalnoj skali). Otuda e stepen merljivosti podataka odrediti grupu metoda koje je opravdano na njih primeniti, kao i statistike pokazatelje koje je za njih opravdano izraunati i valjano ih interpretirati.

IZVORI PODATAKA I METODI NJIHOVOG PRIKUPLJANJA

Primarni i sekundarni podaci

Podatke koji su nam neophodni za statistiko istraivanje moemo prikupiti iz razliitih izvora. U zavisnosti od upotrebljenog izvora delimo ih na:

- primarne podatke, i

- sekundarne podatke.

Ako ne postoji dostupan izvor iz kojeg moemo da preuzmemo potrebne podatke, ili takvi podaci ne postoje, onda ih moramo samostalno prikupiti. Ovakve podatke nazivamo primarnim podacima i oni predstavljaju originalan rezultat istraivanja. Do primarnih podataka dolazimo primenom razliitih tehnika posmatranja i eksperimenata, a njihovo prikupljanje zahteva dosta vremena, pretpostavlja angaovanje eksperata i esto podrazumeva znaajne trokove.

Sekundarni podaci predstavljaju podatke koje pribavljamo iz razliitih izvora u kojima oni postoje u eljenom obliku, a prikupljeni su za potrebe nekih prethodnih istraivanja, esto od strane drugih subjekata. To su publikovani podaci statistikih zavoda, naunih instituta, specijalizovanih nacionalnih i meunarodnih organizacija, baze podataka preduzea i slino. Nesumnjiva prednost sekundarnih u odnosu na primarne podatke je to su oni neuporedivo jeftiniji i brzo dostupni. Zato svako istraivanje poinjemo sa prikupljanjem ovih podataka, a tek kada se oni pokau nedovoljnim ili neadekvatnim za istraivanje, pristupamo prikupljanju primarnih podataka. Ali, primena sekundarnih podataka nalae posebnu obazrivost. Budui da su prikupljeni od strane drugih subjekata i za druge potrebe, neophodno je proveriti da li sekundarni podaci u potpunosti odgovaraju naim ciljevima istraivanja, da li su aktuelni, nepristrasni i pouzdani.

obuhvatnost podataka

Pojavu moemo posmatrati na svim jedinicama skupa (tada govorimo o potpunoj obuhvatnosti), ili samo na jednom njegovom delu (kada je re o deliminoj obuhvatnosti). Potpunu obuhvatnost sprovodimo popisom ili statistikim izvetajem, dok pod deliminim posmatranjem podrazumevamo izbor statistikog uzorka.

Statistiki popis je takav oblik statistikog posmatranja kojim obuhvatamo sve jedinice osnovnog skupa u odreenom momentu (tzv. kritinom momentu) i prikupljamo podatke o jednoj ili vie karakteristika koje nas interesuju. S obzirom na organizacione tekoe i velika materijalna sredstva koja iziskuje, popis osnovnog skupa (posebno ako je re o velikom skupu) vrimo relativno retko, a duinu vremenskog intervala izmeu dva popisa odreujemo prema raspoloivim sredstvima i brzini kojom se menjaju karakteristike skupa.

Popis nije mogue primeniti u svim situacijama iz vie razloga.

- Ponekad je nemogue obuhvatiti ili identifikovati sve jedinice skupa. Neke skupove zbog veliine ili drugih karakteristika tretiramo kao beskonane, a ponekad nam zbog predmeta istraivanja svi elementi nisu dostupni (kao u sluaju praenja narkomanije, kriminala i slino).

- Metodi potpunog posmatranja su po pravilu veoma skupi, pa ponekad ne raspolaemo potrebnim sredstvima ili je njihova cena nesrazmerna znaaju dobijenih informacija.

- Vreme potrebno za sprovoenje popisa je esto ozbiljan ograniavajui faktor jer svaka informacija (bez obzira na njenu tanost) gubi na znaaju ako je pribavimo sa zakanjenjem i shodno tome ne reagujemo na vreme.

U navedenim suajevima (koji su u praksi i najei) umesto potpunog posmatranja opredeljujemo se za delimino posmatranje, odnosno, primenjujemo statistiki uzorak.Statistiki uzorakStatistiki uzorak predstavlja deo osnovnog skupa na osnovu ijih osobina donosimo statistike zakljuke o odgovarajuim karakteristikama skupa iz kojeg je izabran.

Vano je da naglasimo da uzorak nikada ne izvlaimo da bismo saznali samo njegove karakteristike, ve iskljuivo da bismo uoptavanjem dobijenih informacija iz uzorka ocenili nepoznate karakteristike skupa u celini. Da bi zakljuci o karakteristikama celog statistikog skupa na osnovu samo jednog njegovog dela (podataka prikupljenih uzorkom) bili valjani, neophodno je da uzorak bude reprezentativan.

Uzorak je reprezentativan ako svojim osobinama verno odraava osobine statistikog skupa koje ispitujemo.

Pre izbora uzorka moramo odluiti koju vrstu uzorka emo birati i kolika e biti njegova veliina. Reenje ovih problema zavisi od cilja istraivanja, od prirode statistikog skupa i preciznosti sa kojom elimo da donesemo statistike zakljuke. Vano je rei da ne postoji nain izbora elemenata iz skupa koji bi nam u svakom pojedinanom sluaju garantovao formiranje savreno reprezentativnog uzorka. Samo ako je uzorak po veliini jednak osnovnom skupu, ili ako uzorak biramo iz skupa koji ine sve istovetne jedinice, moemo biti sigurni u njegovu reprezentativnost. U ostalim sluajevima (tj. u svim praktinim sluajevima), nezavisno od izabrane vrste uzorka i njegove veliine, moramo biti svesni da zakljuivanje zasnovano na informaciji iz uzorka neminovno povlai prisustvo rizika da emo pogreiti. Razlog je to iz jednog osnovnog skupa (veliine N) moemo izabrati veliki broj razliitih uzoraka (veliine n) koji e biti razliito reprezentativni (neki e verno odraavati strukturu osnovnog skupa, dok e je drugi u manjoj ili veoj meri deformisati). Ako izaberemo reprezentativan uzorak, nai zakljuci e biti ispravni; u suprotnom, nainiemo greku i na osnovu nereprezentativnog uzorka pogreno oceniti nepoznatu karakteristiku skupa koja nas interesuje. Ipak, uskoro emo videti da izborom odreenih vrsta uzoraka, i variranjem njihove veliine, prisutan rizik greke moemo svesno da kontroliemo, odnosno, da ga smanjimo na eljeni nivo.

I pored injenice da ne moemo biti potpuno sigurni u tanost izvedenih zakljuaka na osnovu uzorka, njegova primena u statistikoj praksi dominira u odnosu na popis. MOGUE GREKE U FAZI PRIKUPLJA-NJA PODATAKA

Nezavisno od naina prikupljanja podataka (da li sprovodimo popis ili izvlaimo uzorak) uvek postoji opasnost da podaci ne odraavaju verno karakteristike posmatrane pojave. U takvim sluajevima, bilo kakva statistika analiza koju bismo bazirali na takvim podacima ne bi bila validna. Nekada e greka biti zanemarljiva i neznatno uticati na rezultat, dok nekada postaje toliko velika da nas podaci navode na pogrene zakljuke. Budui da su uzroci greaka brojni, potrebno je da se sa njima upoznamo i, ako je mogue, pokuamo da ih izbegnemo. Ovde emo navesti uzroke greaka koji su zajedniki svim metodima prikupljanja podataka, dok emo u 7. glavi vie panje posvetiti grekama koje se mogu javiti samo prilikom izbora uzorka.

Loe dizajniran upitnik Da bismo obezbedili jednobrazno prikupljanje podataka potrebno je da sastavimo statistiki upitnik i pripremimo anketare koji e ih popunjavati. Tanost i preciznost odgovora esto zavise od toga kako je upitnik sastavljen. Zato pitanja moraju biti jednostavna i nedvosmislena, a svi pojmovi u njima precizno definisani, poznati i jasni i nestrunim licima. Pitanja treba formulisati da budu neutralna (kako ne bi usmeravala ispitanika na eljeni odgovor), a njihov broj ogranien (veliki upitnici izazvaju zamor, pad koncentracije i dosadu kod ispitanika, to znaajno umanjuje tanost prikupljenih podataka). Vano je izabrati i redosled pitanja, da prethodno dati odgovori ne bi uticali na odgovore koji slede. Takoe, ponueni odgovori moraju biti odreeni i kratki, a njihov spisak potpun. Zato na dizajniranju upitnika treba da radi tim u kojem se, uz strunjake iz oblasti za koju se podaci prikupljaju, nalaze psiholozi i statistiari. Da bismo otklonili mogue greke, sastavljeni upitnik pre konane upotrebe obino testiramo na kontrolnoj grupi.

Pogreni odgovori - Dobro dizajnirani upitnik nas na alost ne titi od netanih odgovora, za koje mogu biti odgovorni i anketari i ispitanici. Nestruni anketari svojim nastupom, tonom glasa ili mimikom (koja izraava uenje, negodovanje ili odobravanje) mogu preusmeravati odgovore ispitanika. S druge strane, ispitanici netanim odgovorima prikrivaju svoje neznanje ili se trude da ostave pozitivan utisak na anketara, u elji da budu kooperativni daju odgovore za koje misle da su oekivani, nekada svesno izbegavaju istinu strahujui od njene mogue zloupotrebe, ili odbijaju da odgovore. Tada e prikupljeni podaci biti u manjoj ili veoj meri iskrivljena slika stvarnog stanja. Zato se meu pitanjima po pravilu nalaze i kontrolna pitanja, kojima se utvruje konzistentnost datih odgovora.PAGE 2

_1284289908.unknown

_1284290007.unknown