statistika usmeni (2)

Upload: merhunisa-pasic-podbicanin

Post on 19-Oct-2015

91 views

Category:

Documents


0 download

DESCRIPTION

pitanja za usmeni

TRANSCRIPT

1.STATISTICKO POSMATRANJE I PRIKUPLJANJE PODATAKA

Priprema programa posmatranja i prikupljanja podataka obuhvata utvrdjivanje i unosenje planskog reda i sadrzaja posmatranja kao i metodoloskih resenja pod kojim podrazumjevamo:a) cilj,predmet,jedinicu i obiljezje posmatranjab) izvore prikupljanja podatakac)nacine prikupljanja podatakad)metode obuhvatanja tj. Obim i oblik jedinica posmatranjae)sredstva prikupljanja-izrada baza podatakaf)kontrola i provjera podataka

2.CILJ I OBILJEZJE POSMATRANJA I PRIKUPLJANJA

Cilj posmatranja proizilazi iz prakticnih ili naucno istrazivackih potreba i mora da bude postavljen jasno i odredjeno kako bi bio odrednica za ostale elemente.Obiljezja su karakteristike statistickih jedinica prema kojima se one medjusobno razlikuju ili su slicne,a definisu se stvarno (sadrzinski), prostorno i vremenski.

3.IZVORI I NACINI PRIKUPLJANJA PODATAKA

Statisticka teorija i praksa koriste podatke iz sljedecih izvora i to pojedinacno i konbinovano:Pismeni izvori- predstavljaju neposredno posmatranje i prikupljanje,Sekundarni izvori:Posredni-predstavljaju posredno uzimanje podataka ispitivanjem licaNeposredni-predstavljaju postojecu dokumentaciju i druge zapisePrikupljanje da bude organizovano na slijedece nacune:EkspedicioniPrijavniSamoregistracijaKorespodentniPostanski-internetski

4.METODE(obim i oblik) OBUHVATANJA JEDINICA I POSMATRANJA

Prema obuhvatnosti jedinica razlikujemo sledece dvije metode prikupljanja podataka:potpuno i nepotpuno prikupljanje:POTPUNO PRIKUPLJANJE-Ovaj metoda daje vrlo pouzdane rezultate ali je dosta skup i spor,a moze da se organizuje u vidu popisa i tekucih registracija.NEPOTPUNO(djelimicno)PRIKUPLJANJE PODATAKA-Izbor jednog dovoljno selektivnog broja jedinica iz statistickog skupa ekspeditivno dolazimo do sudova i zakljucka o cijelom statistickom skupu.UZROK- Predstavlja odredjen broj jedinica osnovnog skupa odabran po principu slucajnostiANKETA-je posmatranje odredjenog broja namjerno ili slucajno odabranih tipicnih jedinica statistickog skupa.PROCJENA-je poseban metoda djelimicnog posmatranja i prikupljanja podataka gdje se na osnovu jednog djela,koji nas u odredjenom momentu informiseProcjena moze biti:prostasracunata

5.SREDSTVA PRIKUPLJANJA-IZRADA BAZE PODATAKA-IZBOR

Upitnik je relativno prakticno sredstvo za prikupljanje podataka.Sacinjen je u vidu obrasca.Sustinu sadrzine upitnika cine pitanja koja treba da pragmaticna,jasno formulisana,razumljiva,precizna,kratka,kategoricna,diskretna i logicna.Kod sastavljanja upitnika za stanja u pogledu stavova postoje dvije tehnike:a)formulacija pitanja i uz njih prazno mijesto za odgovor i b)formulacija pitanja sa modlitetom odgovora i njihovom sifrom

6.KONTROLA PROVJERE PODATAKA

Kontrola u toku prikupljanja je preventivna i obavljaju je popisivaci,a primjenjuje se kod ekspeditivnog nacina i samoregistracije gdje se neposredno vrsi uvid u tacnost odgovora.Analogno grskama u statistici se primjenjuju i dvije vrste kontrola i to logicke i racunske.Logickom kontrolom se eliminisu greske.Racunska kontrola izvodi se sistemski i obuhvata provjeru tacnosti podataka i njihovog odnosa.

7.GRUPISANJE ISREDJIVANJE PODATAKA

Grupisanje i sredjivanje empiriskih podataka predstavlja rasclanjavanje statistickog materijala prema vrsti grupnih obiljezja i njihovih modaliteta na odgovarajuce grupe,cijim se redjanjem po odredjenom kriteriju,formiraju statisticke serije.Grupisanje podataka vrsi se pridruzivanjem jedinica i formiranjem grupa po modalitetima datog obiljezja,na osnovu izradjene seme grupisanja.Sastavljene seme grupisanja predstavljaju oblik ili sablon grupisanja podataka o pojedinim vrstama obiljezja:prema atributivnim metodamaprema semi grupisanja i cilju istrazivanja prikupljeni statisticki materijal tehnicko-metodoloski se sredjuje rasporedom u serije i tabela koje predstavljaju sintaksu statistickog jezika.

8.STATISTICKE SERIJE-NUMERICKE SERIJE STRUKTURE

Numericke serije strukture predstsvljaju statisticke nizove kod koih se podatci rasporedjeni na osnovu vrijednosti numerickih obiljezja,odnosno njihovih frekvencija.a)Prosta numericka serija(serija grupisanih podataka)b)Neintervalna numericka serija distribucije frekvencija (serija grupisanih podataka)

9.sTATISTICKE SERIJE-ATRIBUTIVNE SERIJE

Rasclanjavanjem statistickih podataka prema atributivnom obiljezju i njegovim metodama, nastaju atributivne grupe cijem se redanjem prema odredjenom kriteriju formiraju atributivne serije.

10.STATISTICKE SERIJE-VREMENSKE SERIJE

Rasclanjavanjem statistickih podataka prema vremenskom obiljezju i njegovim modalitetima nastaju vremenske grupe cijim se hronoloskim redoslijedom formiraju vremenske serije.Vremenske(hronoloske)serije su nizovi statistickih podataka grupisani po uzastopnim momentima vremena ili intervalima.Vremenske serije ,prema prirodi podataka koje sadrze,dijele se na momentalne i intervalne.

11.STATISTICKE SERIJE-PROSTORNE SERIJE

Rasclanjavanje statistickih podataka prema prostornom obilezju i njegovim modalitetima nastaju prostorne grupe cijim se redanjem prema odredjenom kriteriju,formiraju prostorne (geografske serije).

12.TABELARNO PRIKAZIVANJE (STATISTICKE SERIJE )

Statisticke tabele,kao graficko sredstvo se konstruisu sistemskim ukrstanjem veceg broja vertikalnih i horizontalnih linija,pri cemu se obrazuju pravougaone povrsine koje se nazivaju polja tabele.Horizontalno povezivanje polja cine redove,a vertikalno povezana polja cine kolone,tako da polja tabele,odredjeno presjekom odgovarajuceg reda i kolone,predstavlja mjesto za upisivanje statistickog podatka u vidu cifre.GRAFICKO PRIKAZIVANJEGraficko prikazivanje statistickih podataka,pored ilustracije dobijenih rezultata statisticke analize,sluzi i za orjentaciju kada je u pitanju izbor najpodesnijeg tipa funkcije ili oblika rasporeda.U grafickom prikazivanju statistickih serija koristi se uglavnom dvodimenzionalni oblik unutar ili van koordinatnog sistema,jer se tako postize tacnost i preglednost.

13.LINIJSKI I POVRSINSKI DIJAGRAMI

Linijski dijagrami sluze za pokazivanje modaliteta jednog obiljezja i analizu statistickih podataka svrstanih u rasporede frekvencija ili vremenske serije.Za konstrukciju liniskih dijagrama koristimo dva osnovna koordinatna sistema i to pravougli koordinatni sistem u ravni i polami koordinirani sistem,koji se konstruise konbinacijom radijalne i ciklicne mreze.Pravougli linijski dijagram sluzi za graficki prikaz rasporeda frekvencija ,najcesce unutar prvog kvadrata,pri cemu se na X osi vrsi izbor skale koja moze biti ravnomjerna (aritmeticka),neravnomjerna(logaritamska).Polarni liniski dijagram koristi se za prikazivanje vremenskih serija onih pojava koje imaju izrazeno sezonsko kretanje u duzem ili kracim ciklusima.Kontrolise se na taj nacin da se vrijednosti obiljezja nanesu na radijanu mrezu koja predstavlja zrakasto sirenje vektor-radijusa od centra ka periferiji. Povrsinski dijagram se koriste za graficko pokazivanje ,prvenstveno serija strukture i poredjenja i to najcesce u obliku histograma i poligona frekvencija.Histogram se dobija podizanjem ordinate iznad granica intervala prema velicini frekvencija.Spajanjem ovih ordinata dobija se onoliko pravugaonika koliko ima grupnih intervala.Baza svih pravugaonika je jedinica,tako da su im visine odredjene frekvencijama.Poligon frekvencija nastaje kada se ucrtane tacke,odredjene sredinom grupnog intervala i grupnom frekvencijom , medjusobno po redoslijedu spoje pravim linijama.Histogram kvadrata -upotrebljava se za prikaz uporedjivanja obima dviju ili vise pojava ili hronoloskih promjena strukture jedne pojave.

14.SREDNJE VRIJEDNOSTI (MJERE CENTRALNE TENDENCIJE)

Mnostvo brojcanih podataka jedino je moguce kontrolisati svodjenjem individualnih vrijednosti na manji broj statistickih pokazatelja,tako da se vecina orginalnih podataka koncentrise oko jedne sinteticke centralne vrijednosti opsteg znacenja.Takva vrijednost oznacava centralnu tendenciju skupa i reprezentativna je u pogledu znacaja obiljezja.Autenticno zamjenjuje sve vrijednosti cije karakteristike objedinjuju sto je cini tipicnom za dati raspored.Srednje vrjednosti dijelimo u sljedece grupe:a)srednje vrijednosti kao mjere centralne tendencije rasporeda,b)mjere varijabiliteta(disperzija )podatakac)mjere oblka rasporeda d)relativna ucesca statistickih rasporeda 15.ARITMETICKA SREDINA

Prosta aritmeticka sredina se racuna za seriju negrupisanih empiriskih podataka slucajne velicine X,koji su dati u obliku osnovnog rasporeda vrijednostri pri cemu su empirijske vjerovatnoce(a posteriori) za svaki od mogucih ishoda jednake.Izracunava se pomocu formule

U slucaju grupisanih podataka u vidu rasporeda frekvencija moramo pri izracunavanju ponderisane aritmeticke sredine uzeti razlike u frekvencijama.Ponderisana aritmeticka sredina se izracunava pomocu formule.

HARMONIJSKA SREDINA je reciprocna vrijednost aritmeticke sredine.Ako je statisticka serija negrupisana,tada se izracunava prosta harmonijska sredina na slijedeci nacin:

Kada je zadana statisticka serija sa grupisanim podatcima,tada se izracunava ponderisana harmonijska sredina na osnovu formule:

Geometrijska sredina je konstantan broj odredjen iz niza varijabilnih velicina tako da se proizvod clanova niza ne mijenja kada se varijabilne velicine zamjene tim konstantnim brojem.Ako je dana statisticka serija sa ne grupisanim podatcima,izracunava se na slijedeci nacin:, odnosno

16.MODUS (Mo)

Modus kao najcesca vrijednost u seriji je jedna od vaznih karakteristika za posmatrani statisticki skup,a predstavlja modalitet obiljezja koji dominira u nizu,odnosno modalitet sa najvecom frekvencijom ili najvecom vjerovatnocom.Ako je dana statisticka serija modus se jednostavno ocitava kao modalitet sa najvecom frekvencijom i za takve serije kazemo da su unimodalne.Ako postoje dva ili vise modaliteta sa jednakom najvecom frekvencijom,serije su bimodalne,odnosno multimodalne.Izracunava se po formuli.

Gdje je: L1 -donja granica modalnog intervala K-velicina modalnog intrvala f 1-frekvencija predhodnog intervala-predmodalni f2 -frekvencija modalnog intervala-modalni f3-frekvencija modalnog intervala-postmodalni

17.MJERE VARIJABILITETA

U statistickoj analizi koriste se apsolutne mjere varijabiliteta u koje spadaju interval varijacije, srednje apsolutno odstupanje ,varijansa i standardna devijacija i relativne mjere varijabiliteta u koje se ubrajaju kojeficijent varijacije,normalizovano odstupanje itd.Intrval varijacije (Iv) ili amplituda kolebanja vrijednosti obiljezaja iskazuje se kao razlika izmedju najvece i najmanje oznacene vrijednosti obiljezaja :

SREDNJE APSOLUTNO ODSTUPANJE je aritmeticka sredina apsolutnih odstupanja pojedinacnih vrijednosti obiljezaja (Xi).VARIJANSA varijansa predstavlja prosjecno kvadratno odstupanje pojedinacnih vrijednosti obiljezja od aritmeticke sredine i uvjek je pozitivna velicina tj.

STANDARDNA DEVIJACIJA -Matematicki posmatrano ,standardna devijacija je linearni oblik varijanse,odnosno kvadratni korijen iz varijanse ,tako da se izracunava na slijedeci nacin:

-

STANDARDNA DEVIJACIJA ZA SERIJE GRUPISANIH PODATAKA -

18.RELATIVNE MJERE VARIJABILITETA

Kojeficijent varijacije je odnos standardne devijacije i aritmeticke sredine,a moze se izracunavati po slijedecoj formuli :

Normalizovano (standardizovno ) odstupanje (Zi)predstavlja odstupanje bilo koje vrijednosti od izrazeno u jedinicama standardne devijacije i izracunava se na slijedeci nacin:

19.RASPODJELA DISKRETNE SLUCAJNE PROMJENJIVE

S obzirom da slucajna promjenjiva uzima vrijednosti na slucajan nacin ,za njenu potpunu karakterizaciju nije dovoljno znati samo te vrjednosti ,vec i vjerovatnoce sa kojima se one mogu realizovati .Funkcionalna veza izmedju vrijednosti slucajne promjenjive i vjerovatnoca njihove realizacije predstavlja zakon raspodjele slucajne promjenjive .

20,BINOMNA RASPODJELA

Predpostavimo da slucajna promjenjiva X predstavlja broj realizacija nekog slucajnog dogadjaja u n nezavisnih eksperimenata.Ako je p-vjerovatnoca realizacije tog slucaja dogadjaja u svakom pojedinacnom eksperimentu, a q=1-p suprotna vjerovatnoca iz teorije vjerovatnoce je poznato da je:

Naime na osnovu binomnog obrasca je:

ovo je jednako jedinici ,jer je p+q=1.Predhodni izraz se definise kao binomni zakon raspodjele.

21.FUNKCIJA I GUSTINA RASPODJELE

Funkcija raspodjele neprekidne slucajne promjenjive X

Ima sljedeca svojstva :1. 2. 3. F(x) je neprekidnaFunkcija raspodjele je primitivna funkcija za gustinu raspodjele.

22. NORMALNA RASPODJELANeprekidna slucajna promjenjiva X ima normalnu raspodjelu ako je njena gustina raspodjele zadana funkcijom:

prethodnim analitickim izrazom definisana je familija krivih koje zavise od dva parametra . Za fiksirane vrijednosti ovih parametra grafik je predstavljen na sljedeci nacin nacratati dva grafika str.73

Gustina raspodjele normirane slucajne velicine.Grafik gustine normalne raspodjele naziva se normalna kriva.

23. X (kvadrat) raspodjela Neka su X1, X2,... Xn uzajamno nezavisne normirane normalno rasporedjene slucajne promjenjive. Suma njihovog kvadrata: napisati formulu

ima tzv. X kvadrat (hi-kvadrat) raspodjelu sa n stepeni slobode. Pod pojmom broja stepeni slobode podrazumjeva se broj linearno nezavisnih promjenjivih u nekom skupu promjenjivih.Sa povecanjem broja stepeni slobode X kvadrat raspodjela tezi normalnoj raspodjeli.

24.STUDENTOVA RASPODJELA

Neka je X normirana, normalno rasporedjena slucajna promjenjiva, a Y /n je nezavisna slucajna promjenjiva koja ima Xkvadrat n- raspodjelu.Tada slucajna promjenjiva: formula 77 str.

ima studentovu ili t raspodjelu sa n stepeni slobode. Sa povecanjem broja stepeni slobode i ova raspodjela tezi normalnoj.

25.IZBOR I NACINI FORMIRANJA UZORKA

statisticki podaci cine niz posmatranja u ispitivanju slucajne promjenjive X. Osnovni skup cine sva moguca, ponekad zamisljena (hipoteticka), posmatranja obiljezja X.Umjesto termina funkcija raspodjele obiljezja X cesto se koristi raspodjela osnovnog skupa. U prakticnim situacijama najcesce je nemoguce vrsiti ispitivanje cijelog osnovnog skupa. Zbog toga se za ispitivanje zakonitosti obiljezja X vrsi posmatranje na dijelu osnovnog skupa koji se naziva uzoracki skup ili jednostavno uzorak. Broj objekata u osnovnom skupu i u uzorku naziva se obim. Metod, koji se satoji u tome da se na osnovu svojstva uzoraka x1,x2,....xn izvedu zakljucci o numerickim karakteristikama i zakonu raspodjele obiljezja X, naziva se metoda uzorka.Procedure izbora semogu podijeliti u dvije osnovne grupe:a) prost slucajni izbor,b) kontrolisani izbor.U drugoj grupi procedura izbora, kontrolisanog izbora, spadaju procedure kod kojih postoji ogranicenje slucajnosti. Medju najcesce koristene spadaju: a) mehanicki izbor, b) viseetapni izborc)stratifikovani izbor.Osnovni nedostatak mehanickog izbora je sto ne obezbjedjuje reprezentativnost uzorka.

26. ODREDJIVANJE OBIMA UZORAKA

posmatraju se dva slucaja u zavisnosti od toga da li je poznata varijansa osnovnog skupa (obiljezja X) ili ne. 1.VARIJANSA OSNOVNOG SKUPA JE POZNATAna osnovu izvedenih formula za tacnost ocjene u paragrafu neophodan obim slucajnog uzorka je:

kada je uzorak sa vracanjem.

Kada je uzorak bez vracanja.2.VARIJANSA OSNOVNOG SKUPA NIJE POZNATAu ovom slucaju prvo se preliminantnim uzorkom obima n0 ocjenjuje nepoznata varijansa osnovnog skupa. Za ocjenu nepoznate varijanse koristi se korigovana uzoracka varijansa- napisati formulu.

27.OBIM UZORAKA ZA OCJENU PROPORCIJE SVOJSTVA A U OSNOVNOM SKUPU

Neka je p proporcija svojstva A, tada je minimalan obim uzorka za:a) uzorak sa vracanjem-b) uzorak bez vracanja Ukoliko proporcija p nije poznata iz ranijih ispitivanja, p stoji ocjena prporcije p0.

28.POJAM I VRSTE STATISTCKE OCJENE

Statisticka ocjena, pored statisticke provjere hipoteza, predtavlja osnovni vid statistickog zakljucivanja. U praksi se obicno uzima jedan uzorak i na osnovu njega se ocjenjuje nepoznati parametar osnovnog skupa. Zbog toga je vazno formirati takva pravila ocjenjivanja da se na osnovu jednog uzorka dobije sto je moguce tacnija ocjena trazenog parametra. Ocjene parametra dijele se na tackaste i intervalne.

29. OSNOVNA SVOJSTVA TACKASTE OCJENE

Osnovna svojstva koja treba da ima dobra ocjena nepoznatog parametra su: nepristrasnost, stabilnost, (konzistentnost) i efikasnost. Ocjena nepoznatog parametra naziva se nepristrasnom (bez sistemske greske) ako je njeno matematicko ocekivanje jednako ocjenjivanom parametru, tj ako je Nepristrasnost je minimalni zahtjev koji se trazi od ocjene. Razlika izmedju matematickog ocekivanja ocjene i vrijednosti ocjenjivanog parametra naziva se pristrasnost (bias).

30. INTERVALNE OCJENE PARAMETARA RASPODJELE

Intervalna ocjena je ona ocjena koja omogucava da se odrede tacnost i pouzdanost ocjene. Intervalne ocjene se preporucuju u slucaju malog broja posmatranja, kada je tackasta ocjena malo pouzdana.Tackasta ocjena nepoznatog parametra - formula je bolja. Kada je razlika mala. Pozitivan broj -- koji karakterise granicu ove razlike naziva se tacnost ocjene. Ocjena je tacnija sto je -- manje. - zavisi od obima uzoraka.

31.INTERVAL POVJERENJA ZA SREDNJU VRIJEDNOST OSNOVNOG SKUPA (POZNATA VARIJANSA)

Za formiranje interval povjerenja posmatra se slucajna velicina

koja ima standardizovanu normalnu raspodjelu, tj Z:N (O;1), jer je X ima normalnu raspodjelu sa srednjom vrijednoscu -form- i varijansom. Napisati formuluZa zadani nivo znacajnosti (1 alfa) moguce je naci kvantile normalne raspodjele iz tablica normalne raspodjele, za koje je

Moze se zakljuciti da se sa povecanjem obima uzoraka, pri istoj vjerovatnoci (1 alfa) povecava tacnost ocjene smanjuje se duzina intervala povecanja.

INTERVAL POVJERENJA ZA SREDNJU VRIJEDNOST OSNOVNOG SKUPA (NEPOZNATA VARIJANSA)

Statistika

Ima Studentovu t raspodjelu sa (n 1) stepeni slobode. Ona se koristi za odredjivanje intervala povjerenja nepoznatog parametra . Za zadani nivo znacajnosti alfa moguce je naci kvantile iz t-raspodjele tablice tako da je kao na sljedecoj slici graf- kvantili t-raspodjele

Dobijeni interval ima ista svojstva kao i interval povjerenja z asrednju vrijednost osnovnog skupa pri poznatoj varijansi.

32.TESTIRANJE HIPOTEZA

Pod statistickom provjerom (testiranjem) podrazumjeva se jednostavno pravilo odbacivanja ili neodbacivanja hipoteze na osnovu uzorackih posmatranja. U zavisnosti od formulisane pretpostavke statisticka hipoteza moze biti parametarska i neparametarska. Kod parametarske statisticke hipoteze formulisana pretpostavka se odnosi na vrijednost parametra funkcije raspodjele poznatog tipa

Kod neparametarske statisticke hipoteze formulisana pretpostavka se odnosi na tip raspodjele osnovnog skupa. U statistici se postavljena hipoteza obicno naziva nulta hipoteza i oznacava se simbolom Ho.Neka je (omega) skup svih mogucih vrijednosti statistike (slucajne velicine) K. U opstem slucaju (omega) visedimenziona oblast. Ukoliko je kriterijum K definisan pomocu jedne slucajne velicine, sto je najcesci slucaj, (omega) je realna prava ili jedan njen dio, i moze se graficki preciznpo prikazati. Provjera staisticke hipoteze vrsi se razbijanjem oblasti (omega) na dvije disjunktne oblasti

33.TESTIRANJE PARAMETARSKIH HIPOTEZA Kod odredjivanja kriticne oblasti treba uzeti u obzir i alternativnu hipotezu. Naime ako je za a) alternativna hipoteza -formula- onda je kriticna oblast dvostrana. Ovakva formulacija alternativne hipoteze znaci da oblast odbacivanja mora uzeti u obzir realizacije slucajne velicine K lijevo i desno od k0. ..........

pri testiranju parametarskje hipoteze ...............- moguce je za konkretene vrijednosti parametra .....- alternativnoj hipotezi izracunati moc testa (1 beta). Ako je alternativna hipoteza slozena, onda se za razlicite vrijednosti -.....- izracunava moc testa i tako dobija tzv. funkcija moci. Veza izmedju -......- predstavlja operativnu karakteristiku.

34. SLUCAJ NEZAVISNIH UZORAKA

Vecina zadataka poredjenja svodi se na provjeru statisticke hipoteze o jednakosti srednjih vrijednosti dva obiljezja. Testiranjem ovako postavljenje hipoteze provjerava se da li je razlika uzorackih sredina posljedica slucajnih kolebanja ili uzorci poticu iz osnovnih skupova sa razlicitim srednjim vrijednostima. U zavisnosti od raspolozive informacije o parametrima osnovnog skupa mogu se formirati dva osnovna modela testiranja I za svaki od njih odgovarajuci kriterijum znacajnosti.Model 1 (poznate varijanse) pretpostavlja se da su nepoznati parametri posmatranih osnovnih skupova. Na osnovu dva nezavisna uzorka obima n1 i n2, izvucena iz ispitivanih skupova treba provjeriti nultu hipotezu ...............protiv alternative ............

Model 2 (nepoznate varijanse) na osnovu dva nezavisna uzorka, obima n1 i n2 (n1;n2