biometrika 2010

Post on 08-Apr-2015

520 views

Category:

Documents

4 download

Embed Size (px)

TRANSCRIPT

Biometrika Miroslav Kap tel: 239-3949 e-mail: mkaps@agr.hr ii 1 OPISNA STATISTIKA................................................................................................................................................. 1 1.1 PODACI I VARIJABLE.................................................................................................................................................. 1 1.2 GRAFIKE METODE ZA OPIS PODATAKA..................................................................................................................... 2 1.2.1 Grafike metode za opis kvalitativnih podataka............................................................................................... 2 1.2.2 Grafike metode za opis kvantitativnih podataka............................................................................................. 3 1.3 NUMERIKE METODE ZA OPIS KVANTITATIVNIH PODATAKA...................................................................................... 3 1.3.1 Mjere centralne tendencije ............................................................................................................................... 4 1.3.2 Mjere varijabilnosti .......................................................................................................................................... 5 1.3.3 Mjere relativnog poloaja................................................................................................................................. 5 2 VJEROJATNOST......................................................................................................................................................... 7 2.1 PRAVILA O VJEROJATNOSTI JEDNOSTAVNIH DOGAAJA............................................................................................. 7 2.1.1 Prikaz dogaaja i pripadajuih vjerojatnosti Stablo dijagramom (engl. tree diagram) .................................. 8 2.2 SLOENI DOGAAJI ................................................................................................................................................... 8 3 SLUAJNE VARIJABLE I NJIHOVE RASPODJELE......................................................................................... 11 3.1 RASPODJELE VJEROJATNOSTI ZA DISKRETNE SLUAJNE VARIJABLE ........................................................................ 12 3.1.1 Oekivanje i varijanca diskretne sluajne varijable....................................................................................... 13 3.1.2 Binomna raspodjela........................................................................................................................................ 13 3.1.3 Multinomna raspodjela................................................................................................................................... 16 3.2 RASPODJELE VJEROJATNOSTI ZA KONTINUIRANE SLUAJNE VARIJABLE.................................................................. 16 3.2.1 Normalna raspodjela...................................................................................................................................... 17 3.2.2 Jo neke kontinuirane varijable i njihove raspodjele ..................................................................................... 24 4 POPULACIJA I UZORAK........................................................................................................................................ 25 4.1 RASPODJELE VJEROJATNOSTI STATISTIKA ............................................................................................................... 26 4.1.1 Sredinji granini teorem................................................................................................................................ 26 4.1.2 Neke statistike koje nemaju normalnu raspodjelu .......................................................................................... 26 4.2 STUPNJEVI SLOBODE................................................................................................................................................ 27 5 PROCJENA PARAMETARA.................................................................................................................................... 28 5.1 INTERVALNA PROCJENA .......................................................................................................................................... 28 5.2 PROCJENA PROSJEKA POPULACIJE............................................................................................................................ 28 5.3 PROCJENA VARIJANCE U NORMALNOJ POPULACIJI ................................................................................................... 30 6 PROVJERA HIPOTEZA ........................................................................................................................................... 31 6.1 PROVJERA HIPOTEZA O PROSJEKU POPULACIJE. ....................................................................................................... 31 6.1.1 P-vrijednost..................................................................................................................................................... 34 6.1.2 Jednostrana provjera. ..................................................................................................................................... 35 6.1.3 Provjera hipoteza o prosjeku populacije za mali uzorak (n dogaaj ima vjerojatnost Funkcija vjerojatnosti gustoe govori o raspodjeli vjerojatnosti Gustoa = podsjetnik da govorimo o vjerojatnosti u intervalima Funkcija gustoe = model prave (nepoznate) raspodjele frekvencije Svojstva funkcije gustoe: 1. f(yi) 0 2. P(- y +) = 1 (vjerojatnost da se dogodi bilo koji y je jednaka 1) 3.2.1 Normalna raspodjela - model raspodjele relativnih frekvencija u mnogim pojavama. - normalnu raspodjelu slijede mnogi pokazatelji koji se koriste za statistiko zakljuivanje. - normalna krivulja = Gaussova krivulja - oblik zvona. f(y) Slika 3-2: Normalna (Gaussova) krivulja Poloaj i oblik normalne krivulje je odreen sa dva parametra, prosjekom i variajncom 2. Prosjek je parametar poloaja Varijanca 2 je parametar disperzije (rairenosti, varijabilnosti) (Podsjetimo se da je standardna devijacija: 2 = ) Funkcija gustoe je:

|.|

\| =221221) ( uye y f - < y < + e = baza prirodnog logaritma (e = 2.71828...) = 3.14... u 18 - Visina i rasprenost krivulje ovisi o varijanci 2 - Poveanje varijance - krivulja je vie rairena. 00.10.20.30.4-4 -3 -2 -1 0 1 2 3 4Frrekvencija = 1 = 1.5 Slika 3-3: Normalne krivulje sa parametrima = 1 i = 1.5 Jo neke znaajke: - krivulja je simetrina s obzirom na prosjek - u intervalu 1.96 nalazi se 95% opaanja. Svojstva normalne funkcije (kao i za sve funkcije gustoe): 1. f(yi) 0 2. P(- y +) = 1 Vjerojatnost da varijabla y poprima vrijednosti u intervalu (y1, y2) jednaka je povrina ispod normalne krivulje ograniena tim vrijednostima y1 i y2. (Uzima se da je ukupna povrina 1 ili 100%) Ta povrina je jednaka proporciji onih opaanja s vrijednosti izmeu y1 i y2 u odnosu na sva opaanja. Primjer: Koja je vjerojatnost da sluajno izabrana jedinka ima vrijednosti izmeu 170 i 210: Drugim rijeima: Koja je proporcija jedinki s vrijednostima izmeu 170 i 210 Vjerojatnost da y bude izmeu 170 i 210 kg: P(y1 y y2) = P(170 y 210) u = 200y1 = 170y2 = 210 Slika 3-4: Povrina ispod normalne krivulje ograniena vrijednostima 170 i 210 Kumulativna normalna raspodjela F(y0) = P(y y0) 19 Vjerojatnost da sluajno izabrani y ima vrijednost manju od y0 (Proporcija jedinki koje imaju vrijednost veu od y0) Primjer: Vjerojatnost da y < 230 u = 2000y = 230 Slika 3-5: Normalna krivulja sa = 200 i = 20 Iscrtana povrina = vrijednost kumulativne raspodjele za y0 = 230: F(y0) = P(y y0) = P(y 230) Primjer: F() = P(y ) = 0.5 (jer je krivulja simetrina) Standardizacija normalnih krivulja Budui da oblik krivulje ovisi samo o varijanci, odnosno standardnoj devijaciji, sve normalne krivulje se mogu standardizirati, tj. prevesti u standardnu normalnu krivulju Standardizacija: sluajna normalna varijabla y se izrazi u jedinicama standardne devijacije: u =yz Standardna normalna je dakle takva normalna krivulja kojoj je prosjek 0 i standardna devijacija je 1 Funkcija gustoe standardne normalne varijable je: | |22121) (ze z f = 20 0 -1 z1 Slika 3-6: Standardna normalna krivulja ( = 0 i = 1) Povrina ispod standardne normalne krivulje ograniena sa dvije vrijednosti standardne normalne varijable z1 i z2, predstavlja vjerojatnost da varijabla poprima vrijednosti izmeu ta dva broja. (isto kao i za svaku normalnu krivulju) Praktina vrijednost standardizacije je u tome to za pronalaenje povrine ispod krivulje ogranienu nekim intervalom koristimo samo jednu krivulju. Podsjetimo se da povrina ispod krivulje u nekom intervalu (y1,y2) odgovara vjerojatnosti da sluajna varijabla y poprima vrijednosti u tom intervalu. Matematiki povrina ispod krivulje je jednaka odreenom integralu funkcije gustoe. Kako ne postoji eksplicitna formula za taj integral, sluimo se tablicama (bilo iz knjige ili kompjuterskog programa). Poto je mogue sve normalne krivulje svesti na standardnu, potrebno je imati samo jednu tablicu. Naime vjerojatnost da y poprima vrijednosti izmeu y1 i y2 je: P(y1 y y2) = P(z1 z z2) gdje su u =11yz i u =22yz Ne zaboravite da dogovorno uzimamo da je ukupna povrina jednaka jedan: P(- z +) = 1 Primjer: Izraunajmo vjerojatnosti iz primjera sa = 200 kg i = 20 kg. Kolika je vjerojatnost da varijabla y poprimi vrijednosti vee od 230 kg? Kolika je vjerojatnost da varijabla y poprimi vrijednosti manje od 230 kg? Zadano je: = 200 kg = 20 kg y0 = 230 kg 21 u = 200 0 y = 230 y Prvo treba odrediti kolika je vrijednost standardne normalne varijable, recimo z0, koja odgovara vrijednosti y0 = 230 kg. 20200 230z0 = = 1.5 Drugim rijeima, to