44549738 biometrika i planiranje istrazivanja 2010

Upload: doris-doricic

Post on 10-Jul-2015

854 views

Category:

Documents


7 download

TRANSCRIPT

Biometrika i planiranje istraivanja na ivotinjama Miroslav Kap tel: 239-3949 e-mail: [email protected] 1 UVOD............................................................................................................................................................................. 1 1.1 PODACI I VARIJABLE.................................................................................................................................................. 1 1.2 PRIKAZ PODATAKA.................................................................................................................................................... 3 1.2.1 Grafiki prikazi ................................................................................................................................................. 3 1.2.2 Numerike metode za opis kvantitativnih podataka.......................................................................................... 3 1.2.3 Simboli .............................................................................................................................................................. 3 1.2.4 Aritmetika srednja vrijednost:......................................................................................................................... 4 1.2.5 Varijanca uzorka: ............................................................................................................................................. 4 1.2.6 Standardna devijacija uzorka ........................................................................................................................... 5 1.2.7 Uvodni SAS primjer .......................................................................................................................................... 5 1.3 ZAKLJUCI O POPULACIJAMA NA TEMELJU UZORAKA................................................................................................ 6 1.4 SLUAJNE VARIJABLE I NJIHOVE RASPODJELE ........................................................................................................... 6 1.4.1 Raspodjele vjerojatnosti za diskretne sluajne varijable.................................................................................. 7 1.4.2 Raspodjele vjerojatnosti za kontinuirane sluajne varijable............................................................................ 8 1.5 FUNKCIJE SLUAJNE VARIJABLE.............................................................................................................................. 14 1.5.1 Neke statistike i njihove raspodjele................................................................................................................. 15 1.5.2 Stupnjevi slobode ............................................................................................................................................ 16 1.6 ZAKLJUIVANJE O POPULACIJI NA TEMELJU UZORAKA............................................................................................ 16 1.7 PROCJENA PARAMETARA......................................................................................................................................... 16 1.7.1 Procjena srednje vrijednosti populacije ......................................................................................................... 17 1.7.2 Procjena varijance u normalnoj populaciji .................................................................................................... 17 1.8 PROVJERA HIPOTEZA............................................................................................................................................... 17 1.8.1 P-vrijednost..................................................................................................................................................... 18 1.8.2 Statistika i praktina znaajnost ................................................................................................................... 19 1.8.3 Mogue greke kod statistikog zakljuivanja i snaga provjere..................................................................... 19 2 JEDNOSTAVNA LINEARNA REGRESIJA........................................................................................................... 21 2.1 UVOD...................................................................................................................................................................... 21 2.2 PROCJENA PARAMETARA 0 I 1............................................................................................................................... 23 2.3 OSTATAK I SVOJSTVA OSTATKA............................................................................................................................... 24 2.4 PROSJECI I VARIJANCE PROCJENITELJA.................................................................................................................... 24 2.5 STUDENTOVA T-PROVJERA I INTERVAL POUZDANOSTI PROCJENE PARAMETARA...................................................... 25 2.6 INTERVAL POUZDANOSTI ZA 1................................................................................................................................ 26 2.7 INTERVALI POUZDANOSTI ZAVISNE VARIJABLE ....................................................................................................... 26 2.8 RALANJENJE UKUPNE VARIJABILNOSTI ................................................................................................................ 28 2.8.1 Veza izmeu suma kvadrata............................................................................................................................ 29 2.9 PROVJERA HIPOTEZA - F- PROVJERA........................................................................................................................ 30 2.10 KOEFICIJENT DETERMINACIJE (R2) ........................................................................................................................ 31 2.11 SAS PRIMJER ZA JEDNOSTAVNU LINEARNU REGRESIJU.......................................................................................... 32 3 KOEFICIJENT KORELACIJE................................................................................................................................ 34 3.1 PROCJENA KOEFICIJENTA KORELACIJE..................................................................................................................... 35 4 VEKTORI I MATRICE ............................................................................................................................................. 36 4.1 TIPOVI I SVOJSTVA MATRICA................................................................................................................................... 36 4.1.1 Operacije s matricama i vektorima: ............................................................................................................... 37 5 JEDNOSTAVNA REGRESIJA U MATRINOM PRIKAZU............................................................................... 40 6 MULTIPLA REGRESIJA.......................................................................................................................................... 43 6.1 DVIJE NEZAVISNE VARIJABLE.................................................................................................................................. 43 6.1.1 Ralanjenje ukupne varijabilnosti i provjera hipoteza ................................................................................. 45 6.2 PARCIJALNE I STUPNJEVITE EKSTRA SUME KVADRATA ............................................................................................ 46 6.3 SAS PRIMJER ZA MULTIPLU REGRESIJU ................................................................................................................... 47 6.4 KRIVOLINIJSKA REGRESIJA DRUGOG STUPNJA ......................................................................................................... 48 6.4.1 SAS primjer za kvadratnu regresiju................................................................................................................ 49 6.5 MOGUE POTEKOE KOD UPOTREBE REGRESIJE .................................................................................................... 50 6.5.1 Analiza ostataka i naruenost pretpostavki modela........................................................................................ 51 6.5.2 Loa opaanja................................................................................................................................................. 52 6.5.3 Multikolinearnost............................................................................................................................................ 52 6.6 IZGRADNJA MODELA I KRITERIJI ZA IZBOR MODELA................................................................................................. 53 7 JEDNOSTRUKA ANALIZA VARIJANCE............................................................................................................. 54 7.1 MODEL JEDNOSTRUKE ANALIZE VARIJANCE S FIKSNIM UTJECAJIMA........................................................................ 55 7.1.1 Ralanjenje ukupne varijabilnosti na izvore varijabilnosti: ......................................................................... 56 7.1.2 Postavljanje hipoteza i F-provjera ................................................................................................................. 57 7.2 USPOREDBA SREDNJIH VRIJEDNOSTI POJEDINIH GRUPA ........................................................................................... 59 7.2.1 Najmanja znaajna razlika (LSD) .................................................................................................................. 59 7.2.2 Tukey provjera (HSD)..................................................................................................................................... 59 7.3 SAS PRIMJER JEDNOSTRUKE ANALIZE VARIJANCE S FIKSNIM UTJECAJIMA .............................................................. 60 7.4 MODEL SA SLUAJNIM UTJECAJIMA GRUPA............................................................................................................. 61 7.5 INTRAKLASNA KORELACIJA..................................................................................................................................... 63 7.6 SAS PRIMJER JEDNOSTRUKE ANALIZE VARIJANCE SA SLUAJNIM UTJECAJIMA ....................................................... 64 8 NAELA PLANIRANJA POKUSA.......................................................................................................................... 65 8.1 POKUSNA JEDINICA I TRETMANI .............................................................................................................................. 66 8.2 PONAVLJANJA I POKUSNA GREKA .......................................................................................................................... 66 8.3 POTREBAN BROJ PONAVLJANJA ............................................................................................................................... 67 9 POTPUNO SLUAJNI POKUSNI PLAN................................................................................................................ 68 10 BLOKOVI U ANALIZI VARIJANCE.................................................................................................................... 70 10.1 SLUAJNI BLOK PLAN (POTPUNI) ........................................................................................................................... 70 10.1.1 Ralanjenje ukupne sume kvadrata............................................................................................................. 71 10.1.2 Postavljanje hipoteza i F-provjera ............................................................................................................... 72 10.1.3 SAS primjer za sluajni blok plan................................................................................................................. 73 10.1.4 SAS primjer s vie pokusnih jedinica po kombinaciji blok x tretman ........................................................... 74 11 'CHANGE-OVER' POKUSNI PLANOVI .............................................................................................................. 77 11.1 JEDNOSTAVNI 'CHANGE-OVER' PLAN...................................................................................................................... 77 11.2 'CHANGE-OVER' PLAN KADA POSTOJI UTJECAJ RAZDOBLJA.................................................................................... 78 11.2.1 SAS primjer za change-over plan s utjecajem razdoblja ........................................................................... 79 11.3 LATINSKI KVADRAT............................................................................................................................................... 80 11.3.1 SAS primjer za latinski kvadrat..................................................................................................................... 82 11.4 CHANGE OVER PLAN POSTAVLJEN KAO VIE LATINSKIH KVADRATA...................................................................... 84 12 FAKTORIJALNI POKUS........................................................................................................................................ 85 12.1 SAS PRIMJER ZA FAKTORIJALNI POKUS ................................................................................................................. 88 13 HIJERARHIJSKI POKUSNI PLANOVI ............................................................................................................... 90 13.1 SAS PRIMJER ZA HIJERARHIJSKI PLAN ................................................................................................................... 92 14 POKUSNI PLANOVI SA KAVEZIMA I PREGONIMA..................................................................................... 94 15 DVOSTRUKI BLOKOVI......................................................................................................................................... 96 16 SPLIT PLOT POKUSNI PLAN............................................................................................................................. 100 16.1 FAKTOR A (GLAVNI FAKTOR) KAO SLUAJNI BLOK PLAN .................................................................................... 100 16.1.1 SAS Primjer: Split plot plan, glavne jedinice kao sluajni blokovi ............................................................ 101 16.2 FAKTOR A (GLAVNI FAKTOR) KAO POTPUNO SLUAJNI PLAN .............................................................................. 103 16.2.1 SAS primjer: Glavne jedinice u potpuno sluajnom planu......................................................................... 104 17 ANALIZA KOVARIJANCE.................................................................................................................................. 106 17.1 POTPUNO SLUAJNI POKUSNI PLAN SA KOVARIJABLOM....................................................................................... 106 11 Uvod 1.1 Podaci i varijable Podaci: - materijal s kojim statistiar radi - prikupljaju se mjerenjem, brojanjem ili opaanjem- Primjeri: skup teina teladi, koliina mlijeka u laktaciji, muki ili enski spol, plava ili zelena boja oiju Pokus ili eksperiment: Proces sakupljanja, opaanja ili mjerenja podataka Varijabla Oznaava skup podataka Poprima razliite vrijednostivrijednosti varijable pokazuju varijabilnostPrimjeri: teina, koliina mlijeka, spol, boja oiju Podaci su vrijednosti koje varijabla poprima.- teina od 200 kg, ili koliina mlijeka od 20 kg. VARIJABLE KVALITATIVNE (ATRIBUTIVNE, KATEGORIKE). KVANTITATIVNE(NUMERIKE) NOMINALNEORDINALNEDISKRETNEKONTINUIRANE VARIJABLE A) kvantitativne (numerike) - ije se vrijednosti prikazuju brojevima, a razlike izmeu brojeva imaju numeriko znaenje- teina ivotinja, broj mladih u leglu, temperatura, vrijeme a) diskretne - konana ili beskonana - prebrojiva, mjeri sa cijelim ili prirodnim brojevima- broj mladih u leglu ili broj jaja 2b) kontinuirane - poprima beskonano mnogo vrijednosti- njene vrijednosti mjere se realnim brojevima - koliina mlijeka ili teina B) kvalitativne (atributivne, kategorike) - podaci su im opisni - boja oiju ili da li je ivotinja bolesna ili nijea) nominalne - ne moe se rei da je jedna kategorija vea ili manja od druge- boja oiju ili koe b) ordinalne - kod kojih se kategorije mogu poredati po veliini - ocjene lakoe telenja Zato podaci, mjerenja, opaanja Mjerenja ili opaanja nam pomau u zakljuivanju o nekoj pojavi Pitanje je i koji je uzrok da je neka krava bolja Da li moemo izmjeriti i taj uzrok Da li moemo rei da e uslijed nekog zahvata krava biti bolja Na primjer: ako damo kravi mineralni dodatak da li e dati vie mlijeka? Kako emo to zakljuiti? Zakljuak:Rekapitulacija stanja Koristiti i u buduim situacijama Koliko smo sigurni da je na zakljuak korektan? Tonost i preciznost zakljuaka ovise o broju podataka (koliini informacija), kvaliteti podataka, reprezentativnosti podataka esto donosimo zakljuak uz neku vjerojatnost Statistike metode Naini na koje dolazimo do zakljuaka koristei podatkeUkljuuju sakupljanje, organiziranje, tabeliranje, analizu, interpretaciju, opis i prezentaciju podataka Ukljuuju paljivo i precizno definiranje problema (postavljanje cilja), donoenje pravilnog zakljuka koji pomae odgovoriti na postavljeno pitanje ili cilj Biometrika (Biostatisika), a posebno statistike metode ukljuuju dva glavna pristupa u donoenju zakljuaka:1. Opis nekog skupa podataka (opisna statistika)2. Izbor uzoraka iz veeg skupa podataka (populacije, izvora podataka) i koritenje tih uzoraka za zakljuak o toj populaciji (populacijama) 31.2 Prikaz podataka 1.2.1 Grafiki prikazi Primjer: Histogram:-raspodjela frekvencija nekog skupa podataka - podaci se svrstavaju u razrede - prikazuje broj opaanja u pojedinom razredu - prava ili relativna frekvencija 1 158 861216127 782520246810121416190 200 210 220 230 240 250 260 270 280 290 300 310 320 330Sredine razredaBroj teladi Slika 1-1: Histogram teine teladi u dobi od 7 mjeseci (n=100) 1.2.2 Numerike metode za opis kvantitativnih podataka NUMERIKE OPISNE MJEREA)Mjere centralne tendencije - Aritmetika srednja vrijednost - Medijan - Mode B) Mjere varijabilnosti - Raspon- Varijanca - Standardna devijacija - Koeficijent varijabilnosti C) Mjere relativnog poloaja - Percentili - z-vrijednost 1.2.3 Simboli i = veliko grko slovo sigma = oznaka za sumu i = 1 do n Suma n brojeva:i yi = y1 + y2 +.....+ yn Suma kvadrata n brojeva: i y2i = y21 + y22 +.....+ y2n Suma produkata dva niza brojeva: i xiyi = x1y1 + x2y2 +.....+ xnyn 4 Primjer: yy1y2y3 246 x x1x2x3 367 i yi = y1 + y2 + y3 = 2 + 4 +6 = 12 i y2i = y21 + y22 + y23 = 22 + 42 +62 = 56i xiyi = x1y1 + x2y2 + x3y3 = (3)(2) + (6)(4) +(7)(6) = 72 1.2.4 Aritmetika srednja vrijednost: nyyii =

Svojstva aritmetike srednje vrijednosti: 1. ( )= iiy y 0

2. ( )= iiy y minimum2 drugim rijeima( ) ( ) < iiiia y y y2 2,za bilo koji broj a. 1.2.5 Varijanca uzorka: Ako se i prosjek izraunava iz istog uzorka kao y (tj. ako je nepoznat prosjek populacije) 1) (22= ny ysii Ako je od prije poznat prosjek populacije i NE rauna se iz istog uzorka: nysii =22) ( - Varijanca je prosjeno kvadrirano odstupanje od prosjeka Suma kvadriranih odstupanja od srednje vrijednosti (korigirana suma kvadrata) =( )nyy y yiiiiii22 2) ( = 51.2.6 Standardna devijacija uzorka2s s = prosjeno odstupanje od prosjeka 1.2.7 Uvodni SAS primjer Pogledajmo rjeavanje primjera o uzorku teine teladi koristei SAS software. Na detaljna objanjenja upotrebe programa itaoca upuujem na iscrpnu SAS literaturu, dio koje moe vidjeti u popisu literature na kraju ove knjige. Ovdje moemo samo ukratko spomenuti da se svaki SAS program sastoji od dva dijela: 1) DATA step, koji slui za unos ili kreiranje skupa podataka za koji se eli napraviti analiza, i 2) PROC step, koji slui za analizu podataka. Treba jo rei da SAS software daje mogunost obrade podataka i bez pisanja programa sa instrukcijama, tj. koristei i birajui ponuene opcije za eljenu analizu. Meutim, pisanje programa daje korisniku vee mogunosti i znanje o koritenju programa bez obzira na kompjutersku platformu. SAS ima tri osnovna prozora: Program prozor (PGM) u koji se upisuje program, Ispis prozor (OUT) u kojem korisnik moe vidjeti ispis i LOG prozor u kojem se moe provjeriti detalje o provedbi programa i mogue greke. Vratimo se primjeru o teinama teladi. Izmjereni su slijedei podaci 20 teladi: SAS program: DATA telad; INPUT tezina @@; DATALINES; 260260230280290280260270260300 280290260250270320320250320220 ; PROC MEANSDATA = telad N MEAN MIN MAX VAR STD CV ; VAR tezina; RUN; Objanjenje: SAS naredbe pisat emo uvijek velikim slovima da ih istaknemo, makar to u programu nije potrebno, tj. program jednako tretira i velika i mala slova. Imena koja sam korisnik daje varijablama i drugim oznakama pisat emo malim slovima. Naredba DATA definira ime datoteke koja e sadravati podatke, a ovdje je telad ime datoteke. Naredba INPUT definira ime varijable, a naredba DATALINES govori da slijede podaci. Ovdje je varijabla tezina. SAS treba podatke varijabli u kolonama, pa se u pravilu podaci i piu u kolone. Na primjer, INPUT tezina; DATALINES; 260 260 220 ; uitava podatke varijable tezina. Podaci se mogu pisati i jedan za drugim u redu ako se koristi oznaka @@ kod naredbe INPUT. SAS ita podatke jedan po jedan i sprema ih u kolonu. Program koristi proceduru MEANS. Da bi oznaili da je to ime procedure treba napisati PROC MEANS. DATA = telad, definira za koju datoteku e se raunati statistike. Slijedi popis statistika koje traimo: N = broj podataka, MEAN = aritmetika srednja vrijednost, MIN = minimum, MAX = maksimum, VAR = varijanca, STD= standardna devijacija, CV = koeficijent varijacije. Naredba VAR definira varijablu (tezina) koja e se analizirati.6 SAS ispis: Analysis Variable: TEZINA N Mean Minimum Maximum Variance Std Dev CV ------------------------------------------------------------- 20273.5220320 771.3157927.7725710.1545 ------------------------------------------------------------- SAS ispis prikazuje ime varijable koja e se analizirati (Analysis varijabla: TEZINA), a zatim opisnu statistiku. 1.3 Zakljuci o populacijama na temelju uzoraka Populacija:Skup jedinki koje imaju neka zajednika svojstva od interesaIzvor podataka Parametri: Opisni pokazatelji populacije Obino nepoznate vrijednostiPrimjer: prosjek populacije Koliki je prosjek koliine mlijeka u laktaciji? Uzorak: Skup jedinki (podataka) izabran iz populacije Slui za procjenu i (ili) zakljuivanje o populaciji. Vjerodostojnost procjene i zakljuaka o populaciji je vea: ako je uzorak dobar predstavnik populacije uzorak mora biti sluajno izabran Statistike: Numeriki opisni pokazatelji uzorka (eng. statistics) Mogu se izraunati iz uzoraka Primjer: aritmetika srednja vrijednost uzorka Statistiki zakljuci na temelju uzoraka su podloni grekiDonose se uz neku vjerojatnost Kako odrediti vjerojatnost? Definiranjem sluajne varijable i matematikih modela raspodjele vjerojatnosti 1.4 Sluajne varijable i njihove raspodjele Sluajna varijabla: Matematiki pojam, govori kako se opaanju pridruuje numerika vrijednostVrijednost koju varijabla poprima smatra se sluajnim procesom (dogaajem) Na primjer: izmjerimo tele i vidimo da je teko 180 kg. Meutim ne znamo zato ba ima 180 kg.7Barem dio te vrijednosti zato smatramo sluajnim Sluajna varijabla poprima odreenu numeriku vrijednost s odreenom vjerojatnosti y je oznaka za varijablu yi predstavlja vrijednost i-tog opaanje - odreeno opaanje: y1, y2 y y0 su sve vrijednosti koje su manje ili jednake od y0 Sluajne varijable Kontinuirana (neprekidna) - sve vrijednosti u nekom intervalu - realni brojevi- teina teladi starih 6, bilo koja vrijednost u intervalu od 160 do 260 kg, recimo 180.0 ili 191.23456 Diskretna (prekidna) - poprima samo odreeni broj vrijednosti u nekom intervalu - NE sve vrijednosti- esto cijeli brojevi- broj latica u cvijetu, broj mladih u leglu Vrijednost varijable y - numeriki dogaaj - ima odreenu vjerojatnost da se dogodiRaspodjela vjerojatnosti sluajne varijable y: - tablica, grafikon ili formula koji pokazuje vjerojatnost da y poprimi odreenu vrijednost Raspodjela vjerojatnosti sluajne varijable Raspodjela vjerojatnosti sluajne varijable s konanim ili prebrojivim vrijednostima je raspodjela frekvencijaRaspodjela vjerojatnosti se esto moe prikazati formulom (funkcijom) Matematiki model prave raspodjele frekvencijaProcjena prave raspodjele frekvencija Funkcija sluajne varijable: p(y) ili f(y) Raspodjela = distribucija Oekivanje (prosjek) i varijanca sluajne varijable - pokazatelji poloaja i varijabilnosti Oekivanje (prosjek): E(y) = y Varijanca: Var(y) = 2y =2 = E[(y y)2] = E[y2] y2 (Sjetite se da je varijanca prosjeno kvadrirano odstupanje od prosjeka) 1.4.1 Raspodjele vjerojatnosti za diskretne sluajne varijable - tabelarni ili grafiki prikaz ili formula koja daje vjerojatnost p(y) za svaku moguu vrijednost varijable y. Uvjeti: 1. O p(y) 1 2. (svi y) p(y) =1 8 Primjeri diskretnih varijabli Binarna varijabla samo dva mogua rezultata neke pojave DA i NE ili 0 i 1 bolestan zdrav i sl Binomna varijabla Broj povoljnih pokuaja (y) u ukupno n pokuaja U pojedinanom pokuaju mogua samo dva rezultatabroj enske teladi u 4 telenja, broj bijelih praia u leglu Binomna raspodjela - raspodjela vjerojatnosti y povoljnih opaanja (pokuaja) u ukupno n pokuaja - broj enske teladi u 4 telenja - broj bijelih praia u leglu Raspodjela vjerojatnosti od y: - odreena parametrom p i brojem pokuaja n: y n yq pyny p||.|

\|= ) ( (y = 0,1,2,,...., n) p = vjerojatnost povoljnog rezultata u pojedinanom opaanju (pokuaju) (vjerojatnost elementarnog dogaaja). q = 1 p = vjerojatnost nepovoljnog rezultata Oblik raspodjele vjerojatnosti ovisi o p:- binomna raspodjela je simetrina kada je p = 0.5 - asimetrina u svim ostalim sluajevima 00.050.10.150.20.250.30 1 2 3 4 5 6 7 8broj povoljnih pokuajafrekvencijaA)00.10.20.30.40 1 2 3 4 5 6 7 8broj povoljnih pokuajafrekvencijaB) Slika 1-2: Binomna raspodjela (n = 8) za dva sluaja A) p=0.5 i B) p = 0.2 Primjer 1.4.2 Raspodjele vjerojatnosti za kontinuirane sluajne varijable Kontinuirana sluajna varijabla: Poprima neprebrojivo mnogo vrijednosti Nemogue je pridruiti vjerojatnost za svaki pojedinani numeriki dogaaj 9Teoretski vrijednost kontinuirane varijable je toka, a matematiki toka nema dimenzije Vjerojatnost da sluajna varijabla poprimi neku odreenu vrijednost je jednaka nuli VANO:promatrati vjerojatnost da varijabla y poprima vrijednosti u nekom intervaluvjerojatnost se pridruuje numerikom dogaaju koji se odnosi na neki interval Primjer: teina teladi- vrijednosti koje se pridruuju pojedinom mjerenju zavise od preciznosti mjerenja - ako npr. preciznost na 1 kg, tada izmjera od 220 kg znai sve mjere od 219.5 do 220.5 kg- poto se radi o intervalu ==> dogaaj ima vjerojatnost Funkcija vjerojatnosti gustoe Gustoa = podsjetnik da govorimo o vjerojatnosti u intervalimaFunkcija gustoe = model prave (nepoznate) raspodjele frekvencije Svojstva funkcije gustoe: 1. f(yi) 0 2. P( y +) = 1 (vjerojatnost da se dogodi bilo koji y je jednaka 1) 1.4.2.1 NORMALNA RASPODJELA - model raspodjele relativnih frekvencija u mnogim pojavama.- normalnu raspodjelu slijede mnogi pokazatelji koji se koriste za statistiko zakljuivanje. - normalna krivulja = Gaussova krivulja - oblik zvona. Slika 1-3: Normalna (Gaussova) krivulja Poloaj i oblik normalne krivulje je odreen sa dva parametra i 2 (prosjek i varijanca) Funkcija gustoe je: (((

|.|

\|=221221) (ye y f - y N (,2) 10 - Visina i rasprenost krivulje ovisi o varijanci 2

- Poveanje 2 dovodi da krivulja smanjuje visinu i vie je rairena. 00.10.20.30.4-4 -3 -2 -1 0 1 2 3 4Frrekvencija = 1 = 1.5 Slika 1-4: Normalne krivulje sa standardnim devijacijama = 1 i = 1.5 Vjerojatnost da se sluajno izabrana jedinka (s nekom vrijednosti y)nalazi u intervalu (y1, y2) je jednaka povrini ispod normalne krivulje ograniena vrijednostima y1 i y2. (Uzima se da je ukupna povrina 1 ili 100%) Ova vjerojatnost je jednaka proporciji jedinki s vrijednostima izmeu y1 iy2 Primjer: Vjerojatnost da y bude izmeu 170 i 210 P(y1 y y2) = P(170 y 210) = 200y1 = 170y2 = 210 Slika 1-5: Povrina ispod normalne krivulje ograniena vrijednostima 170 i 210 Primjer: Vjerojatnost da y < 230 = 2000y= 230 Slika 1-6: Normalna krivulja sa = 200 i = 20 Standardizacija normalnih krivulja 11Budui da oblik krivulje ovisi samo o varijanci (odnosno stanardnoj devijaciji ),sve normalne krivulje se mogu standardizirati tj. prevesti u standardnu normalnu krivulju Standardizacija: sluajna normalna varijabla y se izrazi u jedinicama standardne devijacije: =yz Standardna normalna krivulja je takva normalna krivulja kojoj je prosjek 0 i standardna devijacija 1 => = 0 i = 1 esto se za standardnu normalnu varijablu pie: z Z ili z N(0, 1) Funkcija gustoe standardne normalne varijable je: | |22121) (ze z f= 0 95% -11.96 1.96 1 Slika 1-7: Standardna normalna krivulja ( = 0 i 2 = 1) Povrina ispod standardne normalne krivulje ograniena s dvije vrijednosti standardne normalne varijable z1 i z2, predstavlja vjerojatnost da varijabla poprime vrijednosti izmeu ta dva broja. (opet se utima da je ukupna povrina jednaka jedan (ili 100%): P( z +) = 1 Takoer: P(1.96 z 1.96) = 0.95 Praktina vrijednost standardizacije je u tome to za pronalaenje povrine ispod krivulje ogranienu nekim intervalom koristimo samo jednu krivulju. Podsjetimo se da je povrina ispod krivulje u nekom intervalu (y1, y2) odgovara vjerojatnosti da sluajna varijabla y poprima vrijednosti u tom intervalu. Matematiki povrina ispod krivulje je jednaka odreenom integralu funkcije gustoe. Kako ne postoji eksplicitna formula za taj integral, sluimo se tablicama (bilo iz knjige ili kompjuterskog programa). Poto je mogue sve normalne krivulje svesti na standardnu, potrebno je imati samo jednu tablicu. Naime vjerojatnost da y poprima vrijednosti izmeu y1 i y2 je: P(y1 y y2) = P(z1 z z2) gdje su =11yzi =22yz 12Primjer zy 0 1.5=200 y0=230 Slika 1-8:Prikaz normalne i standardne normalne krivulje. Prikazane su dvije skale: originalna skala y i standardna normalna skala z. Vrijednost varijable y0 = 230 odgovara vrijednosti z0 = 1.5. 210 200 170.5 0 1.5 zy Slika 1-9: Povrina ispod krivulje izmeu 170 i 210. Koliki je prosjek odabranih ivotinja? zs = prosjek z vrijednosti za koje vrijedi z > z0, tj. z vrijednosti veih od z0.Za standardnu normalnu krivulju vrijedi: Pz fzS) (0= p = povrina ispod standardne normalne krivulje za z>z0, f(z0) = ordinata za vrijednost z0.Ordinata je: 2) (20210zez f=-vrijednost funkcije za danu vrijednost z. 13 z 0 z0zS P f(z) f(z0) Slika 1-10 Prosjek odabranih z vrijednosti. f(z0) = ordinata krivulje za z = z0, P je povrina, odnosno vjerojatnost P(z>z0) i zS je prosjek vrijednosti veih od z0. Primjer: 1.4.2.2 HI KVADRAT RASPODJELA Neka su z1, z2,, zv standardne normalne varijable sa = 0 i = 1. Sluajna varijabla2 =j z2j

ima hi kvadrat raspodjelu sa v stupnjeva slobode.0.000.050.100.150.200.250.300.350.400.450.500 5 10 15 20v=2v=6v=102f (2) Slika 1.11Funkcija gustoe 2 varijabli sa stupnjevima slobode v = 2, v = 6 i v = 10 Nagib i oblik raspodjele ovisi o stupnju slobode 1.4.2.3 STUDENTOVA (T) RASPODJELA Neka je z normalna sluajna varijabla sa = 0 i = 1 i 2 hi-kvadrat sluajna varijabla sa v stupnjevima slobode. Varijabla definirana sa: vzt2= je sluajna varijabla s t-raspodjelom. 14 stupnjevi slobode v = 16 stupnjevi slobode v = 2 Slika 1-12: Funkcija gustoe t sluajnim varijablama sa stupnjevima slobode 16 i 2. Studentovatraspodjelajepooblikuslinanormalnojsamotosasmanjenjemstupnjevaslobode krivulja postaje vie razvuenija (deblja) prema repovima (Slika 1.13). Kada stupnjevi slobode idu prema beskonanosti, t raspodjela prelazi u normalnu.. 1.4.2.4 F-RASPODJELA Neka su 21i 22 hi-kvadrat sluajne varijable sa stupnjevima slobode v1 i v2. I neka su 21i 22 nezavisni. Tada je: 222121vvF=

sluajna varijabla sa F-raspodjelomOblik F raspodjele ovisi o stupnjevima slobode Slika 1.13Funkcije gustoe F raspodjela sa stupnjevima slobode: a) v1=2 i v2 = 6; b) v1=6 i v2 = 10; c) v1=10 i v2 =20 1.5 Funkcije sluajne varijable Sluajne varijable: varijable ije vrijednosti mjerimo, opaamo (teina, koliina mlijeka normalne sluajne varijable) Funkcije tih varijabli iz uzoraka koje zovemo statistike (primjer: aritmetika srednja vrijednost) 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 01234 5 Ff(F) v1=2; v2=6 v1=10; v2=20 v1=6; v2=10 15 Statistike (engl. statistics) Numeriki opisni pokazatelji izraunati iz uzorka Funkcije sluajne varijable => i same su sluajne varijablePrimjeri:y is2 su statistikeImaju poznate teoretske raspodjele => mogua procjena vjerojatnosti sa kojom se odreena vrijednost statistike pojavljuje => koriste se za donoenje zakljuaka o populaciji 1.5.1 Neke statistike i njihove raspodjele 1.5.1.1 RASPODJELA SREDNJIH VRIJEDNOSTI UZORAKA , SREDINJI GRANINI TEOREM Ako se sluajno izabiru uzorci veliine n iz neke populacije sa srednjom vrijednosti i varijancom 2 i kada je n dovoljno velik, raspodjela srednjih vrijednosti uzoraka moe se predoiti normalnom funkcijom gustoe sa prosjekom =y i standardnom devijacijomny =. y = standardna greka procijene prosjeka populacijeili samo standardna greka y Slika 1-14: Raspodjela srednjih vrijednosti uzoraka yse moe procijeniti standardnom grekom uzorkanssy= 1.5.1.2 NEKE STATISTIKE KOJE NEMAJU NORMALNU RASPODJELU 2222) () 1 ( =iy ys n ima hi-kvadrat raspodjela sa v = (n1) stupnjevima slobode, ako je y normalna varijabla. 16Statistika nsyt2 = imai studentovu t raspodjelu sa (n1) stupnjeva slobode, ako je y normalna varijabla. Neke statistike imaju F raspodjelu. 1.5.2 Stupnjevi slobode Broj nezavisnih opaanja povezanih sa procjenom varijance, odnosno s izraunavanjem prosjeka kvadrata Ukupan broj opaanja manje broj parametara koritenih u izraunavanju tog prosjeka kvadrata Na primjer: u izraunu varijance uzorka stupnjevi slobode su (n1) Stupnjevi slobode u izraunu varijance uzorka Varijanca uzorka je prosjeno kvadrirano odstupanje od aritmetike srednje vrijednosti Postoji (n1) nezavisnih opaanja jer smo ve s istim opaanjima izraunali aritmetiku srednju vrijednost Dakle, prosjek kvadriranih odstupanja dobije se dijeljenjem sume kvadrata sa (n1) 1.6 Zakljuivanje o populaciji na temelju uzoraka 1.Procjena svojstava populacije (procjena parametara) 2. provjera hipoteza o populaciji 1.7 Procjena parametara Procjene parametara: Jedinstveni procjenitelj: - pravilo ili formula koja govori kako izraunati procjenu iz uzorkaprocjena = broj koji izraunamo Intervalni procjenitelj -formula koja govori kao izraunati interval procjene - intervalna procijena = izraunati interval Svojstva jedinstvenih procjenitelja: - statistika (funkcija sluajne varijable) - izraunat iz uzorka - mora biti nepristran: oekivanje od procjenitelja je jednako pravom parametru - odstupanje procjenitelja od prave vrijednsoti parametra mora imati najmanju varijancu - ima poznatu raspodjelu statistike uzorka(engl. sampling distribution). Npr. prema centralnom graninom teoremu raspodjela prosjeka uzorka e biti priblino normalna za velike uzorke ( n > 30), sa srednjom vrijednosti i standardnom devijacijomn /

171.7.1 Procjena srednje vrijednosti populacije Jedinstveni procjenitelj od je y Svojstava: Oekivanje od aritmetikog prosjeka je jedanko prosjeku populacije - odstupanja) ( y yi imaju najmanju varijancu) ( y y Vari = min. - y ima normalnu raspodjelu sa i ny =Statistikayyz = ima standardnu normalnu raspodjelu 1.7.2 Procjena varijance u normalnoj populaciji Nepristrani procjenitelj varijance populacije (2) je varijanca uzorka: 1) (22= ny ysii Ukoliko je y normalna varijabla sa prosjekom i varijancom 2, tada je: 222) 1 (s n = sluajna varijabla sa hi-kvadrat raspodjelom. 2) 2 / 1 (2222 /2) 1 ( ) 1 ( s n s n

1.8 Provjera hipoteza Hipoteza: tvrdnja o jednoj ili vie populacija. Istraivaka hipoteza Statistika hipoteza Nul hipoteza (H0) - nepromijenjeno stanje, nepostojea razlika- hipoteza koju provjeravamo Alternativna hipoteza (H1) - promijenjeno stanje, postojea razlika obino je identina istraivakoj - sama se po sebine moe provjeravati, nego se koristi provjera nul hipoteze. 18Provjera hipoteza: - na temelju informacija iz uzorka - rezultira u jednoj od dvije odluke:1. odluka da se H0 odbaci2. odluka da se H0 ne odbaci, jer uzorak nije dao dovoljno dokaza da bi se H0 odbacila.- H0 i H1, se uvijek postavljaju tako da iskljuuju jedna drugu- kada odbacujemo H0, pretpostavljamo da je H1 tona.- u zakljuivanju koristimo zakone vjerojatnosti Openito, lake je dokazati da je neka hipoteza lana nego da je tona - prihvaanje H0 ne znai da je ona tona, nego da uzorak ne daje dovoljno dokaza da je H0 lana.- prihvaamo H0 sve dok nije prikupljeno dovoljno dokaza koji je obaraju Koraci u provjeri hipoteza: 1) Definiramo H0 i H1

2) Odredimo (razinu znaajnosti) 3) Izraunamo procjenu parametra4) Odredimo statistiku za provjeru i njezinu raspodjelu kada vrijedi H0 i izraunamo njenu vrijednost iz uzorka 5) Odredimo kritinu vrijednost, kritino podruje 6) Usporedimo izraunatu vrijednost statistike za provjeru sa kritinim vrijednostima i donosimo zakljuak. Prikaz razine znaajnosti, kritine vrijednosti i kritinog podruja poznate raspodjele z/2- /2 /2 razina znaajnosti = kritino podruje kritino podruje 0 kritina vrijednost 1.8.1 P-vrijednost Drugi nain da se odlui o prihvaanju ili odbijanju nul hipoteze H0, je da se utvrdi vjerojatnost da izraunata vrijednost statistike za provjeru pripada distribuciji kada H0 vrijedi. Ta vjerojatnost obino se oznaava kao P vrijednost i predstavlja opaenu razinu znaajnosti. Mnogi kompjuterski statistiki programi daju P vrijednost i ostavljaju istraivau da sam odlui o prihvaanju ili odbijanju H0. Moe se rei da se H0 odbacuje uz vjerojatnost pogreke koja je jednaka P vrijednosti. P vrijednost se moe koristiti i kada je razina znaajnosti unaprijed odreena. Za zadanu razinu znaajnosti , ako je P vrijednost manja od , H0 se odbacuje uz razinu znaajnosti. 19 1.8.2 Statistika i praktina znaajnost Statistika znaajnost ne mora uvijek znaiti da istraivanje ima i praktinu znaajnost. Na primjer, pretpostavimo pokus s upotrebom aditiva u hrani koji je poveao dnevni prirast u tovu junadi za 20 g. Ovo poveanje je relativno malo i najvjerojatnije nema ni praktino ni ekonomsko znaenje. Meutim uz dovoljno velik uzorak i takvo poveanje se moe pokazati statistiki znaajno. Takoer, razlike izmeu populacija mogu imati praktino znaenje, ali zbog malih uzoraka razlika se nje pokazala statistiki znaajna u uzorcima.Potreban je oprez u upotrebi rijei znaajan. Pojam statistika znaajnost vrijedi samo za uzorak. Tako se moe rei: postoji znaajna razlika izmeu prosjeka uzoraka, to znai da njihova izraunata razlika vodi do izraunate P vrijednosti dovoljno male da moemo odbaciti H0. Ali treba izbjegavati izraze kao prosjeci populacije su znaajno razliiti, jer prosjeci populacije mogu biti samo praktino razliiti, dakle oni su razliiti ili nisu razliiti. Potpuno je pogrean izraz: alternativna hipoteza H1 je da su prosjeci dviju populacije znaajno razliite, jer alternativna hipoteza znai samo razliku, a prihvaanje alternativne hipoteze putem statistike provjere ne znai automatski i praktinu znaajnost. 1.8.3 Mogue greke kod statistikog zakljuivanja i snaga provjere Kod zakljuivanja na temelju uzorka mogua su dva pogrena zakljuka: a) tip I greka = odbacivanje nul hipoteze H0, a da je zapravo H0 istinita b) tip II greka = ne odbacivanje H0, a da je zapravo H0 lana. Istinita (prava) situacija H0 tonoH0 nije tono Nije odbaena H0 Korektno prihvaanje P = 1 Tip II greka P = Odluka statistike provjere Odbaena H0 Tip I greka P = Korektno odbijanje P = 1 1 = snaga provjere Nain kontrole (smanjenja vjerojatnosti) tip I i tip II greke: -poveati uzorak - smanjiti varijancu- poveati utjecaj (engl. effect size) snagu provjere treba razmatrati kod planiranja pokusa- kada je uzorak ve odreen, ne moe se istovremeno smanjiti i i - obino se nastoji smanjiti tip I greka () - postavi = 0.05 i u veini sluajeva se ne obazire na . Vjerojatnost tip I greke (, P-vrijednost): - poznata ili se lako izrauna - postavlja ju sam istraiva kao razinu znaajnostiVjerojatnost tip II greke (): - esto teko izraunati- mora se pretpostaviti neka raspodjela ako je H1 tono i na temelju te raspodjele pokuati odrediti 20 Raspodjela ako vrijedi H1

0 Snaga provjere Raspodjela ako vrijedi H0

Kritino podruje1 Slika 1-15: Vjerojatnost greke tipa I i II Snaga provjere: - vea snaga provjere (ili analogno mali , jer snaga je jednaka 1 ) je vana u sluaju kada ne odbacujemo nul hipotezu- ako provjera ima malu snagu i nije odbaena nul hipoteza, zakljuak je sumnjiv i velika je ansa da radimo tip II greku - obino ne donosimo zakljuke o jednakosti dva ili vie parametara ba zbog esto velike vjerojatnosti , odnosne male snage (1 ) Snaga provjere moe se odrediti ako pretpostavimo nekoliko specifinih alternativnih hipoteza sa razliitim parametrima 212 Jednostavna linearna regresija 2.1 Uvod Mjerenja vie varijabli Pitanja: - kakav utjecaj imaju varijable jedna na drugu - da li postoji funkcijska veza izmeu varijabli Primjer:- kako promjena vanjske temperature za jedan stupanj utjee na promjenu konverziju hrane- kako promjena razine proteina u hrani utjee na promjenu dnevnog prirasta. Regresija- ukljuuje skup statistikih procedura kojima se izvode zakljuci o vezi izmeu varijabli- prouava statistiku vezu izmeu varijabli na taj nain da se jedna varijabla definira kao zavisna varijabla, a ostale kao nezavisne varijable- kako promjena nezavisnih varijabli utjee na promjenu zavisne varijable zavisna varijabla = y (konverzija hrane) nezavisne varijable = x (temperatura) Statistiki model: y = 0 + 1x + y= zavisna varijabla (sluajna) x= nezavisna varijabla (fiksna) 0, 1= regresijski koeficijenti (parametri) = sluajna greka = sluajna neprotumaena odstupanja - zbog individualnih razlika izmeu ivotinja ili razliite okoline, greke kod mjerenja i sl., Statistiki model: matematiki model koji sadri Deterministiki model: NE sadri - kada bi opseg prsa tono opisao teinuy = 0 + 1x Model regresije se odnosi na parove opaanja (x1,y1),(x2,y2),...,(xn,yn)Prema modelu svaki yi se moe prikazati: yi = 0 + 1xi + i i = 1,.....n Odnosno, y1 = 0 + 1x1 + 1 y2 = 0 + 1x2 + 2 ............ yn = 0 + 1xn + n 22 Oekivanje zavisne varijable y za zadani x je E(y|x) i predstavlja pravac.E(yi| xi) = 0 + 1xi = pravac yE(y|x)********* * (xi,yi )ix Slika 2-1:Pravac linearne regresije. Zvjezdicama su prikazana prava mjerenja (xi,yi), Pravac E(y|x) je oekivanje zavisne varijable, i je odstupanje mjerenja od oekivanja Objanjenje parametara jednostavne regresije 0 = odsjeak na y osi, vrijednost (E(y| xi=0)1 = govori o nagibu pravca, to je promjena E(y| x) koja odgovara promjeni vrijednosti varijable x za jedinicu (x=1). E(yi |xi) = 0 + 1xi01xy1x=1 Slika 2-2: Objanjenje parametara obine linearne regresije x xyxya) b)xyc) Slika 2-3:a) pozitivna regresija, 1 > 0; b) negativna regresija, 1 < 0,c) regresija nije jasno utvrena, 1 = 0 23 2.2 Procjena parametara 0 i 1 1) izabrati sluajni uzorak2) izmjeriti y i x Broj ivotinje123...n Opseg prsa (x)x1 x2 x3 ...xn

Teina (y)y1 y2 y3 ...yn

Cilj: pronai krivulju koja e najbolje opisati dani skup podataka; pronai procjenitelje parametara 0 i 1.Procjenitelji parametara: 0i 1 ili b0 i b1.E(yi|xi) se procjenjuje sa: i ix b b y1 0 + =

= procijenjeni pravac (krivulja) regresije, procijenjeni model Ostatak: i i iy y e =Svako opaanje u uzorku se moe napisati: yi = b0 + b1xi + eii = 1,.....n i i iy y e =$ yi$ y***** **** * yi y x Slika 2-4: Procijenjeni pravac jednostavne linearne regresije. Metoda najmanjih kvadrata:Pravilo: - pronai procjenitelje b0 i b1, da vrijedi:( ) min 2 2 = = iiii ie y y (ostaci moraju biti to manji) OSTiiSS e=2= Suma kvadrata ostatka 24Procjenitelji b1 i b0 : x b y bSSSSbxxxy1 01 == Gdje su: ( )( ) y y x x SSiii xy =

= suma produkata y i x ( )2 =ii xxx x SS = suma kvadrata od x n = veliina uzorka 2.3 Ostatak i svojstva ostatka Podsjetite se da je greka pravog modela (modela populacije): i = yi E(yi|xi) Ostatak je odstupanje vrijednosti zavisne varijable od regresijskog pravca procijenjenog iz uzorka:i i iy y e =Dakle, Ostatak = greka procijenjenog pravca (procijenjenog modela) Suma kvadrata za ostatak:( )2 =ii i OSTy y SS

Prosjek kvadrata ostatka (varijanca procijenjenog modela): 22= =nSSs MSOSTOST (n2) = stupnjevi slobode.MSOST = s2 je procjena 2 = Var (). Stupnjevi slobode:n (broj parametara koje treba procijeniti za dotinu sumu kvadrata) Skraeni nain raunanja: xxxyyy OSTSSSSSS SS2) ( = 2.4 Prosjeci i varijance procjeniteljaSvojstva procjenitelja: E(b1) = 1 xxbSSb Var2211) ( = = Ako y normalan onda b1 normalan Podsjetimo se: varijanca greke: Var(i) = 2.25Nepristrani procjenitelj varijance 2 je: ( )OSTOSTii iMSnSSy yns == =2212 2 MSOST =prosjek kvadrata za ostatak Skraeni nain raunanja sume kvadrata za ostatak: xxxyyy OSTSSSSSS SS2) ( = Standardna greka regresijskog modela:22= =nSSOSTs s Var(b1) moemo procijeniti sa: xxbSSss221= Standardna greka procjenitelja b1 je: xxbSSss21= 2.5 Studentova t-provjera i interval pouzdanosti procjene parametara Provjera hipoteza o nagibu pravca regresije:H0: 1 = 0 H1: 1 0 H0: regresije nema, nagib regresije je nula, pravac regresije je horizontalan.H1: regresija postoji, nagib nije horizontalan Statistika za provjeru: 101bsbt= Uz H0,statistika t ima t raspodjelu sa (n2) stupnjeva slobode Odbacujemo H0 ako je izraunata statistika |t| velika. Za razinu znaajnosti odbacujemo H0 ako |t| t/2,(n2). b11 = 0t/2 -t/2 0t Slika 2-5: Teoretska distribucija procjenitelja b1 i skala odgovarajue t statistike 26 2.6 Interval pouzdanosti za 1

Moemo pisati da je za 100(1)% interval pouzdanosti 12 , 2 1 b ns t b Za 95% interval pouzdanosti (IP)12 , 025 . 0 1 b ns t b t/2,n2 = kritina vrijednostxx bSS s s21 == standardna greka procjenitelja b1. 2.7 Intervali pouzdanosti zavisne varijable Procjena prosjeka populacije za danu vrijednost x0 E[y|x0] = 0 + 1x0. Procjenitelj: 0 1 0 0 x b b y + =.( )((

+ =xxiSSx xny Var22) 01 ( Standardna greka: ( )((

+ =xxiySSx xns s2210 Interval pouzdanosti: 2 , 025 . 0 00n yt s y Predvianje budue vrijednosti varijable y na temelju dane vrijednosti x0.y|x0 = 0 + 1x0 + 0. Procjenitelj: 0 1 0 , 0 x b b yNOVI+ =. Varijanca procjenitelja: ( )((

+ + =xxiNOVISSx xny Var22) , 011 ( Standardna greka predvienih novih vrijednosti zavisne varijable za danu vrijednost x0 je: ( )((

+ + =xxiySSx xns sNOVI2211, 0. 27Interval pouzdanosti za nova opaanja uz razinu znaajnosti = 0.05 je: 2 , 025 . 0 , 0,n y NOVIt s yNOVI i Intervali pouzdanosti za vie x vrijednosti: Prosjek populacije: p n p y ipF s yi, , Nova opaanja: p n p NOVI y ipF s yi, , , Gdje su: F = granina vrijednost F raspodjele za p i (np) stupnjeva slobode p = broj parametara n = broj opaanja = vjerojatnost da je barem jedan interval nekorektan. 550600650700750212 214 216 218 220 222Opseg trupa (cm)Teina (kg) Slika -6:Povrine pouzdanosti za prosjeke populacije za dane vrijednosti x ( ___ )i nova opaanja (......) 28 2.8 Ralanjenje ukupne varijabilnosti Regresijskim modelom nastoji se objasniti to vei dio varijabilnosti zavisne varijable. ***raspodjelay********xy yiokoraspodjela(A)(B)y yi okoyy Slika 2-7: Raspodjela varijabilnosti oko prosjeka i procijenjenog pravca regresije. (B) mjeren sa sumom kvadrata za ostatak: ( )2 =ii i OSTy y SS (A) mjeren sa ukupnom sumom kvadrata: ( )2 =ii i UKUPy y SS Tri izvora varijabilnosti: 1.Varijabilnost opisana modelom - protumaena varijabilnost, mjeri se sumom kvadrata za regresiju (SSREG). 2. Ukupna varijabilnost zavisne varijable- varijabilnost okoy , mjeri se ukupnom sumom kvadrata. (SSUKUP) 3. Neprotumaena varijabilnost - varijabilnost okoy, mjeri se sumom kvadrata za ostatak (SSOST). ************yx 29Jak linearan trend: SSOST F,1,n2) f (F1, n-2 )F,1,n -2F1,n -2 Slika 2.9F raspodjela i kritina vrijednost za stupnjeve slobode 1 i (n 2). Izraz F,1,n2 predstavlja kritinu vrijednost F raspodjele 31Korisno je izraune i provjeru upisati u ANOVA tablicu (tablicu analize varijance) ANOVA tablica Izvor SS dfMSF RegresijaSSREG1MSREG F = MSREG / MSOST OstatakSSOSTn2MSOST

UkupnoSSUKUPn1 Analiza varijance jepodjela ukupne varijabilnosti na izvore varijabilnosti i analiza znaajnosti tih izvora. 2.10 Koeficijent determinacije (R2) - Proporcija varijabilnosti protumaenog modelom u odnosu na ukupnu varijabilnost: UKUPOSTUKUPREGSSSSSSSSR = = 12 Poprima vrijednosti od 0 do 1:1 02 RMjera valjanosti modela Dobar model UKUP REGSS SS Lo model UKUP OSTSS SS Dobar model znai da je12 R 32 2.11 SAS primjer za jednostavnu linearnu regresiju Primjer: Procijenite pravac linearne regresije teine na opseg grudi krava prema slijedeem uzorku: Krava123456 Teina (y):641633651666688680 Opseg prsa (x):214215216217219221 SAS program: DATA krave; INPUT tezina opseg; DATALINES; 641 214 633 215 651 216 666 217 688 219 680 221 ; PROC REG; MODEL tezina = opseg / ; RUN; QUIT; *ili; PROC GLM; MODEL tezina =opseg / ; RUN; QUIT; Objanjenje: Koristi se procedura GLM ili procedura REG. Naredba MODEL tezina = opsegznai da je zavisna varijabla tezina, a nezavisna opseg. SAS ispis: Analiza varijance Sum of Mean Source DFSquares SquareF ValueProb>F Model1 1927.529411927.52941 16.6420.0151 Error4463.30392115.82598 C Total5 2390.83333 Root MSE10.76225 R-square 0.8062 Dep Mean 659.83333 Adj R-sq 0.7578 C.V. 1.63106 Parameter Estimates ParameterStandardnaT for H0: VariableDF Estimate Error Parameter=0Prob > |T| INTERCEP 1-974.049020400.54323178-2.4320.0718 OPSEG1 7.5294121.84571029 4.0790.0151 33 Objanjenje: Prvo je dana ANOVA tablica: izvor (Source), stupnjevi slobode (DF), sume kvadrata (Sum of Squares), prosjek kvadrata (Mean Square), F vrijednost (F value) i P vrijednost (Prob>F). Izvori varijabilnosti su Regresija (Model), Ostatak (Error) i Ukupno (C Total). Vidljivo je da je F = 16.642 sa P vrijednosti = 0.0151, to znai da je koeficijent regresije u uzorku znaajno razliit od nule. Ispod ANOVA tablice dane su standardna greka regresijskog modela (Root MSE) = 10.76225 i koeficijent determinacije (R-square) = 0.8062. Ispod podnaslova Parameter Estimates, moemo vidjeti procijene parametara sa standardnim grekama i t provjerom da su procjenitelji znaajno razliiti od nule. Ovdje je b0 (INTERCEP) = 974.046020 sa standardnom grekom (Standard error) = 400.54323178, a b1 (opseg) = 7.529412 sa standardnom grekom 1.84571029. Izraunata t statistika je 4.079, s P vrijednosti (Prob > |T|) = 0.0151, to pokazuje da je b1 znaajno razliit od nule. 630640650660670680690700214 216 218 220 222Opseg prsa (cm)Teina (kg) Slika 2-10: Regresija teine krava na opseg prsa 343 Koeficijent korelacije Korelacija:- mjera jakosti linearne veze izmeu dvije varijable- relativna mjera - poprima vrijednosti izmeu -1 i 1- x i y su sluajne varijable sa zajednikom bivarijatnom raspodjelom -Varijable zajedniki variraju - Ne mora nuno postojati uzrono-posljedina veza (Pozor: Regresija: uzrono-posljedina veza x i y, x = nezavisna, y = zavisna varijabla) Koeficijent korelacije: 2 2y xxy =

2y = Var(y)2x =Var(x)xy = Cov(x, y) = kovarijanca izmeu x i y x i y su sluajne normalne varijable. Kovarijanca:- zajedniko variranje dvije sluajne varijable - apsolutna mjera veze - ako su varijable nezavisne => Cov(x, y) = 0Korelacija je kovarijanca standardiziranih varijabli x i y - Korealcija moe biti pozitivna ili negativna.Korelacija = 1 ili = 1 znai idealnu linearnu vezu = 0 znai da veza ne postoji. 35 xx xxyxyxa)xb)xc)xd)x xy xy Slika 3-1a) pozitivna korelacija, b) negativna korelacija, c) korelacija ne postoji d) veza izmeu varijabli postoji ali nije linearna 3.1 Procjena koeficijenta korelacije Procjenitelj koeficijenta korelacije je koeficijent korelacije uzorka: yy xxxySS SSSSr = SSxx = suma kvadrata od x ( )2 =ii xxx x SS SSyy = suma kvadrata od y ( )2 =ii yyy y SS SSxy = suma produkata y i x ( )( ) y y x x SSiii xy =

n = veliina uzorka 364 Vektori i matrice Matrica je skup brojeva koji su po nekom kriteriju svrstani u redove i kolone:2 x 3 2 x 332 3122 2112 111 21 13 1a aa aa a((((

=((((

= A2 x 3 2 x 332 3122 2112 112 13 11 2b bb bb b((((

=((((

= B esto piemo:A = {aij}3x2

Vektor: jedna kolona ili jedan red 1 x 221((

= b 4.1 Tipovi i svojstva matrica Kvadratna matrica: - isti broj kolona i redova.Simetrina matrica:- kvadratna matrica - vrijedi aij = aji. 2 x 22 11 2((

= C Dijagonalna matrica - kvadratna matrica takva da je aij = 0 za svaki i j2 x 22 00 2D((

= Jedinina matrica: - dijagonalna matrica aii = 1 ((((

=((

=1 0 00 1 00 0 1,1 00 13 2I I Nul matrica je matrica iji su svi lanovi jednaki nuli. Nul vektor je vektor iji su lanovi jednaki nuli.37((((

=((

=0000,0 00 00 Matrica iji su svi lanovi jednaki 1, obino se oznaava sa J. Vektor iju su svi lanovi jednaki 1 obino se oznaava sa 1. ((((

=((

=111,1 11 11 J Transponirana matrica: - matrica kojoj su kolone zamijenjene s redovima ((

=1 1 32 1 1' A 4.1.1 Operacije s matricama i vektorima: Zbrajanje matrica=((((

+ ++ ++ += +33 33 31 3122 22 21 2112 12 11 11b a b ab a b ab a b aB A 2 x 31 34 24 32 1 1 23 1 1 11 3 2 1((((

=((((

+ ++ ++ += + B A Mnoenje matrica s brojem2 x 32 42 26 22((((

= A Mnoenje matrice s matricom- broj kolona prve matrice mora biti jednak broju redova druge matrice,- broj elemenata u redu prve matrice mora biti jednak broju redova druge matrice Openito: A = {aik}ima dimenzije r x cB = {bkj}ima dimenziju c x s produkt AB= {cij} ima dimenziju r x s: cij = =c1 kkj ikb a Primjer: Izraunaj AC ako je: 382 x 3 2 x 332 3122 2112 111 21 13 1a aa aa a((((

=((((

= A i 2 x 2 2 x 222 2112 112 11 2c cc c((

((

= C ((((

+ ++ ++ +=22 32 21 31 21 32 11 3122 22 21 21 21 22 11 2122 12 21 11 21 12 11 11c * a c * a c * a c * ac * a c * a c * a c * ac * a c * a c * a c * aAC 2 30 33 37 52 * 1 1 * 2 1 * 1 2 * 22 * 1 1 * 1 1 * 1 2 * 12 * 3 1 * 1 1 * 3 2 * 1x((((

=((((

+ ++ += AC Primjer 2: 1 x 221((

= b. Izraunaj Ab 1 x 3 1 x 30371 * 1 2 * 22 * 1 1 * 12 * 3 1 * 1((((

=((((

++= Ab Kvadratni oblik: - umnoak transponiranog vektora i samog vektora- predstavlja sumu kvadrata elemenata vektora. Neka je vektor1 nxn21y...yy(((((

= y Kvadratni oblik je: | |=(((((

=i2in21n 2 1yy...yyy .. y y y y' = suma kvadriranih lanova vektora Inverzna matrica neke matrice C je matrica C-1 takva da je C-1C = IiCC-1 = I Sustav linearnih jednadbi moe prikazati matrino.Primjer: Sustav jednadbi s dvije nepoznanice 2a1+a2 =5 a1a2=1 39((

=21aaa

((

=1 11 2X

((

=15y Xa = y | X1 X1Xa = X1y a = X1y ((

=((

((

=((

((

=((

12153 / 2 3 / 13 / 1 3 / 1151 11 2121aa Normalne jednadbe definirane su sa: XXa = Xy (XX)1(XX)a = (XX)1Xy Normalne jednadbe pogodne su za rjeavanje sustava jednadbi kada je broj jednadbi vei nego broj nepoznanica 405 Jednostavna regresija u matrinom prikazu skalarni model regresije: yi = 0 + 1xi + i i = 1,.....n Definirajmo vektore i matrice (((((

=nyyy...21y (((((

=nxxx1... ...1121X ((

=10 (((((

=n...21 y = vektor opaanja zavisne varijable X = matrica opaanja nezavisnih varijabli = vektor parametara = vektor greki y = X + Prosjek od y : ( ) X y =(((((

+++=(((((

=n nxxxy Ey Ey EE1 02 1 01 1 021...) (...) () ( Varijanca od y je: Var(y) = 2I Procijenjeni model : Xb y = y y e == vektor ostataka b = vektor procjenitelja ((

=10bbbi (((((

=n21e...eeeNormalne jednadbe: (XX)b = Xy 41Rjeenje jednadbe za b je: b = (XX)1Xy (((

= iiiiiix xx n2X X' (((

=ii iiiy xyy X' (((((

+=xx xxxx xSS SSxSSxSSxn11) (21X X' Oekivanje i varijanca su: E(b) = ((

= ) ( =1 2) ( ) , () , ( ) () Var(1 1 01 0 0b Var b b Covb b Cov b VarX X' b Ukoliko koristimo s2 tada je varijanca vektora b jednaka: s2(b) = s2(X'X)1 Vektor procijenjenih vrijednosti zavisne varijable je: ( ) y X X X X Xb y1' ' = = Ostatak je definiran sa: y - y e = Sume kvadrata: ( )2ii REGy y ) ( )' ( SS = = y y y y( )2ii OSTy y ) ( )' ( SS = = y y y y( )2ii UKUPy y ) ( )' ( SS = = y y y y Primjer: Napiite procijenjeni model regresije teine na opseg grudi krava koristei matrice i vektore. Mjerenja 6 krava dana su u slijedeoj tablici: Krava123456 Teina (y):641633651666688680 Opseg prsa (x):214215216217219221 42Vektor y i matrica X su: ((((((((

=680688666651633641y i((((((((

=221 1219 1217 1216 1215 1214 1XPrva kolona matrice X sadri broj 1 jer procjenjujemo odsjeak na osi y, b0. Kada uvrstimo X i y, model je: (((((((((

+((

((((((((

=((((((((

65432110 2211 1219 1217 1216 1215 1214 1680688666651633641 eeeeeebb(((((((((

+ ++ ++ ++ ++ ++ +=6 1 05 1 04 1 03 1 02 1 01 1 0221219217216215214e b be b be b be b be b be b b 436 Multipla regresija Multipla regresija: - regresija koja ima dvije ili vie nezavisnih varijabli- regresija koja ima tri ili vie parametara Ciljevi: 1. Pronai model (funkciju) koja najbolje opisuje zavisnost zavisne varijable o nezavisnim varijablama. Odnosno odrediti parametre. 2. Predvianje vrijednosti zavisne varijable na temelju novih mjerenja nezavisnih varijabli 3. Prouiti vanost nezavisnih varijabli, odnosno procijeniti da li su sve ili samo neke nezavisne varijable vane u modelu. To je izgradnja optimalnog modela. Podaci: yx1x2...xp y1x11x21...xp1 y2x12x22...xp2 .... .... ynx1nx2n...xpn Model: yi = 0 + 1x1i + 2x2i + ... + p1x(p1)i + ii = 1,...,n yi = opaanja zavisne varijable x1i ,x2i ,......,x(p1)i = opaanja nezavisnih varijabli 0 , 1 , 2 ,......, p1 = regresijski koeficijenti (parametri) i = greka, model nije egzaktan, sluajna odstupanja, neprotumaena, zbog jedinke ili mjerenja 6.1 Dvije nezavisne varijable Model: yi = 0 + 1x1i + 2x2i + ii = 1,...,n yi = opaanja zavisne varijable y x1i i x2i = opaanja nezavisnih varijabli x1 i x2

0 , 1 , 2 = regresijski koeficijenti (parametri) i = greka modela Model procijene (procijenjena krivulja) je: i i ix b x b b y2 2 1 1 0 + + = i = 1,...,n 44Ostatak: )] x b x b (b - [y y y e2i 2 1i 1 0 i i i i+ + = = b0 , b1 i b2 = procjenitelji parametara Model matrino: y = X + y = vektor zavisne varijable = vektor parametara X = matrica konstanti = vektor greki sa prosjekom E() = 0 i varijancom Var() = 2I (((((

=nyyy...21y (((((

=n nx xx xx x2 122 1221 111... ... ...11X((((

=210 (((((

=n...21 Procijenjeni model je: Xb y = ((((

=210bbbb (((((

=neee...21e Procjena parametara: Metoda najmanjih kvadrata: uvjet da i e2i= ee = min. e'e = suma kvadrata ostataka.ee parcijalno derivira po b i izjednai s nulom.Normalne jednadbe: XXb = Xy b = (XX)1Xy (((((

((((

=n 2 n 122 1221 11n 2 22 12n 1 12 11x x 1... ... ...x x 1x x 1x ... x xx ... x x1 ... 1 1X X'((((

= iiii iiiii iiiiiiiiix x x xx x x xx x n22 2 1 22 121 12 1 ((((

=(((((

((((

=ii i 2ii i 1iin21n 2 22 21n 1 12 11y xy xyy...yyx ... x xx ... x x1 ... 1 1y X'

Primjer 45Ostatak: y y e = Suma kvadrata za ostatak je: SSOST = e'eVarijanca 2 procjenjuje se saOSTOSTMSp nSSs ==2 np = stupnjevi slobode.Openito: stupnjevi slobode = n (broj parametara u modelu). Drugi korijen iz procjene varijance:2s s = standardna greka regresijskog modela. Svojstva procjenitelja: E(b) = Var(b) = 2(XX)1

Ukoliko se koristi varijanca procijenjena iz uzorka tada je varijanca: s2(b) = s2(XX)1

Provjera hipoteze H0: i = 0 Statistika za provjeru: ) (iib sbt = ) ( ) s(b2i ib s =Kritina vrijednost t raspodjele odreuje se prema razini znaajnosti i stupnju sloboden p, gdje je p = broj parametara.p = 3 pa su stupnjevi slobode jednak n3. 6.1.1 Ralanjenje ukupne varijabilnosti i provjera hipoteza Sume kvadrata:( )2 ) ( )' ( = =ii REGy y SS y y y y ( )2 ) ( )' ( = =ii OSTy y SS y y y y ( )2) ( )' ( = =ii UKUPy y SS y y y y SSUKUP = SSREG +SSOST Stupnjevi slobode: n1= (p1) +(np) n = broj ivotinja i p je broj parametara Hipoteze: 46H0: 2 = ... = p = 0 H1 : barem jedan i 0, i = 1 do p1 Ako nul hipoteza vrijedi tada kvocijent OSTREGMSMSF = ima F-raspodjelu sa (p1) i (np) stupnjeva slobode, gdje je p broj parametara u modelu. Za razinu znaajnosti odbacujemo Ho ako F,p1,n3 ( F > F,p1,n3). ANOVA tablica Izvor SS dfMS = SS/dfF RegresijaSSREGp1MSREGF=MSREG/SSOST OstatakSSOSTnpMSOST UkupnoSSUKUPn1 Koeficijent multiple determinacije je: UKUPOSTUKUPREGSSSSSSSSR = = 12 0 R2 1 6.2 Parcijalne i stupnjevite ekstra sume kvadrata SSREG se moe ralaniti na sume kvadrate za odgovarajue parametre u modelu Provjerava se vanost pojedinih parametara Primjer: Puni model (sve varijable ukljuene u model).y = 0 + 1x1 + 2x2 + 3x3 + Reducirani modeli (podskupovi punog modela): y = 0 + 1x1 + 2x2 + y = 0 + 1x1 + 3x3 + y = 0 + 2x2 + 3x3 + y = 0 + 1x1 + y = 0 + 2x2 + y = 0 + 3x3 + y = 0 + Broj parametara SSREG SSOST Broj parametara SSREG SSOST Provjera opravdanosti parametara 3 i 4 u punom modelu je: Openito: ) (). ( ) (__ _PUNI PUNI OSTREDUCIRANI PUNI PUNI OST REDUCIRANI OSTp n SSp p SS SSF = 47Ovdje je: pREDUCIRANI = broj parametara u reduciranom modelu. pPUNI = broj parametara u punom modeluSSOST_PUNI / (npPUNI) = MSOST_PUNI = prosjek kvadrata ostatka punog modela 6.3 SAS primjer za multiplu regresiju Primjer: Procijenite regresiju teine na opseg grudi i visina do grebena 6 mladih bikova. Podaci su slijedei: Bik:1234567 Teina, kg (y)480450480500520510500 Opseg, cm (x1):175177178175186183185 Visina, cm (x2):128122124128131130124 SAS program: DATA bikovi; INPUT tezina opseg visina; DATALINES; 480 175 128450 177 122480 178 124500 175 128520 186 131510 183 130500 185 124 ; PROC GLM; MODEL tezina=opseg visina; RUN; QUIT; SAS ispis: Dependent Variable: tezina Sum of Source DF Squares Mean SquareF ValuePr > F Model 2 2727.655201 1363.827601 9.780.0288 Error 4558.059085139.514771 Corrected Total 6 3285.714286 R-Square Coeff VarRoot MSEtezina Mean 0.8301562.40353111.81164 491.4286 SourceDF Type I SS Mean SquareF ValuePr > F opseg1 1400.983103 1400.98310310.040.0339 visina 1 1326.672098 1326.672098 9.510.0368 SourceDF Type III SS Mean SquareF ValuePr > F opseg1616.426512616.426512 4.420.1034 48 visina 1 1326.672098 1326.672098 9.510.0368 Standard Parameter Estimate Errort ValuePr > |t| Intercept -495.0140313 225.8696150-2.190.0935 opseg2.2572580 1.0738674 2.100.1034 visina 4.5808460 1.4855045 3.080.0368 6.4 Krivolinijska regresija drugog stupnja Model:yi = 0 + 1xi + 2x2i + ii = 1,...,n yi= opaanja zavisne varijable y xi = opaanja nezavisne varijable x0, 1, 2 = regresijski koeficijenti (parametri) i = greka modela, kvadratna regresija = multipla regresija sa dvije nezavisne varijable x i x2, Model procijene (parabola): i i i ie x b x b b y 2 2 1 1 0+ + + =i = 1,...,n Matrino model se pie: y = X + (((((

=nyyy...21y ((((((

=222 221 11... ... ...11n nx xx xx xX ((((

=310 (((((

=n...21 Model procijene: Xb y = Ostatak: y y e = ((((

=210bbbb

(((((

=neee...21e Vektor procjena parametara izrauna se iz izraza: b = (XX)1Xy Provjera hipoteza: H0: 1 = ... = p1 = 0 H1: barem jedan i 0, i = 1 do (p1) 49Ako nul hipoteza vrijedi tada kvocijent OSTREGMSMSF = ima F-raspodjelu sa 2 i (n3) stupnjeva slobode. Primarni cilj analize:- da li je 2 potreban u modelu - odnosno da li je model kvadratne regresije valjan.Hipoteza: H0: 2 = 0t- provjera: ) (22b sbt = Procijenjene varijance i kovarijance za b0, b1 i b2 su;: s2(b) = s2(XX)1

6.4.1 SAS primjer za kvadratnu regresiju SAS program za primjer s rastom purana je slijedei. SAS program: DATA purani; INPUT tezina dan @@; DATALINES; 44 166 7100 14150 21265 28370 35455 42605 49770 56 ; PROC GLM; MODEL tezina=dan dan*dan/ ; RUN; QUIT; Objanjenje: Koristimo proceduru GLM. Naredba MODEL tezina = dan dan*dan znai da je zavisna varijabla tezina, a nezavisne dan kao linearna komponenta i dan*dan kao kvadratna komponenta. SAS ispis: Dependent Variable: TEZINA Sum of Mean SourceDF SquaresSquare F Value Pr > F Model 2 523870.39532261935.19766 1246.82 0.0001 Error 6 1260.49357 210.08226 Corrected Total 8 525130.88889 R-Square C.V.Root MSETEZINA Mean 0.997600 4.617626 14.494215313.88889 Source DFType I SS Mean Square F Value Pr > F DAN 1 497569.66165497569.66165 2368.45 0.0001 DAN*DAN 126300.73366 26300.73366125.19 0.0001 50Source DFType III SS Mean Square F Value Pr > F DAN 1 859.390183859.3901834.09 0.0896 DAN*DAN 1 26300.73366426300.733664125.19 0.0001 T for H0:Pr > |T| Std Error of Parameter EstimateParameter=0Estimate INTERCEPT38.85551791 3.15 0.019712.31629594 DAN 2.07249024 2.02 0.0896 1.02468881 DAN*DAN 0.1951545811.19 0.0001 0.01744173 01002003004005006007008000 20 40 60Dob u danimaTeina (g) Slika 6-1: Mjerene () i procijenjene (-) vrijednosti teine zago 6.5 Mogue potekoe kod upotrebe regresije Mogui problemi kod regresije mogu se pojaviti zbog1) Neka opaanja su loa. Pod loim podacima misli se na opaanja koja su neuobiajeno ekstremna. 2) greke modela nemaju konstantnu varijancu 3) greke modela nisu nezavisne 4) greke modela nisu normalno distribuirane 5) Nelinarnost 6) Jedna ili vie vanih nezavisnih varijabli nisu ukljueni u model 7) Model sadri previe nezavisnih varijabli 8) Multikolinearnost. Multikolinearnost je pojava kad postoji korelacija izmeu nezavisnih varijabli. Mogu dovesti do: - upotrebe krivog modela,- loeg procjene regresije,- krivog zakljuka- nepreciznosti procjene parametara zbog velike varijance. 516.5.1 Analiza ostataka i naruenost pretpostavki modela i i iy y e = ***********0( )x y$e Model OK Rasprenost ostatka sluajna Varijanca konstantna Nema ekstremnih podataka. ************0e( ) x y$ Nelinearnost. ????Potreban xi2 ili xi3 u modelu. ???? logaritamska, eksponencijalna funkcija ***********0( )x y$e Zavisnost ostataka (autokorelacija) 52****************0( )x y$e Varijanca nije homogena. Potrebne su transformacije ili x ili y varijable.Mogua je i upotreba razliite strukture varijance koja e definirati nehomogenost. Normalnost ostataka. Nenormalnost dovodi u pitanje valjanostF ili t provjere.??? poopeni linearni model (engl. 'generalized linear models') 6.5.2 Loa opaanja loa = neuobiajeno ekstremna opaanja ********************xi xiyy****45321* Slika -2Prikaz ekstremnih vrijednosti u analizi regresiji Ekstremne vrijednosti su zaokruene i oznaene brojevima: a) ekstremi u odnosu na x su: 3, 4 i (5), b) ekstremi u odnosu na y su: 1, 2 i4, c) ekstremi koji imaju utjecaja na procjenu regresije su: 2,4 i (5) 6.5.3 Multikolinearnost Postoji znaajna i visoka korelacija izmeu nezavisnih varijabliNezavisne varijable su skoro linearno zavisneVarijanca procjenitelja velika 53 Problem multiokolinearnosti moe se rijeiti: a) isputanjem problematinih opaanja b) ako se iz nekoliko koreliranih nezavisnih varijabli definira jedna c) isputanjem nepotrebnim varijabli iz modela d) koritenjem drugih statistikim metoda ('Ridge' regresija ili 'Principal Components') 6.6 Izgradnja modela i kriteriji za izbor modela a) Koeficijent determinacije(R2) Dodavanje nove varijable ==> poveanje R2

? dodavanje kojih varijabli znaajno poveava R2 b) Prosjek kvadrata ostatka (MSOST) Dodavanje nove varijable obino se smanjuje MSOST.!!!! opasnost da se izabere preveliki model. c) Parcijalne F-provjere Znaajnost pojedine varijable u modelu.??? optimalan model. Kolinearnost (varijable gledane posebno mogu izgledati vane, a ukupni model moe biti vrlo neprecizan) c ) Cp kriterij ('Conceptual Predictive Criterion')- Usporeuje se model kandidat sa 'pravim' modelom e) AIC (Akaike Information Criteria) 547 Jednostruka analiza varijance Cilj:- da li postoji razlika prosjeka vie populacija - provjera razlika aritmetikih prosjeka uzoraka izabranih iz vie populacija. Zavisna varijabla: - mjerenja ili opaanjaNezavisna varijabla:- grupa (ili nain klasificiranja), esto kaemo i tretmani (grupe predstavljaju populacije) - kvalitativna, ili kategorika varijabla - faktor Da li postoji utjecaj grupa na opaanja??? Primjer1 : Utjecaj razliite hranidbe na prirast u tovu.Sakupljanje podataka, odnosno organiziranje pokusa: Odredit emo grupe ivotinja sluajnim izborom, razliito ih tretirati i izraunati srednje vrijednosti grupa.(Izabrati emo sluajni uzorak i sluajno primijeniti tretmane (napraviti grupe) na uzorak). Primjer 2: Da li postoji razlika u mlijenosti krava simentalske pasmine izmeu tri upanije.Sakupljanje podataka, odnosno plan pokusa: Izabrati emo sluajne uzorke iz upanija upanije su definicije grupa (razliitih populacija) Pitanja? 1. Procijeniti prosjeke grupa i ukupnu srednju vrijednost, 2. Da li postoji utjecaj grupe, tj. da li su prosjeci pojedinih grupa razliiti (Da li su aritmetike srednje vrijednosti uzoraka grupa znaajno razliiti) Odgovoriti na pitanje da li postoji utjecaj grupe, tj. da li su srednje vrijednosti pojedinih grupa dovoljno razliite da ih moemo smatrati znaajno razliitim. (Znaajna razlika => u smislu da moemo u velikom broju takvih ponovljenih pokusa oekivati razliku.) Odgovor na ova pitanja moe dati statistika procedura koja se zove analiza varijance. Analiza varijance:- podjela ukupne varijabilnosti na izvore varijabilnosti i analiza znaajnosti tih izvora.- da li je protumaena varijabilnost (varijabilnost izmeu prosjeka grupa) znaajna u odnosu na neprotumaenu varijabilnost (unutar grupa) Modeli analize varijance prema broju nezavisnih (kategorikih) varijabli: - jednostruka- dvostruka, itd.557.1 Model jednostruke analize varijance s fiksnim utjecajima Pretpostavka je da postoji fiksni utjecaj, tj. utjecaj grupe je isti na svaku jedinku u toj grupi Neka je broj grupa (tretmana) = aGrupe ili tretmani = sluajni uzorci iz odgovarajuih populacijaPo svakom tretmanu n mjerenja.ukupno N = (n a) jedinica je podijeljeno u a grupa veliine n. Mjera varijabilnosti izmeu grupa je varijabilnost prosjeka grupaMjera varijabilnosti unutar grupa je varijabilnost izmeu pojedinih mjerenja unutar grupe Model: yij = + i + iji = 1,.....,aj = 1,...,n yij = opaanje jedinice j u grupi i (tretmanu i) = ukupni prosjek i = fiksni utjecaji grupe ili tretmana iij = greka modela sa N(0, 2) Nezavisna varijabla : - poprima vrijednosti razliitih grupa (tretmana)- kategorika varijabla, esto se zove faktor- prema modelu faktor ima utjecaj na vrijednosti zavisne varijable y Prosjeci populacija procjenjuju se aritmetikim prosjecima grupa. Model procijene:i i ijy + = = i = 1,.....,a j = 1,...,n ijednost srednja vr ukupnanaprocijenje =

i grupe utjecaj ni procijenje =i i grupe prosjekni procijenje =ii ij ijy e == ostatak u uzorcima, neprotumaen modelom yij = j-to mjerenje u i-toj grupi Grupa G1G2G3y11 y21 y31

y12 y22 y32

y13 y23 y33

y14 y24 y34

y15 y25 y35

567.1.1 Ralanjenje ukupne varijabilnosti na izvore varijabilnosti: Izvori varijabilnosti:a) ukupna varijabilnost (varijabilnost opaanja bez obzira u kojoj su grupi),b) varijabilnost opaanja unutar svake grupe ic) varijabilnost izmeu prosjeka grupa Podsjetimo se da je varijanca uzorka pokazatelj varijabilnosti tog uzorka: ( )( )1 1var2222== =nnyyny ysiiiiii Takoer, ( )( ) = iiiiiinyy y y22 2 = suma kvadrata korigirana na srednju vrijednost (SS). Mjere izvora varijabilnosti Ukupna varijabilnost => (SSUKUP) = Ukupna suma kvadrata Varijabilnost izmeu grupa => (SSTRT) = Suma kvadrata izmeu grupa (tretmana)= Suma kvadrata za grupe (tretmane)Varijabilnost unutar grupa => (SSOST) = Suma kvadrata unutar grupa = Suma kvadrata za ostatak SSTRT = Suma kvadrata izmeu grupa (tretmana) = Suma kvadrata za grupe (tretmane)SSOST = Suma kvadrata unutar grupa = suma kvadrata za ostatak = suma kvadrata za pokusnu greku SSUKUP = Ukupna suma kvadrata Moe se pokazati da vrijedi: SSUKUP = SSTRT + SSOST

Stupnjevi slobode (ukupno) = stupnjevi slobode (grupa) + stupnjevi slobode (ostatak) (N1) = (a1) + (Na) N = ukupan broj mjerenja, a = broj tretmana. Oznakeprosjeka: ijijinyy= .= prosjek grupe i..Nyyiji j== prosjek svih opaanja N =ukupan broj opaanja 57 Sume kvadrata: =i jij UKUPy y SS2..) ( = =ii ii ji TRTy y n y y SS2 2..) . ( ..) . ( =i ji ij OSTy y SS2.) ( Kratki nain raunanja: 1) Ukupna suma i j yij

2) Korekcija za srednju vrijednost ( )( )opazanja broj ukupnisuma ukupna 22= = NyCi jij

3) Ukupna (korigirana) suma kvadrata =i jij UKUPC y SS2 = Suma svih kvadriranih opaanja minus C 4) Suma kvadrata za grupe (tretmane) ( )CnySSiijijTRT = 2 = Suma ( )grupi u opaanja brojsuma grupe 2 za svaku grupu minus C 5) Suma kvadrata za ostatak SSOST = SSUKUP SSTRT Dijeljenjem suma kvadrata s odgovarajuim stupnjevima slobode dobiju se prosjeci kvadrata:prosjek kvadrata = SS/ stupnjevi slobode Prosjek kvadrata za tretmane:MSTRT = SSTRT/(a1)Prosjek kvadrata za ostatak:MSOST = SSOST/(Na) 7.1.2 Postavljanje hipoteza i F-provjera H0: 1 = 2 =... = a , nema utjecaja grupaH1: i i za barem jedan par (i,i), razlika izmeu grupa postoji Hipoteza se moe i ovako postaviti: H0: 1 = 2 =... = a , prosjeci populacija su isti, H1: i i za barem jedan par (i,i) prosjeci populacija nisu isti. 58F provjerom provjeravamo: - da li je varijabilnost mjerenja potpuno sluajna ili je uvjetovana i nekim sistematskim utjecajem (grupom ili tretmanom)- da li je varijabilnost izmeu grupa (izmeu prosjeka grupa) znaajna u odnosu na varijabilnost unutar grupa- da li su prosjeci grupa ili utjecaji grupa znaajno razliiti OSTTRTMSMSF = ima F raspodjelu sa (a1) i (Na) stupnjeva slobode, ukoliko vrijedi H0. : - Odbacujemo H0 ako F > F,(a1),(Na), tj. ako je izraunata statistika F iz uzorka vea od kritine vrijednosti F,(a-1),(N-a) FF Slika 7-1: Provjera hipoteza koristei F raspodjelu. Ako je F izraunatimanji od F kritino, tj. F < F,a1,Na,H0ne odbacujemo. F,(a-1),(N-a) FF Slika 7-2: Provjera hipoteza koristei F raspodjelu. Ako je F izraunativei od F kritono, tj. F > F,a1,Na,H0odbacujemo uz razinu znaajnosti. Radi preglednosti izrauni i provjera se moe napisati u tablicu analize varijance ANOVA tablica: Izvor SSdfMS = SS/dfF GrupaSSTRTa1MSTRT MSTRT/MSOST OstatakSSOSTNaMSOST

UkupnoSSUKUPN1 597.2 Usporedba srednjih vrijednosti pojedinih grupaF-provjerom provjeravamo da li postoji razlika izmeu tretmana.Ako se H0 ne odbaci: - nije potrebno dublje analizirati problem,- (!!!mogunost tip II greke)Ako se H0 odbaci:- ? koji tretman je utjecao na to - izmeu kojih tretmana je utvrena znaajna razlika. - da li je i i za tretmane i i' 7.2.1 Najmanja znaajna razlika (LSD) Cilj:utvrditinajmanjurazlikukojaebitiznaajnaiusporeditirazlikesvihparovasrednjih vrijednosti tretmana sa tom vrijednou. ||.|

\|+ =', 2 / '1 1i iOST a N iin nMS t LSD Procedura: 1.F-provjera (H0: 1 =..........= a , H1: i i za barem jedan par i,i) 2. Ukoliko H1 tada se rauna LSDii za sve parove ii.3. Zakljuujemo i i ako ' ' ii i iLSD y y F provjera mora prethoditi LSD da osiguramo razinu znaajnosti za bilo koji broj usporedbi. Prednost LSD provjere:- vrlo vjerojatno da e pronai razliku izmeu srednjih vrijednosti (ako postoje)- ima nisku razinu tip II grekeLoa strana:- pokazuje esto razlike kada i nisu- visoka razina tip 1 greke 7.2.2 Tukey provjera (HSD) tOSTa N anMSq HSD=, , q statistika ima Q raspodjelu (iz tablica); nt je broj opaanja po grupi Zakljuujemo , ako' ' ' ii i i i iHSD y y . Vjerojatnost da se napravi greka tip I je jednaka , tj razina vrijedi za cijelu proceduru, tj. za sve parove srednjih vrijednostiZa nejednaki broj opaanja po grupi:) (112NnNaniit= Prednost Tukey provjere:- ne toliko pogrenih zakljuaka kao LSD,Loa strana: - ima vie pogrenih i = j zakljuaka. 607.3 SAS primjer jednostruke analize varijance s fiksnim utjecajimaPrimjer: Postavljen je pokus u svrhu provjere razlika tri smjese u dnevnom prirastu prasadi. Tri smjese su oznaene s TR1, TR2 i TR3. Podaci su dani u slijedeoj tablici: TR1TR2TR3 270290290 300250340 280280330 280290300 270280300Ukupno SAS program: DATA pigs; INPUTsmjesa $ prirast @@; DATALINES; TR1 270 TR2 290 TR3 290 TR1 300 TR2 250 TR3 340 TR1 280 TR2 280 TR3 330 TR1 280 TR2 290 TR3 300 TR1 270 TR2 280 TR3 300 ; PROC GLM DATA = pigs; CLASS smjesa; MODEL prirast = smjesa; LSMEANS smjesa / STDERR PDIFF ADJUST=TUKEY; RUN; QUIT; Dependent Variable: prirast Sum ofMean SourceDFSquares SquareF Value Pr > F Model2 3640.00001820.00006.13 0.0146 Error 12 3560.0000 296.6667 Corrected Total 14 7200.0000 R-Square Coeff Var.Root MSE prirastMean 0.505556 5.939315 17.224014 290.00000 Least Squares Means Adjustment for multiple comparisons: Tukey prirast Standard LSMEAN smjesaLSMEAN ErrorPr > |t|Number TR1280.0000007.7028130.0001 1 TR2278.0000007.7028130.0001 2 TR3312.0000007.7028130.0001 3 Least Squares Means for effect smjesa Pr > |t| for H0: LSMean(i)=LSMean(j) i/j 1 2 3 1 0.98160.0310 20.9816 0.0223 30.03100.0223 617.4 Model sa sluajnim utjecajima grupa Grupa ili tretman sluajna varijabla sa nekom raspodjelom.Slijedee dvije slike prikazuju razlike izmeu modela s fiksnim i modela sa sluajnim utjecajima: Slika 7-3: Prikaz izvora varijabilnosti fiksnog modela jednostruke analize varijance: Ukupna varijabilnost , varijabilnost unutar grupa,varijabilnost izmeu grupa . Slika 7-4: Prikaz izvora varijabilnosti sluajnog modela jednostruke analize varijance: Ukupna varijabilnost , varijabilnost unutar grupa,varijabilnost izmeu grupa . Fiksni model: Mali (konaan) broj grupa Utjecaj grupe definiran i fiksan Varijabilnost izmeu grupa nije objanjena teoretskom raspodjelom Sluajni model Velik (beskonaan) broj grupa Utjecaj pojedine grupe (prosjek) je sluajna varijabla Varijabilnost izmeu grupa je objanjena teoretskom raspodjelom Model jednostruke analize varijance: yij = + i + ij i = 1, 2, ...j = 1,...,n yij = Opaanje jedinice j u grupi i = ukupni prosjek i = sluajni utjecaji grupe ili tretmana iij = sluajna greka62 Pretpostavke modela: i= sluajna varijabla sa prosjekom E(i) = 0 i varijancom Var(i) = 2

ij = sluajna greka sa prosjekom E(ij) = 0 i homogenom varijancom 2 2 i 2 = komponente varijance. i i ij su nezavisni, tj.Cov(i , ij) = 0 Iz pretpostavki slijediyi N(0, 2 + 2)varijanca opaanja sadri komponente varijanci Cov(yij , yij) = 2 Cov(i , yij) = 2 - kovarijanca izmeu opaanja unutar jedne grupe je jednaka varijanci izmeu grupa. Ciljevi: 1. Provjera hipoteza2. Procjena komponenti varijance 3. Predvianje 1,.., a. Hipoteze: da li postoji varijabilnost izmeu tretmana: H0: 2 = 0 H1: 2 0 Ukoliko vrijedi H0:=> varijanca grupa jednaka je nuli => grupe su jednake jer nema varijabilnosti izmeu njih F provjera: OSTTRTMSMSF =

ako vrijedi H0 tada je 2 = 0, i F = 1. ANOVA tablica Izvor SSdfMS = SS/dfE(MS) GrupaSSTRTa1MSTRT 2 + n 2 OstatakSSOSTNaMSOST 2 UkupnoSSUKUPN1 U tablicu je dobro upisati i oekivanja prosjeka kvadrata, E(MS) Poto jeE(MSOST) = 2

E(MSTRT) = 2 + n 2

63mogu se iz Anova tablice procijeniti komponente varijance koristei jednakosti: 2 2 2 2 ) ( n MS n MS ETRT TRT+ = + = 2 2 ) ( = =OST OSTMS MS E Iz tog slijedi: OSTMS =2 ) - (2nMS MSOST TRT=

parametara procijene su i 2 2 n = broj opaanja po grupi Predvianje srednjih vrijednosti odnosno utjecaja tretmana (primijetite da su razliite od aritmetikih prosjeka zbog komponenti varijanci):.. y = ) . ( . , =i y iy bi ( )( )i ii iyn y Vary Covbi/,2 22. , += =ako su varijance poznate iynbi/ 2 22. , +=ako se varijance isto procjenjuju iz uzoraka 7.5 Intraklasna korelacija Korelacija izmeu opaanja unutar grupe.) ( ) () , (' , ,' , ,j i j ij i j ity Var y Vary y Cov= Kovarijanca izmeu opaanja unutar grupa jednaka komponenti varijance izmeu grupa: Cov(yij,yij') = Var (i) = 2

Varijanca bilo kojeg opaanja ij je: Var(yij) =2 + 2 Intraklasna korelacija: 2 22 +=t Procjena iz uzorka: 2 22 +=tr 647.6 SAS primjer jednostruke analize varijance sa sluajnim utjecajima Primjer: Mjerena je koncentracija progesterona kod 8 svinja s ciljem da se procijeni varijabilnost unutar i izmeu svinja, odnosno da se utvrdi da li je varijabilnost izmeu svinja znaajna. Koncentracija progesterona je mjerena tri puta na svakoj svinji. Podaci su u slijedeoj tablici. Svinja Mjerenje12345678 15.36.64.34.28.17.95.57.8 26.35.67.05.67.94.74.67.0 34.26.37.96.65.86.83.47.9 SAS program: DATA sow; INPUT sow prog @@; DATALINES; 15.3 16.3 14.2 26.6 25.6 26.3 34.3 37.0 37.9 44.2 45.6 46.6 58.1 57.9 55.8 67.9 64.7 66.8 75.5 74.6 73.4 87.8 87.0 87.9 ; PROC MIXED DATA=sow METHOD = REML; CLASS sow ; MODEL prog = / SOLUTION DDFM = SATTERTH; RANDOM sow / SOLUTION; RUN; SAS ispis: Covariance Parameter Estimates Cov Parm Estimate sow0.5571 Residual 1.4937 Solution for Fixed Effects Standard Effect Estimate ErrorDFt ValuePr > |t| Intercept 6.1375 0.3632716.90 |t| sow 1 -0.45990.54755.49-0.840.4360 sow 20.01540.54755.49 0.030.9785 sow 30.13860.54755.49 0.250.8093 sow 4 -0.35420.54755.49-0.650.5437 sow 50.59630.54755.49 1.090.3216 sow 60.17380.54755.49 0.320.7626 sow 7 -0.86470.54755.49-1.580.1698 sow 80.75470.54755.49 1.380.2216 658 Naela planiranja pokusaPokus (eksperiment): - planirano istraivanje u svrhu dobivanja novih injenica ili potvrde odnosno osporavanja rezultata prijanjih pokusa Istraivanje se moe prikazati u nekoliko koraka: 1. Opis problema (uvod) - openito, dosadanja istraivanja 2. Postavljanje cilja (hipoteze) - usko, specifino, dalji rad slijedi iz toga - pitanje na koje treba odgovoriti - hipoteza koju treba provjeriti- utjecaj koji treba procijeniti 3. Postavljanje pokusnog plana (design) - to treba uiniti, materijal i metode 4. Sakupljanje podataka - prema pokusno planu 5. Analiza (Rezultati i rasprava) 6. Donoenje zakljuka- odgovor na postavljeni cilj- jasan i koncizan U pokusnom planu treba definirati: - Tretmani (populacije)- Pokusna jedinica - Jedinica uzorka (opaanje) - Ponavljanja - Pokusna greka Pokusni plan:- Nain na koji se primjenjuju tretmani na pokusne jedinice- Postavlja ga istraiva - Unutar okvira plana mora postojati sluajnost primjene tretmana Statistiki model: - Slijedi pokusni plan - Pomae pri provjeri statistikih hipoteza - Pomae pri donoenju zakljuaka - Sastoji se od tri dijela: - prosjeci (oekivanja) - disperzija (varijance i kovarijance) - definirane raspodjele esto prikazan matematikom formulom 668.1 Pokusna jedinica i tretmani Pokusna jedinica - jedinica materijala na koje se primjenjuju tretmani - jedna jedinka, npr. ivotinja - ili grupa jedinki kao to je 10 pilia u jednom kavezu Tretman - procedura iji utjecaj e biti mjeren i usporeivan s drugim utjecajima - primjer: razina hranidbe, nain primjene insekticida- odreivanje populacije za koje e se donositi zakljuci Utjecaj tretmana se mjeri na jedinici uzorkaFaktor: grupa tretmana koji predstavljaju vrijednosti jedne kategorike nezavisne varijable. Jedinica uzorka: - moe biti jednaka pokusnoj jedinici - moe biti dio pokusne jedinice 8.2 Ponavljanja i pokusna grekaPonavljanja:- kada se tretmani primjenjuju vie puta na vie pokusnih jedinca - omoguuju procjenu pokusne greke - vie ponavljanja poveava preciznost pokusa jer se time smanjuju standardne greke tretmana Pokusna greka (engl. experimental error): - mjera neprotumaene varijabilnosti koja postoji izmeu opaanja na pokusnim jedinicama kada bi one bile tretirane jednako, odnosno kad nema utjecaja tretmana MSOST , s2 , MSE

- prosjek kvadrata za ostatak - prosjek kvadrata izmeu pokusnih jedinica - prosjek kvadrata unutar tretmana (grupa).Procjena pokusne greke je potrebna: - za provjeru znaajnosti razlika pojedinih utjecaja - za procjenu intervala povjerenja srednjih vrijednosti Koliina informacija: 2snI = Kontrola pokusne greke(kontrola varijabilnosti izmeu pokusnih jedinica) Pokusna greka se moe smanjiti: 1. Izborom pokusnog materijala sa to manjom varijabilnosti meu pokusnim jedinicama (sluajnost izbora mora biti zadovoljena) 2. Poboljanjem provedbe pokusa dajui sline uvjete pokusnim jedinicama 3. Izborom odgovarajueg statistikog plana 67Na tonu procjenu pokusne greke utjee: - sluajnost izbora pokusnog materijala - sluajnost primjene tretmana na pokusne jedinice Izvori varijabilnost pokusne greke: - varijabilnost izmeu pokusnih jedinica koju se ne moe objasniti - postoji varijabilnost zbog pomanjkanja uniformnosti u provedbi pokusa. Preciznost pokusnih planova Na preciznost pokusa utjee:izbor i homogenost pokusnog materijala izbor i razine tretmana kontrola pokusne greke broj ponavljanja 8.3 Potreban broj ponavljanja Ovisi o: - varijabilnosti uzorka - eljenoj razlici izmeu prosjeka tretmana - preciznosti pokusa - broju tretmana - razini vjerojatnosti sa kojom elimo biti sigurni da nismo pogrijeili u zakljuivanju (razina znaajnosti) Potreban broj ponavljanja: ( )222 /2 z zr+ z/2 = vrijednost na apscisi standardne normalne raspodjele odreen sa /2 vjerojatnosti tipa 1 greke z = vrijednost na apscisi standardne normalne krivulje odreen sa vjerojatnosti tipa 2 greke = eljena razlika koju elimo utvrditi 2 = pokusna greka, odnosno varijanca pokusnih jedinca kad ne bi bilo utjecaja tretmana. 689 Potpuno sluajni pokusni planSvojstva: - tretmani se dodjeljuju sluajno na pokusne jedinice- pokusne jedinice izabrane su sluajno iz populacije jednostruka analiza varijance = jednofaktorska analiza varijance. Koristi se: - kada su pokusne jedinice homogene. Primjer: Utjecaj tri razliite hranidbe na prirast u tovu.Prvo treba definirati sakupljanje podataka, odnosno napraviti plan pokusa: Izabrat emo sluajni uzorak i sluajno primijeniti tretmane na uzorak (definirati grupe)Izabrali smo 15 junadi i razliito ih hranili.(tretirali). 69Radi preglednosti mogu se ivotinje i njihova mjerenja napisati po tretmanima Tretmani T1T2T3 JuneMjerenjeJuneMjerenjeJuneMjerenje 211701109031290 612004105051340 911808108071330 121180101090111300 151170141080131300 Shema: Broj ivotinje12345678 TretmanT2T1T3T2T3T1T3T2 Broj ivotinje9101112131415 TretmanT1T2T3T1T3T2T1 Radi preglednosti mogu se ivotinje i njihova mjerenja napisati po tretmanima: Tretmani T1T2T3 BrojMjerenjeBrojMjerenjeBrojMjerenje 2y111y213y31 6y124y225y32 9y138y237y33 12y1410y2411y34 15y1514y2513y35 7010 Blokovi u analizi varijanceUnaprijed je poznato da e neke pokusne jedinice, iako tretirane jednako, ponaati razliito - tee ivotinje e imati drugaiji prirast nego lake- mjerenje na isti dan e biti slinija nego ona u razliitim danima Pokusni plan:- pokusne jedinice se klasificiraju i prema tim poznatim izvorima varijabilnosti- smanjuje se pokusna greka 10.1 Sluajni blok plan (potpuni) Pokusne jedinice uz tretmane mogu grupirati i prema drugom poznatim izvoru varijabilnosti u blokove- npr. na temelju poetne teine, kondicije, pasmine, spolu, stadij laktacije, legla, itd. Blokovi: - grupe koje slue da se protumai jo jedan dio varijabilnosti - njihova provjera obino nije od primarnog interesaCilj grupiranja u blokove: - da su jedinice unutar blokova sline tako da je varijabilnost izmeu njih uglavnom zbog razliitih tretmana Karakteristike sluajnog blok plana su: - imamo a tretmana i b blokova. Svaki tretman se javlja u svakom bloku i to samo jedanput - nain kako se tretmani primjenjuju na ivotinje u pojedinom bloku je potpuno sluajan - dvostruka analiza varijance (dvostruka klasifikacija) - dva naina klasificiranja pokusnih jedinica: prema bloku i tretmanu Primjer:Stimulansi na rast junadi - 3 tretmana- 4 bloka prema poetnoj teini - u svakom bloku 3 ivotinje na koje sluajno primjenjujemo tretmane - ukupno 12 ivotinja u pokusu Blokivotinje I1,2,3 II4,5,6, III7,8,9 IV10,11,12 Shema pokusnog plana: 71 Blokovi IIIIIIIV Br. 1 (T3)br. 4 (T1)br. 7 (T3) br. 10 (T3) Br. 2 (T1)br. 5 (T2)br. 8 (T1) br. 11 (T2)Br. ivotinje (Tretman) Br. 3 (T2)br. 6 (T3)br. 9 (T2) br. 12 (T1) Rezultati mjerenja: Blokovi IIIIIIIV T1 y11y12y13y14 T2y21y22y23y24 Tretman T3y31y32y33y34 yij = mjerenje tretmana i u bloku j. Model:yij = + i + j + iji = 1,.....,aj = 1,...,b yij = opaanje pokusne jedinice za tretman i u bloku j, = ukupna srednja vrijednost i = fiksni utjecaji grupe (tretmana) j = fiksni utjecaji blokova ij - sluajni neprotumaeni utjecaj N(0, 2) = interakcija blok x tretman 10.1.1 Ralanjenje ukupne sume kvadrata Sume kvadrata: SSUKUP = SSTRT + SSBLK + SSOST Stupnjevi slobode su: (ba1) = (a1) + (b1) + (a1)(b1) Takoer je (a1)(b1) = (abab+1) Jednostruka ANOVA: SSUKUP = SSTRT + SS'OST Dvostruka ANOVA:SSUKUP = SSTRT + SSBLK + SSOST SS'OST = SSBLK + SSOST

SSOST :suma kvadrata za ostatak kod dvostruke ANOVA-e (pokusna greka kod sluajnog blok plana)

SS'OST : suma kvadrata za ostatak kod jednostruke ANOVA-e72Smanjenje SS ostatka => vea preciznost sluajnog blok plana u utvrivanju eventualnih razlika tretmana Sume kvadrata: =i jij UKUPy y SS2..) ( = =iii ji TRTy y b y y SS2 2..) . ( ..) . ( = =iji jj BLKy y a y y SS2 2..) . ( ..) . ( + =i jj i ij OSTy y y y SS2..) . . ( Kratki nain raunanja suma kvadrata: 1) Ukupna suma = i j yij

2) Korekcijski faktor za srednju vrijednost: ( )( )opazanja broj ukupnisuma ukupna 22= = abyCi jij

3) SSUKUP =i j yij2 C4) ( )CbySSijijTRT = 2 5) ( )CaySSjiijBLK =2 6) SSOST = SSUKUP SSTRT SSBLK

Prosjeci kvadrata = MS = SS/df MSBLK = SSBLK/ (b1), MSTRT = SSTRT/ (a1), MSOST = SSOST/[(a1)(b1)] 10.1.2 Postavljanje hipoteza i F-provjera H0: 1 = 2 =... = a , nema utjecaja tretmanaH1: i i za barem jedan par (i,i), razlika izmeu tretmana postoji F statistikaOSTTRTMSMSF = ima F raspo