Šumarska biometrika skripta
DESCRIPTION
Skripta za polaganje ispita, pogodna za vjezbanje zadataka za skolovanje a tako i praksi.TRANSCRIPT
ŠUMARSKI FAKULTET SARAJEVO Katedra za uredivanje šuma Šumarska biometrika Mr. Azra Cabaravdic, dipl.ing.
ŠUMARSKA BIOMETRIKA
Numericki primjeri
Sarajevo, 2003
1
Sadržaj
UVOD
I. DESKRIPTIVNA STATISTIKA
Uredivanje statistickih skupova Graficko prikazivanje statistickih skupova Mjere centralne tendencije Mjere varijacije Mjere oblika distribucije frekevencija
II. TEORIJSKI RASPOREDI
Normalni raspored Binomski raspored
III. REGRESIONA ANALIZA
Linearna regresija Krivolinijska regresija Višestruka regresija Neto korelacije Korelacija ranga
IV. TEORIJA UZORAKA Distribucije statistika uzoraka Intervalne ocjene parametara osnovnog skupa Statisticki testovi
2
UVOD
Pojam “biometrika” nastao je kao složenica od “bios”- živjeti i “metrein”- mjeriti.
Zar* naziva “biometrikom” (biostatistikom) statisticke metode primjenjive na biološke probleme. Pojam “šumarska biometrika “ odnosi se na skup statistickih metoda primjenjivih na izucavanje bioloških pojava (procesa) u šumarstvu.
Predmet istraživanja šumarske biometrike
Predmet biometrijskog istraživanja su masovne pojave. Masovne pojave u
šumarstvu predstavljaju skupovi stabala šumskog drveca, šumskih sastojina, biotskog svijeta šume (divljac, insekti) i sl.
Radi uocavanja zakonitosti koje se javljaju u prirodi, vrše se opažanja masovnih pojava i registruju njihove manifestacije.
Osnovni zadaci šumarske biometrike su: 1. Istraživanje metoda prikupljanja, obrade, prikazivanja i interpretacije
numerickih podataka masovnih pojava, 2. Ocjena vjerovatnoce pojave odredenog opažanja (dogadaja), 3. Postavljanje teorijske osnove za projektovanje istraživanja i experimenata.
Prikupljeni podaci o manifestacijama istraživane masovne pojave analiziraju se odgovarajucim naucnim statistickim metodama.
U šumarstvu se najcešce vrši istraživanje jedne masovne pojave, uzajamni odnosi dviju ili više masovnih pojava, te istraživanje karakteristika osnovnih skupova na osnovu uzoraka.
Podjela statistickih metoda
Za analiziranje navedenih pojava koriste se :
- deskriptivna statistika, - regresiona analiza i - teorija uzoraka.
Osnovni pojmovi
Osnovni pojmovi koji se javljaju u šumarskoj biometrici su: – statisticki skup, – biološki objekat (elemenat statistickog skupa), – varijabla (statisticko obilježje, varijabilno obilježje).
Kada se istraživana pojava okarakteriše pojmovno, prostorno i vremenski, govori se o statistickom skupu. Statisticki skup predstavlja skup istovrsnih bioloških objekata koji se medusobno razlikuju u odnosu na ispitivanu karakteristiku (osobinu, obilježje, atribut, varijablu) na odredenom podrucju u odredenom vremenskom okviru.
Biološke objekte (elemente statistickog skupa) u šumarstvu najcešce predstavljaju stabla, dijelovi stabala (debla, krošnje, listovi, cetine, cvjetovi, šišarke), skupine stabala, elementarne površine (experimentalne površine - ogledne plohe, površine odredene velicine: 1 ha, 1 ar i sl.), biljke, gljive, insekti, divljac.
Karakteristika istraživane pojave, koja se može razlikovati od jednog biološkog objekta do drugog, u ovom ce radu biti oznacena pojmom varijabla.
3
Stabla se npr. medusobno razlikuju u mnogobrojinim karakteristikama koje variraju - varijablama (taxonomskoj pripadnosti – vrsti, starosti, debljini, visini, dužini debla, izgledu kore, boji kore, debljini kore, dužini krošnje, obliku krošnje, horizontalnoj projekciji krošnje, ukupnoj biomasi, biomasi dijelova stabala, prisustvu/odsustvu deformacija – bolesti i insekata i sl). Skupine stabala mogu varirati po prosjecnoj starosti, smjesi vrsta, omjeru smjese vrsta, ukupnoj zapremini drvne mase, prosjecnoj visini, prosjecnoj temeljnici i sl.
Elementarne površine u okviru šumskog gazdinstva variraju po prisustvu/odsustvu drvenastih biljnih vrsta, sastavu biljne zajednice, smjesi drvenastih biljnih vrsta, omjeru te smjese, prosjecnim velicinama debljine, visine, zapremine stabala, stupnju pokrivenosti tla krošnjama stabala, velicini biomase, biodiverzitetu i sl.
Mnogo je razlicitih varijabli koje su predmet istraživanja u šumarstvu, stoga se izvodi klasifikacija varijabli.
Tipovi bioloških podataka
Klasifikacija varijabli zasniva se na vrsti varijable. Osnovna podjela varijabli je
na: - kvantitativne (numericke) i - kvalitativne (atributivne, opisne).
Kvantitativne varijable izražavaju se numericki (brojem). Mogu biti neprekidne (kontinuirane) i prekidne (diskontinuirane, diskretne). Primjeri neprekidnih varijabli su debljine, visine, zapremine stabala, dužine debala, dužine krošanja, površine horizontalnnih projekcija krošanja po jedinici površine i sl. Primjeri prekidnih varijabli su broj stabala po jedinici površine, broj deformacija po stablu, broj insekata po jedinici lisne površine ili po stablu, broj insekata po klopki, broj divljaci po jedinici površine i sl.
Kvalititivne varijable izražavaju se opisno. Primjeri kvalitativnih varijabli su: pripadnost vrsti, pripadnost kategoriji, tip tla, oblik debla stabla, izgled kore, boja kore, boja lišca, cetina, oblik lišca, cetina i sl.
Na razlicite varijable primjenjuju se razlicite statisticke procedure. Vrsta statistickih procedura zavisi od skale varijable.
Skale podataka
Radi lakše preglednosti ustanovljene su sljedece skale: - nominalna skala, - ordinalna (skala ranga, redna) skala, - metricke skale:
- intervalna skala, - apsolutna (omjerna) skala.
Nominalna skala Nominalna skala upotrebljava se za analizu kvalitativnih varijabli. Varijabla može
biti npr. vrsta drveca. Tada razlicite vrste drveca sacinjavaju skalu. Služi za svrstavanje objekata (stabala) u klase (kategorije).
4
Ordinalna skala Ordinalna skala (redna)(skala ranga) se upotrebljava kad je potrebno rangirati
objekte, odnosno klasificirati rang objekta pri cemu skala kvantificira objekte tako da su manji ili veci jedan od drugog po ispitivanoj varijabli (uzgojno-tehnicka klasifikacija stabala, tehnicka klasifikacija stabala, razvojni stupanj sastojine).
Metricke skale
Metricke skale odnose na numericka varijable. Mogu biti: intervalna skala i apsolutna skala.
Intervalna skala Intervalna skala predstavlja skalu s jednakim razlikama izmedu parova podataka,
ali nula tacka je proizvoljna (npr. prosjecna temperatura experimentalne površine).
Apsolutna skala Apsolutna skala je slicna intervalnoj skali, ali na ovoj skali postoji fizicka oznaka
nula tacke. Kako se mogu analizirati omjeri mjerenja, ova skala nosi naziv i mjerna skala (npr. težina, zapremina). Mjerna skala ukazuje na tacnu razliku izmedu objekata.
Ponekad podaci s ordinalne, intervalne ili apsolutne skale mjerenja mogu biti registrovani u kategorijama nominalne skale.
Takode je prakticno, gdje god je moguce, podatke ordinalne skale izraziti intervalnom ili apsolutnom skalom.
Skala varijable je presudna za statisticku analizu koja treba biti primjenjena. Najcešce se u šumarstvu vrši proucavanje masovnih pojava cije su manifestacije numericke neprekidne varijable metricke skale (Primjer 1).
5
Primjer 1
U sastojini smrce u Han Pijesku 1990 godine, izvršeno je mjerenje velicina taxacionih elemenata stabala, i to: prsnog promjera stabla ( e1X ) i visine stabla ( e2X ) te je izvedena velicina zapremine stabla ( e3X ).
Za 132 stabla (biološka objekta) { } { }( )132,1eOO,....O,O e13221 =≡ u Tabeli 1
registrovani su podaci o velicinama prsnih promjera (varijable e1X ). Tabela 1. Baza podataka
e e1X (cm)
e e1X (cm)
e e1X (cm)
e e1X (cm)
e e1X (cm)
1 16,1 31 26,4 61 16,9 91 17,6 121 15,0 2 11,0 32 9,2 62 26,5 92 10,9 122 17,4 3 19,0 33 20,5 63 22,7 93 17,0 123 12,1 4 24,4 34 22,4 64 13,2 94 12,8 124 24,2 5 24,0 35 27,8 65 24,4 95 16,1 125 25,2 6 26,8 36 17,3 66 17,3 96 27,7 126 26,8 7 6,2 37 14,9 67 25,0 97 7,4 127 11,8 8 16,5 38 21,3 68 8,8 98 18,4 128 15,0 9 23,5 39 15,7 69 24,8 99 25,1 129 19,0 10 12,0 40 21,7 70 10,1 100 16,4 130 12,5 11 14,1 41 10,1 71 15,0 101 16,0 131 11,3 12 8,8 42 13,2 72 32,9 102 11,6 132 25,9 13 8,0 43 9,7 73 20,2 103 19,2 131 11,3 14 12,6 44 15,8 74 10,3 104 16,1 132 25,9 15 13,6 45 17,4 75 20,6 105 20,2 16 6,6 46 18,7 76 15,8 106 17,8 17 14,7 47 14,7 77 15,0 107 18,5 18 15,6 48 14,9 78 19,9 108 10,1 19 18,4 49 24,9 79 21,1 109 14,8 20 15,8 50 15,7 80 16,1 110 17,7 21 16,0 51 24,3 81 16,0 111 17,5 22 15,8 52 9,1 82 19,7 112 19,1 23 24,8 53 20,0 83 20,4 113 20,1 24 17,3 54 20,8 84 17,2 114 20,3 25 16,7 55 23,6 85 15,6 115 25,9 26 15,0 56 25,4 86 28,3 116 23,2 27 28,1 57 17,0 87 13,4 117 8,9 28 22,3 58 20,7 88 21,0 118 16,9 29 30,2 59 12,1 89 21,5 119 17,9 30 14,3 60 18,7 90 17,5 120 18,0
6
Tabela 2. Pregled simbola u upotrebi Simbol Naziv simbola Znacenje simbola
eO Objekat
iX Numericka vrijednost i-tog obilježja
eX Numericka vrijednost e-tog objekta
ieX Numericka vrijednost i-tog obilježja e-tog objekta
ietX teta Numericka vrijednost i-tog obilježja e-tog objekta u t trenutku
N Broj podataka u skupu K Broj intervala d Dužina intervala
[ ]ii DL − Lijeva i desna granica i-tog intervala
if Apsolutna frekvencija i-tog intervala
ik Redni broj i-tog intervala
( )ii f,X Distribucija apsolutnih frekvencija
∑ Sigma Suma
ST Središnja tacka X Iks bar Prosjecna velicina, prosjek, aritmeticka sredina
iC Jedinicna cijena
eM Medijana
oM Modus, mod
H Harmonijska sredina G Geometrijska sredina RV Razmak varijacije Q Kvartilna devijacija P 10-90 percentilni razmak
xd Srednje apsolutno odstupanje
x2δ Sigma² Varijansa
xδ Sigma Standardna devijacija KQ Koeficijent interkvartilne devijacije RD Relativna devijacija
xKV Koeficijent varirijacije
eZ Standardizirana varijabla
H′ Index biodiverziteta J′ Relativni diverzitet
3α Alfa Asimetrija
4α Alfa Spljoštenost
ijC Kovarijansa 2
2.1S Rezidualna varijansa
2.1S Standardna greška regresije 2ρ ro² Determinacija
ρ ro Koeficijent korelacije
7
sr Spirmanov koeficijent korelacije
2,1,05.0F νν Tablicna vijednost F distribucije
OX Aritmeticka sredina osnovnog skupa 2Oσ Varijansa osnovnog skupa
ω omega Broj uzoraka n Broj elemenata (podataka) u uzorku ( )XA Aritmeticka sredina aritmetickih sredina uzoraka
( )XD2 Varijansa aritmetickih sredina uzoraka
( )XD Standardna devijacija aritmetickih sredina uzoraka
uX Aritmeticka sredina uzorka
p Propocija ostvarenja q Proporcija neostvarenja
n,tα Tablicna vrijednost t distribucije
itf Teorijska frekvencija 2χ hi Hi kvadrat
8
DESKRIPTIVNA STATISTIKA
Uredivanje statistickih skupova Zadatak 1.
Statisticki skup varijable e1X (prsni promjer (cm)) predstavljen u Tabeli 1. urediti u:
a) rastuci niz, b) distribuciju neintervalnih frekvencija, c) distribuciju intervalnih frekvencija (apsolutno, relativno, procentualno,
kumulativno, relativno kumulativno). Rješenje:
a) Formiranje rastuceg niza je prvi korak uredivanja statistickog skupa. Omogucava uvid u brojnost skupa i u velicine minimalne i maximalne numericke vrijednosti u statistickom skupu. Rastuci niz predstavlja numericki ureden niz podataka tako da je svaki naredni podatak veci ili jednak prethodnom:
1ee XX +≤ .
Rastucim nizom obuhvaceni svi podaci uredeni pocevši od minimalnog do maximalnog podatka:
+− ≤≤ XXX e .
Tabela 3. Rastuci niz:
6,2 <6,6 <7,4 <8,0 <8,8 =8,8 <8,9 <9,1 <9,2 <9,7 <10,1 =10,1 =10,1 <10,3
<10,9 <11,0 <11,3 <11,6 <11,8 <12,0 <12,1 =12,1 <12,5 <12,6 <12,8 <13,2 =13,2 <13,4
<13,6 <14,1 <14,3 <14,7 =14,7 <14,8 <14,9 =14,9 <15,0 =15,0 =15,0 =15,0 =15,0 <15,6
=15,6 <15,7 =15,7 <15,8 =15,8 =15,8 =15,8 <16,0 =16,0 =16,0 <16,1 =16,1 =16,1 =16,1
<16,4 <16,5 <16,7 <16,9 =16,9 <17,0 =17,0 <17,2 <17,3 =17,3 =17,3 <17,4 =17,4 <17,5
=17,5 <17,6 <17,7 <17,8 <17,9 <18,0 <18,4 =18,4 <18,5 <18,7 =18,7 <19,0 =19,0 <19,1
<19,2 <19,7 <19,9 <20,0 <20,1 <20,2 =20,2 <20,3 <20,4 <20,5 <20,6 <20,7 <20,8 <21,0
<21,1 <21,3 <21,5 <21,7 <22,3 <22,4 <22,7 <23,2 <23,5 <23,6 <24,0 <24,2 <24,3 <24,4
=24,4 <24,8 =24,8 <24,9 <25,0 <25,1 <25,2 <25,4 <25,9 =25,9 <26,4 <26,5 <26,8 =26,8
<27,7 <27,8 <28,1 <28,3 <30,2 <32,9
Rastucim nizom obuhvaceni svi podaci uredeni pocevši od minimalnog cm2,6X =− do maximalnog podatka cm9,32X =+ :
9,32XX2,6X e =≤≤= +− .
9
b) Distribucija (raspodjela) neintervalnih frekvencija (broja ponavljanja) ( )vv n,X je ureden statisticki skup kod kojeg se za svaku numericku varijantu ( vX ) u skupu registruje broj ponavljanja te varijante (frekvencija) ( vn ). Distribucija neintervalnih ferkvencija prikazuje se tabelarno:
Tabela 4. Distribucija neintervalnih frekvencija
vX vn vX vn vX vn 6,2 1 16,5 1 22,4 1 6,6 1 16,7 1 22,7 1 7,4 1 16,9 2 23,2 1 8,0 1 17,0 2 23,5 1 8,8 2 17,2 1 23,6 1 8,9 1 17,3 3 24,0 1 9,1 1 17,4 2 24,2 1 9,2 1 17,5 2 24,3 1 9,7 1 17,6 1 24,4 2 10,1 3 17,7 1 24,8 2 10,3 1 17,8 1 24,9 1 10,9 1 17,9 1 25,0 1 11,0 1 18,0 1 25,1 1 11,3 1 18,4 2 25,2 1 11,6 1 18,5 1 25,4 1 11,8 1 18,7 2 25,9 2 12,0 1 19,0 2 26,4 1 12,1 2 19,1 1 26,5 1 12,5 1 19,2 1 26,8 2 12,6 1 19,7 1 27,7 1 12,8 1 19,9 1 27,8 1 13,2 2 20,0 1 28,1 1 13,4 1 20,1 1 28,3 1 13,6 1 20,2 2 30,2 1 14,1 1 20,3 1 32,9 1 14,3 1 20,4 1 132 14,7 2 20,5 1 14,8 1 20,6 1 14,9 2 20,7 1 15,0 5 20,8 1 15,6 2 21,0 1 15,7 2 21,1 1 15,8 4 21,3 1 16,0 3 21,5 1 16,1 4 21,7 1 16,4 1 22,3 1
10
c) Distribucija intervalnih frekvencija se odnosi na ureden statisticki skup kod kojeg se podaci, radi preglednosti svrstavaju u intervale ( )ii DL − . Broj intervala (K) odreduje se pomocu formule:
Nlog3,312logNlog
1K +=+= ,
pri cemu se K zaokružuje na cijeli broj dajuci prednost susjednom neparnom cijelom broju.
U našem primjeru je: 7132log3,31K =+= .
Dužina intervala (d) predstavlja razmak izmedu gornje i donje granice intervala. Dužina intervala se odreduje po formuli:
KXX
d−+ −
= .
Prakticno je da dužina intervala bude izražena cijelim brojem.
U našem primjeru je: cm434,38
2,69,32d ≅=
−= .
Donja granica prvog interva la ( )1L i gornja granica posljednjeg intervala ( )kD treba da obuhvati sve podatke:
ke1 DXXXL ≤≤≤≤ +− . U našem primjeru je: ke1 D9,32X2,6L ≤≤≤≤ .
Donja granica prvog intervala treba da je manja ili jednaka najmanjoj numerickoj varijanti −X :
−≤ XL1 . U našem primjeru je: 2,6X6L1 =⟨= − .
Ostale donje granice intervala odreduju se po formuli:
dLL 1ii += − . U našem primjeru je: 1046L2 =+= ,
14410L3 =+= , 18414L4 =+=
...
Gornje granice intervala odreduju se po formuli: )1,0d(LD ii −+= .
U našem primjeru je: ( ) 9,91,046D2 =−+= ( ) 9,131,0410D3 =−+= ( ) 9,171,0414D4 =−+= ...
11
Interval se aproksimira intervalnim obilježjem ( )iX koje se racuna po formuli:
2DL
X iii
+= .
U našem primjeru je: 82
99,96X1 =
+=
&
122
99,1310X 2 =
+=
&
162
99,1714X 3 =
+=
&
....
Distribucija intervalnih apsolutnih frekvencija Kada se za definirane intervale registruje broj podataka cija se numaricka
vrijednost nalazi u intervalu formira se intervalna distribucija apsolutnih frekvencija ( )ii f,X (Tabela 3). Suma frekvencija ( )if intervalno uredene distribucije apsolutnih frekvencija iznosi ukupan broj podataka N:
NfK
1ii =∑
=
.
Tabela 5. Intervalno uredenje statistickog skupa
( )ii DL − iX frekvencije if 6-9,9 8 IIIII IIIII 10
10-13,9 12 IIIII IIIII IIIII IIII 19 14-17,9 16 IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII I 46 18-21,9 20 IIIII IIIII IIIII IIIII IIIII II 27 22-25,9 24 IIIII IIIII IIIII IIIII IIIII 20 26-29,9 28 IIIII III 8 30-34 32 II 2
132
U našem primjeru je: 132f7
1ii =∑
=
.
Distribucija intervalnih kumulativnih frekvencija Distribucija intervalnih kumulativnih frekvenc ija ( )+
ii F,X je ureden statisticki skup kod koga se u svakom narednom intervalu kumuliraju (sabiraju) apsolutne frekvencije predhodnih:
∑=
+ =i
1jji fF .
U našem primjeru je: 10ffF 1
1
1jj1 === ∑
=
+ ,
12
291910fffF 21
2
1jj2 =+=+== ∑
=
+ ,
75461910ffffF 321
3
1jj3 =++=++== ∑
=
+ ,
... Distribucija intervalnih kumulativnih frekvencija ( )−
ii F,X je ureden statisticki skup kod koga se u svakom narednom intervalu oduzimaju apsolutne frekvencije predhodnih uzimajuci da se prvom intervalu dodjeljuje ukupan broj podataka N.
U našem primjeru je: 132NF1 ==− ,
12210132fFF1
1ii12 =−=−= ∑
−
−− ,
10319122fFF2
1ii23 =−=−= ∑
=
−− ,
... Distribucija intervalnih relativnih kumulativnih frekvencija ( )Ii RF,X je ureden statisticki skup kod koga se relativne kumulativne frekvencije odreduju po formuli:
NF
RF ii = .
U našem primjeru je: 07,013210
RF1 ==+
22,013229
RF2 ==+
57,013275
RF3 ==+
... odnosno
1132132
RF1 ==−
92,0132122
RF2 ==−
78,0132103
RF3 ==− .
Distribucija intervalnih relativnih frekvencija ( )ii r,X je ureden statisticki skup kod koga se relativne frekvencije intervala odreduju po formuli:
Nf
r ii = .
U našem primjeru je: 076,013210
r1 ==
144,013219
r2 ==
348,013246
r3 == .....
13
Suma relativnih frekvencija iznosi 1:
1rK
1ii =∑
=
.
U našem primjeru je: 1r7
1ii =∑
=
.
Distribucija intervalnih procentualnih frekvencija ( )ii p,X je ureden statisticki skup kod koga procentualne frekvencije odreduju po formuli:
Nf
100r100p iii == .
U našem primjeru je: 58,713210
100p i ==
39,1413219
100p i2 ==
85,3413246
100p3 ==
... Suma procentualnih frekvencija iznosi 100 :
100pK
1ii =∑
=
.
U našem primjeru je: 100p7
1ii =∑
=
.
Tabela 6. Distribucije intervalnih apsolutnih, kumulativnih, relativnih kumulativnih, relativnih i procentualnih frekvencija
ii DL − iX if +iF
+iRF −
iF −
iRF ir ip
6-9,9 8 10 10 0,07 132 1,00 0,076 7,58 10-13,9 12 19 29 0,22 122 0,92 0,144 14,39 14-17,9 16 46 75 0,57 103 0,78 0,348 34,85 18-21,9 20 27 102 0,77 57 0,43 0,205 20,45 22-25,9 24 20 122 0,92 30 0,23 0,152 15,15 26-29,9 28 8 130 0,98 10 0,07 0,061 6,06 30-34 32 2 132 1,00 2 0,01 0,015 1,52
132 1,000 100
14
Graficko prikazivanje distribucija frekvencija Zadatak 2.
Distribucije frekvencija Tabele 4. predstaviti graficki i to:: a) distribuciju intervalnih apsolutnih frekvencija ( )ii f,X - poligonom, b) distribuciju intervalnih apsolutnih frekvencija ( )ii f,X - histogramom, c) distribucije intervalnih kumulativnih frekvencija - poligonom,
Koristeci graficki prikaz s dvije ose, predstaviti poligonima: d) distribucije intervalnih kumulativnih K+ i intervalnih relativnih
kumulativnih frekvencija i distribucije intervalnih kumulativnih K- i intervalnih relativnih kumulativnih frekvencija.
e) distribucije intervalnih apsolutnih i intervalnih relativnih frekvencija i distribucije intervalnih apsolutnih i intervalnih procentualnih frekvencija.
Rješenje: a) Poligon apsolutnih frekvencija je linijski grafikon kod koga se u koordinatnom sistemu linijski povežu tacke ( )ii f,X .
Grafik 1. Poligon apsolutnih frekvencija
0
5
10
15
20
25
30
35
40
45
50
0 4 8 12 16 20 24 28 32 36 40Xi(cm)
fi
15
b) Histogram frekvencija predstavlja površinski poligon koji formira se tako što se dužina intervala koristi kao osnovica provaouganika ciju visina predstavlja apsolutna frekvencija intervala.
Grafik 2. Histogram apsolutnih frekvencija
0
5
10
15
20
25
30
35
40
45
50
6-9,9 10-13,9 14-17,9 18-21,9 22-25,9 26-29,9 30-34 Xi(cm)
fi
16
c) Kumulante F+ i F- predstavljaju linijske poligone. Formiraju se tako da se: - Kod kumulante F+ linijski povežu tacke ( )+
Ii F,D i - Kod kumulane F- linijski povežu tacke ( )−
ii F,L .
Grafik 3. Kumulane F+ i F-
0
20
40
60
80
100
120
140
0 5 10 15 20 25 30 35 40Xi(cm)
N
F+F-
17
d) Koristeci graficki prikaz s dvije y-ose moguce je predstaviti dva tipa distribucije frekvencija intervalno uredenog statistickog skupa. Pri tome se mogu koristiti kombinacije linijskog i površinskog grafikona.
Primjeri.
Grafik 4. Distribucije kumulativnih F+ i relativnih kumulativnih frekvencija RF+
Grafik 5. Distribucije kumulativnih F- i relativnih kumulativnih frekvencija RF-
0
20
40
60
80
100
120
140
6 8 12 16 20 24 28 32 Xi(cm)
F+
00,10,20,30,40,50,60,70,80,91RF+
F+RF+
0
20
40
60
80
100
120
140
8 12 16 20 24 28 32 34 Xi(cm)
F-
00,10,20,30,40,50,60,70,80,91
RF-
F-RF-
18
Grafik 6. Distribucije apsolutnih i relativnih frekvencija
Grafik 7. Distribucije apsolutnih i procentualnih frekvencija
0
5
10
15
20
25
30
35
40
45
50
2 8 12 16 20 24 28 32 38Xi(cm)
f
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4r
fr
0
5
10
15
20
25
30
35
40
45
50
2 8 12 16 20 24 28 32 38Xi(cm)
f
0
5
10
15
20
25
30
35
40
p
fp
19
Zadatak 3. Na terenu je registrovano prisustvo razlicitih vrsta drveca: Tabela 7. Prisustvo vrsta
Vrsta drveca Oznaka Frekvencije Fagus A 44 Abies B 12 Picea C 28 Quercus D 8 Fraxinus E 2 Acer F 3
Distribuciju frekvencija predstaviti graficki. Rješenje: Kako se u zadatku radi o podacima nominalne skale, ilustrativan je histogram frekvencija koji pokazuje distribuciju frekvencija kategorija.
Grafik 8. Histogram frekvencija Radi uocavanja procentualne zastupljenosti pojedinih vrsta drveca u posmatranom skupu koristi se kružni dijagram – strukturni krug:
Grafik 9. Strukturni krug
0
10
20
30
40
50
A B C D E F
f
A46%
B12%
C29%
D8%
E2%
F3%
20
Zadatak 4. Izvršena je uzgojna klasifikacija 132 stabla za dvije razlicite vrste drveca A i B. Distribucije frekvencija u uzgojnim klasama su sljedece:
Tabela 8. Uzgojna klasifikacija stabala Frekvencije
Uzgojna klasa A B I 18 12 II 59 38 III 42 46 IV 13 36
Distribucije frekvencija predstaviti graficki. Rješenje: Kada se analiziraju distribucije frekvencija dva razlicita skupa istorodnih objekata može se koristiti uporedni histogram frekvencija. Pri tome se frekvencije pojedinih intervala (kategorija) razlicitih skupova prikazuju uporedo. U zadatku se radi o varijabli ordinalne skale pe se na x-osi nalaze kategorije ranga.
Grafik 10. Uporedni histogram frekvencija
0
10
20
30
40
50
60
I II III IV
f
AB
21
Zadatak 5. U periodu 12.05.-08.09. 2000 vršena su registrovanja brojnosti potkornjaka:
Tabela 9. Ulov potkornjaka 12.05.00 19.05.00. 26.05.00. 02.06.00. 09.06.00. 16.06.00. 23.06.00. 30.06.00. 07.07.00. 1722 874 237 354 800 470 197 69 363
14.07.00. 21.07.00. 28.07.00. 04.08.00. 11.08.00. 18.08.00. 25.08.00. 01.09.00. 08.09.00.
86 30 61 90 38 91 70 77 70 Distribuciju frekvencija predstaviti graficki. Rješenje: Za graficko prikazivanje vremenskih serija mogu se koristiti linijski i površinski dijagrami. Pri tome se na x-osu nanose periodi (datumi) registrovanja pojave.
Grafik 11. Brojnost potkornjaka u periodu 12.05.-08.09.2001
0
200
400
600
800
1000
1200
1400
1600
1800
12.05.
00
19.05.
00.
26.05.
00.
02.06.
00.
09.06.
00.
16.06.
00.
23.06.
00.
30.06.
00.
07.07.
00.
14.07.
00.
21.07.
00.
28.07.
00.
04.08.
00.
11.08.
00.
18.08.
00.
25.08.
00.
01.09.
00.
08.09.
00.
f
22
Zadatak 6. U sektorima od po 45º u odnosu na stajalište posmatraca, u toku jednog dana, registrovana je pojava ptica. Registrovani su podaci:
Tabela 10. Pojava ptica Sektor Frekvencija 0-45 66 45-90 29 90-135 9 135-180 10 180-225 14 225-270 146 270-315 290 315-360 201
Distribuciju frekvencija predstaviti graficki. Rješenje: Kod graficke predstave distribucija frekvencija koje se odnose na registraciju pojave u pojedinim sektorima može se koristiti polarni dijagram. Pri tome se na ose polarnog dijagrama (ose sektora) nanose pripadne frekvencije.
Grafik 12. Polarni dijagram
050
100150
200250
3000-45
45-90
90-135
135-180225-270
270-315
315-360
23
Pozicione mjere centralne tendencije Zadatak 7. Za statisticki skup varijable e1X iz Tabele 1 odrediti pozicione mjere centralne tendencije:
a) središnju tacku, b) medijanu, c) modus.
Rješenje: a) Središnja tacka ST predstavlja središte geometrijske duži ( )+− X,X :
2XX
ST+− +
= .
Kako je u našem primjeru cm2,6X =− i cm9,32X =+ , to je središnja tacka:
cm55,192
9,322,6ST =
+= .
Znaci, središte geometrijske duži (6,2;32,9) je 19,55 cm. b) Medijana eM je poziciona mjera centralne tendencije. Medijana dijeli posmatrani statisticki skup na dva jednakobrojna podskupa. Odreduje se kada je statisticki skup ureden u rastuci (ili opadajuci) niz.
Kod statistickog skupa s neparnim brojem podataka medijana je vrijednost iz skupa koja se nalazi na poziciji:
21N +
, tj.
21Ne XM += .
Kod statistickog skupa s parnim brojem podataka potrebno je odrediti prvi i drugi centralni podatak:
cX - prvi centralni podatak,
1cX + - drugi centralni podatak, pri cemu je:
2N
c = .
Medijana je tada:
2XX
M 1cce
++= .
U našem primjeru je cm4,16X c = i cm5,16X 1c =+ , pa je medijana:
cm45,162
5,164,16M e =
+= .
Znaci, polovina podataka u skupu ima vrijednost manju od 16,45cm, dok su vrijednosti druge polovine skupa vece od 16,45cm.
24
c) Modus oM je poziciona mjera centralne tendencije koja pokazuje koja se numericka varijanta najcešce javlja u statistickom skupu. Može se lako odrediti kod uredenog rastuceg niza ili neintervalno uredene distribucije frekvencija, pri cemu se registruje numericka varijanta koja se najcešce javlja (najveca frekvencija). Na osnovu Tabele 2. utvrdeno je da je modus 15,0 cm, tj.
cm0,15Mo = . Znaci, u analiziranom statistickom skupu najcešce se javlja numericka varijanta 15,0 cm.
Zadatak 8. Za intervalno uredenu distribuciju apsolutnih frekvencija (Tabele 4) izracunati:
a) medijanu, b) percentile 10%,35% i 90% , decil 2D i kvartile 321 Q,Q,Q , c) modus.
Rješenje: a) Kod intervalno uredene distribucije frekvencija medijana eM se dobije iz formule:
Me
1Me
Mee f
F2
1N
dLM−−
+
+=
pri cemu je:
MeL lijeva (niža) granica medijanskog intervala, d širina medijanskog intervala, N broj svih podataka u skupu,
1MeF − kumulativna frekvencija u predmedijanskom intervalu,
Mef frekvencija u medijanskom intervalu. Medijanski interval predstavlja interval u kome se nalazi N/2-ti podatak. Za naš primjer, korištenjem Tabele 4. odredujemo medijanski interval posmatrajuci kumulantu K+ i registrujuci interval u koji pada 132/2=61 podatak. To je interval (14-17,9). Zatim izracunavamo medijanu:
cm26,1746
292
1132
414M e =−
+
+= .
Znaci, 50 % stabala (61 stablo) ima prsni promjer manji od 17,26 cm. c) Percentili, decili i kvartili su pozicione mjere centralne tendencije kojima se odreduju vrijednosti koje skup dijele na podskupove cija brojnost odgovara odabranom procentu, desetom dijelu ili cetvrtini posmatranog skupa. Kod intervalno uredene distribucije frekvencija percentil je:
25
( )
p
1p
pp f
F100
1N
dLP−
ρ
−+ρ
+= ,
gdje je: ρP - percentil,
pL - lijeva granica percentilnog intervala,
pd - dužina percentilnog intervala,
1pF − - kumulativna frekvencija u pred-percentilnom intervalu,
pf - apsolutna frekvencija percentilnog intervala.
Prvo je potrebno odrediti poziciju percentila ( )ρPP :
( ) ( )100
1NPP
+ρ=ρ .
U našem primjeru, za deseti percentil 10P kojim se skup brojno dijeli na podskupove u kojima se nalazi 10% podataka vrijednosti manjih od desetog percentila i 90% podataka vrijednosti vecih od desetog percentila, pozicija percentila je:
( ) ( )3,13
100113210
PP 10 =+
= ,
odnosno percentilni interval je interval u kome se nalazi 13,3 (14-ti) podatak. Posmatrajuci kumulativnu distribuciju frekvencija uocavamo da se 14-ti podatak nalazi u intervalu :
( ]9.13,10P10 ∈ . Korištenjem Tabele 4 izracunavamo 10-ti percentil 10P :
( )cm69,10
19
10100
113210
410P10 =−
+
+=
Znaci, 0% podataka u skupu ima vrijednost manju od 10,69cm. Za 35-ti percentil 35P :
( ) ( )55,46
100113235
PP 35 =+
= ? +3F =75 ? ( ]9.17,14P35 ∈
( )cm52,15
46
29100
113235
414P35 =−
+
+=
Znaci, 35% podataka u skupu ima vrijednost manju od 15,52cm.
Za 90-ti percentil 90P :
( ) ( )7,119
100113290
PP 90 =+
= ? +5F =122? ( ]9.25,22P90 ∈
( )cm54,25
20
102100
113290
422P90 =−
+
+=
Znaci, 90% podataka u skupu ima vrijednost manju od 25,54cm.
26
Decili predstavljaju vrijednosti koje skup brojno dijele na desete dijelove. Mogu biti izraženi i kao percentili. Drugi decil 2D ustvari predstavlja 20-ti percentil 20P . U našem primjeru je:
( ) ( ) ( )6,26
100113220
PPDP 202 =+
== ? +2F =29? ( ]9.13,10P20 ∈
( )cm49,13
19
10100
113220
410PD 202 =−
+
+==
Znaci, 20% podataka u skupu ima vrijednost manju od 13,49cm.
Kvartili predstavljaju vrijednosti koje skup brojno dijele na 25% dijelove. Mogu biti izraženi i kao percentili. Npr. 1Q je ustvari 25-ti percentil, tj. 25P . Unašem primjeru se odreduje kao:
( ) ( ) ( )25,33
100113225
PPQP 251 =+
== ? +3F =75? ( ]9.17,14P25 ∈
( )cm37,14
46
29100
113225
414PQ 251 =−
+
+==
Znaci, prvi kvartil je 14,37cm, tj. 25% podataka u skupu ima vrijednost manju od 14,37 cm.
Drugi kvartil 2Q = 50P = eM :
( ) ( ) ( )5,66
100113250
MPPQP e502 =+
=== ? +3F =75? ( ]9.17,14P50 ∈
( )cm26,17
46
29100
113250
414PQ 502 =−
+
+==
Znaci, drugi kvartil je 17,26cm, tj. 50% podataka u skupu ima vrijednost manju od 17,26 cm.
Za treci kvartil je 3Q = 75P :
( ) ( ) ( )75,99
100113275
PPQP 753 =+
== ? +4F =102? ( ]9.21,18P75 ∈
( )cm67,21
27
75100
113275
418PQ 753 =−
+
+==
Znaci, treci kvartil je 21,67cm, tj. 75% podataka u skupu ima vrijednost manju od 21,67 cm.
27
c) Kod intervalno uredene distribucije frekvencija modus oM se odreduje po formuli:
( ) ( )1MoMo1MoMo
1MoMoMoMoo ffff
fflLM
+−
−
−+−−
+= .
pri cemu je :
MoL = lijeva ( niža ) granica modalnog intervala
Mod = širina modalnog intervala
1Mof − = apsolutna frekvencija u predmodalnom intervalu
Mof = apsolutna frekvencija u modalnom intervalu
1Mof + = apsolutna frekvencija u postmodalnom intervalu
Modalni interval je interval s najvecom apsolutnom frekvencijom maxif , što je našem
slucaju: maxif =46,
pa je modus:
( ) ( )
cm35,1627461946
1946414M o =
−+−−
+=
Znaci, u datoj distribuciji frekvencija najcešce se javlja podatak 16,35 cm, tj. najveci broj stabala ima ve licinu prsnog promjera 16,35 cm. (Napomena: Kod intervalno urednih distribucija frekvencija potrebno ja proanalizirati i graficki prikaz distribucije apsolutnih frekvencija. Ukoliko se na grafickom prikazu uocava jedan najviši vrh – zakljucujemo da je distribucija frekvencija unimodalna i izracunavamo modus. Ukoliko se na grafickom prikazu uocava dva dominantna vrha – zakljucujemo da je distribucija frekvencija bimodalna i zakljucujemo da je modus neizvjestan. Ukoliko se na grafickom prikazu uocava više dominantnih vrhova – zakljucujemo da je distribucija frekvencija polimodalna i zakljucujemo da je modus neizvjestan.)
28
Racunske (izvedene) mjere centralne tendencije
Aritmeticka sredina Zadatak 9. Za statisticki skup varijable e1X iz Tabele 1 izracunati aritmeticku sredinu. Rješenje: a) Aritmeticka sredina negrupisanih podataka predstavlja kolicnik sume svih podataka i ukupnog broja podataka:
N
XX
N
1ee∑
== .
U našem primjeru je:
cm25,17132
9,253,119,25...0,190,111,16X =
++++++=
Znaci, aritmeticka sredina negrupisanih podataka prsnih promjera iznosi 17,25 cm. Zadatak 10. Za intervalno uredenu distribuciju apsolutnih frekvencija iz Tabele 4 izracunati aritmeticku sredinu. Rješenje: a) Aritmeticka sredina intervalno uredene distribucije apsolutnih frekvencija se racuna po formuli:
∑=
=k
1iiiXf
N1
X .
Može se koristiti i distribucija relativnih frekvencija pri cemu je aritmeticka sredina suma proizvoda intervalnog obilježja i relativnih frekvencija:
∑=
=k
1iiiXrX .
29
Tabela broj 11. Proracun aritmeticke sredine
iX if ir iifX iirX
8 10 0,076 80 0,61 12 19 0,144 228 1,73 16 46 0,348 736 5,58 20 27 0,205 540 4,09 24 20 0,152 480 3,64 28 8 0,061 224 1,70 32 2 0,015 64 0,48 132 2352 17,82
cm82,172352132
1X ==
cm82,17X =
Znaci, aritmeticka sredina intervalno grupisanih podataka iznosi 17,82 cm.
Ponderisana aritmeticka sredina Zadatak 11 Na medustovarištu se nalazi nekoliko vrsta drvnih sortimenata bukve s razlicitim cijenama po m³: Tabela 12. Pregled sortimentinh zaliha na medjustovaristu Sortiment F L1 L2 I II III VS Kolicina (m³) 14 16 21 24 33 48 64 Cijena (KM) 246 196 141 101 85 61 56 Izracunati prosjecnu cijenu sortimenata na medustovarištu.
Rješenje:
Kako se radi o izracunavanju aritmeticke sredine za više podskupova, koristi se tzv. ponderisna aritmeticka sredina:
N21
NN2211N
1ii
N
1iii
P...PPXP...XPXP
P
XPX
++++++
==
∑
∑
=
= ,
gdje su iP - ponderi (težine) aritmeticke sredine pojedinih podskupova iX . U ovom slucaju aritmeticka sredina je:
KM74,9664483324211614
56*6461*4885*33101*24141*21196*16246*14X =
++++++++++++
=
30
Znaci, prosjecna cijena drvnih sortimenata na stovarištu iznosi 96,74 KM. Kvadratna sredina
Zadatak 12. Za statisticki skup varijable e1X iz Tabele 1. izracunati jednostavnu kvadratnu sredinu. Rješenje: Kvadratna sredina negrupisanih podataka predstavlja kvadratni korijen aritmeticke sredine sume kvadrata podataka:
N
XK
N
1e
2e∑
== .
cm66,18132
6,45942132
9,25...0,111,16K
222
==+++
=
Znaci, kvadratna sredina negrupisanih podataka prsnih promjera iznosi 18,66 cm.
Zadatak 13. Za intervalno uredenu distribuciju apsolutnih frekvencija iz Tabele 4 izracunati kvadratnu sredinu (prsni promjer srednjeg stabla po temeljnici). Rješenje: Kvadratna sredina intervalno uredene distribucije apsolutnih frekvencija se racuna po formuli:
∑=
=k
1i
2iiXf
N1
K
Tabela broj 13: Proracun kvadratne sredine
iX if 2iiXf
8 10 640 12 19 2736 16 46 11776 20 27 10800 24 20 11520 28 8 6272 32 2 2048 132 45792
cm63,1845792132
1K ==
Kvadratna sredina intervalno grupisanih podataka iznosi 18,63 cm. U šumarstvu se na ovaj nacin racuna tzv. prsni promjer srednjeg stabla po temeljnici.
31
Harmonijska sredina Zadatak 14. Tri radnika, pri istim uslovima rada, izvode kresanje grana. Za kresanje grana jednog stabla utroše razlicito vrijeme i to:
Radnik I II III Vrijeme (minuta) 10,4 16,6 12,3
a) Odrediti prosjecno utrošeno vrijeme za kresanje grana jednog stabala. b) Uz pretpostavku da je razlicit broj radnika vršio kresanje grana:
Broj radnika 4 12 15 5 Vrijeme (minuta) 10,4 11,6 15,1 9,9
izracunati prosjecno utrošeno vrijeme za kresanje grana jednog stabla.
Rješenje:
a) Kada se varijabla posmatrane pojave izražava reciprocnom vrijednošcu
eX1
koristi se harmonijska sredina H. U ovom slucaju koristi se jednostavna harmonijska sredina H:
∑=
=N
1e eX1
NH .
U našem primjeru je:
min62,1224,03
3,121
6,161
4,101
3H ==
++=
Prosjecno utrošeno vrijeme za kresanje grana jednog stabla je 12,62 minuta.
c) Ovdje se radi o složenoj harmonijskoj sredini jer je vrijednost iX javlja if puta:
∑=
=k
1i i
i
Xf
NH .
U našem primjeru je:
min34,1292,2
36
9,95
1,1515
6,1112
4,104
515124H ==
+++
+++=
U ovom slucaju, prosjecno utrošeno vrijeme za kresanje grana jednog stabla je 12,34 minuta.
32
Geometrijska sredina Zadatak 15. Godišnja proizvodnja pilanskih trupaca u jednom preduzecu šumarstva bila je:
Godina 1996 1997 1998 1999 2000 2001 Proizvodnja (u 000 m3) 7,8 8,9 11,3 12,8 13,9 14,9
Odrediti prosjecnu godišnju proizvodnju pilanskih trupaca. Rješenje: Kako se ovdje proizvodnja mijenja približno po zakonu geometrijske progresije, za izracunavanje prosjecne proizvodnje koristi se geometrijska sredina. Prosjecna godišnja proizvodnju pilanskih trupaca racuna se po formuli za jednostavnu geometrijsku sredinu G:
Ni
N
1e
XG Π=
=
Radi jednostavnosti izracunavanja geometrijske sredine, potrebno je izvršiti logaritmiranje predhodne jednacine:
N
XlogGlog
N
1ii∑
+= .
U našem primjeru je:
53,06
9,14log9,13log8,12log3,11log9,8log8,7logGlog =
+++++=
G= antilog (logG)
Prosjecna proizvodnja pilanskih trupaca je:
G=1,29m³.
33
Mjere varijacije Razmak varijacije
Zadatak 16 Izracunati razmak varijacije statistickog skupa iz Tabele 1. Rješenje: Razmak varijacije statistickog skupa xRV predstavlja razliku izmedu najvece i najmanje numericke vrijednosti u skupu:
cm7,28)2,69,32(RV
)XX(RV
x
x
=−=−= −+
Razmak varijacije statistickog skupa iznosi 28,7 cm.
Kvartilna devijacija Zadatak 17.
Izracunati kvartilnu devijaciju intervalnih frekvencija iz Tabele 4.
Rješenje:
Kvartilna devijacija distribucije intervalnih frekvencija Q je definirana sljedecom formulom:
2QQ
Q 13 −= ,
gdje su 1Q i 3Q prvi i treci kvartil u skupu. U našem primjeru je:
cm65,32
37,1467,21Q =
−= .
Znaci, kvartilna devijacija u analiziranom skupu je 3,65 cm.
10-90 percentilni razmak Zadatak 18.
Izracunati 10-90 percentilni razmak intervalnih frekvencija iz Tabele 4.
Rješenje:
10-90 percentilni razmak distribucije intervalnih frekvencija P je definiran formulom:
1090 PPP −= , gdje su 90P i 10P deseti i devedeseti percentil u skupu. U našem slucaju je:
cm85,1469,1054,25P =−= Znaci, 10-90 percentilni razmak u analiziranoj distribuciji frekvencija je 14,85 cm.
34
Srednje apsolutno odstupanje Zadatak 19. Izracunati :
a) Srednje apsolutno odstupanje statistickog skupa iz Tabele 1, b) Srednje apsolutno odstupanje distribucije intervalnih frekvencija iz Tabele 4.
Rješenje:
a) Srednje apsolutno odstupanje statistickog skupa je aritmeticka sredina apsolutnih vrijednosti odstupanja podataka od aritmeticke sredine:
∑=
−=N
1eex XX
N1
d
U našem slucaju:
( ) cm32,4132
66,57025,179,25...25,170,1125,171,16
N1
dx ==−++−+−=
Srednje apsolutno odstupanje statistickog skupa iznosi 4,32 cm.
b) Srednje apsolutno odstupanje distribucije intervalnih frekvencija:
XXfN1
d i
k
1iix −= ∑
=
Tabela broj 14: Proracun srednjeg apsolutnog odstupanja
iX if XXf ii −
8 10 98,2 12 19 110,5 16 46 83,6 20 27 58,9 24 20 123,6 28 8 81,5 32 2 28,4 132 584,7
cm4,47,584132
1dx ==
Znaci, srednje apsolutno odstupanje u analiziranom skupu je 4,4 cm.
35
Varijansa Zadatak 20.
Izracunati: a) Varijansu i standardnu devijaciju statistickog skupa iz Tabele 1, b) Varijansu i standardnu devijaciju distribucije intervalnih frekvencija iz Tabele
4. Rješenje:
a) Varijansa statistickog skupa je aritmeticka sredina kvadrata odstupanja podataka od aritmeticke sredine:
( )∑=
−=σN
1e
2e
2x XX
N1
.
U navedenom primjeru je:
( ) ( ) ( )( ) 08,30132
29,397125,179,25...25,170,1125,171,16
N1 2222
x ==−++−+−=σ
Varijansa analiziranog statistickog skupa iznosi 30,08. Standardna devijacija je kvadratni korijen varijanse:
( )2N
1ee
2xx XX
N1 ∑
=
−=σ=σ
=σx 48,508,30 = cm Standardna devijacija statistickog skupa iznosi 5,48 cm. Znaci, prosjecno odstupanje podataka od njhove aritmeticke sredine iznosi 5,48 cm.
b) Varijansa intervalno uredene distribucije frekvencija se racuna po formuli:
( )2i
k
1ii
2x XXf
N1
−=σ ∑=
po def.
Standardna devijacija intervalno uredene distribucije frekvencija se racuna po formuli:
( )2i
k
1ii
2xx XXf
N1
−=σ=σ ∑=
po def.
Pored ovog nacina, varijansa odnosno standardna devijacija mogu se racunati i pomocu tzv. radnih formula:
22i
k
1ii
2xx
22i
k
1ii
2x
XXfN1
XXfN1
−=σ=σ
−=σ
∑
∑
=
=,
odnosno,
36
)XfXXf(N1
)XfXXf(N1
k
1iii
2i
k
1ii
2xx
k
1iii
2i
k
1ii
2x
∑∑
∑∑
==
==
−=σ=σ
−=σ
Tabela broj 15. Proracun mjera varijabiliteta
iX if XX i − XXf ii − ( )2ii XXf −
8 10 -98,2 98,2 964,0 12 19 -110,5 110,5 643,2 16 46 -83,6 83,6 152,1 20 27 58,9 58,9 128,5 24 20 123,6 123,6 764,3 28 8 81,5 81,5 829,4 32 2 28,4 28,4 402,2 132 584,7 3883,6
U navedenom primjeru je:
- po definiciji:
cm42,542,29
42,296,3883132
1
x
2x
==σ
=⋅=σ
- po radnim formulama:
cm42,542,29
42,29)235282,1745792(132
1
cm42,542,29
42,2982,1745792132
1
x
2x
x
22x
==σ
=⋅−⋅=σ
==σ
=−⋅=σ
37
Ponderisana varijansa Zadatak 21: Za tri ogledne plohe )3,1o( = zasada smrce (A, B i C) iste starosti odredeni su:
A B C
ON 412,0 386,0 432,0
oX 14,2 15,4 13,6 2oσ 18,2 20,2 24,1
gdje su:
ON - broj stabala o-te ogledne plohe,
oX - aritmeticka sredina prsnih promjera stabala o-te ogledne ploha, 2oσ - varijansa prsnih promjera stabala o-te ogledne ploha.
Izracunati aritmeticku sredinu prsnih promjera i varijansu zajednickog skupa svih zasada.
Rješenje: Kako se radi o tri podskupa jednog zajednickog skupa, koriste se sljedece formule:
- aritmeticka sredina zajednickog skupa:
o
K
1ooXN
N1
X ∑=
=
o
K
1ooXN
N1
X ∑=
=
- varijansa zajednickog skupa:
( ) 222x σ+σ=σ tj.
( ) ( )
−+σ=σ ∑∑
==
K
1o
22oo
K
1o
2oo
2x XXN
N1
NN1
U našem slucaju je:
36,14176701230
1X == cm,
( ) 92,2066,25731230
12 ==σ ,
55,036,1420,2545221230
1 22 =
−=σ , pa je
47,2155,092,202
x =+=ς
38
Dakle, unutarnja varijansa (aritmeticka sredina varijansi zasada) iznosi 20,92. Vanjska varijansa (prosjecni kvadrat odstupanja aritmetickih sredina zasada od zajednicke aritmeticke sredine) iznosi 0,55. Opca varijansa skupa zasada iznosi 21,47.
Varijansa bi-varijantnog obilježja Zadatak 22. U jednom zasadu smrce registrovano je prisustvo/odsustvo bolesti (deformacija) stabala. Kod 120 stabala utvrdeno je prisustvo bolesti, dok kod 200 stabala nije utvrdeno prisustvo bolesti. Odrediti prosjecno prisustvo bolesti, te varijansu i standardnu devijaciju.
Rješenje:
Prisustvo/odsustvo osobine (pojave) na objektu se definira kao bi-varijantna varijabla, pri cemu se prisustvo bolesti pojave oznacava s 1X e = , a odsustvo pojave s
0X e = . Prosjecno prisustvo osobine (pojave) u skupu se racuna po formuli:
∑=
=n
1eeX
N1
X .
Varijansa bi-varijantne varijable racuna se po formuli:
pq2x =σ
pri cemu je: p - broj objekata s prisustvom pojave:
N
Xp
N
1ee∑
== ,
q - broj objekata s odsustvom pojave: p1q −= .
U navedenom primjeru je:
375,0320120
X == .
Prosjecna prisustvo bolesti u zasadu 0,375.
23,02x =σ
Varijansa prisustva bolesti u zasadu je 0,23.
48,0=σ Standardna devijacija prisustva bolesti u zasadu je 0,48.
39
Standardizacija varijable Zadatak 23:
a) Izvršiti transformaciju intervalnog obilježja iX Tabele 7 u standardiziranu varijablu iZ ,
b) Formulirati novi statisticki skup standardizirane varijable, c) Izracunati aritmeticku sredinu, varijansu i standardnu devijaciju standardizirane
distribucije frekvencija. Rješenje: a) Standardizirana varijabla je nova promjenjiva koja se dobije transformacijom originalnih podataka po formuli:
x
ii
XXZ
σ−
= .
U našem slucaju su:
cm82,17X = cm42,5x =σ
pa formiramo distribuciju standardizirane varijable:
Tabela 16. Standardizirana distribucija frekvencija.
iX if iZ IiZf ( )2ii ZZf −
8 10 -1,81 -18,10 32,76 12 19 -1,07 -20,38 21,86 16 46 -0,34 -15,42 5,17 20 27 0,40 10,86 4,37 24 20 1,14 22,79 25,98 28 8 1,88 15,02 28,19 32 2 2,62 5,23 13,67
132 0 132
b) Novi skup standardizirane varijable definiramo kao { }k,1iZZ i =≡ .
c) Iz Tabele 7 izracunavamo:
0132
0Z == ,
11321322
z ==σ .
40
Relativne mjere varijacije Interkvartilna devijacija
Zadatak 24: Izracunati koeficijent interkvartilne devijacije distribucije intervalnih frekvencija iz Tabele 4. Rješenje:
Koeficijent interkvartilne devijacije intervalno uredene distribucije frekvencija je:
100QQQQ
KQ31
13
+−
= .
U navedenom primjeru je:
%25,2210037,1467,2137,1467,21
KQ =⋅+−
= .
Relativna devijacija Zadatak 25: Izracunati:
a) Relativnu devijaciju statistickog skupa iz Tabele 1, b) Relativnu devijaciju distribucije intervalnih frekvencija iz Tabele 4.
Rješenje:
a) Relativna devijacija statistickog skupa RD je srednje apsolutno odstupanje izraženo u procentima aritmeticke sredine:
100Xd
RD = .
U navedenom primjeru je:
%04,2510025,1732,4
RD ==
Relativna devijacija statistickog skupa iznosi 25,04% .
b) Relativna devijacija intervalno uredene distribucije frekvencija je:
100Xd
RD x= .
U navedenom primjeru je:
%69,2410082,174,4
RD == .
Znaci, relativna devijacija u analiziranom skupu je 24,69%.
41
Koeficijent varijacije Zadatak 26: Izracunati:
a) Koeficijent varijacije statistickog skupa iz Tabele 1, b) Koeficijent varijacije distribucije intervalnih frekvencija iz Tabele 4.
Rješenje:
a) Koeficijent varijacije KV je standardna devijacija izražena u procentima aritmeticke sredine. Pomocu varijacionog koeficijenta utvrduje se u kom stepenu varira neka osobina.
%100X
KV xx
σ=
U primjeru neuredenog statistickog skupa koeficijent varijacije je:
%77,313177,025,1748,5
KVx ===
Koeficijent varijacije neuredenog statistickog skupa iznosi 31,77%. b) U primjeru intervalno uredenog statistickog skupa je:
%41,303041,082,1742,5
KV === .
Koeficijent varijacije intervalno uredenog statistickog skupa iznosi 31,77%.
42
Index biodiverziteta Zadatak 27. Koristeci podatke iz Tabele 17., odrediti:
a) Shannonov index biodiverziteta, b) Relativni diverzitet.
Tabela 17. Shannonov index biodiverziteta
Vrsta Frekvencija ip ( )iplog ( )ii plogp
Fagus 44 0,4536 -0,3433 -0,1557 Abies 12 0,1237 -0,9076 -0,1123 Picea 28 0,2887 -0,5396 -0,1558 Quercus 8 0,0825 -1,0837 -0,0894 Fraxinus 2 0,0206 -1,6857 -0,0348 Acer 3 0,0309 -1,5097 -0,0467
97 -0,5946 Rješenje: a) Shannonov index biodiverziteta predstavlja mjeru varijacije izmedu kategorija i
racuna se po formuli:
( )i
k
1ii plogpH ∑
=
−=′
U navedenom primjeru je: 59,0H =′
b) Relativni diverzitet (homogenitet) predstavlja proporciju izmedu prisutnog
diverziteta i maximalno moguceg diverziteta. Kod skupa sa jednakim frekvencijama u svim kategorijama, relativni diverzitet je jedanak jedan.
Racuna po formuli:
maxHH
J′
′=′ ,
pri cemu je:
( )klogHmax =′ . U navedenom primjeru je:
( ) 78,06logHmax ==′
76,078,059,0
J ==′
Znaci, u posmatranoj šumi sve vrste drveca nisu homogeno zastupljene, nego su neke vrste zastupljenije od drugih.
43
Mjere oblika distribucija frekvencija Asimetrija
Zadatak 28. Za distribuciju apsolutnih frekvencija iz zadataka 1.c) izracunati mjeru asimetrije. Rješenje:
Asimetrija distribucije frekvencija 3α se racuna po formuli:
3x
33 δ
µ=α
gdje je 3µ tzv. Momenat treceg reda.
( )3k
1iii3 XXf
N1 ∑
=
−=µ
Tabela broj 18. Proracun asimetrije
iX if ( )3ii XXf −
8 10 -9464,4 12 19 -3742,1 16 46 -276,5 20 27 280,4 24 20 4724,7 28 8 8444,3 32 2 5704,6 132 5671,1
27,042,596,42
96,421,56711321
33
3
==α
==µ
Data distribucija frekvencija ima pozitivnu (desnu) srednju asimetriju.
(Napomena: Moguci slucajevi asimetrije:
33 =α - simetricna distribucija frekvencija;
33 <α - negativan (lijeva) asimetrija ( )oe MMX ≤≤
33 >α - pozitivna (desna) asimetrija ( )oe MMX ≥≥
44
Spljoštenost Zadatak 29. Za distribuciju apsolutnih frekvencija iz zadataka 1.c) izracunati mjeru spljoštenosti.
Rješenje: Spljoštenost 4a se racuna po formuli:
4x
44 δ
µ=α ,
gdje je 44µ tzv. momenat cetvrtog reda:
( )4k
1iii4 XXf
N1 ∑
=
−=µ
Tabela broj 19. Proracun spljoštenosti
iX if ( )4ii XXf −
8 10 92923,2 12 19 21772,2 16 46 502,7 20 27 611,8 24 20 29207,5 28 8 85978,8 32 2 80901,7 132 311898,0
86,2362311898132
14 ==µ
73,242,5
86,236244 ==α
Data distribucija frekvencija je spljoštena.
(Napomena: Moguci slucajevi:
4α =3 - distribucija frekvencija normalno spljoštena;
4α <3 - distribucija frekvencija spljoštena (široka);
4α >3 - distribucija frekvencija izdužena (uska).)
45
TEORIJSKI RASPOREDI Normalni (Gaussovog) raspored
Zadatak 30. Za ispitivanu distribuciju frekvencija prsnih promjera odabrati model teorijskog rasporeda (provjeriti uvjete za primjenu modela normalnog (Gaussovog) rasporeda). Navesti model vjerovatnoce odabranog teorijskog rasporeda. Navesti opci model vjerovatnoce odabranog standardiziranog teorijskog rasporeda. Rješenje: Radi izbora odgovarajuceg teoretskog rasporeda potrebno je utvrditi tip varijable: neprekidna ili prekidna. U ovom primjeru varijabla je neprekidna, numericka. Nadalje, za empirijske distribucije frekvencija neprekidne numericke varijable potrebno je provjeriti odnos medijane, modusa i aritmeticke sredine, te velicine koeficijenata asimetrije i spljoštenosti. Ukoliko je empirijska distribucija frekvencija neprekidne numericke varijable, te
XMM oe == , 03 =α i 34 =α
za modeliranje analizirane empirijske distribucije frekvencija bira se normalni (Gaussov) teorijski raspored. U ovom slucaju:
XMM oe == ? 82,1735,1626,17 ≅≅ ,
03 =α ? 027,03 ≅=α , 34 =α ? 373,24 ≅=α .
Kako se ispitivana distribucija frekvencija odnosi na numericko, neprekidno obilježje, a uz to i približno zadovoljava navedene uvjete, odabran je teorijski model normalnog (Gaussovog) rasporeda. Model vjerovatnoce normalnog rasporeda je:
( )2
x
i XX
21
i e21
Xf
σ
−−
π= .
U konkretnom slucaju,
( )2
i
42,5
82,17X
21
i e21
Xf
−−
π= .
Opci model vjerovatnoce standardiziranog normalnog rasporeda je:
( )2Z
21
i e21
Zf−
π= .
46
Zadatak 31. Za transformirani standardizirani normalni raspored iz zadatka 10.: a) odrediti teorijske frekvencije ispitivane distribucije frekvencija metodom ordinata, b) nacrtati poligon empirijskih i teorijskih frekvencija, c) odrediti teorijske frekvencije ispitivane distribucije frekvencija metodom
površina. Rješenje: a) Kod odredivanja teorijskih frekvencija ispitivane distribucije frekvencija
metodom ordinata koriste se utablicene ordinate standardizirane normalne krive (Tablica 1). Za izracunate vrijednosti standardiziranog obilježja:
x
ii
XXZ
σ−
=
u Tablici ocitavaju se vrijednosti ( )iZf . Dalje je
( )ix
it ZfNd
fσ
= .
[ ]itf predstavlja cjelobrojnu zaokruženu vrijednost itf . Tabela 20. Proracun teorijskih frekvencija metodom ordinata
iX if iZ ( )iZf itf [ ]itf
8 10 -1,81 0,0775 7,55 8 12 19 -1,07 0,2251 21,91 22 16 46 -0,34 0,3765 36,65 37 20 27 0,40 0,3683 35,85 36 24 20 1,14 0,2083 20,28 21 28 8 1,88 0,0681 6,63 7 32 2 2,62 0,0129 1,25 2
132 130,12 132
47
b)
Grafikon 13. Empirijska i teorijska Gaussova distribucija frekvencija c) Kod odredivanja teorijskih frekvencija ispitivane distribucije frekvencija metodom površina koriste se utablicene površine ispod standardizirane normalne krive (Tablica2):
Za iZ <0 ? ( )kZiP =0,5- ( )iZP ; Za iZ >0 ? ( )kZiP = ( )iZP -0,5;
NPf iit = .
Tabela 21. Proracun teorijskih frekvencija metodom površina
iX if iZ ( )iZP ( )kiZP iP itf [ ]itf
6 -2,18 0,0146 0,4854 0,0205 2,71 3 8 10 -1,81 0,0351 0,4649 0,1072 14,15 14
12 19 -1,07 0,1423 0,3577 0,2246 29,65 30 16 46 -0,34 0,3669 0,1331 0,2885 38,08 38 20 27 0,4 0,6554 0,1554 0,2174 28,70 29 24 20 1,14 0,8729 0,3729 0,0971 12,82 13 28 8 1,88 0,9699 0,4699 0,0257 3,39 4
32 2 2,62 0,9956 0,4956 0,0030 0,40 1 34 2,99 0,9986 0,4986 0,9840 129,88 132
132 127,19 132
0
5
10
15
20
25
30
35
40
45
50
0 4 8 12 16 20 24 28 32 36 40 X (cm)
f
48
Zadatak 32. Pretpostavljajuci model standardiziranog normalnog rasporeda: a) odrediti vjerovatnocu da stablo ima prsni promjer: - veci od 30 cm,
- manji od 10 cm; b) odrediti vjerovatnocu da stablo ima prsni promjer izmedu 15 cm i 25 cm; c) odrediti prsni promjer d tako da je P(di>d)=0,95; d) odrediti prsni promjer stabla iznad kojeg se nalazi 10 % najdebljih stabala u
sastojini. Rješenje: a) Za cm30Xe =
25,242,5
82,1730Zi =
−=
( ) 0,0122 9878,0125,2ZP =−=≥ Tražena vjerovatnoca iznosi 1,22%. Znaci da u analiziranom skupu stabala 1,22% ili dva stabla imaju prsni promjer veci od 30 cm. Za cm10Xe =
44,142,5
82,1710Zi −=
−=
( ) ( ) 0,0749 9251,0144,1ZP44,1ZP =−=≥=−≤ Tražena vjerovatnoca iznosi 7,49%. Znaci da u analiziranom skupu stabala 7,49% ili deset stabala imaju prsni promjer manji od 10 cm. b) Za cm15X1 = 5200,0Z1 −= cm25X2 = 3247,1Z2 =
( ) ( ) ( )[ ] 6051,06985,019066,05200,0P13247,1P3247,1Z5200,0P =+−==−−−=−≤≤− Tražena vjerovatnoca je 60,51%. Znaci da u analiziranom skupu stabala 60,51% ili 80 stabala ima prsni promjer izmedu 15 i 25 cm. c) ( ) 95,0ZZP i =≥ ? 64,1Zi =
XZX xii +σ= cm73,26X i =
Znaci, u analiziranom skupu stabala 5% stabala ima prsni promjer veci od 26,73 cm.
d) ( ) 90,0ZZP 1 =≥ ? 28,1Z1 = XZX xii −σ=
cm76,24X1 = Znaci, u analiziranom skupu stabala 10% najdebljih stabala ima prsni promjer iznad 24,76 cm.
49
Binomni raspored Zadatak 33. U rasadniku je ispitivano preživljavanje 75 skupina od po 8 sadnica koje su tretirane hemijskim sredstvom:
iX if
0 21 1 26 2 19 3 6 4 2 5 0 6 1 7 0 8 0 75
a) odabrati model teorijskog rasporeda, b) izracunati teorijske frekvencije rasporeda, c) graficki predstaviti empirijsku i teorijsku distribuciju frekvencija. Rješenje:
a) U ovom slucaju radi se o numerickoj prekidnoj varijabli, stoga je potrebno provjeriti koji teorijski raspored za prekidne varijable najbolje odgovara analiziranoj empirijskoj distribuciji frekvencija. Ukoliko ispitivana distribucija frekvencija zadovoljava uvjete:
1) varijabla prekidna,
2) 1nX
0 ≤≤
3)
−≈σ
nX
1X2
odabire se binomni teorijski raspored. Kod analizirane distribucije frekvencija je:
1) varijabla prekidna,
2) 1828,1
0 ≤≤
3) 07,134,1 ≈ , što upucuje na zakljucak da analiziranom empirijskom rasporedu odgovara model teorijskog binomnog rasporeda.
50
b) Odredivanje teorijskih frekvencija
∑∑=
i
ii
f
XfX
28,17596
X ==
nX
p̂ =
16,0828,1
p̂ ==
P(X) se dobije ocitanjem iz Tablica i odnosi se na vjerovatnocu slucajeva za koje je X=0, 1, 2, 3... if̂ se dobije množenjem vjerovatnoce P(X) s brojem podataka:
( )NXPf̂i = .
[ ]itf predstavlja cjelobrojnu vrijednost if̂ . Tabela 22. Proracun teorijskih frekvencija binomnog rasporeda
iX if ( )XP if̂ [ ]itf
0 21 0,2479 18,591 19 1 26 0,3777 28,329 28 2 19 0,2518 18,886 19 3 6 0,0959 7,1946 7 4 2 0,0228 1,7130 2 5 0 0,0035 0,2610 0 6 1 0,0003 0,0249 0 7 0 2E-05 0,0014 0
8 0 4E-07 3E-05 0
75 75
51
c)
Grafik 14. Empirijska i teorijska binomna distribucija frekvencija
0
5
10
15
20
25
30
0 1 2 3 4 5 6 7 8
feft
52
REGRESIONA ANALIZA
Linearna regresija (korelacija) Zadatak 34. Provjerite, na osnovu dijagrama rasipanja tacaka i strucnog razmatranja, da li postoji korelaciona veza izmedu prsnog promjera i visine stabala ( )e2e1 X,X za 30 stabala datih u Tabeli 2. Na osnovu podataka o velicinama koreliranih varijabli ( )e2e1 X,X za 30 stabala iz Tabele 2. odaberite model regresije. Tabela 23. Regresiona analiza
e ( )e1X ( )e2X 1 6,2 10,5 2 30,2 34,5 3 6,8 8,5 4 21,2 24,5 5 8,3 10,5 6 15,8 14,0 7 10,2 11,5 8 22,4 22,0 9 11,4 10,0
10 16,3 17,0 11 12,5 12,0 12 23,5 25,5 13 12,6 10,0 14 16,5 15,0 15 18,4 18,5 16 24,4 26,0 17 14,1 12,5 18 17,3 16,0 19 19,6 22,0 20 22,6 22,0 21 14,7 15,5 22 19,4 18,5 23 22,3 24,5 24 23,5 27,0 25 20,1 19,0 26 26,8 32,5 27 28,1 35,5 28 24,7 23,5 29 26,6 30,0 30 24,8 28,0
53
0
5
10
15
20
25
30
35
40
0 5 10 15 20 25 30 35 X1 (cm)
X2 (m)
Grafik 15. Oblak rasipanja tacaka
54
Zadatak 35. Izracunajte parametre linearnog regresijskog modela metodom najmanjih kvadrata. Rješenje: Regresijski model:
( )e1e2 XfX =
Linearni regresijski model:
e1e2 bXaX̂ += Parametar a naziva se konstanta regresije. Parametra b naziva se koeficijent regresije.
Metod najmanjih kvadrata Analogno racunanju varijanse za jednu varijablu, kojom su minimizirani kvadrati odstupanja od prosjeka, odreduje se model linearne regresije tako da se suma kvadrata pojedinacnih odstupanja od pravca minimizira:
min)bXaX(X̂ 2e1e2e2 =−−=∑
Koeficijenti a i b se odreduju tako da suma kvadrata odstupanja od pravca bude minimalna po metodu najmanjih kvadrata. Za odredivanje minimuma, uzimamo parcijalne izvode po a i b i izjednacavamo ih s nulom. Parcijalni izvodi po a i b su:
( )b,aFbXaX̂ e1e2 =+=
( ) 01)bXaX(2aF
e1e2 =−−−=∂∂ ∑
0Xb1aX e1e2 =++− ∑∑∑
∑∑ =+ e2e1 XXbna ? I
( ) 0X)bXaX(2bF
e1e1e2 =−−−=∂∂ ∑
0XbXaXX 2e1e1e2e1 =++− ∑∑∑
∑∑∑ =+ e2e12e1e1 XXXbXa ? II
Na ovaj nacin se izvodi sistem normalnih jednacina (I i II), cijim se rješavanjem odreduju parametri a i b:
∑∑∑
∑∑
===
==
=+
=+
n
1ee2e1
n
1e
2e1
n
1ee1
n
1ee2
n
1ee1
XXXbXa
XXbna
55
Proracun parametara linearne regresije Koristeci jedan od poznatih matematickih nacina rješavanja sistema dvije linearne jednacine s dvije nepoznate odreduju se numericke vrijednosti parametara a i b. U ovom radu navodimo nekoliko primjera odredivanja parametara a i b.
I Gaussov metod eliminacije
( )
68,1adobijemoiprvuuuvrstimo15,1bslijedidrugeIz
30,561*50,59630*65,12563b)30,56113,11719*30(
50,596b30,561a30
I)30,561(II30
65,12563b13,11719a30,56150,596b30,561a30
2
−==
−=−
=+
−+
=+=+
II Normirani Gaussov metod
68,115,1*88,2038,22a
15,1b50,2b17,2
38,22b88,20a88,19b71,18a
30,56165,12563b13,11719a30,5613050,596b30,561a30
−=−=
==
=+−=−−
→=+−→=+
III Pomocu determinanti
Determinanta sistema ∆
2N
1ee1
N
1e
21eN
1e
2e1
N
1ee1
N
1ee1
XXnXX
Xn
−==∆ ∑∑
∑∑
∑==
==
=
21,3651630,56113,117193013,1171930,561
30,56130 2 =−×==∆
56
Determinanta uz konstantu regresije a
( ) ∑∑∑∑∑∑
∑∑====
==
== −==∆N
1ee1e2
N
1ee1
N
1e
21e
N
1ee2N
1e
2e1
N
1ee2e1
N
1ee1
N
1ee2
XXXXXXXX
XXa
( ) 70,6151530,56165,1256313,1171930,56113,1171965,12563
30,56130,561a −=×−×==∆
Konstanta regresija a
( )68,1
21,3651670,61515a
−=−
=∆
∆
Determinanta uz koeficijent regresije b
( ) ∑∑∑∑∑
∑===
==
= −==∆N
1ee2
N
1ee1
N
1ee2e1N
1ee2e1
N
1ee1
N
1ee2
XXXXnXXX
Xnb
( ) 05,4209450,59630,56165,125633065,1256330,561
50,59630b =×−×==∆
Koeficijent regresije b ( )
15,121,3651605,42094b
==∆
∆
IV Pomocu kovarijanse:
( )( )
( )( )( )
( )∑∑
∑
∑
−
−−=
−
−−
=σ
= 2
e1e1
e2e2e1e12
e1e1
e2e2e1e1
21
12
XX
XXXX
nXX
n
XXXXC
b
e1e2 XbaX +=
e1e2 XbXa −=
U datom primjeru je:
15,121,121710,1403
b ==
68,171,1815,188,19a −=×−=
57
Po odredivanju parametara izražavamo model linerane regresije:
e1e2 X15,168,1X̂ +−=
Koeficijent regresije b=1,15 znaci da s porastom prsnog promjera za 1 cm, visina raste za 1,15 m.
Standardna greška regresije Zadatak 36. Na osnovu podataka o velicinama koreliranih varijabli ( )e2e1 X,X za 30 stabala iz Tabele 2, izracunajte standardnu grešku linearne regresije. Rješenje: Standardne greške linearne regresije predstavlja prosjecno odstupanje empirijskih od procjenjenih vrijednosti. Proracun standardne greške linearne regresije vrši se:
- po definiciji:
( )
m23,299,430
88,149ss
n
X̂Xss
21.21.2
n
1e
2
e2e22
1.21.2
====
−==
∑=
Znaci da visine stabala prosjecno odstupaju 2,23 m od procjenjenih visina.
Determinacija Zadatak 37. Na osnovu podataka o velicinama koreliranih varijabli ( )e2e1 X,X za 30 stabala, izracunajte jacinu korelacione veze. Interpretirajte izracunati pokazatelj.
Rješenje:
Jacina veze izražava se determinacijom 2? .
91,030/34,176730/46,16172
22
22̂2
==ρ
σ
σ=ρ
Znaci, u konkretnom slucaju, modelom linearne regresije, variranje u visini objašnjava se sa 91 % variranjem prsnih promjera, a ostatak (7%) se odnosi na druge neobuhvacene faktore.
58
Koeficijent korelacije Zadatak 38. Odrediti stupanj meduzavisnosti prsnih promjera i visina.
Rjesenje: Meduzavisnost se izražava koeficijentom korelacije ? , koji predstavlja kvadratni
korijen iz determinacije ( 2? ). Izracunava se iz:
2ρ=ρ
U navedenom slucaju je:
96,091,0 ==ρ , što ukazuje na vrlo visok stupanj korelacije izmedu prsnih promjera i visina stabala.
59
Krivolinijska regresija (korelacija) Parametri modela krivolinjske regresije
Zadatak 39. Za podatake o velicinama koreliranih varijabli ( )e2e1 X,X za 20 stabala datih u Tabeli X , koristeci modele krivolinijske regresije odredite:
- parametre modela, - standardnu grešku regresije, - determinaciju i - index korelacije.
Tabela 24. Krivolinijska regresija - polinom drugog stupnja
n e1X e2X 2e1X e2e1 XX 3
e1X 4e1X e2
2e1 XX
e2*X̂
1 16,50 14,30 272,25 235,95 4492,1 74120,1 3893,2 15,8 2 17,40 15,40 302,76 267,96 5268 91663,6 4662,5 17 3 16,10 15,90 259,21 255,99 4173,3 67189,8 4121,4 15,2 4 17,50 17,60 306,25 308,00 5359,4 93789,1 5390 17,2 5 18,40 19,70 338,56 362,48 6229,5 114622,9 6669,6 18,4 6 15,80 15,30 249,64 241,74 3944,3 62320,1 3819,5 14,8 7 18,50 18,80 342,25 347,80 6331,6 117135,1 6434,3 18,5 8 15,60 13,30 243,36 207,48 3796,4 59224,1 3236,7 14,5 9 19,00 17,50 361,00 332,50 6859 130321 6317,5 19,2
10 15,40 12,20 237,16 187,88 3652,3 56244,9 2893,4 14,2 11 20,20 21,10 408,04 426,22 8242,4 166496,6 8609,6 20,7 12 14,70 15,50 216,09 227,85 3176,5 46694,9 3349,4 13,2 13 20,40 22,60 416,16 461,04 8489,7 173189,1 9405,2 21 14 14,10 12,90 198,81 181,89 2803,2 39525,4 2564,6 12,3 15 20,60 22,80 424,36 469,68 8741,8 180081,4 9675,4 21,2 16 13,60 14,00 184,96 190,40 2515,5 34210,2 2589,4 11,5 17 21,50 22,80 462,25 490,20 9938,4 213675,1 10539,3 22,4 18 13,60 10,50 184,96 142,80 2515,5 34210,2 1942,1 11,5 19 14,70 11,20 216,09 164,64 3176,5 46694,9 2420,2 13,2 20 23,50 23,20 552,25 545,20 12977,9 304980,1 12812,2 24,7 347,10 336,60 6176,41 6047,70 112683,24 2106388,5 111345,62 336,6
Rješenje: Krivolinijsku regresiju možemo izraziti polinomom k-tog stupnja:
je1
k
1jj0
*e2 XbbX̂ ∑
=
+= .
Polinom drugog stupnja: 2
e12e110e2 XbXbbX̂ ++=∗
60
Sistem normalnih jednacina za polinom drugog stupnja:
Proracun parametara modela: - Gausov metod eliminacije
( )( )
( )
44,12a01,2b02,0c
DEAKcCEFAIIEIIIADcCaA
600,336c41,6176b10,347a20
41,617650,210638820F
10,34741,617624,11268320E41,617610,34724,11268320C
10,34741,617620A
KFcEbI41,6176III20DcCaAI10,347II20600,336c41,6176b10,347a20
622,111345c50,2106388b24,112683a41,6176700,6047c24,112683b41,6176a10,347
600,336c41,6176b10,347a20
2
2
−=′=′
−=′
−=′−→−=′+′
=′+′+′
−×=
×−×=×−×=
−×=
=+→−+=′+′→−+
=′+′+′
=′+′+′=′+′+′
=′+′+′
∑∑ ∑∑
∑∑ ∑∑
∑∑ ∑
== ==
== ==
== =
=′+′+′
=′+′+′
=′+′+
n
1ee2
2e1
n
1e
n
1e
4e1
3e1
n
1e
2e1
n
1ee2e1
n
1e
n
1e
3e1
2e1
n
1ee1
n
1ee2
n
1e
n
1e
2e1e1
XXXcXbXa
XXXcXbXa
XXcXbna
61
- Normirani Gausov metod eliminacije
Dakle, odgovarajuca jednacina regresije polinoma drugog stupnja je:
2e1e1e2 X02,0X01,244,12X̂ −+−=∗
Standardna greška krivolinijske regresije
-po definiciji
( )
m42,102,220
36,40ss
n
X̂Xss
21.21.2
n
1e
2
e2e22
1.21.2
====
−==
∑=
∗
Determinacija 2?
- po definiciji
( )( )
87,020/08,31920/72,278
n/XX
n/X̂X
2
22
21.2̂
n
1e
2e2e2
n
1e
2
e2e22
==ρ
σ
σ=
−
−=ρ
∑
∑
=
=
∗
ili
44,1201,224,1802,004,341028,18a01,202,022,32198,1b
02,0c004,0c22,0
347,1c23,36b351,1c01,36b
89,0198,1c22,32b89,0IIII44,0/594,0c82,15b44,0III
III028,18c04,341b24,18aII424,17c64,324b79,17a
I830,16c82,308b36,17a41,6176/622,111345c50,2106388b24,112683a41,6176
10,347/700,6047c24,112683b41,6176a10,34720/600,336c41,6176b10,347a20
−=×−×−=′=×−=′
=′⇒=′
=′+′−=′−′−
→=′+′⇒+−→=′+′⇒+
⇒=′+′+′⇒=′+′+′
⇒−=′−′−′−→=′+′+′
→=′+′+′−→=′+′+′
62
-pomocu rezidualne varijanse:
87,020/08,319
20/36,401
s1
2
22
21.22
=−=ρ
σ−=ρ
U konkretnom slucaju, krivolinijskom korelacionom vezom (polinomom drugog stupnja) promjene u visini objašnjavaju se sa 93 % promjenama u prsnom precniku, a ostatak (7%) se duguje drugim neobuhvacenim faktorima.
Index korelacije ? -po definiciji
2ρ=ι
93,087,0 ==ι
Višestruka regresija Parametri modela višestruke linerane regresije
Zadatak 40: Na osnovu podataka o velicinama koreliranih varijabli )X,X,X( e3e2e1 (prsni promjer, visina, volumen stabla) za 30 stabala datih u Tabeli Y, odredite model višestruke (multiple) linearne regresije tj. odredite parametre funkcije izravnanja ( ( )e2e1e3 X,XfX̂ = ) metodom najmanjih kvadrata.
Rješenje:
Model višestruke (muliple) regresije ( )e2e1e3 X,XfX̂ = odnosi se na
e2e1e3 X*X*X̂ γ+β+α=
Sistem normalnih jednacina za proracun parametara jednacine višestruke regresije
)XX()X()X*X()X(
)XX()XX()X()X(
)X()X()X(N
n
1ee3e2
n
1e
n
1e
2e2e2e1
n
1ee2
n
1ee3e1
n
1e
n
1ee2e1
2e1
n
1ee1
n
1ee3
n
1e
n
1ee2e1
∑∑ ∑∑
∑∑ ∑∑
∑∑ ∑
== ==
== ==
== =
=γ+β+α
=γ+β+α
=γ+β+α
63
Tabela broj 25. Višestruka regresija
e e1X e2X e3X 2
e3X e3e1 XX 2e1X e3e2 XX 2
e2X e3e1 XX
1 16,12 14,93 0,15 0,02 2,35 259,88 2,17 223,01 2,35 2 10,98 10,54 0,05 0,00 0,52 120,55 0,50 111,04 0,52 3 18,98 18,53 0,25 0,06 4,75 360,42 4,64 343,31 4,75 4 24,41 27,60 0,62 0,38 15,06 596,06 17,02 761,52 15,06 5 24,00 26,81 0,58 0,34 13,90 576,16 15,53 718,58 13,90 6 26,82 32,55 0,88 0,77 23,54 719,11 28,57 1059,34 23,54 7 6,21 8,82 0,01 0,00 0,08 38,62 0,11 77,86 0,08 8 16,47 15,33 0,16 0,02 2,57 271,20 2,39 234,89 2,57 9 23,46 25,79 0,53 0,28 12,49 550,36 13,73 665,03 12,49
10 11,98 11,19 0,06 0,00 0,72 143,62 0,67 125,19 0,72 11 14,07 12,86 0,10 0,01 1,34 197,95 1,23 165,45 1,34 12 8,81 9,48 0,03 0,00 0,24 77,59 0,26 89,78 0,24 13 7,99 9,20 0,02 0,00 0,18 63,76 0,20 84,56 0,18 14 12,56 11,61 0,07 0,00 0,86 157,70 0,80 134,70 0,86 15 13,63 12,48 0,09 0,01 1,18 185,81 1,08 155,63 1,18 16 6,56 8,87 0,01 0,00 0,09 43,03 0,13 78,71 0,09 17 14,71 13,47 0,11 0,01 1,61 216,46 1,47 181,36 1,61 18 15,57 14,34 0,13 0,02 2,03 242,57 1,87 205,67 2,03 19 18,41 17,74 0,23 0,05 4,15 338,90 4,00 314,73 4,15 20 15,78 14,56 0,14 0,02 2,14 248,93 1,98 211,93 2,14 21 15,98 14,78 0,14 0,02 2,26 255,36 2,09 218,39 2,26 22 15,75 14,53 0,14 0,02 2,13 248,14 1,96 211,15 2,13 23 24,76 28,28 0,65 0,42 16,10 613,17 18,39 799,61 16,10 24 17,25 16,25 0,18 0,03 3,13 297,61 2,95 264,22 3,13 25 16,72 15,62 0,16 0,03 2,74 279,59 2,56 243,95 2,74 26 15,00 13,75 0,12 0,01 1,74 225,02 1,60 189,08 1,74 27 28,07 35,37 1,05 1,09 29,35 788,14 36,97 1251,04 29,35 28 22,25 23,63 0,44 0,19 9,77 495,22 10,37 558,57 9,77 29 30,20 40,49 1,38 1,92 41,81 911,80 56,06 1639,58 41,81 30 14,26 13,03 0,10 0,01 1,42 203,21 1,29 169,86 1,42
507,78 532,41 8,55 5,75 200,25 9725,93 232,60 11487,72 200,25
64
I nacin: Normiranje jednadžbi - Gausov metod eliminacije
II nacin : pomocu determinanti (Kramerovo pravilo)
212
22
212
212
1221 C
CC
−σσ=σ
σ=∆
( ) 231213222
223
1213 CCCC
CC−σ=
σ=β∆
( ) 13122321
2312
1321 CCC
CCC
−σ=σ
=γ∆
( )2e1e1
21 XX
n1
−=σ
( )2e1e1
21 XX
n1
−=σ
( )2e1e1
21 XX
n1
−=σ
( )( )∑ −−= e2e2e1e112 XXXXn1
C
e2e1e3 X061,0X03,029,0X̂
29,0061,0*577,21)03,0(*674,19437,003,0061,0*394,1055,0
061,0006,0100,0
055,0394,1049,0293,1
748,2152,0829,3748,2IIII228,2/109,0881,2228,2III
III437,0577,21674,19II7394,0628,20154,19
I285,0747,17925,16
4,5326,2327,114876,104744,5328,507/3,2006,104749,97258,507
306,84,5328,50730
+−=
=−−−=α−=−=β
=γ⇒=γ
=γ+β−=γ−β−
→=γ+β⇒+→=γ+β⇒+
⇒=γ+β+α⇒=γ+β+α
⇒−=γ−β−α−
→=γ+β+α→=γ+β+α
−→=γ+β+α
65
( )( )∑ −−= e3e3e1e113 XXXXn1
C
( )( )∑ −−= e3e3e2e223 XXXXn1
C
( )∆β∆
=β
( )∆γ∆
=γ
213 XXX γ−β−=α
74,18477,4897,67*71,3797,6777,4877,4871,37 2 =−==∆
( ) 64,577,48*69,297,67*85,197,6769,277,4885,1
−=−==β∆
( ) 37,1185,1*77,4869,2*71,3769,277,4885,171,37
=−==γ∆
03,074,18464,5
−=−
=β
06,074,184
37,11==γ
29,075,17*06,092,16*03,028,0 −=−−−=α
e2e1e3 X061,0X03,029,0X̂ +−=
66
Standardna greška višestruke linearne regresije Zadatak 41. Na osnovu podataka o velicinama koreliranih varijabli )X,X,X( e3e2e1 za 30 stabala, za višestruku linearnu regresiju odredite standardnu grešku regresije. Rješenje:
Proracun standardne greške višestruke regresije vrši se pomocu formule:
( )n
X̂Xs
n
1e
2
e3e3
12.3
∑=
−= .
U nasem slucaju:
312.3
12.3
m0332,0s
0011,0s
=
=
Znaci, prosjecno odstupanje zapremina stabala od ravni definirane prsnim promjerom i visinom stabala je 0,0332 m³.
Determinacija Zadatak 42. Na osnovu podataka o velicinama koreliranih varijabli )X,X,X( e3e2e1 za 30 stabala, za višestruku linearnu regresiju odredite mjere jacine krivolinijske regresije : determinaciju i index korelacije. Rješenje:
Proracun jacine višestruke korelacije vrši se
9951,09902,0
9902,01105,00011,0
1s
1
212.312.3
3212.3
2
12.32
==ρ=ρ
=−=σ
−=ρ
Komentar: U konkretnom slucaju, višestrukom korelacionom vezom promjene u volumenu stabla objašnjavaju se sa 99,02 % promjenama u prsnom promjeru i visini , a ostatak (0,98%) se duguje drugim neobuhvacenim faktorima.
67
Neto korelacije
Modeli neto regresija Zadatak 43. Odrediti modele neto regresije za zavisnost volumena stabala ( )e3X od prsnog promjera ( )e1X i visine stabala ( )e2X . Rješenje: Model višestruke linearne regresije:
e2e1e3 XXX̂ γ+β+α=
e2e1e3 X06,0X03,029,0X̂ +−=
Modeli parcijalnih linearnih regresija odnose se na:
(1) e2e112.3 XXX̂ γ+β+α=
75,17*06,0X03,029,0X̂ e112.3 +−=
e1e3 X03,035,1X̂ −=
(2) e2e121.3 XXX̂ γ+β+α=
ee212.3 X06,092,16*03,029,0X̂ +−=
e212.3 X06,099,50X̂ +−=
68
Neto korelacije Zadatak 44. Odrediti parcijalne korelacije izmedu volumena stabala ( )e3X i prsnog promjera ( )e1X i visine stabala ( )e2X ,pomocu determinanti (koeficijenata parcijalnih korelacija).
Rješenje:
Korelaciona matrica
=
1rrr1r
rr1
R
3231
2321
1312
( )( )
( ) ( )∑ ∑∑
−−
−−=
σσ=
2jejeieie
jejeieie
ji
ijij
XXXX
XXXXCr
2
9632,011,2039*34,1131
10,1463r12 ==
9067,031,3*34,1131
5221,55r13 ==
9835,031,3*11,2039
85,80r23 ==
Korelaciona matrica:
=
19835,09067,09835,019632,0
9067,09632,01
R
Determinanta korelacione matrice:
Minori:
0007,09835,09067,019632,0
9067,019067,0
9835,09632,09632,0
19835,09835,01
1Rdet =+−=
69
232
32
3211 r1
1rr1
M −==
0327,09835,0119835,0
9835,01M 2
11 =−==
1778,09067,0119067,0
9067,01M 2
22 =−==
0720,09632,0119632,0
9632,01M 2
33 =−==
Algebarski kofaktori:
( ) ijji
ij M1R +−=
0327,0R11 = 1778,0R 22 = 0720,0R33 =
Parcijalne korelacije
jjii
ijk.ij
RR
Rr
−=
13R =0,0406
11R =0,0327
33R =0,0720
8371,00720,0*0327,0
0406,0*1RR
R1r
3311
132.13 −=
−=
−=
23R =-0,1100
22R =0,1778
9720,01778,0
11,0*1RR
R1r
3322
231.23 =
−−=
−=
70
Tabela 25. Koeficijenti parcijalnih korelacija
( ) ( ) ( )e3e3e2e2e1e1 XXC,XXB,XXA −=−=−=
e1X e2X e3X A B C A² B² C² AB AC BC 16,12 14,93 0,15 -0,81 -2,81 -0,14 0,65 7,91 0,02 2,27 0,11 0,39 10,98 10,54 0,05 -5,95 -7,21 -0,24 35,36 51,97 0,06 42,87 1,41 1,71 18,98 18,53 0,25 2,06 0,78 -0,03 4,24 0,61 0,00 1,61 -0,07 -0,03 24,41 27,6 0,62 7,49 9,85 0,33 56,08 97,00 0,11 73,75 2,48 3,27 24,00 26,81 0,58 7,08 9,06 0,29 50,09 82,07 0,09 64,12 2,08 2,66 26,82 32,55 0,88 9,89 14,8 0,59 97,82 219,06 0,35 146,38 5,86 8,77 6,21 8,82 0,01 -10,71 -8,92 -0,27 114,74 79,62 0,07 95,58 2,92 2,43
16,47 15,33 0,16 -0,46 -2,42 -0,13 0,21 5,86 0,02 1,11 0,06 0,31 23,46 25,79 0,53 6,53 8,04 0,25 42,69 64,66 0,06 52,54 1,62 1,99 11,98 11,19 0,06 -4,94 -6,56 -0,22 24,42 43,01 0,05 32,41 1,11 1,47 14,07 12,86 0,10 -2,86 -4,88 -0,19 8,16 23,85 0,04 13,95 0,54 0,93 8,81 9,48 0,03 -8,12 -8,27 -0,26 65,90 68,42 0,07 67,15 2,09 2,13 7,99 9,20 0,02 -8,94 -8,55 -0,26 79,94 73,13 0,07 76,45 2,35 2,25
12,56 11,61 0,07 -4,37 -6,14 -0,22 19,08 37,71 0,05 26,83 0,95 1,33 13,63 12,48 0,09 -3,29 -5,27 -0,20 10,85 27,79 0,04 17,37 0,65 1,04 6,56 8,87 0,01 -10,37 -8,88 -0,27 107,46 78,77 0,07 92,00 2,81 2,40
14,71 13,47 0,11 -2,21 -4,28 -0,18 4,90 18,32 0,03 9,47 0,39 0,75 15,57 14,34 0,13 -1,35 -3,41 -0,15 1,83 11,60 0,02 4,60 0,21 0,53 18,41 17,74 0,23 1,48 -0,01 -0,06 2,20 0,00 0,00 -0,01 -0,09 0,00 15,78 14,56 0,14 -1,15 -3,19 -0,15 1,32 10,17 0,02 3,66 0,17 0,48 15,98 14,78 0,14 -0,95 -2,97 -0,14 0,89 8,81 0,02 2,81 0,14 0,43 15,75 14,53 0,14 -1,17 -3,22 -0,15 1,38 10,34 0,02 3,77 0,18 0,48 24,76 28,28 0,65 7,84 10,53 0,37 61,41 110,89 0,13 82,52 2,86 3,85 17,25 16,25 0,18 0,33 -1,49 -0,1 0,11 2,23 0,01 -0,49 -0,03 0,15 16,72 15,62 0,16 -0,21 -2,13 -0,12 0,04 4,53 0,01 0,44 0,02 0,26 15,00 13,75 0,12 -1,93 -4,00 -0,17 3,71 15,97 0,03 7,69 0,33 0,68 28,07 35,37 1,05 11,15 17,62 0,76 124,28 310,58 0,58 196,46 8,48 13,40 22,25 23,63 0,44 5,33 5,89 0,15 28,38 34,66 0,02 31,36 0,82 0,91 30,20 40,49 1,38 13,27 22,74 1,10 176,09 517,33 1,21 301,82 14,59 25,01 14,26 13,03 0,10 -2,67 -4,71 -0,19 7,13 22,22 0,03 12,59 0,50 0,88
507,78 532,41 8,55 1131,34 2039,11 3,31 1463,10 55,52 80,85
Korelacija ranga
Spearmanov koeficijent korelacije ranga
Zadatak 45. Dva sumarska inzinjera ocijenila su kvalitet deset razlicitih stabala hrasta koristeci skalu od 1 do 100. Ocjene za pojedina stabla predstavljena su u Tabeli 26:
71
Tabela 26. Ocjena kvaliteta stabala Osoba A Osoba B
Bodovi Rang Bodovi Rang Razlike 17 1 17 3 -2 24 3 15 1 2 27 4 30 4 0 19 2 16 2 0 37 6 38 5 1 44 7 44 7 0 56 8 70 9 -1 35 5 41 6 -1 72 9 68 8 1 88 10 91 10 0
Provjeriti postoji li, uz vjerovatnocu od 95%, statisticki znacajna razlika izvedenih ocjena izmedju ova dva sumarska inzinjera. Rjesenje: Posto je kvalitet stabala ocijenjen na osnovu skale ranga, za ocjenu signifikantnosti razlike koristi se tzv. Spirmanov (Spearman) koeficijent korelacije ranga:
( )1nn
d61r
2
2i
s −−= ∑
.
U nasem slucaju je:
( )927,0
11001012*6
1rs =−
−= .
Dobijenu vrijednost poredimo s tablicnom vrijednoscu datoj u Tabeli kriticnih vrijednosti Sprimanovog koeficijenta korelacije ranga :
564,0rT = .
Uocava se da je izracunata vrijednost Spirmanovog koeficijenta korelacije ranga veca od kriticne vrijednosti, te zakljucujemo da je korelacija statisticki znacajna, tj. da postoji znacajna povezanost izmedju nacina ocjenjivanja ova dva sumarska inzinjera.
72
Distribucije statistika uzoraka Zadatak 46. Pretpostavimo da osnovni skup cini pet stabala s visinama: 37, 42, 55, 50 i 46 m. a) Koliko ima razlicitih uzoraka od po dva stabla? Koji su to uzorci? Odrediti
aritmeticku sredinu visine osnovnog skupa. Odrediti procjenu aritmeticke sredine visine osnovnog skupa koristeci aritmeticke sredine visina uzoraka. Izracunati standardnu grešku aritmeticke sredine visine koristeci procjenu sredine uzorcima.
b) Koliko ima razlicitih uzorka od po cetiri stabla? Koji su to uzorci? Odrediti standardnu grešku aritmeticke sredine visine u ovom slucaju.
c) Uporediti standardne greške aritmeticke sredine visine pri navedene dvije velicine uzoraka.
Rješenje: a) Broj mogucih uzoraka bez ponavljanja elemenata u uzorku velicine n
( )!nN!n!N
nN
CNn −
=
=
Broj mogucih uzoraka velicine n=2: N=5 ; n=2;
( )10
24*5
!3*2!3*4*5
)1*2*3(*)1*2(1*2*3*4*5
!25!*2!5
C52 ====
−=
Moguci uzorci od po dva stabla u uzorku i njihove aritmeticke sredine visina: 37,42 m5,39X1 =
37,55 m0,46X2 = 37,50 m5,43X3 =
37,46 m5,41X4 = 42,55 m5,48X5 =
42,50 m0,46X6 =
42,46 m0,44X7 =
55,50 m5,52X8 =
55,46 m5,50X9 =
50,46 m0,48X10 =
Aritmeticka sredina osnovnog skupa ( )OX :
∑=
=N
1eeO X
N1
X
73
Aritmeticka sredina visine skupa od pet stabala:
m0,465
4650554237XO =
++++=
Procjena aritmeticke sredine osnovnog skupa uzorcima ( )( )XA :
( ) ∑ω
=ω=
1uuX
1XA
m0,4610
0,485,505,520,440,465,485,415,430,465,39XO =
+++++++++=
Varijansa sredina uzorka ( )( )XD2 :
( ) ( )2O
1u
2u
2 XX1
XD −ω
= ∑ω
=
Tabela 27. Proracun statistika uzorka uzoraka od po dva stabla
uX 2uX
39,5 1560,2 46,0 2116,0 43,5 1892,2 41,5 1722,2 48,5 2352,2 46,0 2116,0 44,0 1936,0 52,5 2756,2 50,5 2550,2 48,0 2304,0
460,0 21305,5
( ) 55,140,4655;2130XD 22 =−= Standardna devijacija aritmeticke sredine visine uzorka ( )XD :
( ) ( )XDXD 2=
( ) m81,3XD =
b) Broj mogucih uzoraka velicine n=4:
5!4
!4*5!1!*4
!5C5
4 ===
74
Tabela 28. Moguci uzorci
( )4,3,2,1iXi = iX 2iX
37, 42, 55, 50 46,00 2116,00 37, 55, 50, 46 47,00 2209,00 37, 42, 50, 46 43,75 1914,06 37, 42, 55, 46 45,00 2025,00 42, 55, 50, 46 48,25 2328,06
230,00 10592,10
Varijansa aritmeticke sredine visine uzorka stabala sacinjenog od aritmetickih sredina mogucih uzoraka od po cetiri stabla:
( ) 42,25
00,23010,10592
51
XD2
2 =
−=
Standardna devijacija aritmeticke sredine visine uzorka ( )XD : ( ) m56,1XD =
c) Što je veci uzorak, ocekuje se manji varijabilitet izmedu svih mogucih procjena uzorcima.
Procjene parametara osnovnog skupa pomocu uzorka Interval povjerenja aritmeticke sredine osnovnog skupa
Zadatak 47. Premjerom 24 probne površine velicine 1 ha u sastojini velicine 90 ha, utvrdene su sljedece velicine zalihe krupne drvne mase po ha :
316,7 304,4 315,3 236 301,4 174,6 151,9 266,5 269,1 306,8 193,4 209,2 186,7 313,4 316,5 308,5 189,3 220,7 254,9 197 189,6 186,9 211,5 248,9
a) Odrediti interval povjerenja, uz vjerovatnocu od 95 %, za: 1) prosjecnu zalihu sastojine, 2) totalnu zalihu sastojine, 3) totalnu vrijednost zalihe drvne mase sastojine ako je 1m³ drvne mase vrijedi
220 KM, b) Odrediti velicinu uzorka za tacnost procjene od 5%.
75
Rješenje: a) Za ocjenu intervala povjerenja potrebno je izracunati statistike uzorka.
Tabela 29. Proracun statistika uzorka
iX 2iX
316,73 100317,89 304,4 92659,36
315,25 99382,56 235,98 55686,56 301,41 90847,99 174,58 30478,18 151,92 23079,69 266,48 71011,59 269,06 72393,28 306,77 94107,83 193,42 37411,30 209,16 43747,91 186,7 34856,89
313,44 98244,63 316,52 100184,91 308,48 95159,91 189,31 35838,28 220,72 48717,32 254,92 64984,21 197,03 38820,82 189,59 35944,37 186,94 34946,56 211,5 44732,25
248,93 61966,14 5869,24 1505520,43
Intervala povjerenja
( ) ( )ucuoucu XDZXXXDZX +≤≤−
( )n
XD uu
σ= - standardna greška aritmeticke sredine uzoraka
- za n<30:
Nn
1n
tXX ouo −
σ±=
76
n
XX i
u∑= ? ha/m55,244
2424,5869
X 3u ==
( )
1n1n
XX
2i2
i
u −−
−=σ
∑ ∑
ha/3m24,5565,3051124
12424,5869
43,15055202
u ==−
−−
=σ
( ) ha/m27,112424,55
nXD 3x
u ==σ
=
068,2t 23,05.0 =
95% interval povjerenja za prosjecnu zalihu drvne mase sastojine
9024
12424,55
068,255,244 −− < OX <9024
12424,55
068,255,244 −+
224,59 m³/ha < OX < 264,51 m³/ha
b) 95% interval povjerenja za totalnu zalihu drvne mase sastojine
XNXT = ? 3T m5,220955,244*90X ==
nNnN
N2u22
u T
σ−=σ ? 38,755283
2465,3051
902490
9022u T
=−
=σ ? 3X m07,869
T=σ
07,869*068,25,2209 − < TX < 07,869*068,25,2209 +
20212,26 m³ < TX < 23806,74 m³
c) 95% interval povjerenja za vrijednost totalne zalihe drvne mase sastojine
CXX T* = ? KM4842090220*5,2209X* ==
C
TT X*X
σ=σ ? KM45,191195220*07,869*XT
==σ
45,191195*068,24842090 − < *X < 45,191195*068,24842090 +
77
444669,81 KM < *X < 5237482,19 KM
Zapaža se da najveca moguca razlika procjene zalihe od 4842090 KM od stvarne vrijednosti zalihe, na bazi uzorka navedene velicine, iznosi 395392,19 KM (8%).
d) Potrebna velicina uzorka ( )
2
2
E
KV*4n =
100X
KV uσ= ? 59,22100*
55,24424,55
KV ==
%5E =
825
59,22*4n 2
2≅=
Zadatak 48. Premjerom debljina 19 stabala obuhvacenih uzorkom ( stopa izbora 0,125) na oglednoj plohi, dobijene su sljedece statistike :
cm3,32Xu = cm9,7u =σ
Ocijenite uz vjerovatnocu od 95 %:
a) Interval povjerenja aritmeticke sredine osnovnog skupa, b) Interval povjerenja standardne devijacije osnovnog skupa,
Rjesenje: a) Ocjena intervala povjerenja aritmeticke sredine osnovnog skupa
Nn
1n
tXX ouo −
σ±=
stopa izbora=Nn
125,01199,7
101,23,32XU −±=
cm73,28X
cm86,35X
O
O
=
=−
+
Na bazi statistickog uzorka ,uz vjerovatnocu od 95 % procjenjujem da se
aritmeticka sredina osnovnog skupa krece u intervalu od 28,73 cm do 35,86 cm.
78
b) Ocjena intervala povjerenja standardne devijacije osnovnog skupa
( ) ( )ucuoucu DZXDZ σ+≤σ≤σ−σ
( )n2
D2u
uσ
=σ
Nn
1n2
t uuo −
σ±σ=σ
125,0119*29,7
101,29,7o −±=σ
cm38,5
cm42,10
o
o
=σ
=σ−
+
Na bazi statistickog uzorka ,uz vjerovatnocu od 95 % procjenjujem da se
standardna devijacija osnovnog skupa krece u intervalu od 5,38 cm do 10,42 cm.
Statisticki testovi t-test
Zadatak 49.
Na terenu su testirani uticaji dva razlicita feromona PH i IP. Pri tome su dnevno registrovane brojnosti ulovljenih potkornjaka: PH 4960 524 1290 892 2240 3480 2320 2560 625 4300 3440 2540 4500 IP 2760 296 777 457 2840 2960 1640 1524 107 2000 2220 2060 4400 Testirati znacajnost razlika ulova potkornjaka razlicitim feromonima. Rješenje: H0: 21 µ=µ (test parova) (Nema statisticki znacajne razlike izmedu prosjecnih ulova pri upotrebi dva feromona uz vjerovatnocu od 95%.) U ovom slucaju koristi se t-test parova:
dsd
t = ,
pri cemu je:
( )
( )1n*nn
dd
s
2j2
j
d −
−=
∑ ∑
Izracunata t- vrijednost se poredi s tablicnom t-vrijednoscu iz Tablica t-distribucije na osnovu odabrane vjerovatnoce i velicine uzorka.
79
Tabela 30. Proracun vrijednosti za test parova
PH IP jd 2
jd 4960 2760 2200 4840000 524 296 228 51984
1290 777 513 263169 892 457 435 189225
2240 2840 -600 360000 3480 2960 520 270400 2320 1640 680 462400 2560 1524 1036 1073296 625 107 518 268324
4300 2000 2300 5290000 3440 2220 1220 1488400 2540 2060 480 230400 4500 4400 100 10000
33671 24041 9630 14797598
35,365,22177,740
t ==
( ) 1n,1,05.0t − ? ( ) 78,1t 12,1,05.0 =
Zakljucak: Hipoteza se ne prihvata. Znaci, postoje statisticki znacajna razlika izmedu prosjecnog ulova potkornjaka s dva ispitivana feromona uz vjerovatnocu od 95%, odnosno nivo rizika od 5%.
80
Zadatak 50. Dati su prosjecne visine, varijanse i velicine dva uzorka iz sastojina smrce:
1X = 22 m, 1221 =σ , 1n =9 i
2X = 18 m, 1522 =σ , 2n =11.
Testirati razliku prosjecnih visina uzoraka uz vjerovatnocu od 95 %. Napisati zakljucak. Rješenje: OH : 21 XX = (test nezavisnih uzoraka) (Nema statisticki znacajnih razlika izmedu prosjecnih visina uzoraka dviju razlicitih sastojina uz vjerovatnocu od 95%.)
Testiranje razlike izmedu dvije aritmeticke sredine
21 XX
21s
XXt
−
−=
2
22
1
21
XX ns
ns
s21
+=− ? m09,21115
912
s21 XX =+=−
91,109,2
1822t =
−=
( ) 21 nn,2,05.0t + ? ( ) 09,2t 20,2,05.0 =
t < ( ) 21 nn,2,05.0t +
Hipoteza se ne odbacuje. Zakljucak: Ne postoje statisticki znacajne razlike izmedu prosjecnih visina u razlicitim sastojinama smrce.) Zadatak 51. Provjeriti da li se varijansa Uzorka 1 statisticki znacajno razlikuje od varijanse Uzorka 2 uz vjerovatnocu od 95 %, pri cemu su:
16n1 = ; 2521 =σ ,
11n 2 = ; 1022 =σ .
Rjesenje: U ovom slucaju primjenjuje se F-test, pri cemu se izracunata vrijednost
22
21 /F σσ=
5,210/25F == poredi s tablicnom vrijednoscu iz Tablica F distibucije
( ) 05,0n,n*
21F
( ) 85,2F 05,010;,15* =
Kako je *FF < zakljucujemo da nema statisticki znacajne razlike izmedju varijansi ovih uzoraka.
81
Višestruka poredenja Slucajni blok sistem – analiza varijanse
Zadatak 52. Registrovane su visine stabala tri razlicite provenijencije ariša.
1X 2X 3X 21,08 24,63 20,31 22,89 23,98 22,05 20,03 19,77 24,78 20,18 18,81 18,58 18,08 17,48 21,50
Provjeriti postoje li statisticki znacajne razlike u visinama stabala razlicitih provenijencija uz vjerovatnocu od 95%.
Rješenje: OH : 321 XXX == (Nema statisticki znacajnih razlika izmedu prosjecnih visina uzoraka tri razlicite provenijencije ariša uz vjerovatnocu od 95%.) Tabela 31. Jednostruka analiza varijanse ANOVA
Izvori varijacije SK df PK F P-value 2,05.0F
Izmedu grupa 2,4608 2 1,2304 0,1997 0,8217 3,8853 Unutar grupa 73,9393 12 6,1616 Ukupno 76,4001 14
8853,3F 2,05.0 = F=0,1997< 8853,3F 2,05.0 = Hipoteza se ne odbacuje. Zakljucak: Nema statisticki znacajnih razlika izmedu prosjecnih visina uzoraka tri razlicite provenijencije ariša uz vjerovatnocu od 95%.
82
Zadatak 53. Postavljen je slucajni blok plan radi testiranja razlicitih provenijencija ariša. Pri tome su registrovane prosjecne visine provenijencija u blokovima:
Provenijencija(P) / Blok I II III P1 14,50 21,75 20,60 P2 19,33 20,00 20,00 P3 16,25 19,60 20,25 P4 18,75 18,25 14,50 P5 17,20 20,33 20,00 P6 21,75 24,83 22,00 P7 17,50 18,88 25,17 P8 19,70 19,50 19,13 P9 13,83 16,25 23,17 P10 17,33 19,83 21,00
Provjeriti razlike u prosjecnim visinama razlicitih provenijencija ariša zasadenih u tri razlicita bloka. Rješenje:
OH : 321 XXX == (Nema statisticki znacajnih razlika izmedu prosjecnih visina blokova uz vjerovatnocu od 95%.)
OH : 1021 P.....PP === (Nema statisticki znacajnih razlika izmedu prosjecnih visina uzoraka deset razlicitih provenijencija ariša uz vjerovatnocu od 95%.) Tabela 32. Dvostruka analiza varijanse ANOVA
Izvori varijacije Sk df PK F P-value F crit Provenijencije 65,423 9 7,2692 1,2893 0,3078 2,4563 Blokovi 48,572 2 24,286 4,3073 0,0296 3,5546 Greška 101,49 18 5,6383 Total 215,48 29
Provenijencije
cijaprovenijenF < crit,cijaprovenijenF Hipoteza se ne odbacuje. Zakljucak: Nema statisticki znacajnih razlika izmedu prosjecnih visina uzoraka deset razlicitih provenijencija ariša uz vjerovatnocu od 95%.
83
Blokovi:
blokovaF > crit,blokovaF Hipoteza se ne prihvata. Zakljucak: Postoje statisticki znacajne razlike izmedu prosjecnih visina blokova uz vjerovatnocu od 95%. U ovom slucaju pristupa se multipom testu i to t-testu najmanjih znacajnih razlika (NZR): Tabela 33. Visestruka poredjenja prosjecnih visinaa blokova (NZR)
Blok I Blok J Razlika Prosjeka (I-J) Signifikantnost I II -2,3080(*) ,048 III -2,9680(*) ,013 II I 2,3080(*) ,048 III -,6600 ,558 III I 2,9680(*) ,013 II ,6600 ,558
* Razlika prosjeka je signifikantna na nivou od 0,05. Znaci, uz vjerovatnocu od 95% postoje statisticki signifikantne razlike izmedju prosjecnih visina blokova i to:
• prvog i drugog bloka i • prvog i treceg bloka.
84
Test saglasnosti teorijskih i empirijskih frekvencija χ2-test.
Zadatak 54. Za distribucije frekvencija date u Tabeli provjeriti hipotezu o saglasnosti empirijske distribucije frekvencija i teoretske Gaussove distribucije frekvencija . Rješenje:
OH : Nema statisticki znacajnih razlika izmedu empirijske distribucije frekvencija i teoretske Gaussove distribucije frekvencija uz vjerovatnocu od 95%.
( )∑ −
=χit
2iti2
fff
Tabela 34. Proracun vrijednosti za χ2-test.
if [ ]itf ( ) it2
iti f/ff − 10 8 0,50
19 22 0,40
46 37 2,18
27 36 2,25
20 21 0,04
8 7 0,14
130 130 5,54
5388,62 =χ
59,1226,05.0 =χ
5388,62 =χ < 59,1226,05.0 =χ
Hipoteza se ne odbacuje.
Zakljucak: Nema statisticki znacajnih razlika izmedu empirijske distribucije frekvencija i teoretske Gaussove distribucije frekvencija uz vjerovatnocu od 95%.
85
Ocjena znacajnosti koeficijenta regresije. Zadatak 55. U zadatku P iz dijela regresiona analiza ustanovljena je: - regresija
e1e2 X15,168,1X̂ +−= , - rezidalna varijansa:
99,4s21.2 =
- ukupna varijansa: =σ2
2 59,91. - broj parova podataka:
n=30. Provjeriti signifikantnost regresije uz vjerovatnocu od 95%.. Rjesenje: Signifikantnost regresije moze se provjeriti t-testom i to poredeci izracunatu vrijednost t:
bSEb
t = ,
22
21.2
b
sSE
σ=
s tablicnom vrijednoscu t za odabranu vjerovatnocu i za (n-2) stupnjeva slobode. U nasem slucaju je:
29,091,59
99,4SEb ==
95,329,015,1
t == .
Poredjenjem dobijene vrijednosti s tablicnom za 28 stupnjeva slobode i vjerovatnocu od 95% od 2,048 uocava se da je dobijena t-vrijednost veca od tablicne te zakljucuje da postoji statisticki znacajna regresija izmedju prsnog promjera i visine stabala.