Transcript
Page 1: ŠUMARSKA BIOMETRIKA SKRIPTA

ŠUMARSKI FAKULTET SARAJEVO Katedra za uredivanje šuma Šumarska biometrika Mr. Azra Cabaravdic, dipl.ing.

ŠUMARSKA BIOMETRIKA

Numericki primjeri

Sarajevo, 2003

Page 2: ŠUMARSKA BIOMETRIKA SKRIPTA

1

Sadržaj

UVOD

I. DESKRIPTIVNA STATISTIKA

Uredivanje statistickih skupova Graficko prikazivanje statistickih skupova Mjere centralne tendencije Mjere varijacije Mjere oblika distribucije frekevencija

II. TEORIJSKI RASPOREDI

Normalni raspored Binomski raspored

III. REGRESIONA ANALIZA

Linearna regresija Krivolinijska regresija Višestruka regresija Neto korelacije Korelacija ranga

IV. TEORIJA UZORAKA Distribucije statistika uzoraka Intervalne ocjene parametara osnovnog skupa Statisticki testovi

Page 3: ŠUMARSKA BIOMETRIKA SKRIPTA

2

UVOD

Pojam “biometrika” nastao je kao složenica od “bios”- živjeti i “metrein”- mjeriti.

Zar* naziva “biometrikom” (biostatistikom) statisticke metode primjenjive na biološke probleme. Pojam “šumarska biometrika “ odnosi se na skup statistickih metoda primjenjivih na izucavanje bioloških pojava (procesa) u šumarstvu.

Predmet istraživanja šumarske biometrike

Predmet biometrijskog istraživanja su masovne pojave. Masovne pojave u

šumarstvu predstavljaju skupovi stabala šumskog drveca, šumskih sastojina, biotskog svijeta šume (divljac, insekti) i sl.

Radi uocavanja zakonitosti koje se javljaju u prirodi, vrše se opažanja masovnih pojava i registruju njihove manifestacije.

Osnovni zadaci šumarske biometrike su: 1. Istraživanje metoda prikupljanja, obrade, prikazivanja i interpretacije

numerickih podataka masovnih pojava, 2. Ocjena vjerovatnoce pojave odredenog opažanja (dogadaja), 3. Postavljanje teorijske osnove za projektovanje istraživanja i experimenata.

Prikupljeni podaci o manifestacijama istraživane masovne pojave analiziraju se odgovarajucim naucnim statistickim metodama.

U šumarstvu se najcešce vrši istraživanje jedne masovne pojave, uzajamni odnosi dviju ili više masovnih pojava, te istraživanje karakteristika osnovnih skupova na osnovu uzoraka.

Podjela statistickih metoda

Za analiziranje navedenih pojava koriste se :

- deskriptivna statistika, - regresiona analiza i - teorija uzoraka.

Osnovni pojmovi

Osnovni pojmovi koji se javljaju u šumarskoj biometrici su: – statisticki skup, – biološki objekat (elemenat statistickog skupa), – varijabla (statisticko obilježje, varijabilno obilježje).

Kada se istraživana pojava okarakteriše pojmovno, prostorno i vremenski, govori se o statistickom skupu. Statisticki skup predstavlja skup istovrsnih bioloških objekata koji se medusobno razlikuju u odnosu na ispitivanu karakteristiku (osobinu, obilježje, atribut, varijablu) na odredenom podrucju u odredenom vremenskom okviru.

Biološke objekte (elemente statistickog skupa) u šumarstvu najcešce predstavljaju stabla, dijelovi stabala (debla, krošnje, listovi, cetine, cvjetovi, šišarke), skupine stabala, elementarne površine (experimentalne površine - ogledne plohe, površine odredene velicine: 1 ha, 1 ar i sl.), biljke, gljive, insekti, divljac.

Karakteristika istraživane pojave, koja se može razlikovati od jednog biološkog objekta do drugog, u ovom ce radu biti oznacena pojmom varijabla.

Page 4: ŠUMARSKA BIOMETRIKA SKRIPTA

3

Stabla se npr. medusobno razlikuju u mnogobrojinim karakteristikama koje variraju - varijablama (taxonomskoj pripadnosti – vrsti, starosti, debljini, visini, dužini debla, izgledu kore, boji kore, debljini kore, dužini krošnje, obliku krošnje, horizontalnoj projekciji krošnje, ukupnoj biomasi, biomasi dijelova stabala, prisustvu/odsustvu deformacija – bolesti i insekata i sl). Skupine stabala mogu varirati po prosjecnoj starosti, smjesi vrsta, omjeru smjese vrsta, ukupnoj zapremini drvne mase, prosjecnoj visini, prosjecnoj temeljnici i sl.

Elementarne površine u okviru šumskog gazdinstva variraju po prisustvu/odsustvu drvenastih biljnih vrsta, sastavu biljne zajednice, smjesi drvenastih biljnih vrsta, omjeru te smjese, prosjecnim velicinama debljine, visine, zapremine stabala, stupnju pokrivenosti tla krošnjama stabala, velicini biomase, biodiverzitetu i sl.

Mnogo je razlicitih varijabli koje su predmet istraživanja u šumarstvu, stoga se izvodi klasifikacija varijabli.

Tipovi bioloških podataka

Klasifikacija varijabli zasniva se na vrsti varijable. Osnovna podjela varijabli je

na: - kvantitativne (numericke) i - kvalitativne (atributivne, opisne).

Kvantitativne varijable izražavaju se numericki (brojem). Mogu biti neprekidne (kontinuirane) i prekidne (diskontinuirane, diskretne). Primjeri neprekidnih varijabli su debljine, visine, zapremine stabala, dužine debala, dužine krošanja, površine horizontalnnih projekcija krošanja po jedinici površine i sl. Primjeri prekidnih varijabli su broj stabala po jedinici površine, broj deformacija po stablu, broj insekata po jedinici lisne površine ili po stablu, broj insekata po klopki, broj divljaci po jedinici površine i sl.

Kvalititivne varijable izražavaju se opisno. Primjeri kvalitativnih varijabli su: pripadnost vrsti, pripadnost kategoriji, tip tla, oblik debla stabla, izgled kore, boja kore, boja lišca, cetina, oblik lišca, cetina i sl.

Na razlicite varijable primjenjuju se razlicite statisticke procedure. Vrsta statistickih procedura zavisi od skale varijable.

Skale podataka

Radi lakše preglednosti ustanovljene su sljedece skale: - nominalna skala, - ordinalna (skala ranga, redna) skala, - metricke skale:

- intervalna skala, - apsolutna (omjerna) skala.

Nominalna skala Nominalna skala upotrebljava se za analizu kvalitativnih varijabli. Varijabla može

biti npr. vrsta drveca. Tada razlicite vrste drveca sacinjavaju skalu. Služi za svrstavanje objekata (stabala) u klase (kategorije).

Page 5: ŠUMARSKA BIOMETRIKA SKRIPTA

4

Ordinalna skala Ordinalna skala (redna)(skala ranga) se upotrebljava kad je potrebno rangirati

objekte, odnosno klasificirati rang objekta pri cemu skala kvantificira objekte tako da su manji ili veci jedan od drugog po ispitivanoj varijabli (uzgojno-tehnicka klasifikacija stabala, tehnicka klasifikacija stabala, razvojni stupanj sastojine).

Metricke skale

Metricke skale odnose na numericka varijable. Mogu biti: intervalna skala i apsolutna skala.

Intervalna skala Intervalna skala predstavlja skalu s jednakim razlikama izmedu parova podataka,

ali nula tacka je proizvoljna (npr. prosjecna temperatura experimentalne površine).

Apsolutna skala Apsolutna skala je slicna intervalnoj skali, ali na ovoj skali postoji fizicka oznaka

nula tacke. Kako se mogu analizirati omjeri mjerenja, ova skala nosi naziv i mjerna skala (npr. težina, zapremina). Mjerna skala ukazuje na tacnu razliku izmedu objekata.

Ponekad podaci s ordinalne, intervalne ili apsolutne skale mjerenja mogu biti registrovani u kategorijama nominalne skale.

Takode je prakticno, gdje god je moguce, podatke ordinalne skale izraziti intervalnom ili apsolutnom skalom.

Skala varijable je presudna za statisticku analizu koja treba biti primjenjena. Najcešce se u šumarstvu vrši proucavanje masovnih pojava cije su manifestacije numericke neprekidne varijable metricke skale (Primjer 1).

Page 6: ŠUMARSKA BIOMETRIKA SKRIPTA

5

Primjer 1

U sastojini smrce u Han Pijesku 1990 godine, izvršeno je mjerenje velicina taxacionih elemenata stabala, i to: prsnog promjera stabla ( e1X ) i visine stabla ( e2X ) te je izvedena velicina zapremine stabla ( e3X ).

Za 132 stabla (biološka objekta) { } { }( )132,1eOO,....O,O e13221 =≡ u Tabeli 1

registrovani su podaci o velicinama prsnih promjera (varijable e1X ). Tabela 1. Baza podataka

e e1X (cm)

e e1X (cm)

e e1X (cm)

e e1X (cm)

e e1X (cm)

1 16,1 31 26,4 61 16,9 91 17,6 121 15,0 2 11,0 32 9,2 62 26,5 92 10,9 122 17,4 3 19,0 33 20,5 63 22,7 93 17,0 123 12,1 4 24,4 34 22,4 64 13,2 94 12,8 124 24,2 5 24,0 35 27,8 65 24,4 95 16,1 125 25,2 6 26,8 36 17,3 66 17,3 96 27,7 126 26,8 7 6,2 37 14,9 67 25,0 97 7,4 127 11,8 8 16,5 38 21,3 68 8,8 98 18,4 128 15,0 9 23,5 39 15,7 69 24,8 99 25,1 129 19,0 10 12,0 40 21,7 70 10,1 100 16,4 130 12,5 11 14,1 41 10,1 71 15,0 101 16,0 131 11,3 12 8,8 42 13,2 72 32,9 102 11,6 132 25,9 13 8,0 43 9,7 73 20,2 103 19,2 131 11,3 14 12,6 44 15,8 74 10,3 104 16,1 132 25,9 15 13,6 45 17,4 75 20,6 105 20,2 16 6,6 46 18,7 76 15,8 106 17,8 17 14,7 47 14,7 77 15,0 107 18,5 18 15,6 48 14,9 78 19,9 108 10,1 19 18,4 49 24,9 79 21,1 109 14,8 20 15,8 50 15,7 80 16,1 110 17,7 21 16,0 51 24,3 81 16,0 111 17,5 22 15,8 52 9,1 82 19,7 112 19,1 23 24,8 53 20,0 83 20,4 113 20,1 24 17,3 54 20,8 84 17,2 114 20,3 25 16,7 55 23,6 85 15,6 115 25,9 26 15,0 56 25,4 86 28,3 116 23,2 27 28,1 57 17,0 87 13,4 117 8,9 28 22,3 58 20,7 88 21,0 118 16,9 29 30,2 59 12,1 89 21,5 119 17,9 30 14,3 60 18,7 90 17,5 120 18,0

Page 7: ŠUMARSKA BIOMETRIKA SKRIPTA

6

Tabela 2. Pregled simbola u upotrebi Simbol Naziv simbola Znacenje simbola

eO Objekat

iX Numericka vrijednost i-tog obilježja

eX Numericka vrijednost e-tog objekta

ieX Numericka vrijednost i-tog obilježja e-tog objekta

ietX teta Numericka vrijednost i-tog obilježja e-tog objekta u t trenutku

N Broj podataka u skupu K Broj intervala d Dužina intervala

[ ]ii DL − Lijeva i desna granica i-tog intervala

if Apsolutna frekvencija i-tog intervala

ik Redni broj i-tog intervala

( )ii f,X Distribucija apsolutnih frekvencija

∑ Sigma Suma

ST Središnja tacka X Iks bar Prosjecna velicina, prosjek, aritmeticka sredina

iC Jedinicna cijena

eM Medijana

oM Modus, mod

H Harmonijska sredina G Geometrijska sredina RV Razmak varijacije Q Kvartilna devijacija P 10-90 percentilni razmak

xd Srednje apsolutno odstupanje

x2δ Sigma² Varijansa

xδ Sigma Standardna devijacija KQ Koeficijent interkvartilne devijacije RD Relativna devijacija

xKV Koeficijent varirijacije

eZ Standardizirana varijabla

H′ Index biodiverziteta J′ Relativni diverzitet

3α Alfa Asimetrija

4α Alfa Spljoštenost

ijC Kovarijansa 2

2.1S Rezidualna varijansa

2.1S Standardna greška regresije 2ρ ro² Determinacija

ρ ro Koeficijent korelacije

Page 8: ŠUMARSKA BIOMETRIKA SKRIPTA

7

sr Spirmanov koeficijent korelacije

2,1,05.0F νν Tablicna vijednost F distribucije

OX Aritmeticka sredina osnovnog skupa 2Oσ Varijansa osnovnog skupa

ω omega Broj uzoraka n Broj elemenata (podataka) u uzorku ( )XA Aritmeticka sredina aritmetickih sredina uzoraka

( )XD2 Varijansa aritmetickih sredina uzoraka

( )XD Standardna devijacija aritmetickih sredina uzoraka

uX Aritmeticka sredina uzorka

p Propocija ostvarenja q Proporcija neostvarenja

n,tα Tablicna vrijednost t distribucije

itf Teorijska frekvencija 2χ hi Hi kvadrat

Page 9: ŠUMARSKA BIOMETRIKA SKRIPTA

8

DESKRIPTIVNA STATISTIKA

Uredivanje statistickih skupova Zadatak 1.

Statisticki skup varijable e1X (prsni promjer (cm)) predstavljen u Tabeli 1. urediti u:

a) rastuci niz, b) distribuciju neintervalnih frekvencija, c) distribuciju intervalnih frekvencija (apsolutno, relativno, procentualno,

kumulativno, relativno kumulativno). Rješenje:

a) Formiranje rastuceg niza je prvi korak uredivanja statistickog skupa. Omogucava uvid u brojnost skupa i u velicine minimalne i maximalne numericke vrijednosti u statistickom skupu. Rastuci niz predstavlja numericki ureden niz podataka tako da je svaki naredni podatak veci ili jednak prethodnom:

1ee XX +≤ .

Rastucim nizom obuhvaceni svi podaci uredeni pocevši od minimalnog do maximalnog podatka:

+− ≤≤ XXX e .

Tabela 3. Rastuci niz:

6,2 <6,6 <7,4 <8,0 <8,8 =8,8 <8,9 <9,1 <9,2 <9,7 <10,1 =10,1 =10,1 <10,3

<10,9 <11,0 <11,3 <11,6 <11,8 <12,0 <12,1 =12,1 <12,5 <12,6 <12,8 <13,2 =13,2 <13,4

<13,6 <14,1 <14,3 <14,7 =14,7 <14,8 <14,9 =14,9 <15,0 =15,0 =15,0 =15,0 =15,0 <15,6

=15,6 <15,7 =15,7 <15,8 =15,8 =15,8 =15,8 <16,0 =16,0 =16,0 <16,1 =16,1 =16,1 =16,1

<16,4 <16,5 <16,7 <16,9 =16,9 <17,0 =17,0 <17,2 <17,3 =17,3 =17,3 <17,4 =17,4 <17,5

=17,5 <17,6 <17,7 <17,8 <17,9 <18,0 <18,4 =18,4 <18,5 <18,7 =18,7 <19,0 =19,0 <19,1

<19,2 <19,7 <19,9 <20,0 <20,1 <20,2 =20,2 <20,3 <20,4 <20,5 <20,6 <20,7 <20,8 <21,0

<21,1 <21,3 <21,5 <21,7 <22,3 <22,4 <22,7 <23,2 <23,5 <23,6 <24,0 <24,2 <24,3 <24,4

=24,4 <24,8 =24,8 <24,9 <25,0 <25,1 <25,2 <25,4 <25,9 =25,9 <26,4 <26,5 <26,8 =26,8

<27,7 <27,8 <28,1 <28,3 <30,2 <32,9

Rastucim nizom obuhvaceni svi podaci uredeni pocevši od minimalnog cm2,6X =− do maximalnog podatka cm9,32X =+ :

9,32XX2,6X e =≤≤= +− .

Page 10: ŠUMARSKA BIOMETRIKA SKRIPTA

9

b) Distribucija (raspodjela) neintervalnih frekvencija (broja ponavljanja) ( )vv n,X je ureden statisticki skup kod kojeg se za svaku numericku varijantu ( vX ) u skupu registruje broj ponavljanja te varijante (frekvencija) ( vn ). Distribucija neintervalnih ferkvencija prikazuje se tabelarno:

Tabela 4. Distribucija neintervalnih frekvencija

vX vn vX vn vX vn 6,2 1 16,5 1 22,4 1 6,6 1 16,7 1 22,7 1 7,4 1 16,9 2 23,2 1 8,0 1 17,0 2 23,5 1 8,8 2 17,2 1 23,6 1 8,9 1 17,3 3 24,0 1 9,1 1 17,4 2 24,2 1 9,2 1 17,5 2 24,3 1 9,7 1 17,6 1 24,4 2 10,1 3 17,7 1 24,8 2 10,3 1 17,8 1 24,9 1 10,9 1 17,9 1 25,0 1 11,0 1 18,0 1 25,1 1 11,3 1 18,4 2 25,2 1 11,6 1 18,5 1 25,4 1 11,8 1 18,7 2 25,9 2 12,0 1 19,0 2 26,4 1 12,1 2 19,1 1 26,5 1 12,5 1 19,2 1 26,8 2 12,6 1 19,7 1 27,7 1 12,8 1 19,9 1 27,8 1 13,2 2 20,0 1 28,1 1 13,4 1 20,1 1 28,3 1 13,6 1 20,2 2 30,2 1 14,1 1 20,3 1 32,9 1 14,3 1 20,4 1 132 14,7 2 20,5 1 14,8 1 20,6 1 14,9 2 20,7 1 15,0 5 20,8 1 15,6 2 21,0 1 15,7 2 21,1 1 15,8 4 21,3 1 16,0 3 21,5 1 16,1 4 21,7 1 16,4 1 22,3 1

Page 11: ŠUMARSKA BIOMETRIKA SKRIPTA

10

c) Distribucija intervalnih frekvencija se odnosi na ureden statisticki skup kod kojeg se podaci, radi preglednosti svrstavaju u intervale ( )ii DL − . Broj intervala (K) odreduje se pomocu formule:

Nlog3,312logNlog

1K +=+= ,

pri cemu se K zaokružuje na cijeli broj dajuci prednost susjednom neparnom cijelom broju.

U našem primjeru je: 7132log3,31K =+= .

Dužina intervala (d) predstavlja razmak izmedu gornje i donje granice intervala. Dužina intervala se odreduje po formuli:

KXX

d−+ −

= .

Prakticno je da dužina intervala bude izražena cijelim brojem.

U našem primjeru je: cm434,38

2,69,32d ≅=

−= .

Donja granica prvog interva la ( )1L i gornja granica posljednjeg intervala ( )kD treba da obuhvati sve podatke:

ke1 DXXXL ≤≤≤≤ +− . U našem primjeru je: ke1 D9,32X2,6L ≤≤≤≤ .

Donja granica prvog intervala treba da je manja ili jednaka najmanjoj numerickoj varijanti −X :

−≤ XL1 . U našem primjeru je: 2,6X6L1 =⟨= − .

Ostale donje granice intervala odreduju se po formuli:

dLL 1ii += − . U našem primjeru je: 1046L2 =+= ,

14410L3 =+= , 18414L4 =+=

...

Gornje granice intervala odreduju se po formuli: )1,0d(LD ii −+= .

U našem primjeru je: ( ) 9,91,046D2 =−+= ( ) 9,131,0410D3 =−+= ( ) 9,171,0414D4 =−+= ...

Page 12: ŠUMARSKA BIOMETRIKA SKRIPTA

11

Interval se aproksimira intervalnim obilježjem ( )iX koje se racuna po formuli:

2DL

X iii

+= .

U našem primjeru je: 82

99,96X1 =

+=

&

122

99,1310X 2 =

+=

&

162

99,1714X 3 =

+=

&

....

Distribucija intervalnih apsolutnih frekvencija Kada se za definirane intervale registruje broj podataka cija se numaricka

vrijednost nalazi u intervalu formira se intervalna distribucija apsolutnih frekvencija ( )ii f,X (Tabela 3). Suma frekvencija ( )if intervalno uredene distribucije apsolutnih frekvencija iznosi ukupan broj podataka N:

NfK

1ii =∑

=

.

Tabela 5. Intervalno uredenje statistickog skupa

( )ii DL − iX frekvencije if 6-9,9 8 IIIII IIIII 10

10-13,9 12 IIIII IIIII IIIII IIII 19 14-17,9 16 IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII I 46 18-21,9 20 IIIII IIIII IIIII IIIII IIIII II 27 22-25,9 24 IIIII IIIII IIIII IIIII IIIII 20 26-29,9 28 IIIII III 8 30-34 32 II 2

132

U našem primjeru je: 132f7

1ii =∑

=

.

Distribucija intervalnih kumulativnih frekvencija Distribucija intervalnih kumulativnih frekvenc ija ( )+

ii F,X je ureden statisticki skup kod koga se u svakom narednom intervalu kumuliraju (sabiraju) apsolutne frekvencije predhodnih:

∑=

+ =i

1jji fF .

U našem primjeru je: 10ffF 1

1

1jj1 === ∑

=

+ ,

Page 13: ŠUMARSKA BIOMETRIKA SKRIPTA

12

291910fffF 21

2

1jj2 =+=+== ∑

=

+ ,

75461910ffffF 321

3

1jj3 =++=++== ∑

=

+ ,

... Distribucija intervalnih kumulativnih frekvencija ( )−

ii F,X je ureden statisticki skup kod koga se u svakom narednom intervalu oduzimaju apsolutne frekvencije predhodnih uzimajuci da se prvom intervalu dodjeljuje ukupan broj podataka N.

U našem primjeru je: 132NF1 ==− ,

12210132fFF1

1ii12 =−=−= ∑

−− ,

10319122fFF2

1ii23 =−=−= ∑

=

−− ,

... Distribucija intervalnih relativnih kumulativnih frekvencija ( )Ii RF,X je ureden statisticki skup kod koga se relativne kumulativne frekvencije odreduju po formuli:

NF

RF ii = .

U našem primjeru je: 07,013210

RF1 ==+

22,013229

RF2 ==+

57,013275

RF3 ==+

... odnosno

1132132

RF1 ==−

92,0132122

RF2 ==−

78,0132103

RF3 ==− .

Distribucija intervalnih relativnih frekvencija ( )ii r,X je ureden statisticki skup kod koga se relativne frekvencije intervala odreduju po formuli:

Nf

r ii = .

U našem primjeru je: 076,013210

r1 ==

144,013219

r2 ==

348,013246

r3 == .....

Page 14: ŠUMARSKA BIOMETRIKA SKRIPTA

13

Suma relativnih frekvencija iznosi 1:

1rK

1ii =∑

=

.

U našem primjeru je: 1r7

1ii =∑

=

.

Distribucija intervalnih procentualnih frekvencija ( )ii p,X je ureden statisticki skup kod koga procentualne frekvencije odreduju po formuli:

Nf

100r100p iii == .

U našem primjeru je: 58,713210

100p i ==

39,1413219

100p i2 ==

85,3413246

100p3 ==

... Suma procentualnih frekvencija iznosi 100 :

100pK

1ii =∑

=

.

U našem primjeru je: 100p7

1ii =∑

=

.

Tabela 6. Distribucije intervalnih apsolutnih, kumulativnih, relativnih kumulativnih, relativnih i procentualnih frekvencija

ii DL − iX if +iF

+iRF −

iF −

iRF ir ip

6-9,9 8 10 10 0,07 132 1,00 0,076 7,58 10-13,9 12 19 29 0,22 122 0,92 0,144 14,39 14-17,9 16 46 75 0,57 103 0,78 0,348 34,85 18-21,9 20 27 102 0,77 57 0,43 0,205 20,45 22-25,9 24 20 122 0,92 30 0,23 0,152 15,15 26-29,9 28 8 130 0,98 10 0,07 0,061 6,06 30-34 32 2 132 1,00 2 0,01 0,015 1,52

132 1,000 100

Page 15: ŠUMARSKA BIOMETRIKA SKRIPTA

14

Graficko prikazivanje distribucija frekvencija Zadatak 2.

Distribucije frekvencija Tabele 4. predstaviti graficki i to:: a) distribuciju intervalnih apsolutnih frekvencija ( )ii f,X - poligonom, b) distribuciju intervalnih apsolutnih frekvencija ( )ii f,X - histogramom, c) distribucije intervalnih kumulativnih frekvencija - poligonom,

Koristeci graficki prikaz s dvije ose, predstaviti poligonima: d) distribucije intervalnih kumulativnih K+ i intervalnih relativnih

kumulativnih frekvencija i distribucije intervalnih kumulativnih K- i intervalnih relativnih kumulativnih frekvencija.

e) distribucije intervalnih apsolutnih i intervalnih relativnih frekvencija i distribucije intervalnih apsolutnih i intervalnih procentualnih frekvencija.

Rješenje: a) Poligon apsolutnih frekvencija je linijski grafikon kod koga se u koordinatnom sistemu linijski povežu tacke ( )ii f,X .

Grafik 1. Poligon apsolutnih frekvencija

0

5

10

15

20

25

30

35

40

45

50

0 4 8 12 16 20 24 28 32 36 40Xi(cm)

fi

Page 16: ŠUMARSKA BIOMETRIKA SKRIPTA

15

b) Histogram frekvencija predstavlja površinski poligon koji formira se tako što se dužina intervala koristi kao osnovica provaouganika ciju visina predstavlja apsolutna frekvencija intervala.

Grafik 2. Histogram apsolutnih frekvencija

0

5

10

15

20

25

30

35

40

45

50

6-9,9 10-13,9 14-17,9 18-21,9 22-25,9 26-29,9 30-34 Xi(cm)

fi

Page 17: ŠUMARSKA BIOMETRIKA SKRIPTA

16

c) Kumulante F+ i F- predstavljaju linijske poligone. Formiraju se tako da se: - Kod kumulante F+ linijski povežu tacke ( )+

Ii F,D i - Kod kumulane F- linijski povežu tacke ( )−

ii F,L .

Grafik 3. Kumulane F+ i F-

0

20

40

60

80

100

120

140

0 5 10 15 20 25 30 35 40Xi(cm)

N

F+F-

Page 18: ŠUMARSKA BIOMETRIKA SKRIPTA

17

d) Koristeci graficki prikaz s dvije y-ose moguce je predstaviti dva tipa distribucije frekvencija intervalno uredenog statistickog skupa. Pri tome se mogu koristiti kombinacije linijskog i površinskog grafikona.

Primjeri.

Grafik 4. Distribucije kumulativnih F+ i relativnih kumulativnih frekvencija RF+

Grafik 5. Distribucije kumulativnih F- i relativnih kumulativnih frekvencija RF-

0

20

40

60

80

100

120

140

6 8 12 16 20 24 28 32 Xi(cm)

F+

00,10,20,30,40,50,60,70,80,91RF+

F+RF+

0

20

40

60

80

100

120

140

8 12 16 20 24 28 32 34 Xi(cm)

F-

00,10,20,30,40,50,60,70,80,91

RF-

F-RF-

Page 19: ŠUMARSKA BIOMETRIKA SKRIPTA

18

Grafik 6. Distribucije apsolutnih i relativnih frekvencija

Grafik 7. Distribucije apsolutnih i procentualnih frekvencija

0

5

10

15

20

25

30

35

40

45

50

2 8 12 16 20 24 28 32 38Xi(cm)

f

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4r

fr

0

5

10

15

20

25

30

35

40

45

50

2 8 12 16 20 24 28 32 38Xi(cm)

f

0

5

10

15

20

25

30

35

40

p

fp

Page 20: ŠUMARSKA BIOMETRIKA SKRIPTA

19

Zadatak 3. Na terenu je registrovano prisustvo razlicitih vrsta drveca: Tabela 7. Prisustvo vrsta

Vrsta drveca Oznaka Frekvencije Fagus A 44 Abies B 12 Picea C 28 Quercus D 8 Fraxinus E 2 Acer F 3

Distribuciju frekvencija predstaviti graficki. Rješenje: Kako se u zadatku radi o podacima nominalne skale, ilustrativan je histogram frekvencija koji pokazuje distribuciju frekvencija kategorija.

Grafik 8. Histogram frekvencija Radi uocavanja procentualne zastupljenosti pojedinih vrsta drveca u posmatranom skupu koristi se kružni dijagram – strukturni krug:

Grafik 9. Strukturni krug

0

10

20

30

40

50

A B C D E F

f

A46%

B12%

C29%

D8%

E2%

F3%

Page 21: ŠUMARSKA BIOMETRIKA SKRIPTA

20

Zadatak 4. Izvršena je uzgojna klasifikacija 132 stabla za dvije razlicite vrste drveca A i B. Distribucije frekvencija u uzgojnim klasama su sljedece:

Tabela 8. Uzgojna klasifikacija stabala Frekvencije

Uzgojna klasa A B I 18 12 II 59 38 III 42 46 IV 13 36

Distribucije frekvencija predstaviti graficki. Rješenje: Kada se analiziraju distribucije frekvencija dva razlicita skupa istorodnih objekata može se koristiti uporedni histogram frekvencija. Pri tome se frekvencije pojedinih intervala (kategorija) razlicitih skupova prikazuju uporedo. U zadatku se radi o varijabli ordinalne skale pe se na x-osi nalaze kategorije ranga.

Grafik 10. Uporedni histogram frekvencija

0

10

20

30

40

50

60

I II III IV

f

AB

Page 22: ŠUMARSKA BIOMETRIKA SKRIPTA

21

Zadatak 5. U periodu 12.05.-08.09. 2000 vršena su registrovanja brojnosti potkornjaka:

Tabela 9. Ulov potkornjaka 12.05.00 19.05.00. 26.05.00. 02.06.00. 09.06.00. 16.06.00. 23.06.00. 30.06.00. 07.07.00. 1722 874 237 354 800 470 197 69 363

14.07.00. 21.07.00. 28.07.00. 04.08.00. 11.08.00. 18.08.00. 25.08.00. 01.09.00. 08.09.00.

86 30 61 90 38 91 70 77 70 Distribuciju frekvencija predstaviti graficki. Rješenje: Za graficko prikazivanje vremenskih serija mogu se koristiti linijski i površinski dijagrami. Pri tome se na x-osu nanose periodi (datumi) registrovanja pojave.

Grafik 11. Brojnost potkornjaka u periodu 12.05.-08.09.2001

0

200

400

600

800

1000

1200

1400

1600

1800

12.05.

00

19.05.

00.

26.05.

00.

02.06.

00.

09.06.

00.

16.06.

00.

23.06.

00.

30.06.

00.

07.07.

00.

14.07.

00.

21.07.

00.

28.07.

00.

04.08.

00.

11.08.

00.

18.08.

00.

25.08.

00.

01.09.

00.

08.09.

00.

f

Page 23: ŠUMARSKA BIOMETRIKA SKRIPTA

22

Zadatak 6. U sektorima od po 45º u odnosu na stajalište posmatraca, u toku jednog dana, registrovana je pojava ptica. Registrovani su podaci:

Tabela 10. Pojava ptica Sektor Frekvencija 0-45 66 45-90 29 90-135 9 135-180 10 180-225 14 225-270 146 270-315 290 315-360 201

Distribuciju frekvencija predstaviti graficki. Rješenje: Kod graficke predstave distribucija frekvencija koje se odnose na registraciju pojave u pojedinim sektorima može se koristiti polarni dijagram. Pri tome se na ose polarnog dijagrama (ose sektora) nanose pripadne frekvencije.

Grafik 12. Polarni dijagram

050

100150

200250

3000-45

45-90

90-135

135-180225-270

270-315

315-360

Page 24: ŠUMARSKA BIOMETRIKA SKRIPTA

23

Pozicione mjere centralne tendencije Zadatak 7. Za statisticki skup varijable e1X iz Tabele 1 odrediti pozicione mjere centralne tendencije:

a) središnju tacku, b) medijanu, c) modus.

Rješenje: a) Središnja tacka ST predstavlja središte geometrijske duži ( )+− X,X :

2XX

ST+− +

= .

Kako je u našem primjeru cm2,6X =− i cm9,32X =+ , to je središnja tacka:

cm55,192

9,322,6ST =

+= .

Znaci, središte geometrijske duži (6,2;32,9) je 19,55 cm. b) Medijana eM je poziciona mjera centralne tendencije. Medijana dijeli posmatrani statisticki skup na dva jednakobrojna podskupa. Odreduje se kada je statisticki skup ureden u rastuci (ili opadajuci) niz.

Kod statistickog skupa s neparnim brojem podataka medijana je vrijednost iz skupa koja se nalazi na poziciji:

21N +

, tj.

21Ne XM += .

Kod statistickog skupa s parnim brojem podataka potrebno je odrediti prvi i drugi centralni podatak:

cX - prvi centralni podatak,

1cX + - drugi centralni podatak, pri cemu je:

2N

c = .

Medijana je tada:

2XX

M 1cce

++= .

U našem primjeru je cm4,16X c = i cm5,16X 1c =+ , pa je medijana:

cm45,162

5,164,16M e =

+= .

Znaci, polovina podataka u skupu ima vrijednost manju od 16,45cm, dok su vrijednosti druge polovine skupa vece od 16,45cm.

Page 25: ŠUMARSKA BIOMETRIKA SKRIPTA

24

c) Modus oM je poziciona mjera centralne tendencije koja pokazuje koja se numericka varijanta najcešce javlja u statistickom skupu. Može se lako odrediti kod uredenog rastuceg niza ili neintervalno uredene distribucije frekvencija, pri cemu se registruje numericka varijanta koja se najcešce javlja (najveca frekvencija). Na osnovu Tabele 2. utvrdeno je da je modus 15,0 cm, tj.

cm0,15Mo = . Znaci, u analiziranom statistickom skupu najcešce se javlja numericka varijanta 15,0 cm.

Zadatak 8. Za intervalno uredenu distribuciju apsolutnih frekvencija (Tabele 4) izracunati:

a) medijanu, b) percentile 10%,35% i 90% , decil 2D i kvartile 321 Q,Q,Q , c) modus.

Rješenje: a) Kod intervalno uredene distribucije frekvencija medijana eM se dobije iz formule:

Me

1Me

Mee f

F2

1N

dLM−−

+

+=

pri cemu je:

MeL lijeva (niža) granica medijanskog intervala, d širina medijanskog intervala, N broj svih podataka u skupu,

1MeF − kumulativna frekvencija u predmedijanskom intervalu,

Mef frekvencija u medijanskom intervalu. Medijanski interval predstavlja interval u kome se nalazi N/2-ti podatak. Za naš primjer, korištenjem Tabele 4. odredujemo medijanski interval posmatrajuci kumulantu K+ i registrujuci interval u koji pada 132/2=61 podatak. To je interval (14-17,9). Zatim izracunavamo medijanu:

cm26,1746

292

1132

414M e =−

+

+= .

Znaci, 50 % stabala (61 stablo) ima prsni promjer manji od 17,26 cm. c) Percentili, decili i kvartili su pozicione mjere centralne tendencije kojima se odreduju vrijednosti koje skup dijele na podskupove cija brojnost odgovara odabranom procentu, desetom dijelu ili cetvrtini posmatranog skupa. Kod intervalno uredene distribucije frekvencija percentil je:

Page 26: ŠUMARSKA BIOMETRIKA SKRIPTA

25

( )

p

1p

pp f

F100

1N

dLP−

ρ

−+ρ

+= ,

gdje je: ρP - percentil,

pL - lijeva granica percentilnog intervala,

pd - dužina percentilnog intervala,

1pF − - kumulativna frekvencija u pred-percentilnom intervalu,

pf - apsolutna frekvencija percentilnog intervala.

Prvo je potrebno odrediti poziciju percentila ( )ρPP :

( ) ( )100

1NPP

+ρ=ρ .

U našem primjeru, za deseti percentil 10P kojim se skup brojno dijeli na podskupove u kojima se nalazi 10% podataka vrijednosti manjih od desetog percentila i 90% podataka vrijednosti vecih od desetog percentila, pozicija percentila je:

( ) ( )3,13

100113210

PP 10 =+

= ,

odnosno percentilni interval je interval u kome se nalazi 13,3 (14-ti) podatak. Posmatrajuci kumulativnu distribuciju frekvencija uocavamo da se 14-ti podatak nalazi u intervalu :

( ]9.13,10P10 ∈ . Korištenjem Tabele 4 izracunavamo 10-ti percentil 10P :

( )cm69,10

19

10100

113210

410P10 =−

+

+=

Znaci, 0% podataka u skupu ima vrijednost manju od 10,69cm. Za 35-ti percentil 35P :

( ) ( )55,46

100113235

PP 35 =+

= ? +3F =75 ? ( ]9.17,14P35 ∈

( )cm52,15

46

29100

113235

414P35 =−

+

+=

Znaci, 35% podataka u skupu ima vrijednost manju od 15,52cm.

Za 90-ti percentil 90P :

( ) ( )7,119

100113290

PP 90 =+

= ? +5F =122? ( ]9.25,22P90 ∈

( )cm54,25

20

102100

113290

422P90 =−

+

+=

Znaci, 90% podataka u skupu ima vrijednost manju od 25,54cm.

Page 27: ŠUMARSKA BIOMETRIKA SKRIPTA

26

Decili predstavljaju vrijednosti koje skup brojno dijele na desete dijelove. Mogu biti izraženi i kao percentili. Drugi decil 2D ustvari predstavlja 20-ti percentil 20P . U našem primjeru je:

( ) ( ) ( )6,26

100113220

PPDP 202 =+

== ? +2F =29? ( ]9.13,10P20 ∈

( )cm49,13

19

10100

113220

410PD 202 =−

+

+==

Znaci, 20% podataka u skupu ima vrijednost manju od 13,49cm.

Kvartili predstavljaju vrijednosti koje skup brojno dijele na 25% dijelove. Mogu biti izraženi i kao percentili. Npr. 1Q je ustvari 25-ti percentil, tj. 25P . Unašem primjeru se odreduje kao:

( ) ( ) ( )25,33

100113225

PPQP 251 =+

== ? +3F =75? ( ]9.17,14P25 ∈

( )cm37,14

46

29100

113225

414PQ 251 =−

+

+==

Znaci, prvi kvartil je 14,37cm, tj. 25% podataka u skupu ima vrijednost manju od 14,37 cm.

Drugi kvartil 2Q = 50P = eM :

( ) ( ) ( )5,66

100113250

MPPQP e502 =+

=== ? +3F =75? ( ]9.17,14P50 ∈

( )cm26,17

46

29100

113250

414PQ 502 =−

+

+==

Znaci, drugi kvartil je 17,26cm, tj. 50% podataka u skupu ima vrijednost manju od 17,26 cm.

Za treci kvartil je 3Q = 75P :

( ) ( ) ( )75,99

100113275

PPQP 753 =+

== ? +4F =102? ( ]9.21,18P75 ∈

( )cm67,21

27

75100

113275

418PQ 753 =−

+

+==

Znaci, treci kvartil je 21,67cm, tj. 75% podataka u skupu ima vrijednost manju od 21,67 cm.

Page 28: ŠUMARSKA BIOMETRIKA SKRIPTA

27

c) Kod intervalno uredene distribucije frekvencija modus oM se odreduje po formuli:

( ) ( )1MoMo1MoMo

1MoMoMoMoo ffff

fflLM

+−

−+−−

+= .

pri cemu je :

MoL = lijeva ( niža ) granica modalnog intervala

Mod = širina modalnog intervala

1Mof − = apsolutna frekvencija u predmodalnom intervalu

Mof = apsolutna frekvencija u modalnom intervalu

1Mof + = apsolutna frekvencija u postmodalnom intervalu

Modalni interval je interval s najvecom apsolutnom frekvencijom maxif , što je našem

slucaju: maxif =46,

pa je modus:

( ) ( )

cm35,1627461946

1946414M o =

−+−−

+=

Znaci, u datoj distribuciji frekvencija najcešce se javlja podatak 16,35 cm, tj. najveci broj stabala ima ve licinu prsnog promjera 16,35 cm. (Napomena: Kod intervalno urednih distribucija frekvencija potrebno ja proanalizirati i graficki prikaz distribucije apsolutnih frekvencija. Ukoliko se na grafickom prikazu uocava jedan najviši vrh – zakljucujemo da je distribucija frekvencija unimodalna i izracunavamo modus. Ukoliko se na grafickom prikazu uocava dva dominantna vrha – zakljucujemo da je distribucija frekvencija bimodalna i zakljucujemo da je modus neizvjestan. Ukoliko se na grafickom prikazu uocava više dominantnih vrhova – zakljucujemo da je distribucija frekvencija polimodalna i zakljucujemo da je modus neizvjestan.)

Page 29: ŠUMARSKA BIOMETRIKA SKRIPTA

28

Racunske (izvedene) mjere centralne tendencije

Aritmeticka sredina Zadatak 9. Za statisticki skup varijable e1X iz Tabele 1 izracunati aritmeticku sredinu. Rješenje: a) Aritmeticka sredina negrupisanih podataka predstavlja kolicnik sume svih podataka i ukupnog broja podataka:

N

XX

N

1ee∑

== .

U našem primjeru je:

cm25,17132

9,253,119,25...0,190,111,16X =

++++++=

Znaci, aritmeticka sredina negrupisanih podataka prsnih promjera iznosi 17,25 cm. Zadatak 10. Za intervalno uredenu distribuciju apsolutnih frekvencija iz Tabele 4 izracunati aritmeticku sredinu. Rješenje: a) Aritmeticka sredina intervalno uredene distribucije apsolutnih frekvencija se racuna po formuli:

∑=

=k

1iiiXf

N1

X .

Može se koristiti i distribucija relativnih frekvencija pri cemu je aritmeticka sredina suma proizvoda intervalnog obilježja i relativnih frekvencija:

∑=

=k

1iiiXrX .

Page 30: ŠUMARSKA BIOMETRIKA SKRIPTA

29

Tabela broj 11. Proracun aritmeticke sredine

iX if ir iifX iirX

8 10 0,076 80 0,61 12 19 0,144 228 1,73 16 46 0,348 736 5,58 20 27 0,205 540 4,09 24 20 0,152 480 3,64 28 8 0,061 224 1,70 32 2 0,015 64 0,48 132 2352 17,82

cm82,172352132

1X ==

cm82,17X =

Znaci, aritmeticka sredina intervalno grupisanih podataka iznosi 17,82 cm.

Ponderisana aritmeticka sredina Zadatak 11 Na medustovarištu se nalazi nekoliko vrsta drvnih sortimenata bukve s razlicitim cijenama po m³: Tabela 12. Pregled sortimentinh zaliha na medjustovaristu Sortiment F L1 L2 I II III VS Kolicina (m³) 14 16 21 24 33 48 64 Cijena (KM) 246 196 141 101 85 61 56 Izracunati prosjecnu cijenu sortimenata na medustovarištu.

Rješenje:

Kako se radi o izracunavanju aritmeticke sredine za više podskupova, koristi se tzv. ponderisna aritmeticka sredina:

N21

NN2211N

1ii

N

1iii

P...PPXP...XPXP

P

XPX

++++++

==

=

= ,

gdje su iP - ponderi (težine) aritmeticke sredine pojedinih podskupova iX . U ovom slucaju aritmeticka sredina je:

KM74,9664483324211614

56*6461*4885*33101*24141*21196*16246*14X =

++++++++++++

=

Page 31: ŠUMARSKA BIOMETRIKA SKRIPTA

30

Znaci, prosjecna cijena drvnih sortimenata na stovarištu iznosi 96,74 KM. Kvadratna sredina

Zadatak 12. Za statisticki skup varijable e1X iz Tabele 1. izracunati jednostavnu kvadratnu sredinu. Rješenje: Kvadratna sredina negrupisanih podataka predstavlja kvadratni korijen aritmeticke sredine sume kvadrata podataka:

N

XK

N

1e

2e∑

== .

cm66,18132

6,45942132

9,25...0,111,16K

222

==+++

=

Znaci, kvadratna sredina negrupisanih podataka prsnih promjera iznosi 18,66 cm.

Zadatak 13. Za intervalno uredenu distribuciju apsolutnih frekvencija iz Tabele 4 izracunati kvadratnu sredinu (prsni promjer srednjeg stabla po temeljnici). Rješenje: Kvadratna sredina intervalno uredene distribucije apsolutnih frekvencija se racuna po formuli:

∑=

=k

1i

2iiXf

N1

K

Tabela broj 13: Proracun kvadratne sredine

iX if 2iiXf

8 10 640 12 19 2736 16 46 11776 20 27 10800 24 20 11520 28 8 6272 32 2 2048 132 45792

cm63,1845792132

1K ==

Kvadratna sredina intervalno grupisanih podataka iznosi 18,63 cm. U šumarstvu se na ovaj nacin racuna tzv. prsni promjer srednjeg stabla po temeljnici.

Page 32: ŠUMARSKA BIOMETRIKA SKRIPTA

31

Harmonijska sredina Zadatak 14. Tri radnika, pri istim uslovima rada, izvode kresanje grana. Za kresanje grana jednog stabla utroše razlicito vrijeme i to:

Radnik I II III Vrijeme (minuta) 10,4 16,6 12,3

a) Odrediti prosjecno utrošeno vrijeme za kresanje grana jednog stabala. b) Uz pretpostavku da je razlicit broj radnika vršio kresanje grana:

Broj radnika 4 12 15 5 Vrijeme (minuta) 10,4 11,6 15,1 9,9

izracunati prosjecno utrošeno vrijeme za kresanje grana jednog stabla.

Rješenje:

a) Kada se varijabla posmatrane pojave izražava reciprocnom vrijednošcu

eX1

koristi se harmonijska sredina H. U ovom slucaju koristi se jednostavna harmonijska sredina H:

∑=

=N

1e eX1

NH .

U našem primjeru je:

min62,1224,03

3,121

6,161

4,101

3H ==

++=

Prosjecno utrošeno vrijeme za kresanje grana jednog stabla je 12,62 minuta.

c) Ovdje se radi o složenoj harmonijskoj sredini jer je vrijednost iX javlja if puta:

∑=

=k

1i i

i

Xf

NH .

U našem primjeru je:

min34,1292,2

36

9,95

1,1515

6,1112

4,104

515124H ==

+++

+++=

U ovom slucaju, prosjecno utrošeno vrijeme za kresanje grana jednog stabla je 12,34 minuta.

Page 33: ŠUMARSKA BIOMETRIKA SKRIPTA

32

Geometrijska sredina Zadatak 15. Godišnja proizvodnja pilanskih trupaca u jednom preduzecu šumarstva bila je:

Godina 1996 1997 1998 1999 2000 2001 Proizvodnja (u 000 m3) 7,8 8,9 11,3 12,8 13,9 14,9

Odrediti prosjecnu godišnju proizvodnju pilanskih trupaca. Rješenje: Kako se ovdje proizvodnja mijenja približno po zakonu geometrijske progresije, za izracunavanje prosjecne proizvodnje koristi se geometrijska sredina. Prosjecna godišnja proizvodnju pilanskih trupaca racuna se po formuli za jednostavnu geometrijsku sredinu G:

Ni

N

1e

XG Π=

=

Radi jednostavnosti izracunavanja geometrijske sredine, potrebno je izvršiti logaritmiranje predhodne jednacine:

N

XlogGlog

N

1ii∑

+= .

U našem primjeru je:

53,06

9,14log9,13log8,12log3,11log9,8log8,7logGlog =

+++++=

G= antilog (logG)

Prosjecna proizvodnja pilanskih trupaca je:

G=1,29m³.

Page 34: ŠUMARSKA BIOMETRIKA SKRIPTA

33

Mjere varijacije Razmak varijacije

Zadatak 16 Izracunati razmak varijacije statistickog skupa iz Tabele 1. Rješenje: Razmak varijacije statistickog skupa xRV predstavlja razliku izmedu najvece i najmanje numericke vrijednosti u skupu:

cm7,28)2,69,32(RV

)XX(RV

x

x

=−=−= −+

Razmak varijacije statistickog skupa iznosi 28,7 cm.

Kvartilna devijacija Zadatak 17.

Izracunati kvartilnu devijaciju intervalnih frekvencija iz Tabele 4.

Rješenje:

Kvartilna devijacija distribucije intervalnih frekvencija Q je definirana sljedecom formulom:

2QQ

Q 13 −= ,

gdje su 1Q i 3Q prvi i treci kvartil u skupu. U našem primjeru je:

cm65,32

37,1467,21Q =

−= .

Znaci, kvartilna devijacija u analiziranom skupu je 3,65 cm.

10-90 percentilni razmak Zadatak 18.

Izracunati 10-90 percentilni razmak intervalnih frekvencija iz Tabele 4.

Rješenje:

10-90 percentilni razmak distribucije intervalnih frekvencija P je definiran formulom:

1090 PPP −= , gdje su 90P i 10P deseti i devedeseti percentil u skupu. U našem slucaju je:

cm85,1469,1054,25P =−= Znaci, 10-90 percentilni razmak u analiziranoj distribuciji frekvencija je 14,85 cm.

Page 35: ŠUMARSKA BIOMETRIKA SKRIPTA

34

Srednje apsolutno odstupanje Zadatak 19. Izracunati :

a) Srednje apsolutno odstupanje statistickog skupa iz Tabele 1, b) Srednje apsolutno odstupanje distribucije intervalnih frekvencija iz Tabele 4.

Rješenje:

a) Srednje apsolutno odstupanje statistickog skupa je aritmeticka sredina apsolutnih vrijednosti odstupanja podataka od aritmeticke sredine:

∑=

−=N

1eex XX

N1

d

U našem slucaju:

( ) cm32,4132

66,57025,179,25...25,170,1125,171,16

N1

dx ==−++−+−=

Srednje apsolutno odstupanje statistickog skupa iznosi 4,32 cm.

b) Srednje apsolutno odstupanje distribucije intervalnih frekvencija:

XXfN1

d i

k

1iix −= ∑

=

Tabela broj 14: Proracun srednjeg apsolutnog odstupanja

iX if XXf ii −

8 10 98,2 12 19 110,5 16 46 83,6 20 27 58,9 24 20 123,6 28 8 81,5 32 2 28,4 132 584,7

cm4,47,584132

1dx ==

Znaci, srednje apsolutno odstupanje u analiziranom skupu je 4,4 cm.

Page 36: ŠUMARSKA BIOMETRIKA SKRIPTA

35

Varijansa Zadatak 20.

Izracunati: a) Varijansu i standardnu devijaciju statistickog skupa iz Tabele 1, b) Varijansu i standardnu devijaciju distribucije intervalnih frekvencija iz Tabele

4. Rješenje:

a) Varijansa statistickog skupa je aritmeticka sredina kvadrata odstupanja podataka od aritmeticke sredine:

( )∑=

−=σN

1e

2e

2x XX

N1

.

U navedenom primjeru je:

( ) ( ) ( )( ) 08,30132

29,397125,179,25...25,170,1125,171,16

N1 2222

x ==−++−+−=σ

Varijansa analiziranog statistickog skupa iznosi 30,08. Standardna devijacija je kvadratni korijen varijanse:

( )2N

1ee

2xx XX

N1 ∑

=

−=σ=σ

=σx 48,508,30 = cm Standardna devijacija statistickog skupa iznosi 5,48 cm. Znaci, prosjecno odstupanje podataka od njhove aritmeticke sredine iznosi 5,48 cm.

b) Varijansa intervalno uredene distribucije frekvencija se racuna po formuli:

( )2i

k

1ii

2x XXf

N1

−=σ ∑=

po def.

Standardna devijacija intervalno uredene distribucije frekvencija se racuna po formuli:

( )2i

k

1ii

2xx XXf

N1

−=σ=σ ∑=

po def.

Pored ovog nacina, varijansa odnosno standardna devijacija mogu se racunati i pomocu tzv. radnih formula:

22i

k

1ii

2xx

22i

k

1ii

2x

XXfN1

XXfN1

−=σ=σ

−=σ

=

=,

odnosno,

Page 37: ŠUMARSKA BIOMETRIKA SKRIPTA

36

)XfXXf(N1

)XfXXf(N1

k

1iii

2i

k

1ii

2xx

k

1iii

2i

k

1ii

2x

∑∑

∑∑

==

==

−=σ=σ

−=σ

Tabela broj 15. Proracun mjera varijabiliteta

iX if XX i − XXf ii − ( )2ii XXf −

8 10 -98,2 98,2 964,0 12 19 -110,5 110,5 643,2 16 46 -83,6 83,6 152,1 20 27 58,9 58,9 128,5 24 20 123,6 123,6 764,3 28 8 81,5 81,5 829,4 32 2 28,4 28,4 402,2 132 584,7 3883,6

U navedenom primjeru je:

- po definiciji:

cm42,542,29

42,296,3883132

1

x

2x

==σ

=⋅=σ

- po radnim formulama:

cm42,542,29

42,29)235282,1745792(132

1

cm42,542,29

42,2982,1745792132

1

x

2x

x

22x

==σ

=⋅−⋅=σ

==σ

=−⋅=σ

Page 38: ŠUMARSKA BIOMETRIKA SKRIPTA

37

Ponderisana varijansa Zadatak 21: Za tri ogledne plohe )3,1o( = zasada smrce (A, B i C) iste starosti odredeni su:

A B C

ON 412,0 386,0 432,0

oX 14,2 15,4 13,6 2oσ 18,2 20,2 24,1

gdje su:

ON - broj stabala o-te ogledne plohe,

oX - aritmeticka sredina prsnih promjera stabala o-te ogledne ploha, 2oσ - varijansa prsnih promjera stabala o-te ogledne ploha.

Izracunati aritmeticku sredinu prsnih promjera i varijansu zajednickog skupa svih zasada.

Rješenje: Kako se radi o tri podskupa jednog zajednickog skupa, koriste se sljedece formule:

- aritmeticka sredina zajednickog skupa:

o

K

1ooXN

N1

X ∑=

=

o

K

1ooXN

N1

X ∑=

=

- varijansa zajednickog skupa:

( ) 222x σ+σ=σ tj.

( ) ( )

−+σ=σ ∑∑

==

K

1o

22oo

K

1o

2oo

2x XXN

N1

NN1

U našem slucaju je:

36,14176701230

1X == cm,

( ) 92,2066,25731230

12 ==σ ,

55,036,1420,2545221230

1 22 =

−=σ , pa je

47,2155,092,202

x =+=ς

Page 39: ŠUMARSKA BIOMETRIKA SKRIPTA

38

Dakle, unutarnja varijansa (aritmeticka sredina varijansi zasada) iznosi 20,92. Vanjska varijansa (prosjecni kvadrat odstupanja aritmetickih sredina zasada od zajednicke aritmeticke sredine) iznosi 0,55. Opca varijansa skupa zasada iznosi 21,47.

Varijansa bi-varijantnog obilježja Zadatak 22. U jednom zasadu smrce registrovano je prisustvo/odsustvo bolesti (deformacija) stabala. Kod 120 stabala utvrdeno je prisustvo bolesti, dok kod 200 stabala nije utvrdeno prisustvo bolesti. Odrediti prosjecno prisustvo bolesti, te varijansu i standardnu devijaciju.

Rješenje:

Prisustvo/odsustvo osobine (pojave) na objektu se definira kao bi-varijantna varijabla, pri cemu se prisustvo bolesti pojave oznacava s 1X e = , a odsustvo pojave s

0X e = . Prosjecno prisustvo osobine (pojave) u skupu se racuna po formuli:

∑=

=n

1eeX

N1

X .

Varijansa bi-varijantne varijable racuna se po formuli:

pq2x =σ

pri cemu je: p - broj objekata s prisustvom pojave:

N

Xp

N

1ee∑

== ,

q - broj objekata s odsustvom pojave: p1q −= .

U navedenom primjeru je:

375,0320120

X == .

Prosjecna prisustvo bolesti u zasadu 0,375.

23,02x =σ

Varijansa prisustva bolesti u zasadu je 0,23.

48,0=σ Standardna devijacija prisustva bolesti u zasadu je 0,48.

Page 40: ŠUMARSKA BIOMETRIKA SKRIPTA

39

Standardizacija varijable Zadatak 23:

a) Izvršiti transformaciju intervalnog obilježja iX Tabele 7 u standardiziranu varijablu iZ ,

b) Formulirati novi statisticki skup standardizirane varijable, c) Izracunati aritmeticku sredinu, varijansu i standardnu devijaciju standardizirane

distribucije frekvencija. Rješenje: a) Standardizirana varijabla je nova promjenjiva koja se dobije transformacijom originalnih podataka po formuli:

x

ii

XXZ

σ−

= .

U našem slucaju su:

cm82,17X = cm42,5x =σ

pa formiramo distribuciju standardizirane varijable:

Tabela 16. Standardizirana distribucija frekvencija.

iX if iZ IiZf ( )2ii ZZf −

8 10 -1,81 -18,10 32,76 12 19 -1,07 -20,38 21,86 16 46 -0,34 -15,42 5,17 20 27 0,40 10,86 4,37 24 20 1,14 22,79 25,98 28 8 1,88 15,02 28,19 32 2 2,62 5,23 13,67

132 0 132

b) Novi skup standardizirane varijable definiramo kao { }k,1iZZ i =≡ .

c) Iz Tabele 7 izracunavamo:

0132

0Z == ,

11321322

z ==σ .

Page 41: ŠUMARSKA BIOMETRIKA SKRIPTA

40

Relativne mjere varijacije Interkvartilna devijacija

Zadatak 24: Izracunati koeficijent interkvartilne devijacije distribucije intervalnih frekvencija iz Tabele 4. Rješenje:

Koeficijent interkvartilne devijacije intervalno uredene distribucije frekvencija je:

100QQQQ

KQ31

13

+−

= .

U navedenom primjeru je:

%25,2210037,1467,2137,1467,21

KQ =⋅+−

= .

Relativna devijacija Zadatak 25: Izracunati:

a) Relativnu devijaciju statistickog skupa iz Tabele 1, b) Relativnu devijaciju distribucije intervalnih frekvencija iz Tabele 4.

Rješenje:

a) Relativna devijacija statistickog skupa RD je srednje apsolutno odstupanje izraženo u procentima aritmeticke sredine:

100Xd

RD = .

U navedenom primjeru je:

%04,2510025,1732,4

RD ==

Relativna devijacija statistickog skupa iznosi 25,04% .

b) Relativna devijacija intervalno uredene distribucije frekvencija je:

100Xd

RD x= .

U navedenom primjeru je:

%69,2410082,174,4

RD == .

Znaci, relativna devijacija u analiziranom skupu je 24,69%.

Page 42: ŠUMARSKA BIOMETRIKA SKRIPTA

41

Koeficijent varijacije Zadatak 26: Izracunati:

a) Koeficijent varijacije statistickog skupa iz Tabele 1, b) Koeficijent varijacije distribucije intervalnih frekvencija iz Tabele 4.

Rješenje:

a) Koeficijent varijacije KV je standardna devijacija izražena u procentima aritmeticke sredine. Pomocu varijacionog koeficijenta utvrduje se u kom stepenu varira neka osobina.

%100X

KV xx

σ=

U primjeru neuredenog statistickog skupa koeficijent varijacije je:

%77,313177,025,1748,5

KVx ===

Koeficijent varijacije neuredenog statistickog skupa iznosi 31,77%. b) U primjeru intervalno uredenog statistickog skupa je:

%41,303041,082,1742,5

KV === .

Koeficijent varijacije intervalno uredenog statistickog skupa iznosi 31,77%.

Page 43: ŠUMARSKA BIOMETRIKA SKRIPTA

42

Index biodiverziteta Zadatak 27. Koristeci podatke iz Tabele 17., odrediti:

a) Shannonov index biodiverziteta, b) Relativni diverzitet.

Tabela 17. Shannonov index biodiverziteta

Vrsta Frekvencija ip ( )iplog ( )ii plogp

Fagus 44 0,4536 -0,3433 -0,1557 Abies 12 0,1237 -0,9076 -0,1123 Picea 28 0,2887 -0,5396 -0,1558 Quercus 8 0,0825 -1,0837 -0,0894 Fraxinus 2 0,0206 -1,6857 -0,0348 Acer 3 0,0309 -1,5097 -0,0467

97 -0,5946 Rješenje: a) Shannonov index biodiverziteta predstavlja mjeru varijacije izmedu kategorija i

racuna se po formuli:

( )i

k

1ii plogpH ∑

=

−=′

U navedenom primjeru je: 59,0H =′

b) Relativni diverzitet (homogenitet) predstavlja proporciju izmedu prisutnog

diverziteta i maximalno moguceg diverziteta. Kod skupa sa jednakim frekvencijama u svim kategorijama, relativni diverzitet je jedanak jedan.

Racuna po formuli:

maxHH

J′

′=′ ,

pri cemu je:

( )klogHmax =′ . U navedenom primjeru je:

( ) 78,06logHmax ==′

76,078,059,0

J ==′

Znaci, u posmatranoj šumi sve vrste drveca nisu homogeno zastupljene, nego su neke vrste zastupljenije od drugih.

Page 44: ŠUMARSKA BIOMETRIKA SKRIPTA

43

Mjere oblika distribucija frekvencija Asimetrija

Zadatak 28. Za distribuciju apsolutnih frekvencija iz zadataka 1.c) izracunati mjeru asimetrije. Rješenje:

Asimetrija distribucije frekvencija 3α se racuna po formuli:

3x

33 δ

µ=α

gdje je 3µ tzv. Momenat treceg reda.

( )3k

1iii3 XXf

N1 ∑

=

−=µ

Tabela broj 18. Proracun asimetrije

iX if ( )3ii XXf −

8 10 -9464,4 12 19 -3742,1 16 46 -276,5 20 27 280,4 24 20 4724,7 28 8 8444,3 32 2 5704,6 132 5671,1

27,042,596,42

96,421,56711321

33

3

==α

==µ

Data distribucija frekvencija ima pozitivnu (desnu) srednju asimetriju.

(Napomena: Moguci slucajevi asimetrije:

33 =α - simetricna distribucija frekvencija;

33 <α - negativan (lijeva) asimetrija ( )oe MMX ≤≤

33 >α - pozitivna (desna) asimetrija ( )oe MMX ≥≥

Page 45: ŠUMARSKA BIOMETRIKA SKRIPTA

44

Spljoštenost Zadatak 29. Za distribuciju apsolutnih frekvencija iz zadataka 1.c) izracunati mjeru spljoštenosti.

Rješenje: Spljoštenost 4a se racuna po formuli:

4x

44 δ

µ=α ,

gdje je 44µ tzv. momenat cetvrtog reda:

( )4k

1iii4 XXf

N1 ∑

=

−=µ

Tabela broj 19. Proracun spljoštenosti

iX if ( )4ii XXf −

8 10 92923,2 12 19 21772,2 16 46 502,7 20 27 611,8 24 20 29207,5 28 8 85978,8 32 2 80901,7 132 311898,0

86,2362311898132

14 ==µ

73,242,5

86,236244 ==α

Data distribucija frekvencija je spljoštena.

(Napomena: Moguci slucajevi:

4α =3 - distribucija frekvencija normalno spljoštena;

4α <3 - distribucija frekvencija spljoštena (široka);

4α >3 - distribucija frekvencija izdužena (uska).)

Page 46: ŠUMARSKA BIOMETRIKA SKRIPTA

45

TEORIJSKI RASPOREDI Normalni (Gaussovog) raspored

Zadatak 30. Za ispitivanu distribuciju frekvencija prsnih promjera odabrati model teorijskog rasporeda (provjeriti uvjete za primjenu modela normalnog (Gaussovog) rasporeda). Navesti model vjerovatnoce odabranog teorijskog rasporeda. Navesti opci model vjerovatnoce odabranog standardiziranog teorijskog rasporeda. Rješenje: Radi izbora odgovarajuceg teoretskog rasporeda potrebno je utvrditi tip varijable: neprekidna ili prekidna. U ovom primjeru varijabla je neprekidna, numericka. Nadalje, za empirijske distribucije frekvencija neprekidne numericke varijable potrebno je provjeriti odnos medijane, modusa i aritmeticke sredine, te velicine koeficijenata asimetrije i spljoštenosti. Ukoliko je empirijska distribucija frekvencija neprekidne numericke varijable, te

XMM oe == , 03 =α i 34 =α

za modeliranje analizirane empirijske distribucije frekvencija bira se normalni (Gaussov) teorijski raspored. U ovom slucaju:

XMM oe == ? 82,1735,1626,17 ≅≅ ,

03 =α ? 027,03 ≅=α , 34 =α ? 373,24 ≅=α .

Kako se ispitivana distribucija frekvencija odnosi na numericko, neprekidno obilježje, a uz to i približno zadovoljava navedene uvjete, odabran je teorijski model normalnog (Gaussovog) rasporeda. Model vjerovatnoce normalnog rasporeda je:

( )2

x

i XX

21

i e21

Xf

σ

−−

π= .

U konkretnom slucaju,

( )2

i

42,5

82,17X

21

i e21

Xf

−−

π= .

Opci model vjerovatnoce standardiziranog normalnog rasporeda je:

( )2Z

21

i e21

Zf−

π= .

Page 47: ŠUMARSKA BIOMETRIKA SKRIPTA

46

Zadatak 31. Za transformirani standardizirani normalni raspored iz zadatka 10.: a) odrediti teorijske frekvencije ispitivane distribucije frekvencija metodom ordinata, b) nacrtati poligon empirijskih i teorijskih frekvencija, c) odrediti teorijske frekvencije ispitivane distribucije frekvencija metodom

površina. Rješenje: a) Kod odredivanja teorijskih frekvencija ispitivane distribucije frekvencija

metodom ordinata koriste se utablicene ordinate standardizirane normalne krive (Tablica 1). Za izracunate vrijednosti standardiziranog obilježja:

x

ii

XXZ

σ−

=

u Tablici ocitavaju se vrijednosti ( )iZf . Dalje je

( )ix

it ZfNd

= .

[ ]itf predstavlja cjelobrojnu zaokruženu vrijednost itf . Tabela 20. Proracun teorijskih frekvencija metodom ordinata

iX if iZ ( )iZf itf [ ]itf

8 10 -1,81 0,0775 7,55 8 12 19 -1,07 0,2251 21,91 22 16 46 -0,34 0,3765 36,65 37 20 27 0,40 0,3683 35,85 36 24 20 1,14 0,2083 20,28 21 28 8 1,88 0,0681 6,63 7 32 2 2,62 0,0129 1,25 2

132 130,12 132

Page 48: ŠUMARSKA BIOMETRIKA SKRIPTA

47

b)

Grafikon 13. Empirijska i teorijska Gaussova distribucija frekvencija c) Kod odredivanja teorijskih frekvencija ispitivane distribucije frekvencija metodom površina koriste se utablicene površine ispod standardizirane normalne krive (Tablica2):

Za iZ <0 ? ( )kZiP =0,5- ( )iZP ; Za iZ >0 ? ( )kZiP = ( )iZP -0,5;

NPf iit = .

Tabela 21. Proracun teorijskih frekvencija metodom površina

iX if iZ ( )iZP ( )kiZP iP itf [ ]itf

6 -2,18 0,0146 0,4854 0,0205 2,71 3 8 10 -1,81 0,0351 0,4649 0,1072 14,15 14

12 19 -1,07 0,1423 0,3577 0,2246 29,65 30 16 46 -0,34 0,3669 0,1331 0,2885 38,08 38 20 27 0,4 0,6554 0,1554 0,2174 28,70 29 24 20 1,14 0,8729 0,3729 0,0971 12,82 13 28 8 1,88 0,9699 0,4699 0,0257 3,39 4

32 2 2,62 0,9956 0,4956 0,0030 0,40 1 34 2,99 0,9986 0,4986 0,9840 129,88 132

132 127,19 132

0

5

10

15

20

25

30

35

40

45

50

0 4 8 12 16 20 24 28 32 36 40 X (cm)

f

Page 49: ŠUMARSKA BIOMETRIKA SKRIPTA

48

Zadatak 32. Pretpostavljajuci model standardiziranog normalnog rasporeda: a) odrediti vjerovatnocu da stablo ima prsni promjer: - veci od 30 cm,

- manji od 10 cm; b) odrediti vjerovatnocu da stablo ima prsni promjer izmedu 15 cm i 25 cm; c) odrediti prsni promjer d tako da je P(di>d)=0,95; d) odrediti prsni promjer stabla iznad kojeg se nalazi 10 % najdebljih stabala u

sastojini. Rješenje: a) Za cm30Xe =

25,242,5

82,1730Zi =

−=

( ) 0,0122 9878,0125,2ZP =−=≥ Tražena vjerovatnoca iznosi 1,22%. Znaci da u analiziranom skupu stabala 1,22% ili dva stabla imaju prsni promjer veci od 30 cm. Za cm10Xe =

44,142,5

82,1710Zi −=

−=

( ) ( ) 0,0749 9251,0144,1ZP44,1ZP =−=≥=−≤ Tražena vjerovatnoca iznosi 7,49%. Znaci da u analiziranom skupu stabala 7,49% ili deset stabala imaju prsni promjer manji od 10 cm. b) Za cm15X1 = 5200,0Z1 −= cm25X2 = 3247,1Z2 =

( ) ( ) ( )[ ] 6051,06985,019066,05200,0P13247,1P3247,1Z5200,0P =+−==−−−=−≤≤− Tražena vjerovatnoca je 60,51%. Znaci da u analiziranom skupu stabala 60,51% ili 80 stabala ima prsni promjer izmedu 15 i 25 cm. c) ( ) 95,0ZZP i =≥ ? 64,1Zi =

XZX xii +σ= cm73,26X i =

Znaci, u analiziranom skupu stabala 5% stabala ima prsni promjer veci od 26,73 cm.

d) ( ) 90,0ZZP 1 =≥ ? 28,1Z1 = XZX xii −σ=

cm76,24X1 = Znaci, u analiziranom skupu stabala 10% najdebljih stabala ima prsni promjer iznad 24,76 cm.

Page 50: ŠUMARSKA BIOMETRIKA SKRIPTA

49

Binomni raspored Zadatak 33. U rasadniku je ispitivano preživljavanje 75 skupina od po 8 sadnica koje su tretirane hemijskim sredstvom:

iX if

0 21 1 26 2 19 3 6 4 2 5 0 6 1 7 0 8 0 75

a) odabrati model teorijskog rasporeda, b) izracunati teorijske frekvencije rasporeda, c) graficki predstaviti empirijsku i teorijsku distribuciju frekvencija. Rješenje:

a) U ovom slucaju radi se o numerickoj prekidnoj varijabli, stoga je potrebno provjeriti koji teorijski raspored za prekidne varijable najbolje odgovara analiziranoj empirijskoj distribuciji frekvencija. Ukoliko ispitivana distribucija frekvencija zadovoljava uvjete:

1) varijabla prekidna,

2) 1nX

0 ≤≤

3)

−≈σ

nX

1X2

odabire se binomni teorijski raspored. Kod analizirane distribucije frekvencija je:

1) varijabla prekidna,

2) 1828,1

0 ≤≤

3) 07,134,1 ≈ , što upucuje na zakljucak da analiziranom empirijskom rasporedu odgovara model teorijskog binomnog rasporeda.

Page 51: ŠUMARSKA BIOMETRIKA SKRIPTA

50

b) Odredivanje teorijskih frekvencija

∑∑=

i

ii

f

XfX

28,17596

X ==

nX

p̂ =

16,0828,1

p̂ ==

P(X) se dobije ocitanjem iz Tablica i odnosi se na vjerovatnocu slucajeva za koje je X=0, 1, 2, 3... if̂ se dobije množenjem vjerovatnoce P(X) s brojem podataka:

( )NXPf̂i = .

[ ]itf predstavlja cjelobrojnu vrijednost if̂ . Tabela 22. Proracun teorijskih frekvencija binomnog rasporeda

iX if ( )XP if̂ [ ]itf

0 21 0,2479 18,591 19 1 26 0,3777 28,329 28 2 19 0,2518 18,886 19 3 6 0,0959 7,1946 7 4 2 0,0228 1,7130 2 5 0 0,0035 0,2610 0 6 1 0,0003 0,0249 0 7 0 2E-05 0,0014 0

8 0 4E-07 3E-05 0

75 75

Page 52: ŠUMARSKA BIOMETRIKA SKRIPTA

51

c)

Grafik 14. Empirijska i teorijska binomna distribucija frekvencija

0

5

10

15

20

25

30

0 1 2 3 4 5 6 7 8

feft

Page 53: ŠUMARSKA BIOMETRIKA SKRIPTA

52

REGRESIONA ANALIZA

Linearna regresija (korelacija) Zadatak 34. Provjerite, na osnovu dijagrama rasipanja tacaka i strucnog razmatranja, da li postoji korelaciona veza izmedu prsnog promjera i visine stabala ( )e2e1 X,X za 30 stabala datih u Tabeli 2. Na osnovu podataka o velicinama koreliranih varijabli ( )e2e1 X,X za 30 stabala iz Tabele 2. odaberite model regresije. Tabela 23. Regresiona analiza

e ( )e1X ( )e2X 1 6,2 10,5 2 30,2 34,5 3 6,8 8,5 4 21,2 24,5 5 8,3 10,5 6 15,8 14,0 7 10,2 11,5 8 22,4 22,0 9 11,4 10,0

10 16,3 17,0 11 12,5 12,0 12 23,5 25,5 13 12,6 10,0 14 16,5 15,0 15 18,4 18,5 16 24,4 26,0 17 14,1 12,5 18 17,3 16,0 19 19,6 22,0 20 22,6 22,0 21 14,7 15,5 22 19,4 18,5 23 22,3 24,5 24 23,5 27,0 25 20,1 19,0 26 26,8 32,5 27 28,1 35,5 28 24,7 23,5 29 26,6 30,0 30 24,8 28,0

Page 54: ŠUMARSKA BIOMETRIKA SKRIPTA

53

0

5

10

15

20

25

30

35

40

0 5 10 15 20 25 30 35 X1 (cm)

X2 (m)

Grafik 15. Oblak rasipanja tacaka

Page 55: ŠUMARSKA BIOMETRIKA SKRIPTA

54

Zadatak 35. Izracunajte parametre linearnog regresijskog modela metodom najmanjih kvadrata. Rješenje: Regresijski model:

( )e1e2 XfX =

Linearni regresijski model:

e1e2 bXaX̂ += Parametar a naziva se konstanta regresije. Parametra b naziva se koeficijent regresije.

Metod najmanjih kvadrata Analogno racunanju varijanse za jednu varijablu, kojom su minimizirani kvadrati odstupanja od prosjeka, odreduje se model linearne regresije tako da se suma kvadrata pojedinacnih odstupanja od pravca minimizira:

min)bXaX(X̂ 2e1e2e2 =−−=∑

Koeficijenti a i b se odreduju tako da suma kvadrata odstupanja od pravca bude minimalna po metodu najmanjih kvadrata. Za odredivanje minimuma, uzimamo parcijalne izvode po a i b i izjednacavamo ih s nulom. Parcijalni izvodi po a i b su:

( )b,aFbXaX̂ e1e2 =+=

( ) 01)bXaX(2aF

e1e2 =−−−=∂∂ ∑

0Xb1aX e1e2 =++− ∑∑∑

∑∑ =+ e2e1 XXbna ? I

( ) 0X)bXaX(2bF

e1e1e2 =−−−=∂∂ ∑

0XbXaXX 2e1e1e2e1 =++− ∑∑∑

∑∑∑ =+ e2e12e1e1 XXXbXa ? II

Na ovaj nacin se izvodi sistem normalnih jednacina (I i II), cijim se rješavanjem odreduju parametri a i b:

∑∑∑

∑∑

===

==

=+

=+

n

1ee2e1

n

1e

2e1

n

1ee1

n

1ee2

n

1ee1

XXXbXa

XXbna

Page 56: ŠUMARSKA BIOMETRIKA SKRIPTA

55

Proracun parametara linearne regresije Koristeci jedan od poznatih matematickih nacina rješavanja sistema dvije linearne jednacine s dvije nepoznate odreduju se numericke vrijednosti parametara a i b. U ovom radu navodimo nekoliko primjera odredivanja parametara a i b.

I Gaussov metod eliminacije

( )

68,1adobijemoiprvuuuvrstimo15,1bslijedidrugeIz

30,561*50,59630*65,12563b)30,56113,11719*30(

50,596b30,561a30

I)30,561(II30

65,12563b13,11719a30,56150,596b30,561a30

2

−==

−=−

=+

−+

=+=+

II Normirani Gaussov metod

68,115,1*88,2038,22a

15,1b50,2b17,2

38,22b88,20a88,19b71,18a

30,56165,12563b13,11719a30,5613050,596b30,561a30

−=−=

==

=+−=−−

→=+−→=+

III Pomocu determinanti

Determinanta sistema ∆

2N

1ee1

N

1e

21eN

1e

2e1

N

1ee1

N

1ee1

XXnXX

Xn

−==∆ ∑∑

∑∑

∑==

==

=

21,3651630,56113,117193013,1171930,561

30,56130 2 =−×==∆

Page 57: ŠUMARSKA BIOMETRIKA SKRIPTA

56

Determinanta uz konstantu regresije a

( ) ∑∑∑∑∑∑

∑∑====

==

== −==∆N

1ee1e2

N

1ee1

N

1e

21e

N

1ee2N

1e

2e1

N

1ee2e1

N

1ee1

N

1ee2

XXXXXXXX

XXa

( ) 70,6151530,56165,1256313,1171930,56113,1171965,12563

30,56130,561a −=×−×==∆

Konstanta regresija a

( )68,1

21,3651670,61515a

−=−

=∆

Determinanta uz koeficijent regresije b

( ) ∑∑∑∑∑

∑===

==

= −==∆N

1ee2

N

1ee1

N

1ee2e1N

1ee2e1

N

1ee1

N

1ee2

XXXXnXXX

Xnb

( ) 05,4209450,59630,56165,125633065,1256330,561

50,59630b =×−×==∆

Koeficijent regresije b ( )

15,121,3651605,42094b

==∆

IV Pomocu kovarijanse:

( )( )

( )( )( )

( )∑∑

−−=

−−

= 2

e1e1

e2e2e1e12

e1e1

e2e2e1e1

21

12

XX

XXXX

nXX

n

XXXXC

b

e1e2 XbaX +=

e1e2 XbXa −=

U datom primjeru je:

15,121,121710,1403

b ==

68,171,1815,188,19a −=×−=

Page 58: ŠUMARSKA BIOMETRIKA SKRIPTA

57

Po odredivanju parametara izražavamo model linerane regresije:

e1e2 X15,168,1X̂ +−=

Koeficijent regresije b=1,15 znaci da s porastom prsnog promjera za 1 cm, visina raste za 1,15 m.

Standardna greška regresije Zadatak 36. Na osnovu podataka o velicinama koreliranih varijabli ( )e2e1 X,X za 30 stabala iz Tabele 2, izracunajte standardnu grešku linearne regresije. Rješenje: Standardne greške linearne regresije predstavlja prosjecno odstupanje empirijskih od procjenjenih vrijednosti. Proracun standardne greške linearne regresije vrši se:

- po definiciji:

( )

m23,299,430

88,149ss

n

X̂Xss

21.21.2

n

1e

2

e2e22

1.21.2

====

−==

∑=

Znaci da visine stabala prosjecno odstupaju 2,23 m od procjenjenih visina.

Determinacija Zadatak 37. Na osnovu podataka o velicinama koreliranih varijabli ( )e2e1 X,X za 30 stabala, izracunajte jacinu korelacione veze. Interpretirajte izracunati pokazatelj.

Rješenje:

Jacina veze izražava se determinacijom 2? .

91,030/34,176730/46,16172

22

22̂2

==ρ

σ

σ=ρ

Znaci, u konkretnom slucaju, modelom linearne regresije, variranje u visini objašnjava se sa 91 % variranjem prsnih promjera, a ostatak (7%) se odnosi na druge neobuhvacene faktore.

Page 59: ŠUMARSKA BIOMETRIKA SKRIPTA

58

Koeficijent korelacije Zadatak 38. Odrediti stupanj meduzavisnosti prsnih promjera i visina.

Rjesenje: Meduzavisnost se izražava koeficijentom korelacije ? , koji predstavlja kvadratni

korijen iz determinacije ( 2? ). Izracunava se iz:

2ρ=ρ

U navedenom slucaju je:

96,091,0 ==ρ , što ukazuje na vrlo visok stupanj korelacije izmedu prsnih promjera i visina stabala.

Page 60: ŠUMARSKA BIOMETRIKA SKRIPTA

59

Krivolinijska regresija (korelacija) Parametri modela krivolinjske regresije

Zadatak 39. Za podatake o velicinama koreliranih varijabli ( )e2e1 X,X za 20 stabala datih u Tabeli X , koristeci modele krivolinijske regresije odredite:

- parametre modela, - standardnu grešku regresije, - determinaciju i - index korelacije.

Tabela 24. Krivolinijska regresija - polinom drugog stupnja

n e1X e2X 2e1X e2e1 XX 3

e1X 4e1X e2

2e1 XX

e2*X̂

1 16,50 14,30 272,25 235,95 4492,1 74120,1 3893,2 15,8 2 17,40 15,40 302,76 267,96 5268 91663,6 4662,5 17 3 16,10 15,90 259,21 255,99 4173,3 67189,8 4121,4 15,2 4 17,50 17,60 306,25 308,00 5359,4 93789,1 5390 17,2 5 18,40 19,70 338,56 362,48 6229,5 114622,9 6669,6 18,4 6 15,80 15,30 249,64 241,74 3944,3 62320,1 3819,5 14,8 7 18,50 18,80 342,25 347,80 6331,6 117135,1 6434,3 18,5 8 15,60 13,30 243,36 207,48 3796,4 59224,1 3236,7 14,5 9 19,00 17,50 361,00 332,50 6859 130321 6317,5 19,2

10 15,40 12,20 237,16 187,88 3652,3 56244,9 2893,4 14,2 11 20,20 21,10 408,04 426,22 8242,4 166496,6 8609,6 20,7 12 14,70 15,50 216,09 227,85 3176,5 46694,9 3349,4 13,2 13 20,40 22,60 416,16 461,04 8489,7 173189,1 9405,2 21 14 14,10 12,90 198,81 181,89 2803,2 39525,4 2564,6 12,3 15 20,60 22,80 424,36 469,68 8741,8 180081,4 9675,4 21,2 16 13,60 14,00 184,96 190,40 2515,5 34210,2 2589,4 11,5 17 21,50 22,80 462,25 490,20 9938,4 213675,1 10539,3 22,4 18 13,60 10,50 184,96 142,80 2515,5 34210,2 1942,1 11,5 19 14,70 11,20 216,09 164,64 3176,5 46694,9 2420,2 13,2 20 23,50 23,20 552,25 545,20 12977,9 304980,1 12812,2 24,7 347,10 336,60 6176,41 6047,70 112683,24 2106388,5 111345,62 336,6

Rješenje: Krivolinijsku regresiju možemo izraziti polinomom k-tog stupnja:

je1

k

1jj0

*e2 XbbX̂ ∑

=

+= .

Polinom drugog stupnja: 2

e12e110e2 XbXbbX̂ ++=∗

Page 61: ŠUMARSKA BIOMETRIKA SKRIPTA

60

Sistem normalnih jednacina za polinom drugog stupnja:

Proracun parametara modela: - Gausov metod eliminacije

( )( )

( )

44,12a01,2b02,0c

DEAKcCEFAIIEIIIADcCaA

600,336c41,6176b10,347a20

41,617650,210638820F

10,34741,617624,11268320E41,617610,34724,11268320C

10,34741,617620A

KFcEbI41,6176III20DcCaAI10,347II20600,336c41,6176b10,347a20

622,111345c50,2106388b24,112683a41,6176700,6047c24,112683b41,6176a10,347

600,336c41,6176b10,347a20

2

2

−=′=′

−=′

−=′−→−=′+′

=′+′+′

−×=

×−×=×−×=

−×=

=+→−+=′+′→−+

=′+′+′

=′+′+′=′+′+′

=′+′+′

∑∑ ∑∑

∑∑ ∑∑

∑∑ ∑

== ==

== ==

== =

=′+′+′

=′+′+′

=′+′+

n

1ee2

2e1

n

1e

n

1e

4e1

3e1

n

1e

2e1

n

1ee2e1

n

1e

n

1e

3e1

2e1

n

1ee1

n

1ee2

n

1e

n

1e

2e1e1

XXXcXbXa

XXXcXbXa

XXcXbna

Page 62: ŠUMARSKA BIOMETRIKA SKRIPTA

61

- Normirani Gausov metod eliminacije

Dakle, odgovarajuca jednacina regresije polinoma drugog stupnja je:

2e1e1e2 X02,0X01,244,12X̂ −+−=∗

Standardna greška krivolinijske regresije

-po definiciji

( )

m42,102,220

36,40ss

n

X̂Xss

21.21.2

n

1e

2

e2e22

1.21.2

====

−==

∑=

Determinacija 2?

- po definiciji

( )( )

87,020/08,31920/72,278

n/XX

n/X̂X

2

22

21.2̂

n

1e

2e2e2

n

1e

2

e2e22

==ρ

σ

σ=

−=ρ

=

=

ili

44,1201,224,1802,004,341028,18a01,202,022,32198,1b

02,0c004,0c22,0

347,1c23,36b351,1c01,36b

89,0198,1c22,32b89,0IIII44,0/594,0c82,15b44,0III

III028,18c04,341b24,18aII424,17c64,324b79,17a

I830,16c82,308b36,17a41,6176/622,111345c50,2106388b24,112683a41,6176

10,347/700,6047c24,112683b41,6176a10,34720/600,336c41,6176b10,347a20

−=×−×−=′=×−=′

=′⇒=′

=′+′−=′−′−

→=′+′⇒+−→=′+′⇒+

⇒=′+′+′⇒=′+′+′

⇒−=′−′−′−→=′+′+′

→=′+′+′−→=′+′+′

Page 63: ŠUMARSKA BIOMETRIKA SKRIPTA

62

-pomocu rezidualne varijanse:

87,020/08,319

20/36,401

s1

2

22

21.22

=−=ρ

σ−=ρ

U konkretnom slucaju, krivolinijskom korelacionom vezom (polinomom drugog stupnja) promjene u visini objašnjavaju se sa 93 % promjenama u prsnom precniku, a ostatak (7%) se duguje drugim neobuhvacenim faktorima.

Index korelacije ? -po definiciji

2ρ=ι

93,087,0 ==ι

Višestruka regresija Parametri modela višestruke linerane regresije

Zadatak 40: Na osnovu podataka o velicinama koreliranih varijabli )X,X,X( e3e2e1 (prsni promjer, visina, volumen stabla) za 30 stabala datih u Tabeli Y, odredite model višestruke (multiple) linearne regresije tj. odredite parametre funkcije izravnanja ( ( )e2e1e3 X,XfX̂ = ) metodom najmanjih kvadrata.

Rješenje:

Model višestruke (muliple) regresije ( )e2e1e3 X,XfX̂ = odnosi se na

e2e1e3 X*X*X̂ γ+β+α=

Sistem normalnih jednacina za proracun parametara jednacine višestruke regresije

)XX()X()X*X()X(

)XX()XX()X()X(

)X()X()X(N

n

1ee3e2

n

1e

n

1e

2e2e2e1

n

1ee2

n

1ee3e1

n

1e

n

1ee2e1

2e1

n

1ee1

n

1ee3

n

1e

n

1ee2e1

∑∑ ∑∑

∑∑ ∑∑

∑∑ ∑

== ==

== ==

== =

=γ+β+α

=γ+β+α

=γ+β+α

Page 64: ŠUMARSKA BIOMETRIKA SKRIPTA

63

Tabela broj 25. Višestruka regresija

e e1X e2X e3X 2

e3X e3e1 XX 2e1X e3e2 XX 2

e2X e3e1 XX

1 16,12 14,93 0,15 0,02 2,35 259,88 2,17 223,01 2,35 2 10,98 10,54 0,05 0,00 0,52 120,55 0,50 111,04 0,52 3 18,98 18,53 0,25 0,06 4,75 360,42 4,64 343,31 4,75 4 24,41 27,60 0,62 0,38 15,06 596,06 17,02 761,52 15,06 5 24,00 26,81 0,58 0,34 13,90 576,16 15,53 718,58 13,90 6 26,82 32,55 0,88 0,77 23,54 719,11 28,57 1059,34 23,54 7 6,21 8,82 0,01 0,00 0,08 38,62 0,11 77,86 0,08 8 16,47 15,33 0,16 0,02 2,57 271,20 2,39 234,89 2,57 9 23,46 25,79 0,53 0,28 12,49 550,36 13,73 665,03 12,49

10 11,98 11,19 0,06 0,00 0,72 143,62 0,67 125,19 0,72 11 14,07 12,86 0,10 0,01 1,34 197,95 1,23 165,45 1,34 12 8,81 9,48 0,03 0,00 0,24 77,59 0,26 89,78 0,24 13 7,99 9,20 0,02 0,00 0,18 63,76 0,20 84,56 0,18 14 12,56 11,61 0,07 0,00 0,86 157,70 0,80 134,70 0,86 15 13,63 12,48 0,09 0,01 1,18 185,81 1,08 155,63 1,18 16 6,56 8,87 0,01 0,00 0,09 43,03 0,13 78,71 0,09 17 14,71 13,47 0,11 0,01 1,61 216,46 1,47 181,36 1,61 18 15,57 14,34 0,13 0,02 2,03 242,57 1,87 205,67 2,03 19 18,41 17,74 0,23 0,05 4,15 338,90 4,00 314,73 4,15 20 15,78 14,56 0,14 0,02 2,14 248,93 1,98 211,93 2,14 21 15,98 14,78 0,14 0,02 2,26 255,36 2,09 218,39 2,26 22 15,75 14,53 0,14 0,02 2,13 248,14 1,96 211,15 2,13 23 24,76 28,28 0,65 0,42 16,10 613,17 18,39 799,61 16,10 24 17,25 16,25 0,18 0,03 3,13 297,61 2,95 264,22 3,13 25 16,72 15,62 0,16 0,03 2,74 279,59 2,56 243,95 2,74 26 15,00 13,75 0,12 0,01 1,74 225,02 1,60 189,08 1,74 27 28,07 35,37 1,05 1,09 29,35 788,14 36,97 1251,04 29,35 28 22,25 23,63 0,44 0,19 9,77 495,22 10,37 558,57 9,77 29 30,20 40,49 1,38 1,92 41,81 911,80 56,06 1639,58 41,81 30 14,26 13,03 0,10 0,01 1,42 203,21 1,29 169,86 1,42

507,78 532,41 8,55 5,75 200,25 9725,93 232,60 11487,72 200,25

Page 65: ŠUMARSKA BIOMETRIKA SKRIPTA

64

I nacin: Normiranje jednadžbi - Gausov metod eliminacije

II nacin : pomocu determinanti (Kramerovo pravilo)

212

22

212

212

1221 C

CC

−σσ=σ

σ=∆

( ) 231213222

223

1213 CCCC

CC−σ=

σ=β∆

( ) 13122321

2312

1321 CCC

CCC

−σ=σ

=γ∆

( )2e1e1

21 XX

n1

−=σ

( )2e1e1

21 XX

n1

−=σ

( )2e1e1

21 XX

n1

−=σ

( )( )∑ −−= e2e2e1e112 XXXXn1

C

e2e1e3 X061,0X03,029,0X̂

29,0061,0*577,21)03,0(*674,19437,003,0061,0*394,1055,0

061,0006,0100,0

055,0394,1049,0293,1

748,2152,0829,3748,2IIII228,2/109,0881,2228,2III

III437,0577,21674,19II7394,0628,20154,19

I285,0747,17925,16

4,5326,2327,114876,104744,5328,507/3,2006,104749,97258,507

306,84,5328,50730

+−=

=−−−=α−=−=β

=γ⇒=γ

=γ+β−=γ−β−

→=γ+β⇒+→=γ+β⇒+

⇒=γ+β+α⇒=γ+β+α

⇒−=γ−β−α−

→=γ+β+α→=γ+β+α

−→=γ+β+α

Page 66: ŠUMARSKA BIOMETRIKA SKRIPTA

65

( )( )∑ −−= e3e3e1e113 XXXXn1

C

( )( )∑ −−= e3e3e2e223 XXXXn1

C

( )∆β∆

( )∆γ∆

213 XXX γ−β−=α

74,18477,4897,67*71,3797,6777,4877,4871,37 2 =−==∆

( ) 64,577,48*69,297,67*85,197,6769,277,4885,1

−=−==β∆

( ) 37,1185,1*77,4869,2*71,3769,277,4885,171,37

=−==γ∆

03,074,18464,5

−=−

06,074,184

37,11==γ

29,075,17*06,092,16*03,028,0 −=−−−=α

e2e1e3 X061,0X03,029,0X̂ +−=

Page 67: ŠUMARSKA BIOMETRIKA SKRIPTA

66

Standardna greška višestruke linearne regresije Zadatak 41. Na osnovu podataka o velicinama koreliranih varijabli )X,X,X( e3e2e1 za 30 stabala, za višestruku linearnu regresiju odredite standardnu grešku regresije. Rješenje:

Proracun standardne greške višestruke regresije vrši se pomocu formule:

( )n

X̂Xs

n

1e

2

e3e3

12.3

∑=

−= .

U nasem slucaju:

312.3

12.3

m0332,0s

0011,0s

=

=

Znaci, prosjecno odstupanje zapremina stabala od ravni definirane prsnim promjerom i visinom stabala je 0,0332 m³.

Determinacija Zadatak 42. Na osnovu podataka o velicinama koreliranih varijabli )X,X,X( e3e2e1 za 30 stabala, za višestruku linearnu regresiju odredite mjere jacine krivolinijske regresije : determinaciju i index korelacije. Rješenje:

Proracun jacine višestruke korelacije vrši se

9951,09902,0

9902,01105,00011,0

1s

1

212.312.3

3212.3

2

12.32

==ρ=ρ

=−=σ

−=ρ

Komentar: U konkretnom slucaju, višestrukom korelacionom vezom promjene u volumenu stabla objašnjavaju se sa 99,02 % promjenama u prsnom promjeru i visini , a ostatak (0,98%) se duguje drugim neobuhvacenim faktorima.

Page 68: ŠUMARSKA BIOMETRIKA SKRIPTA

67

Neto korelacije

Modeli neto regresija Zadatak 43. Odrediti modele neto regresije za zavisnost volumena stabala ( )e3X od prsnog promjera ( )e1X i visine stabala ( )e2X . Rješenje: Model višestruke linearne regresije:

e2e1e3 XXX̂ γ+β+α=

e2e1e3 X06,0X03,029,0X̂ +−=

Modeli parcijalnih linearnih regresija odnose se na:

(1) e2e112.3 XXX̂ γ+β+α=

75,17*06,0X03,029,0X̂ e112.3 +−=

e1e3 X03,035,1X̂ −=

(2) e2e121.3 XXX̂ γ+β+α=

ee212.3 X06,092,16*03,029,0X̂ +−=

e212.3 X06,099,50X̂ +−=

Page 69: ŠUMARSKA BIOMETRIKA SKRIPTA

68

Neto korelacije Zadatak 44. Odrediti parcijalne korelacije izmedu volumena stabala ( )e3X i prsnog promjera ( )e1X i visine stabala ( )e2X ,pomocu determinanti (koeficijenata parcijalnih korelacija).

Rješenje:

Korelaciona matrica

=

1rrr1r

rr1

R

3231

2321

1312

( )( )

( ) ( )∑ ∑∑

−−

−−=

σσ=

2jejeieie

jejeieie

ji

ijij

XXXX

XXXXCr

2

9632,011,2039*34,1131

10,1463r12 ==

9067,031,3*34,1131

5221,55r13 ==

9835,031,3*11,2039

85,80r23 ==

Korelaciona matrica:

=

19835,09067,09835,019632,0

9067,09632,01

R

Determinanta korelacione matrice:

Minori:

0007,09835,09067,019632,0

9067,019067,0

9835,09632,09632,0

19835,09835,01

1Rdet =+−=

Page 70: ŠUMARSKA BIOMETRIKA SKRIPTA

69

232

32

3211 r1

1rr1

M −==

0327,09835,0119835,0

9835,01M 2

11 =−==

1778,09067,0119067,0

9067,01M 2

22 =−==

0720,09632,0119632,0

9632,01M 2

33 =−==

Algebarski kofaktori:

( ) ijji

ij M1R +−=

0327,0R11 = 1778,0R 22 = 0720,0R33 =

Parcijalne korelacije

jjii

ijk.ij

RR

Rr

−=

13R =0,0406

11R =0,0327

33R =0,0720

8371,00720,0*0327,0

0406,0*1RR

R1r

3311

132.13 −=

−=

−=

23R =-0,1100

22R =0,1778

9720,01778,0

11,0*1RR

R1r

3322

231.23 =

−−=

−=

Page 71: ŠUMARSKA BIOMETRIKA SKRIPTA

70

Tabela 25. Koeficijenti parcijalnih korelacija

( ) ( ) ( )e3e3e2e2e1e1 XXC,XXB,XXA −=−=−=

e1X e2X e3X A B C A² B² C² AB AC BC 16,12 14,93 0,15 -0,81 -2,81 -0,14 0,65 7,91 0,02 2,27 0,11 0,39 10,98 10,54 0,05 -5,95 -7,21 -0,24 35,36 51,97 0,06 42,87 1,41 1,71 18,98 18,53 0,25 2,06 0,78 -0,03 4,24 0,61 0,00 1,61 -0,07 -0,03 24,41 27,6 0,62 7,49 9,85 0,33 56,08 97,00 0,11 73,75 2,48 3,27 24,00 26,81 0,58 7,08 9,06 0,29 50,09 82,07 0,09 64,12 2,08 2,66 26,82 32,55 0,88 9,89 14,8 0,59 97,82 219,06 0,35 146,38 5,86 8,77 6,21 8,82 0,01 -10,71 -8,92 -0,27 114,74 79,62 0,07 95,58 2,92 2,43

16,47 15,33 0,16 -0,46 -2,42 -0,13 0,21 5,86 0,02 1,11 0,06 0,31 23,46 25,79 0,53 6,53 8,04 0,25 42,69 64,66 0,06 52,54 1,62 1,99 11,98 11,19 0,06 -4,94 -6,56 -0,22 24,42 43,01 0,05 32,41 1,11 1,47 14,07 12,86 0,10 -2,86 -4,88 -0,19 8,16 23,85 0,04 13,95 0,54 0,93 8,81 9,48 0,03 -8,12 -8,27 -0,26 65,90 68,42 0,07 67,15 2,09 2,13 7,99 9,20 0,02 -8,94 -8,55 -0,26 79,94 73,13 0,07 76,45 2,35 2,25

12,56 11,61 0,07 -4,37 -6,14 -0,22 19,08 37,71 0,05 26,83 0,95 1,33 13,63 12,48 0,09 -3,29 -5,27 -0,20 10,85 27,79 0,04 17,37 0,65 1,04 6,56 8,87 0,01 -10,37 -8,88 -0,27 107,46 78,77 0,07 92,00 2,81 2,40

14,71 13,47 0,11 -2,21 -4,28 -0,18 4,90 18,32 0,03 9,47 0,39 0,75 15,57 14,34 0,13 -1,35 -3,41 -0,15 1,83 11,60 0,02 4,60 0,21 0,53 18,41 17,74 0,23 1,48 -0,01 -0,06 2,20 0,00 0,00 -0,01 -0,09 0,00 15,78 14,56 0,14 -1,15 -3,19 -0,15 1,32 10,17 0,02 3,66 0,17 0,48 15,98 14,78 0,14 -0,95 -2,97 -0,14 0,89 8,81 0,02 2,81 0,14 0,43 15,75 14,53 0,14 -1,17 -3,22 -0,15 1,38 10,34 0,02 3,77 0,18 0,48 24,76 28,28 0,65 7,84 10,53 0,37 61,41 110,89 0,13 82,52 2,86 3,85 17,25 16,25 0,18 0,33 -1,49 -0,1 0,11 2,23 0,01 -0,49 -0,03 0,15 16,72 15,62 0,16 -0,21 -2,13 -0,12 0,04 4,53 0,01 0,44 0,02 0,26 15,00 13,75 0,12 -1,93 -4,00 -0,17 3,71 15,97 0,03 7,69 0,33 0,68 28,07 35,37 1,05 11,15 17,62 0,76 124,28 310,58 0,58 196,46 8,48 13,40 22,25 23,63 0,44 5,33 5,89 0,15 28,38 34,66 0,02 31,36 0,82 0,91 30,20 40,49 1,38 13,27 22,74 1,10 176,09 517,33 1,21 301,82 14,59 25,01 14,26 13,03 0,10 -2,67 -4,71 -0,19 7,13 22,22 0,03 12,59 0,50 0,88

507,78 532,41 8,55 1131,34 2039,11 3,31 1463,10 55,52 80,85

Korelacija ranga

Spearmanov koeficijent korelacije ranga

Zadatak 45. Dva sumarska inzinjera ocijenila su kvalitet deset razlicitih stabala hrasta koristeci skalu od 1 do 100. Ocjene za pojedina stabla predstavljena su u Tabeli 26:

Page 72: ŠUMARSKA BIOMETRIKA SKRIPTA

71

Tabela 26. Ocjena kvaliteta stabala Osoba A Osoba B

Bodovi Rang Bodovi Rang Razlike 17 1 17 3 -2 24 3 15 1 2 27 4 30 4 0 19 2 16 2 0 37 6 38 5 1 44 7 44 7 0 56 8 70 9 -1 35 5 41 6 -1 72 9 68 8 1 88 10 91 10 0

Provjeriti postoji li, uz vjerovatnocu od 95%, statisticki znacajna razlika izvedenih ocjena izmedju ova dva sumarska inzinjera. Rjesenje: Posto je kvalitet stabala ocijenjen na osnovu skale ranga, za ocjenu signifikantnosti razlike koristi se tzv. Spirmanov (Spearman) koeficijent korelacije ranga:

( )1nn

d61r

2

2i

s −−= ∑

.

U nasem slucaju je:

( )927,0

11001012*6

1rs =−

−= .

Dobijenu vrijednost poredimo s tablicnom vrijednoscu datoj u Tabeli kriticnih vrijednosti Sprimanovog koeficijenta korelacije ranga :

564,0rT = .

Uocava se da je izracunata vrijednost Spirmanovog koeficijenta korelacije ranga veca od kriticne vrijednosti, te zakljucujemo da je korelacija statisticki znacajna, tj. da postoji znacajna povezanost izmedju nacina ocjenjivanja ova dva sumarska inzinjera.

Page 73: ŠUMARSKA BIOMETRIKA SKRIPTA

72

Distribucije statistika uzoraka Zadatak 46. Pretpostavimo da osnovni skup cini pet stabala s visinama: 37, 42, 55, 50 i 46 m. a) Koliko ima razlicitih uzoraka od po dva stabla? Koji su to uzorci? Odrediti

aritmeticku sredinu visine osnovnog skupa. Odrediti procjenu aritmeticke sredine visine osnovnog skupa koristeci aritmeticke sredine visina uzoraka. Izracunati standardnu grešku aritmeticke sredine visine koristeci procjenu sredine uzorcima.

b) Koliko ima razlicitih uzorka od po cetiri stabla? Koji su to uzorci? Odrediti standardnu grešku aritmeticke sredine visine u ovom slucaju.

c) Uporediti standardne greške aritmeticke sredine visine pri navedene dvije velicine uzoraka.

Rješenje: a) Broj mogucih uzoraka bez ponavljanja elemenata u uzorku velicine n

( )!nN!n!N

nN

CNn −

=

=

Broj mogucih uzoraka velicine n=2: N=5 ; n=2;

( )10

24*5

!3*2!3*4*5

)1*2*3(*)1*2(1*2*3*4*5

!25!*2!5

C52 ====

−=

Moguci uzorci od po dva stabla u uzorku i njihove aritmeticke sredine visina: 37,42 m5,39X1 =

37,55 m0,46X2 = 37,50 m5,43X3 =

37,46 m5,41X4 = 42,55 m5,48X5 =

42,50 m0,46X6 =

42,46 m0,44X7 =

55,50 m5,52X8 =

55,46 m5,50X9 =

50,46 m0,48X10 =

Aritmeticka sredina osnovnog skupa ( )OX :

∑=

=N

1eeO X

N1

X

Page 74: ŠUMARSKA BIOMETRIKA SKRIPTA

73

Aritmeticka sredina visine skupa od pet stabala:

m0,465

4650554237XO =

++++=

Procjena aritmeticke sredine osnovnog skupa uzorcima ( )( )XA :

( ) ∑ω

=ω=

1uuX

1XA

m0,4610

0,485,505,520,440,465,485,415,430,465,39XO =

+++++++++=

Varijansa sredina uzorka ( )( )XD2 :

( ) ( )2O

1u

2u

2 XX1

XD −ω

= ∑ω

=

Tabela 27. Proracun statistika uzorka uzoraka od po dva stabla

uX 2uX

39,5 1560,2 46,0 2116,0 43,5 1892,2 41,5 1722,2 48,5 2352,2 46,0 2116,0 44,0 1936,0 52,5 2756,2 50,5 2550,2 48,0 2304,0

460,0 21305,5

( ) 55,140,4655;2130XD 22 =−= Standardna devijacija aritmeticke sredine visine uzorka ( )XD :

( ) ( )XDXD 2=

( ) m81,3XD =

b) Broj mogucih uzoraka velicine n=4:

5!4

!4*5!1!*4

!5C5

4 ===

Page 75: ŠUMARSKA BIOMETRIKA SKRIPTA

74

Tabela 28. Moguci uzorci

( )4,3,2,1iXi = iX 2iX

37, 42, 55, 50 46,00 2116,00 37, 55, 50, 46 47,00 2209,00 37, 42, 50, 46 43,75 1914,06 37, 42, 55, 46 45,00 2025,00 42, 55, 50, 46 48,25 2328,06

230,00 10592,10

Varijansa aritmeticke sredine visine uzorka stabala sacinjenog od aritmetickih sredina mogucih uzoraka od po cetiri stabla:

( ) 42,25

00,23010,10592

51

XD2

2 =

−=

Standardna devijacija aritmeticke sredine visine uzorka ( )XD : ( ) m56,1XD =

c) Što je veci uzorak, ocekuje se manji varijabilitet izmedu svih mogucih procjena uzorcima.

Procjene parametara osnovnog skupa pomocu uzorka Interval povjerenja aritmeticke sredine osnovnog skupa

Zadatak 47. Premjerom 24 probne površine velicine 1 ha u sastojini velicine 90 ha, utvrdene su sljedece velicine zalihe krupne drvne mase po ha :

316,7 304,4 315,3 236 301,4 174,6 151,9 266,5 269,1 306,8 193,4 209,2 186,7 313,4 316,5 308,5 189,3 220,7 254,9 197 189,6 186,9 211,5 248,9

a) Odrediti interval povjerenja, uz vjerovatnocu od 95 %, za: 1) prosjecnu zalihu sastojine, 2) totalnu zalihu sastojine, 3) totalnu vrijednost zalihe drvne mase sastojine ako je 1m³ drvne mase vrijedi

220 KM, b) Odrediti velicinu uzorka za tacnost procjene od 5%.

Page 76: ŠUMARSKA BIOMETRIKA SKRIPTA

75

Rješenje: a) Za ocjenu intervala povjerenja potrebno je izracunati statistike uzorka.

Tabela 29. Proracun statistika uzorka

iX 2iX

316,73 100317,89 304,4 92659,36

315,25 99382,56 235,98 55686,56 301,41 90847,99 174,58 30478,18 151,92 23079,69 266,48 71011,59 269,06 72393,28 306,77 94107,83 193,42 37411,30 209,16 43747,91 186,7 34856,89

313,44 98244,63 316,52 100184,91 308,48 95159,91 189,31 35838,28 220,72 48717,32 254,92 64984,21 197,03 38820,82 189,59 35944,37 186,94 34946,56 211,5 44732,25

248,93 61966,14 5869,24 1505520,43

Intervala povjerenja

( ) ( )ucuoucu XDZXXXDZX +≤≤−

( )n

XD uu

σ= - standardna greška aritmeticke sredine uzoraka

- za n<30:

Nn

1n

tXX ouo −

σ±=

Page 77: ŠUMARSKA BIOMETRIKA SKRIPTA

76

n

XX i

u∑= ? ha/m55,244

2424,5869

X 3u ==

( )

1n1n

XX

2i2

i

u −−

−=σ

∑ ∑

ha/3m24,5565,3051124

12424,5869

43,15055202

u ==−

−−

( ) ha/m27,112424,55

nXD 3x

u ==σ

=

068,2t 23,05.0 =

95% interval povjerenja za prosjecnu zalihu drvne mase sastojine

9024

12424,55

068,255,244 −− < OX <9024

12424,55

068,255,244 −+

224,59 m³/ha < OX < 264,51 m³/ha

b) 95% interval povjerenja za totalnu zalihu drvne mase sastojine

XNXT = ? 3T m5,220955,244*90X ==

nNnN

N2u22

u T

σ−=σ ? 38,755283

2465,3051

902490

9022u T

=−

=σ ? 3X m07,869

T=σ

07,869*068,25,2209 − < TX < 07,869*068,25,2209 +

20212,26 m³ < TX < 23806,74 m³

c) 95% interval povjerenja za vrijednost totalne zalihe drvne mase sastojine

CXX T* = ? KM4842090220*5,2209X* ==

C

TT X*X

σ=σ ? KM45,191195220*07,869*XT

==σ

45,191195*068,24842090 − < *X < 45,191195*068,24842090 +

Page 78: ŠUMARSKA BIOMETRIKA SKRIPTA

77

444669,81 KM < *X < 5237482,19 KM

Zapaža se da najveca moguca razlika procjene zalihe od 4842090 KM od stvarne vrijednosti zalihe, na bazi uzorka navedene velicine, iznosi 395392,19 KM (8%).

d) Potrebna velicina uzorka ( )

2

2

E

KV*4n =

100X

KV uσ= ? 59,22100*

55,24424,55

KV ==

%5E =

825

59,22*4n 2

2≅=

Zadatak 48. Premjerom debljina 19 stabala obuhvacenih uzorkom ( stopa izbora 0,125) na oglednoj plohi, dobijene su sljedece statistike :

cm3,32Xu = cm9,7u =σ

Ocijenite uz vjerovatnocu od 95 %:

a) Interval povjerenja aritmeticke sredine osnovnog skupa, b) Interval povjerenja standardne devijacije osnovnog skupa,

Rjesenje: a) Ocjena intervala povjerenja aritmeticke sredine osnovnog skupa

Nn

1n

tXX ouo −

σ±=

stopa izbora=Nn

125,01199,7

101,23,32XU −±=

cm73,28X

cm86,35X

O

O

=

=−

+

Na bazi statistickog uzorka ,uz vjerovatnocu od 95 % procjenjujem da se

aritmeticka sredina osnovnog skupa krece u intervalu od 28,73 cm do 35,86 cm.

Page 79: ŠUMARSKA BIOMETRIKA SKRIPTA

78

b) Ocjena intervala povjerenja standardne devijacije osnovnog skupa

( ) ( )ucuoucu DZXDZ σ+≤σ≤σ−σ

( )n2

D2u

Nn

1n2

t uuo −

σ±σ=σ

125,0119*29,7

101,29,7o −±=σ

cm38,5

cm42,10

o

o

=σ−

+

Na bazi statistickog uzorka ,uz vjerovatnocu od 95 % procjenjujem da se

standardna devijacija osnovnog skupa krece u intervalu od 5,38 cm do 10,42 cm.

Statisticki testovi t-test

Zadatak 49.

Na terenu su testirani uticaji dva razlicita feromona PH i IP. Pri tome su dnevno registrovane brojnosti ulovljenih potkornjaka: PH 4960 524 1290 892 2240 3480 2320 2560 625 4300 3440 2540 4500 IP 2760 296 777 457 2840 2960 1640 1524 107 2000 2220 2060 4400 Testirati znacajnost razlika ulova potkornjaka razlicitim feromonima. Rješenje: H0: 21 µ=µ (test parova) (Nema statisticki znacajne razlike izmedu prosjecnih ulova pri upotrebi dva feromona uz vjerovatnocu od 95%.) U ovom slucaju koristi se t-test parova:

dsd

t = ,

pri cemu je:

( )

( )1n*nn

dd

s

2j2

j

d −

−=

∑ ∑

Izracunata t- vrijednost se poredi s tablicnom t-vrijednoscu iz Tablica t-distribucije na osnovu odabrane vjerovatnoce i velicine uzorka.

Page 80: ŠUMARSKA BIOMETRIKA SKRIPTA

79

Tabela 30. Proracun vrijednosti za test parova

PH IP jd 2

jd 4960 2760 2200 4840000 524 296 228 51984

1290 777 513 263169 892 457 435 189225

2240 2840 -600 360000 3480 2960 520 270400 2320 1640 680 462400 2560 1524 1036 1073296 625 107 518 268324

4300 2000 2300 5290000 3440 2220 1220 1488400 2540 2060 480 230400 4500 4400 100 10000

33671 24041 9630 14797598

35,365,22177,740

t ==

( ) 1n,1,05.0t − ? ( ) 78,1t 12,1,05.0 =

Zakljucak: Hipoteza se ne prihvata. Znaci, postoje statisticki znacajna razlika izmedu prosjecnog ulova potkornjaka s dva ispitivana feromona uz vjerovatnocu od 95%, odnosno nivo rizika od 5%.

Page 81: ŠUMARSKA BIOMETRIKA SKRIPTA

80

Zadatak 50. Dati su prosjecne visine, varijanse i velicine dva uzorka iz sastojina smrce:

1X = 22 m, 1221 =σ , 1n =9 i

2X = 18 m, 1522 =σ , 2n =11.

Testirati razliku prosjecnih visina uzoraka uz vjerovatnocu od 95 %. Napisati zakljucak. Rješenje: OH : 21 XX = (test nezavisnih uzoraka) (Nema statisticki znacajnih razlika izmedu prosjecnih visina uzoraka dviju razlicitih sastojina uz vjerovatnocu od 95%.)

Testiranje razlike izmedu dvije aritmeticke sredine

21 XX

21s

XXt

−=

2

22

1

21

XX ns

ns

s21

+=− ? m09,21115

912

s21 XX =+=−

91,109,2

1822t =

−=

( ) 21 nn,2,05.0t + ? ( ) 09,2t 20,2,05.0 =

t < ( ) 21 nn,2,05.0t +

Hipoteza se ne odbacuje. Zakljucak: Ne postoje statisticki znacajne razlike izmedu prosjecnih visina u razlicitim sastojinama smrce.) Zadatak 51. Provjeriti da li se varijansa Uzorka 1 statisticki znacajno razlikuje od varijanse Uzorka 2 uz vjerovatnocu od 95 %, pri cemu su:

16n1 = ; 2521 =σ ,

11n 2 = ; 1022 =σ .

Rjesenje: U ovom slucaju primjenjuje se F-test, pri cemu se izracunata vrijednost

22

21 /F σσ=

5,210/25F == poredi s tablicnom vrijednoscu iz Tablica F distibucije

( ) 05,0n,n*

21F

( ) 85,2F 05,010;,15* =

Kako je *FF < zakljucujemo da nema statisticki znacajne razlike izmedju varijansi ovih uzoraka.

Page 82: ŠUMARSKA BIOMETRIKA SKRIPTA

81

Višestruka poredenja Slucajni blok sistem – analiza varijanse

Zadatak 52. Registrovane su visine stabala tri razlicite provenijencije ariša.

1X 2X 3X 21,08 24,63 20,31 22,89 23,98 22,05 20,03 19,77 24,78 20,18 18,81 18,58 18,08 17,48 21,50

Provjeriti postoje li statisticki znacajne razlike u visinama stabala razlicitih provenijencija uz vjerovatnocu od 95%.

Rješenje: OH : 321 XXX == (Nema statisticki znacajnih razlika izmedu prosjecnih visina uzoraka tri razlicite provenijencije ariša uz vjerovatnocu od 95%.) Tabela 31. Jednostruka analiza varijanse ANOVA

Izvori varijacije SK df PK F P-value 2,05.0F

Izmedu grupa 2,4608 2 1,2304 0,1997 0,8217 3,8853 Unutar grupa 73,9393 12 6,1616 Ukupno 76,4001 14

8853,3F 2,05.0 = F=0,1997< 8853,3F 2,05.0 = Hipoteza se ne odbacuje. Zakljucak: Nema statisticki znacajnih razlika izmedu prosjecnih visina uzoraka tri razlicite provenijencije ariša uz vjerovatnocu od 95%.

Page 83: ŠUMARSKA BIOMETRIKA SKRIPTA

82

Zadatak 53. Postavljen je slucajni blok plan radi testiranja razlicitih provenijencija ariša. Pri tome su registrovane prosjecne visine provenijencija u blokovima:

Provenijencija(P) / Blok I II III P1 14,50 21,75 20,60 P2 19,33 20,00 20,00 P3 16,25 19,60 20,25 P4 18,75 18,25 14,50 P5 17,20 20,33 20,00 P6 21,75 24,83 22,00 P7 17,50 18,88 25,17 P8 19,70 19,50 19,13 P9 13,83 16,25 23,17 P10 17,33 19,83 21,00

Provjeriti razlike u prosjecnim visinama razlicitih provenijencija ariša zasadenih u tri razlicita bloka. Rješenje:

OH : 321 XXX == (Nema statisticki znacajnih razlika izmedu prosjecnih visina blokova uz vjerovatnocu od 95%.)

OH : 1021 P.....PP === (Nema statisticki znacajnih razlika izmedu prosjecnih visina uzoraka deset razlicitih provenijencija ariša uz vjerovatnocu od 95%.) Tabela 32. Dvostruka analiza varijanse ANOVA

Izvori varijacije Sk df PK F P-value F crit Provenijencije 65,423 9 7,2692 1,2893 0,3078 2,4563 Blokovi 48,572 2 24,286 4,3073 0,0296 3,5546 Greška 101,49 18 5,6383 Total 215,48 29

Provenijencije

cijaprovenijenF < crit,cijaprovenijenF Hipoteza se ne odbacuje. Zakljucak: Nema statisticki znacajnih razlika izmedu prosjecnih visina uzoraka deset razlicitih provenijencija ariša uz vjerovatnocu od 95%.

Page 84: ŠUMARSKA BIOMETRIKA SKRIPTA

83

Blokovi:

blokovaF > crit,blokovaF Hipoteza se ne prihvata. Zakljucak: Postoje statisticki znacajne razlike izmedu prosjecnih visina blokova uz vjerovatnocu od 95%. U ovom slucaju pristupa se multipom testu i to t-testu najmanjih znacajnih razlika (NZR): Tabela 33. Visestruka poredjenja prosjecnih visinaa blokova (NZR)

Blok I Blok J Razlika Prosjeka (I-J) Signifikantnost I II -2,3080(*) ,048 III -2,9680(*) ,013 II I 2,3080(*) ,048 III -,6600 ,558 III I 2,9680(*) ,013 II ,6600 ,558

* Razlika prosjeka je signifikantna na nivou od 0,05. Znaci, uz vjerovatnocu od 95% postoje statisticki signifikantne razlike izmedju prosjecnih visina blokova i to:

• prvog i drugog bloka i • prvog i treceg bloka.

Page 85: ŠUMARSKA BIOMETRIKA SKRIPTA

84

Test saglasnosti teorijskih i empirijskih frekvencija χ2-test.

Zadatak 54. Za distribucije frekvencija date u Tabeli provjeriti hipotezu o saglasnosti empirijske distribucije frekvencija i teoretske Gaussove distribucije frekvencija . Rješenje:

OH : Nema statisticki znacajnih razlika izmedu empirijske distribucije frekvencija i teoretske Gaussove distribucije frekvencija uz vjerovatnocu od 95%.

( )∑ −

=χit

2iti2

fff

Tabela 34. Proracun vrijednosti za χ2-test.

if [ ]itf ( ) it2

iti f/ff − 10 8 0,50

19 22 0,40

46 37 2,18

27 36 2,25

20 21 0,04

8 7 0,14

130 130 5,54

5388,62 =χ

59,1226,05.0 =χ

5388,62 =χ < 59,1226,05.0 =χ

Hipoteza se ne odbacuje.

Zakljucak: Nema statisticki znacajnih razlika izmedu empirijske distribucije frekvencija i teoretske Gaussove distribucije frekvencija uz vjerovatnocu od 95%.

Page 86: ŠUMARSKA BIOMETRIKA SKRIPTA

85

Ocjena znacajnosti koeficijenta regresije. Zadatak 55. U zadatku P iz dijela regresiona analiza ustanovljena je: - regresija

e1e2 X15,168,1X̂ +−= , - rezidalna varijansa:

99,4s21.2 =

- ukupna varijansa: =σ2

2 59,91. - broj parova podataka:

n=30. Provjeriti signifikantnost regresije uz vjerovatnocu od 95%.. Rjesenje: Signifikantnost regresije moze se provjeriti t-testom i to poredeci izracunatu vrijednost t:

bSEb

t = ,

22

21.2

b

sSE

σ=

s tablicnom vrijednoscu t za odabranu vjerovatnocu i za (n-2) stupnjeva slobode. U nasem slucaju je:

29,091,59

99,4SEb ==

95,329,015,1

t == .

Poredjenjem dobijene vrijednosti s tablicnom za 28 stupnjeva slobode i vjerovatnocu od 95% od 2,048 uocava se da je dobijena t-vrijednost veca od tablicne te zakljucuje da postoji statisticki znacajna regresija izmedju prsnog promjera i visine stabala.


Top Related