analiza variance 3...analiza variance 3.del doc.dr. tadeja kraner Šumenjak delovna verzija 2...

1

ANALIZA

VARIANCE

3.del

Doc.dr. Tadeja Kraner Šumenjak

Delovna verzija

2

FAKTORSKI POSKUS (Factorial Experiments)

- dva proučevana dejavnika (dvofaktorski), trije

proučevani dejavniki (trifaktorski), več proučevanih

dejavnikov (večfaktorski poskus),

- bločna zasnova,

- model III ANOVA, SKOblok nima pomena,

- ZELO UPORABNA POSKUSNA ZASNOVA

3

DVOFAKTORSKI POSKUS

Agricultural Field Experiments str. 86

S poljskim poskusom v treh ponovitvah želimo

proučiti vpliv medvrstnega razmika ter gnojenja s fosforjem na pridelek nizkega fižola (kg/parcelo).

V poskus so vključeni trije medvrstni razmaki:

R1=45 cm R2=90 cm R3=135 cm

ter gnojenje s fosforjem v dveh odmerkih:

P1=0 kg/ha P2=25 kg/ha

4

Dejavnik 1:

medvrstni

razmak

Dejavnik 2:

odmerek

fosforja

Nivo

dejavnika

45 cm (1)

60 cm (2)

135 cm (3)

0 kg/ha (1)

25 kg/ha

(2)

Obravnavanj

a

11

12

21

22

31

32

Obravnavanje (Treatment) = česar

vpliv na eksperimentalni material

proučujemo (is a procedure whose

effect on the experimental material is

to be measured),

Dejavnik (Factor) = (a particular class

of related treatments),

Nivo dejavnika (Factor Level)

Interakcija = skupno odvisno

delovanje dveh ali več proučevanih

dejavnikov na izid

INTERAKCIJA

Je posebne vrste vpliv dveh ali več

dejavnikov na izid.

Dvofaktorska interakcija je prisotna, če je

vpliv enega dejavnika na izid drugačen, pri

različnih ravneh drugega.

6

R2P1

60

R1P2

45

R1P1

55

R1P1

65

R3P1

55

R3P1

51

R3P2

66

R3P2

57

R1P2

43

R3P1

59

R1P1

58

R2P1

54

R1P2

56

R2P2

50

R2P2

45

R2P2

62

R2P1

59

R3P2

50

7

2x3 FAKTORSKI POSKUS Design and Analysis of Experiments str. 122

BOB DAE122

Proučiti želimo vpliv gnojenja s fosforjem na pridelek navadnega boba (Vicia faba). Domnevamo, da tip rastline različno reagira na gnojenje, zato v poskus vključimo:

T1= kratek, grmast tip,

T2= visok, pokončen tip.

Preizkušani gnojilni odmerki fosforja so:

P1= 0 kg/ha,

P2= 25 kg/ha,

P3= 50 kg/ha.

8

S STATISTIČNO ANALIZO ODGOVORI:

Ali tip rastline vpliva na pridelek? Pri kateri stopnji tveganja oz. s kakšno zanesljivostjo lahko to trdimo?

Ali gnojenje s fosforjem vpliva na pridelek? Pri kateri stopnji tveganja oz. s kakšno zanesljivostjo lahko to trdimo?

Ali je interakcija tip x P statistično značilna?

9

Obravnavanje

Pridelek

Tip rastline (T)

Gnojenje s fosforjem (P)

T x P

Dejavnik

Srednja vrednost

Tip rastline Grmast

Pokončen

Gnojenje s P 0 kg/ha

25 kg/ha

50 kg/ha

10

PRIMER:

Analizirajmo naslednji primer (Vasilj, str. 202). Izvedli so študijo, da bi ugotovili vpliv dveh različnih razmakov med vrstami (R1, R2) in dveh sort grozdja (G,M) na pridelek grozdja. Poskus je bil postavljen po shemi slučajnega bloka s 6 ponavljanji. Torej imamo popolni dvofaktorski poskus v 6 blokih.

12

Analizirajte bločni poskus najprej tako, da ne upoštevate

strukture v obravnavanjih. Preverite ničelno domnevo,

da je povprečni pridelek po obravnavanjih enak.

Testirajte še homogenost varianc.

14

Test of Homogeneity of Variances

pridelek

1,376 3 20 ,279

Levene

Statistic df1 df2 Sig.

Predpostavka o enakosti varianc po obravnavanjih je izpolnjena

(Levenov test), zato si oglejmo rezultate ANOVE.

16

Tests of Between-Subjects Effects

Dependent Variable: pridelek

12220,228a 8 1527,529 3,148 ,027

280599,513 1 280599,513 578,272 ,000

4779,622 1 4779,622 9,850 ,007

288,496 1 288,496 ,595 ,453

6410,295 5 1282,059 2,642 ,066

741,815 1 741,815 1,529 ,235

7278,567 15 485,238

300098,308 24

19498,795 23

Source

Corrected Model

Intercept

sorta

razmak

blok

sorta * razmak

Error

Total

Corrected Total

Type III Sum

of Squares df Mean Square F Sig.

R Squared = ,627 (Adjusted R Squared = ,428)a.

Na osnovi tega lahko sklepamo:

Da povprečni pridelek grozdja ni odvisen od razdalje med vrstama

(p=0,453), je pa odvisen od sorte (p=0,007). Torej lahko pri 1%

tveganju trdimo, da ima 2. sorta značilno večji pridelek kot 1. sorta.

Pri interakciji lahko zavržemo trditev, da faktorji ne delujejo

neodvisno drug od drugega.

17

Vidimo, da je vseeno, če damo blok kot

slučajni faktor ali ne.

19

Tabela: prikaz povprečij po obravnavanjih za oba faktorja.

Interakcije med

razmakom in sorto

ni.

Prednosti in slabosti faktorskega poskusa

Odkrije interakcijo, če le ta obstaja.

Če interakcija ne obstaja, pa zelo dobro

oceni glavne vplive dejavnikov. Imamo

namreč skrite ponovitve.

Veliko faktorjev in ravni pomeni veliko

obravnavanj.

Včasih vsa obravnavanja niso izvedljiva.

22

PRIMER:

Izvedli so gnojilni poskus na krompirju, kjer so proučevali

vpliv gnojenja z dušikom in kalijem ter njun medsebojni

vpliv. Gnojenje z dušikom (N) so izvedli na dveh ravneh:

0 kg/h in 75 kg/h. Gnojenje s kalijem (K) so izvedli na

dveh ravneh: 0 kg/h in 190 kg/h. Merili so pridelek

krompirja na parcelo (kg/60 m2).

23

1. Dejavnik A: gnojenje z N

Dejavnik B: gnojenje z K

Dvofaktorski poskus: 2x2

Obravnavanja: (0,0), (75,0), (0,190), (75,190)

Poskusna zasnova: 3 bloki, v vsakem bloku 4 parcele, ki merijo 60 m2

Izid: pridelek krompirja v kg/60 m2

Namen poskusa je ugotoviti:

Kako vpliva gnojenje z N na povprečni pridelek krompirja?

Kako vpliva gnojenje s K na povprečni pridelek krompirja?

Kako prisotnost K vpliva na povprečni pridelek pri različnih ravneh N?

24

blok (0,0) (75,0) (0,190) (75,190)

1 90 58 112 156

2 60 61 122 142

3 76 63 113 142

Tabela: izid poskusa – pridelek krompirja v kg/60 m2.

26

Tabela: Homogenost varianc po obravnavanjih.

(Compare/Analysis of Variance/One Way ANOVA

Dependent Variable:pridelek

Factor:obravnavanje

Ikona: Options/Homogeneity of variance test

Test of Homogeneity of Variances

pridelek

1,888 3 8 ,210

Levene

Statistic df1 df2 Sig.

Kar pomeni, da ničelno domnevo

obdržimo in privzamemo, da je ta

predpostavka izpolnjena.

27



13861,417a 5 2772,283 31,533 ,000

119002,083 1 119002,083 1353,578 ,000

127,167 2 63,583 ,723 ,523

200,083 1 200,083 2,276 ,182

11970,083 1 11970,083 136,153 ,000

1564,083 1 1564,083 17,791 ,006

527,500 6 87,917

133391,000 12

14388,917 11

Source

Corrected Model

Intercept

blok

dušik

kalij

dušik * kalij

Error

Total

Corrected Total

Type III Sum



Tabela: ANOVA.

Ukaz:Analyze/General Linear Model/Univariate


Factor:blok,dušik,kalij

Model:blok, dušik, kalij,dušik*kalij

28

Povprečni pridelek je odvisen od dodanega kalija.

Povprečni pridelek ni odvisen od dodanega dušika.

Interakcija NxK je statistično značilna. Pri interpretaciji interakcije

si pomagamo s tabelo povprečij po obravnavanjih in z grafičnimi

prikazi.

Podrobneje si oglejmo interpretacijo interakcije.

29

Tabela: ANOVA.

Ukaz:Analyze/General Linear Model/Univariate


Factor:blok,obravnavanje

Model:blok, dušik, obravnavaje



13861,417a 5 2772,283 31,533 ,000

119002,083 1 119002,083 1353,578 ,000

127,167 2 63,583 ,723 ,523

13734,250 3 4578,083 52,073 ,000

527,500 6 87,917

133391,000 12

14388,917 11

Source

Corrected Model

Intercept

blok

obrav

Error

Total

Corrected Total

Type III Sum



Tabela: ANOVA za obravnavanja

30

pridelek

Tukey HSDa

3 60,6667

3 75,3333

3 115,6667

3 146,6667

,269 1,000 1,000

obrav

(75,0)

(0,0)

(0,190)

(75,190)

Sig.

N 1 2 3

Subset for alpha = .05

Means for groups in homogeneous subsets are displayed.

Uses Harmonic Mean Sample Size = 3,000.a.

Multiple Comparisons


Tukey HSD

-40,33333* 7,38617 ,003 -63,9865 -16,6802

14,66667 7,38617 ,269 -8,9865 38,3198

-71,33333* 7,38617 ,000 -94,9865 -47,6802

40,33333* 7,38617 ,003 16,6802 63,9865

55,00000* 7,38617 ,000 31,3469 78,6531

-31,00000* 7,38617 ,013 -54,6531 -7,3469

-14,66667 7,38617 ,269 -38,3198 8,9865

-55,00000* 7,38617 ,000 -78,6531 -31,3469

-86,00000* 7,38617 ,000 -109,6531 -62,3469

71,33333* 7,38617 ,000 47,6802 94,9865

31,00000* 7,38617 ,013 7,3469 54,6531

86,00000* 7,38617 ,000 62,3469 109,6531

(J) obrav

(0,190)

(75,0)

(75,190)

(0,0)

(75,0)

(75,190)

(0,0)

(0,190)

(75,190)

(0,0)

(0,190)

(75,0)

(I) obrav

(0,0)

(0,190)

(75,0)

(75,190)

Mean

Difference

(I-J) Std. Error Sig. Lower Bound Upper Bound

95% Confidence Interval

The mean difference is significant at the .05 level.*.

31

N

K 0 75 yn=75

-yn=0

0 75,3 60,7 -14,6

190 115,7 146,7 31

yk=190

-yk=0

40,4 86 45,6

Če K ni, dodajanje N zmanjša povprečni pridelek za 14,6 kg/parcelo (ni statistično značilno).

Če K je, dodajanje N poveča povprečni pridelek za 31,0 kg/parcelo (je statistično značilno).

Če N ni, dodajanje K poveča povprečni pridelek za 40,4 kg/parcelo (je statistično značilno).

Če N je, dodajanje K poveča povprečni pridelek za 86,0 kg/parcelo (je statistično značilno).

Prikaz povprečnih pridelkov krompirja po obravnavanjih

32

SKLEPI:

Med obravnavanji obstajajo statistično značilne razlike (p=0,0001).

Gnojiti se splača s K, ki mu dodamo N. Dodan N povečuje vpliv K, saj

se je povprečni pridelek povečal iz 115,7 kg/parcelo na 146, 7

kg/parcelo, torej kar za približno 27 %. Razlika je statistično značilna.

Odsvetujemo gnojenje samo z N, saj je le-ta zmanjšal povprečni

pridelek za približno 20 % v primerjavi s kontrolo, vendar ta razlika ni

statistično značilna.

34

Grafični prikaz interakcije

36

SPLIT-PLOT POSKUS (POSKUSNA ZASNOVA Z DELJENKAMI)

2

Shema split-plot poskusa

Blok1

Blok2

Blok3

Blok4

AB C

A B C

AB C

A BC

0 50100 150 50 0100 150 150 0100 50

150 0100 50 0 10050 150 100 050 150

100 15050 0 0 50100 150 50 0100 150

0 15050 100 150 0100 50 50 0150 100

Parcela

Podparcela

Pri split–plot poskusu imamo dva proučevana dejavnika: dejavnik A

na a ravneh, na glavnih parcelah.

Ta dejavnik potrebuje zaradi tehnoloških ovir večje parcele.

Dejavnik B na b ravneh, na podparcelah (vsaka parcela se razdeli na

podparcele). Ponovitve so izvedene v blokih.

37

Vsak blok (ponovitev) razdelimo na glavne parcele, te glavne

parcele pa razdelimo na podparcele.

Od razporeditve glavnih parcel znotraj bloka, je odvisen model in

ANOVA. Mi se bomo omejili in pogledali statistično analizo za

primer, kjer smo glavne parcele razporedili naključno.

Matematični model za poskusno zasnovo split-plot je

Yijk=μ+αi+βj+(αβ)ij+λk+(αλ)ik+εijk,

kjer je μ povprečna vrednost proučevane lastnosti, αi , λk in (αλ)ik so

fiksni vplivi obravnavanj, βj slučajni vpliv bloka ter (αβ)ij in εijk

slučajni napaki (na glavnih parcelah in podparcelah).

38

PRIMER (Hadživuković, str. 349)

Cilj poskusa je ugotoviti, kako sorta pšenice

in gostota setve vplivata na pridelek pšenice,

in ali obstaja interakcija med obema

dejavnikoma. V poskus so bile vključene štiri

sorte in tri različne gostote setve. Poskus je

bil zasnovan v split-plot zasnovi. Sorta je bila

na glavnih parcelah, gostote setve pa na

podparcelah.

39

Sorte Gostote

setve

Bloki

San

pastore

(1)

500

700

900

2,47

2,77

2,76

2,82

2,66

2,53

2,47

2,57

2,55

2,71

2,82

2,85

2,28

2,55

2,48

Mara

(2)

500

700

900

2,60

2,75

2,77

2,87

2,38

2,56

2,33

2,42

2,61

2,80

2,89

2,51

2,51

2,48

2,65

Produttore

(3)

500

700

900

3,07

2,95

3,06

2,75

2,83

2,30

3,05

3,02

2,91

2,84

3,08

3,05

2,81

2,94

2,83

S-15

(4)

500

700

900

2,22

2,49

2,32

2,45

2,46

2,20

2,26

2,24

2,53

2,48

2,49

2,25

2,17

2,33

2,17

40

Podatke ustrezno zapišemo v programu SPSS.

41

Izberemo Analyze/General linear model/Univariate; vstavimo

odvisno spremenljivko pridelek (Dependent Variable), fiksna

dejavnika gostota setve in sorta (Fixed Factor(s)) in slučajni

dejavnik blok (Random Factor). Pri opciji Model izberemo Custom

in določimo, da SPSS izračuna vpliv dejavnikov gostota setve, sorta

in blok ter kombinacijo sorta*gostota setve. Nato izberemo ikono

Paste in odpre se okno s sintakso - ukazni jezik. Vrstico ’’design’’

dopolnimo z blok(sorta). Nazadnje izberemo ikono Run/Current

in izpišejo se rezultati analize, ki so podani v tabeli.

43

Tabela: ANOVA za split-plot

Tests of Be tween-Subjects Effects


,048 2 ,024 1,054 ,360

,724 32 ,023a

2,370 3 ,790 24,054 ,000

,394 12 ,033b

,379 4 ,095 2,885 ,069

,394 12 ,033b

,075 6 ,012 ,549 ,767

,724 32 ,023a

,394 12 ,033 1,451 ,194

,724 32 ,023a

Source

Hypothesis

Error

gostotasetve

Hypothesis

Error

sorta

Hypothesis

Error

blok

Hypothesis

Error

gostotasetve

* sorta

Hypothesis

Error

blok(sorta)

Type III Sum


MS(Error)a.

MS(blok(sorta))b.

ANOVA je sestavljena iz dveh delov

Za glavne parcele, to je isto kot pri blokih,

s tem ovrednotimo vpliv dejavnika A.

Za podparcele tu ovrednotimo vpliv

dejavnika B in njune interakcije.

45

•Na osnovi dobljenih rezultatov lahko sklepamo, da statistično

značilno variabilnost pridelka povzroča sorta.

•Nadalje lahko razberemo, da čas prekrivanja in njuna interakcija

(sorta*gostota setve) nista statistično značilna.

46

Z dejavnikom, za katerega se izkaže da statistično značilno vpliva na

pridelek, gremo v nadaljnjo analizo:

Tabela: Homogeni nizi pridelek

Tukey HSD

so1 N

Subset for alpha = .05

1 2 3

4,00 15 2,3373

2,00 15 2,6087

1,00 15 2,6193

3,00 15 2,8993

Sig. 1,000 ,997 1,000

Means for groups in homogeneous subsets are displayed.

V tabeli so prikazani homogeni nizi dobljeni s Tukeyevim testom

mnogoterih primerjav pri 5 % tveganju. Na osnovi povprečnih

vrednosti za posamezne sorte ter na osnovi HSD testa, lahko

ugotovimo, da med povprečnima pridelkoma pri sortah San pastore in

Mara ni statistično značilnih razlik pri 5 % tveganju, medtem ko se

povprečni pridelki pri ostalih sortah, statistično značilno razlikujejo.

LATINSKI KVADRAT PRIMER Hadživuković str. 263.

(pridelki in različna gnojenja)

Stolpci/vrstice 1 2 3 4

1 17(A) 15,00(B) 19,50(D) 26,00(C)

2 14,30(D) 21,20(A) 22,40(C) 17,50(B)

3 25,00(C) 13,20(D) 16,70(B) 23,30(A)

4 13,80(B) 26,00(C) 24,00(A) 17,40(D)

48

analiza variance 3...analiza variance 3.del doc.dr. tadeja kraner Šumenjak delovna verzija 2...

Documents