analiza variance 3...analiza variance 3.del doc.dr. tadeja kraner Šumenjak delovna verzija 2...
TRANSCRIPT
-
1
ANALIZA
VARIANCE
3.del
Doc.dr. Tadeja Kraner Šumenjak
Delovna verzija
-
2
FAKTORSKI POSKUS (Factorial Experiments)
- dva proučevana dejavnika (dvofaktorski), trije
proučevani dejavniki (trifaktorski), več proučevanih
dejavnikov (večfaktorski poskus),
- bločna zasnova,
- model III ANOVA, SKOblok nima pomena,
- ZELO UPORABNA POSKUSNA ZASNOVA
-
3
DVOFAKTORSKI POSKUS
Agricultural Field Experiments str. 86
S poljskim poskusom v treh ponovitvah želimo
proučiti vpliv medvrstnega razmika ter gnojenja s fosforjem na pridelek nizkega fižola (kg/parcelo).
V poskus so vključeni trije medvrstni razmaki:
R1=45 cm R2=90 cm R3=135 cm
ter gnojenje s fosforjem v dveh odmerkih:
P1=0 kg/ha P2=25 kg/ha
-
4
Dejavnik 1:
medvrstni
razmak
Dejavnik 2:
odmerek
fosforja
Nivo
dejavnika
45 cm (1)
60 cm (2)
135 cm (3)
0 kg/ha (1)
25 kg/ha
(2)
Obravnavanj
a
11
12
21
22
31
32
Obravnavanje (Treatment) = česar
vpliv na eksperimentalni material
proučujemo (is a procedure whose
effect on the experimental material is
to be measured),
Dejavnik (Factor) = (a particular class
of related treatments),
Nivo dejavnika (Factor Level)
Interakcija = skupno odvisno
delovanje dveh ali več proučevanih
dejavnikov na izid
-
INTERAKCIJA
Je posebne vrste vpliv dveh ali več
dejavnikov na izid.
Dvofaktorska interakcija je prisotna, če je
vpliv enega dejavnika na izid drugačen, pri
različnih ravneh drugega.
-
6
R2P1
60
R1P2
45
R1P1
55
R1P1
65
R3P1
55
R3P1
51
R3P2
66
R3P2
57
R1P2
43
R3P1
59
R1P1
58
R2P1
54
R1P2
56
R2P2
50
R2P2
45
R2P2
62
R2P1
59
R3P2
50
-
7
2x3 FAKTORSKI POSKUS Design and Analysis of Experiments str. 122
BOB DAE122
Proučiti želimo vpliv gnojenja s fosforjem na pridelek navadnega boba (Vicia faba). Domnevamo, da tip rastline različno reagira na gnojenje, zato v poskus vključimo:
T1= kratek, grmast tip,
T2= visok, pokončen tip.
Preizkušani gnojilni odmerki fosforja so:
P1= 0 kg/ha,
P2= 25 kg/ha,
P3= 50 kg/ha.
-
8
S STATISTIČNO ANALIZO ODGOVORI:
Ali tip rastline vpliva na pridelek? Pri kateri stopnji tveganja oz. s kakšno zanesljivostjo lahko to trdimo?
Ali gnojenje s fosforjem vpliva na pridelek? Pri kateri stopnji tveganja oz. s kakšno zanesljivostjo lahko to trdimo?
Ali je interakcija tip x P statistično značilna?
-
9
Obravnavanje
Pridelek
Tip rastline (T)
Gnojenje s fosforjem (P)
T x P
Dejavnik
Srednja vrednost
Tip rastline Grmast
Pokončen
Gnojenje s P 0 kg/ha
25 kg/ha
50 kg/ha
-
10
PRIMER:
Analizirajmo naslednji primer (Vasilj, str. 202). Izvedli so študijo, da bi ugotovili vpliv dveh različnih razmakov med vrstami (R1, R2) in dveh sort grozdja (G,M) na pridelek grozdja. Poskus je bil postavljen po shemi slučajnega bloka s 6 ponavljanji. Torej imamo popolni dvofaktorski poskus v 6 blokih.
-
11
-
12
Analizirajte bločni poskus najprej tako, da ne upoštevate
strukture v obravnavanjih. Preverite ničelno domnevo,
da je povprečni pridelek po obravnavanjih enak.
Testirajte še homogenost varianc.
-
13
-
14
Test of Homogeneity of Variances
pridelek
1,376 3 20 ,279
Levene
Statistic df1 df2 Sig.
Predpostavka o enakosti varianc po obravnavanjih je izpolnjena
(Levenov test), zato si oglejmo rezultate ANOVE.
-
15
-
16
Tests of Between-Subjects Effects
Dependent Variable: pridelek
12220,228a 8 1527,529 3,148 ,027
280599,513 1 280599,513 578,272 ,000
4779,622 1 4779,622 9,850 ,007
288,496 1 288,496 ,595 ,453
6410,295 5 1282,059 2,642 ,066
741,815 1 741,815 1,529 ,235
7278,567 15 485,238
300098,308 24
19498,795 23
Source
Corrected Model
Intercept
sorta
razmak
blok
sorta * razmak
Error
Total
Corrected Total
Type III Sum
of Squares df Mean Square F Sig.
R Squared = ,627 (Adjusted R Squared = ,428)a.
Na osnovi tega lahko sklepamo:
Da povprečni pridelek grozdja ni odvisen od razdalje med vrstama
(p=0,453), je pa odvisen od sorte (p=0,007). Torej lahko pri 1%
tveganju trdimo, da ima 2. sorta značilno večji pridelek kot 1. sorta.
Pri interakciji lahko zavržemo trditev, da faktorji ne delujejo
neodvisno drug od drugega.
-
17
Vidimo, da je vseeno, če damo blok kot
slučajni faktor ali ne.
-
18
-
19
Tabela: prikaz povprečij po obravnavanjih za oba faktorja.
Interakcije med
razmakom in sorto
ni.
-
Prednosti in slabosti faktorskega poskusa
Odkrije interakcijo, če le ta obstaja.
Če interakcija ne obstaja, pa zelo dobro
oceni glavne vplive dejavnikov. Imamo
namreč skrite ponovitve.
Veliko faktorjev in ravni pomeni veliko
obravnavanj.
Včasih vsa obravnavanja niso izvedljiva.
-
22
PRIMER:
Izvedli so gnojilni poskus na krompirju, kjer so proučevali
vpliv gnojenja z dušikom in kalijem ter njun medsebojni
vpliv. Gnojenje z dušikom (N) so izvedli na dveh ravneh:
0 kg/h in 75 kg/h. Gnojenje s kalijem (K) so izvedli na
dveh ravneh: 0 kg/h in 190 kg/h. Merili so pridelek
krompirja na parcelo (kg/60 m2).
-
23
1. Dejavnik A: gnojenje z N
Dejavnik B: gnojenje z K
Dvofaktorski poskus: 2x2
Obravnavanja: (0,0), (75,0), (0,190), (75,190)
Poskusna zasnova: 3 bloki, v vsakem bloku 4 parcele, ki merijo 60 m2
Izid: pridelek krompirja v kg/60 m2
Namen poskusa je ugotoviti:
Kako vpliva gnojenje z N na povprečni pridelek krompirja?
Kako vpliva gnojenje s K na povprečni pridelek krompirja?
Kako prisotnost K vpliva na povprečni pridelek pri različnih ravneh N?
-
24
blok (0,0) (75,0) (0,190) (75,190)
1 90 58 112 156
2 60 61 122 142
3 76 63 113 142
Tabela: izid poskusa – pridelek krompirja v kg/60 m2.
-
25
-
26
Tabela: Homogenost varianc po obravnavanjih.
(Compare/Analysis of Variance/One Way ANOVA
Dependent Variable:pridelek
Factor:obravnavanje
Ikona: Options/Homogeneity of variance test
Test of Homogeneity of Variances
pridelek
1,888 3 8 ,210
Levene
Statistic df1 df2 Sig.
Kar pomeni, da ničelno domnevo
obdržimo in privzamemo, da je ta
predpostavka izpolnjena.
-
27
Tests of Between-Subjects Effects
Dependent Variable: pridelek
13861,417a 5 2772,283 31,533 ,000
119002,083 1 119002,083 1353,578 ,000
127,167 2 63,583 ,723 ,523
200,083 1 200,083 2,276 ,182
11970,083 1 11970,083 136,153 ,000
1564,083 1 1564,083 17,791 ,006
527,500 6 87,917
133391,000 12
14388,917 11
Source
Corrected Model
Intercept
blok
dušik
kalij
dušik * kalij
Error
Total
Corrected Total
Type III Sum
of Squares df Mean Square F Sig.
R Squared = ,963 (Adjusted R Squared = ,933)a.
Tabela: ANOVA.
Ukaz:Analyze/General Linear Model/Univariate
Dependent Variable:pridelek
Factor:blok,dušik,kalij
Model:blok, dušik, kalij,dušik*kalij
-
28
Povprečni pridelek je odvisen od dodanega kalija.
Povprečni pridelek ni odvisen od dodanega dušika.
Interakcija NxK je statistično značilna. Pri interpretaciji interakcije
si pomagamo s tabelo povprečij po obravnavanjih in z grafičnimi
prikazi.
Podrobneje si oglejmo interpretacijo interakcije.
-
29
Tabela: ANOVA.
Ukaz:Analyze/General Linear Model/Univariate
Dependent Variable:pridelek
Factor:blok,obravnavanje
Model:blok, dušik, obravnavaje
Tests of Between-Subjects Effects
Dependent Variable: pridelek
13861,417a 5 2772,283 31,533 ,000
119002,083 1 119002,083 1353,578 ,000
127,167 2 63,583 ,723 ,523
13734,250 3 4578,083 52,073 ,000
527,500 6 87,917
133391,000 12
14388,917 11
Source
Corrected Model
Intercept
blok
obrav
Error
Total
Corrected Total
Type III Sum
of Squares df Mean Square F Sig.
R Squared = ,963 (Adjusted R Squared = ,933)a.
Tabela: ANOVA za obravnavanja
-
30
pridelek
Tukey HSDa
3 60,6667
3 75,3333
3 115,6667
3 146,6667
,269 1,000 1,000
obrav
(75,0)
(0,0)
(0,190)
(75,190)
Sig.
N 1 2 3
Subset for alpha = .05
Means for groups in homogeneous subsets are displayed.
Uses Harmonic Mean Sample Size = 3,000.a.
Multiple Comparisons
Dependent Variable: pridelek
Tukey HSD
-40,33333* 7,38617 ,003 -63,9865 -16,6802
14,66667 7,38617 ,269 -8,9865 38,3198
-71,33333* 7,38617 ,000 -94,9865 -47,6802
40,33333* 7,38617 ,003 16,6802 63,9865
55,00000* 7,38617 ,000 31,3469 78,6531
-31,00000* 7,38617 ,013 -54,6531 -7,3469
-14,66667 7,38617 ,269 -38,3198 8,9865
-55,00000* 7,38617 ,000 -78,6531 -31,3469
-86,00000* 7,38617 ,000 -109,6531 -62,3469
71,33333* 7,38617 ,000 47,6802 94,9865
31,00000* 7,38617 ,013 7,3469 54,6531
86,00000* 7,38617 ,000 62,3469 109,6531
(J) obrav
(0,190)
(75,0)
(75,190)
(0,0)
(75,0)
(75,190)
(0,0)
(0,190)
(75,190)
(0,0)
(0,190)
(75,0)
(I) obrav
(0,0)
(0,190)
(75,0)
(75,190)
Mean
Difference
(I-J) Std. Error Sig. Lower Bound Upper Bound
95% Confidence Interval
The mean difference is significant at the .05 level.*.
-
31
N
K 0 75 yn=75
-yn=0
0 75,3 60,7 -14,6
190 115,7 146,7 31
yk=190
-yk=0
40,4 86 45,6
Če K ni, dodajanje N zmanjša povprečni pridelek za 14,6 kg/parcelo (ni statistično značilno).
Če K je, dodajanje N poveča povprečni pridelek za 31,0 kg/parcelo (je statistično značilno).
Če N ni, dodajanje K poveča povprečni pridelek za 40,4 kg/parcelo (je statistično značilno).
Če N je, dodajanje K poveča povprečni pridelek za 86,0 kg/parcelo (je statistično značilno).
Prikaz povprečnih pridelkov krompirja po obravnavanjih
-
32
SKLEPI:
Med obravnavanji obstajajo statistično značilne razlike (p=0,0001).
Gnojiti se splača s K, ki mu dodamo N. Dodan N povečuje vpliv K, saj
se je povprečni pridelek povečal iz 115,7 kg/parcelo na 146, 7
kg/parcelo, torej kar za približno 27 %. Razlika je statistično značilna.
Odsvetujemo gnojenje samo z N, saj je le-ta zmanjšal povprečni
pridelek za približno 20 % v primerjavi s kontrolo, vendar ta razlika ni
statistično značilna.
-
33
-
34
Grafični prikaz interakcije
-
35
-
36
SPLIT-PLOT POSKUS (POSKUSNA ZASNOVA Z DELJENKAMI)
2
Shema split-plot poskusa
Blok1
Blok2
Blok3
Blok4
AB C
A B C
AB C
A BC
0 50100 150 50 0100 150 150 0100 50
150 0100 50 0 10050 150 100 050 150
100 15050 0 0 50100 150 50 0100 150
0 15050 100 150 0100 50 50 0150 100
Parcela
Podparcela
Pri split–plot poskusu imamo dva proučevana dejavnika: dejavnik A
na a ravneh, na glavnih parcelah.
Ta dejavnik potrebuje zaradi tehnoloških ovir večje parcele.
Dejavnik B na b ravneh, na podparcelah (vsaka parcela se razdeli na
podparcele). Ponovitve so izvedene v blokih.
-
37
Vsak blok (ponovitev) razdelimo na glavne parcele, te glavne
parcele pa razdelimo na podparcele.
Od razporeditve glavnih parcel znotraj bloka, je odvisen model in
ANOVA. Mi se bomo omejili in pogledali statistično analizo za
primer, kjer smo glavne parcele razporedili naključno.
Matematični model za poskusno zasnovo split-plot je
Yijk=μ+αi+βj+(αβ)ij+λk+(αλ)ik+εijk,
kjer je μ povprečna vrednost proučevane lastnosti, αi , λk in (αλ)ik so
fiksni vplivi obravnavanj, βj slučajni vpliv bloka ter (αβ)ij in εijk
slučajni napaki (na glavnih parcelah in podparcelah).
-
38
PRIMER (Hadživuković, str. 349)
Cilj poskusa je ugotoviti, kako sorta pšenice
in gostota setve vplivata na pridelek pšenice,
in ali obstaja interakcija med obema
dejavnikoma. V poskus so bile vključene štiri
sorte in tri različne gostote setve. Poskus je
bil zasnovan v split-plot zasnovi. Sorta je bila
na glavnih parcelah, gostote setve pa na
podparcelah.
-
39
Sorte Gostote
setve
Bloki
San
pastore
(1)
500
700
900
2,47
2,77
2,76
2,82
2,66
2,53
2,47
2,57
2,55
2,71
2,82
2,85
2,28
2,55
2,48
Mara
(2)
500
700
900
2,60
2,75
2,77
2,87
2,38
2,56
2,33
2,42
2,61
2,80
2,89
2,51
2,51
2,48
2,65
Produttore
(3)
500
700
900
3,07
2,95
3,06
2,75
2,83
2,30
3,05
3,02
2,91
2,84
3,08
3,05
2,81
2,94
2,83
S-15
(4)
500
700
900
2,22
2,49
2,32
2,45
2,46
2,20
2,26
2,24
2,53
2,48
2,49
2,25
2,17
2,33
2,17
-
40
Podatke ustrezno zapišemo v programu SPSS.
-
41
Izberemo Analyze/General linear model/Univariate; vstavimo
odvisno spremenljivko pridelek (Dependent Variable), fiksna
dejavnika gostota setve in sorta (Fixed Factor(s)) in slučajni
dejavnik blok (Random Factor). Pri opciji Model izberemo Custom
in določimo, da SPSS izračuna vpliv dejavnikov gostota setve, sorta
in blok ter kombinacijo sorta*gostota setve. Nato izberemo ikono
Paste in odpre se okno s sintakso - ukazni jezik. Vrstico ’’design’’
dopolnimo z blok(sorta). Nazadnje izberemo ikono Run/Current
in izpišejo se rezultati analize, ki so podani v tabeli.
-
42
-
43
Tabela: ANOVA za split-plot
Tests of Be tween-Subjects Effects
Dependent Variable: pridelek
,048 2 ,024 1,054 ,360
,724 32 ,023a
2,370 3 ,790 24,054 ,000
,394 12 ,033b
,379 4 ,095 2,885 ,069
,394 12 ,033b
,075 6 ,012 ,549 ,767
,724 32 ,023a
,394 12 ,033 1,451 ,194
,724 32 ,023a
Source
Hypothesis
Error
gostotasetve
Hypothesis
Error
sorta
Hypothesis
Error
blok
Hypothesis
Error
gostotasetve
* sorta
Hypothesis
Error
blok(sorta)
Type III Sum
of Squares df Mean Square F Sig.
MS(Error)a.
MS(blok(sorta))b.
-
ANOVA je sestavljena iz dveh delov
Za glavne parcele, to je isto kot pri blokih,
s tem ovrednotimo vpliv dejavnika A.
Za podparcele tu ovrednotimo vpliv
dejavnika B in njune interakcije.
-
45
•Na osnovi dobljenih rezultatov lahko sklepamo, da statistično
značilno variabilnost pridelka povzroča sorta.
•Nadalje lahko razberemo, da čas prekrivanja in njuna interakcija
(sorta*gostota setve) nista statistično značilna.
-
46
Z dejavnikom, za katerega se izkaže da statistično značilno vpliva na
pridelek, gremo v nadaljnjo analizo:
Tabela: Homogeni nizi pridelek
Tukey HSD
so1 N
Subset for alpha = .05
1 2 3
4,00 15 2,3373
2,00 15 2,6087
1,00 15 2,6193
3,00 15 2,8993
Sig. 1,000 ,997 1,000
Means for groups in homogeneous subsets are displayed.
V tabeli so prikazani homogeni nizi dobljeni s Tukeyevim testom
mnogoterih primerjav pri 5 % tveganju. Na osnovi povprečnih
vrednosti za posamezne sorte ter na osnovi HSD testa, lahko
ugotovimo, da med povprečnima pridelkoma pri sortah San pastore in
Mara ni statistično značilnih razlik pri 5 % tveganju, medtem ko se
povprečni pridelki pri ostalih sortah, statistično značilno razlikujejo.
-
LATINSKI KVADRAT PRIMER Hadživuković str. 263.
(pridelki in različna gnojenja)
Stolpci/vrstice 1 2 3 4
1 17(A) 15,00(B) 19,50(D) 26,00(C)
2 14,30(D) 21,20(A) 22,40(C) 17,50(B)
3 25,00(C) 13,20(D) 16,70(B) 23,30(A)
4 13,80(B) 26,00(C) 24,00(A) 17,40(D)
48
-
49