katseandmete analüüs i osa www .ut.ee/~tammarut/stat.htm
DESCRIPTION
Katseandmete analüüs I osa http:// www .ut.ee/~tammarut/stat.htm. Vanemuise 46-202. Alustamine. Tunnuste lisamine ja kopeerimine. Väärtustele ridade lisamine ja kopeerimine. t-testid, parameetrilised korrelatsioonid. mitteparameetrilised testid. tunnuse jaotuse kontrollimine. - PowerPoint PPT PresentationTRANSCRIPT
Katseandmete analüüsI osa
http://www.ut.ee/~tammarut/stat.htm
Vanemuise 46-202
Alustamine
Väärtustele ridade lisamine ja kopeerimine
t-testid, parameetrilised korrelatsioonid
mitteparameetrilised testidtunnuse jaotuse kontrollimine
Tunnuse väärtustest histogrammi koostamine
Kahe pideva tunnuse omavahelise seose joonis
Faktortunnuse erinevate tasemete vaheliste jooniste koostamine
Andmete sisestamine File > New... Tunnusenimed: double-click nimereale
Sorteerimine
Arvutamine:
nt. logaritmimiseks:v3=log(v2)
või eri tunnuste kombineerimiseks:
v5=‘kaal’/’vanus’
Tunnuste selekteerimine:Tools >...Include cases: sugu=‘isane’ and vanus=4
Sama teeb ka nupp:
Märgi ära huvipakkuvad statistikud, nt: keskväärtus (Mean) mediaan (Median) mood (Mode) standardhälve (Standard Deviation (SD)) dispersioon (Variance) standardviga (Std. err. of mean (SE)) usalduspiirid (Conf. Limits for mean) variatsioonikoefitsient (Coefficient of Variation; Stat.7 puudub) kvartiilid (Lower and upper quartiles)
Kirjeldavad statistikud
Statistics > Basic statistics and tables > Descriptive statistics > Advanced
Histogramm
Graphs > Histograms > Advanced
20%
30%
15% 15%
10%
5% 5%
1 2 3 4 5 6 70
1
2
3
4
5
6
7
No of obs
Variables: vali uuritav tunnus
Graph type: regular / multiple / double-Y
Fit type: Off / Normal / ...
50%
15% 15%10% 10%
0
2
4
6
8
10
12
No of obs
1 2 3 4 5 6 70
1
2
3
4
5
No of obs
em aste kaal isaste kaal
Show percentages (% tulpade kohale)
Statistics: Descriptive (Kirjeldavad
statistikud joonisele)
Intervals: Categories... (Tulpade arvu
muutmine)
Sel Cond SELECTCASES
T-testStatistics > Basic statistics and tables > t-test, independent, by groups
em ane isane0
1
2
3
4
5
6
7
kaal
Mean Mean±SE Mean±SD
Meid huvitavad statistikud: t-value df p3.59 18 0.002
T-testi aken
Vali uuritavad tunnused Dependent e sõltuv e response-tunnus
(t-testis tunnus, mille erinevust testitakse)Independent e sõltumatu e faktortunnus
(t-testis grupid, mida omavahel võrreldakse)
Advanced
Summary (testitulemused)Box plot (graafik)Categorized Normal Plots (normaaljaotuse testimine)
Levene’s test (dispersioonide
erinevuse testimine)
Quick Options
emane isane0
1
2
3
4
5
6
7
kaal
Mean Mean±SE Mean±SD
Variables:
Eelduste testimiseks
Ühesuunaline ANOVA (dispersioonanalüüs)
Statistics > ANOVA > One-way ANOVA
Variables: Vali sõltuv ja sõltumatu (grupeeriv) muutuja; Vajuta OK > All effects (tulemuste tabel)
> More results > Summary > Whole model R (Adjusted R2 - mudeli seletusvõime näitaja)
Effect SS d.f. MS F pIntercept 194.94 1 194.94 96.62 <0.0001
vanus 23.7 2 11.85 5.87 0.012
Error 34.3 17 2.02
ndf (mudelivabadusastmed) ddf (vea
vabadusastmed)Eelduste testimine:More results>AssumptionsPlot means vs std deviations
Mitteparameetriline ANOVA
Statistics > Nonparametrics > Comparing multiple independent samples
Summary: Kruskal-Wallis ANOVA & Median Test Multiple comparisons of mean ranks (mis grupid erinesid?)
Kruskal-Wallis ANOVA by Ranks; kaal (Näidisandmed) Independent (grouping) variable: sugu Kruskal-Wallis test: H ( 1, N= 20) =7.179669 p =0.0276
Mediaanitest Kruskal-Wallise ANOVA
Tulemused (meid huvitavad H, N ja p):
emane isane0
1
2
3
4
5
6
7
8
kaal
Median 25%-75% Min-Max
Korrelatsioonid
Pearson (parameetriline)
Spearman (mitteparameetriline)
Statistics > Nonparametrics > Correlations
Compute: Detailed report Spearman R
20 0.59 3.12 0.0059
vanus & kaal
P-levelt(N-2)Spearman R
N
Options: Display detailed table of results
Statistics > Basic stat > Correlation matrices
0.61 0.37 3.28 0.0042 20
Nptr2r(X,Y)
Lineaarne regressioon
Statistics > Advanced Linear/Nonlinear Models > General Linear Models > Simple regression (1 sõltumatu muutuja)
või Multiple regression (>1 sõltumatu muutuja) või Factorial regression (>1 sõltumatu muutuja + koosmõjud)
Variables: vali sõltuv ja sõltumatu (predictor e ennustav) muutuja
OK
SS d.f MS F p
Intercept
Vanus
Kaal
Vanus*kaal
Error
147,7466 1 147,7466 60,82710 0,000001
45,7470 1 45,7470 18,83399 0,000507
9,6427 1 9,6427 3,96990 0,063666
7,1408 1 7,1408 2,93988 0,105718
38,8634 16 2,4290
All effects (Erinevate sõltumatute tunnuste mõju hindamiseks):
Whole Model R (Mudeli üldise seletusvõime hindamiseks):
0,89 0,79 0,75 148,34 3 49,45 38,86 16 2,43 20,36 0,00010
Multiple Multiple Adjusted SS df MS SS df MS F p R R2 R2 Model Model Model Resid. Resid. Resid.
Regressioonivõrrand:y = a + bx
Report > Pred.equationVõi:
Graphs > Scatterplots > Advanced (linnuke Regression
equation ette)Või:
More results > Coefficients („Param.“ lahtrist saate
algoordinaadi ja b)
Eelduste paikapidavuse hindamine:
Jääkide jaotus: Resids > Residuals
Jääkide sõltuvus keskväärtustest: Resids > Obs & Resids
-6 -5 -4 -3 -2 -1 0 1 2 3 4 5
X <= Category Boundary
0
1
2
3
4
5
No.
of o
bs.
0 1 2 3 4 5 6 7 8 9 10 11
Observed Values
-5
-4
-3
-2
-1
0
1
2
3
4
5
Raw
Res
idua
ls
Kond itsioon = 9,16 - 1,12 * kaal; 0,95 C onf.Int.
0 1 2 3 4 5 6 7 8kaal
0
2
4
6
8
10
12
Kondit sioon
r2 = 0,3891; r = -0,6238; p = 0,0033
Graafik regressiooni & korrelatsiooni illustreerimiseksGraphs > Scatterplots > Advanced
Korrelatsiooni puhul vali statistikud (Statistics > Corr. and p),
Regressiooni puhul regressioonivalem (Statistics > Regression (fit) equasion) ja
regressioonisirge usalduspiiridega (Regression bands > Confidence)
Mitmesuunaline (Multiway) ANOVAKaks (või rohkem) faktortunnust
Statistics > ANOVA > Factorial ANOVA
Variables > Vali 1 sõltuv muutuja ja vähemalt 2 sõltumatut faktorit
OK > All effects
Intercept
sugu
vanus
sugu*vanus
Error
SS d.f MS F p
768,15 1 768,15 136,85 <0,0001
0,04 1 0,04 0,01 0,94
0,24 1 0,24 0,04 0,84
97,15 1 97,15 17,3 0,00074
89,81 16 5,61
Joonis 2 faktori interaktsiooni illustreerimiseks
1. ANOVA tulemusteaknas All effects/Graphs2. Kliki interaktsiooni-rida aktiivseks > OK
F(1, 16)= 17,308, p= ,00074
emane isane123456789
1011121314
Veresuhkur
s inine punane
ANCOVA e. Kovariatsioonanalüüs
Statistics > Advanced Linear/Nonlinear Models > General Linear Models > Analysis of covariance
Variables > Vali sõltuv tunnus, huvialune faktortunnus ja pidev kovariaat
OK > All effects
423,20 1 423,20 115,67 <0,0001
125,00 1 125,00 34,16 <0,0001
52,16 1 52,16 14,25 0,0015
62,20 17 3,66
SS d.f. MS F p
Intercept
kaal
sugu
Error
LS Means e. kovariaadi mõjust puhastatud keskmised:
ANCOVA tulemusteaknas: Means > Least squares means
emane 7,915385
isane 3,684615
veresuhkur sugu mean
sugu; LS M eans; 0,95 confidence interva ls
C urrent e ffect: F (1, 17)= 14,255, p= ,00151
emane isane123456789
1011
Veresuhkur
Graafiku toimetamineDouble-click graafiku peal avab toimetamise akna
Skaala muutmine: Axis scaling (X või Y) > Mode > Manual Edit step > Mode > Manual
Tunnusenime muutmine: Axis title (X või Y)
Tulpade muutmine: Plot Bars (tulpade värv ja muster) Plot Histogram (tulpade arv ja vahed)
Graafikule kirjutamine: Menüüribast Insert > Text > joonisele ilmub kast „Custom text“, mida saab toimetada.
Graafiku toimetamine
Soovitud väärtuste märkimiseks joonisel:graafiku toimetamise aknas:
Axis: Scale values (“linnuke” custom labels ette)> Edit custom labels...
Kirjuta lisatavad väärtused ja neile vastavad tekstid, “linnuke” Grid etteja toimeta märkimisjoon silmatorkavamaks:
Gridlines...
Toimetatud graafiku Word-i saamiseks klõps parema hiireklahviga jaCopy graph (ja Paste Word-is)
võiSave graph (.wmf, .jpg formaadis ja Insert > Picture > From file Word-is)
Tulemuste toortabeli Word-i saamiseks kopeeri ja kleebi Report aknast.
Andmete importimine ja eksportimine
Kopeerimine ja kleepimine teisest programmist.
Importimine Exelist: File > Open... > Import selected sheet to a workbook
Eksportimine teistesse formaatidesse (tekstifail, SPSS, SAS, LOTUS, .pdf):
File > Save as... > soovitavaks formaadiks kohandamise dialoogaken, nt. Exeli puhul...
Tulemuste haldamine
1. Workbook – kõik analüüsid, joonised, jne paigutatakse ühte kausta,
mida on lihtne sirvida
2. Report – kõik tulemid paigutatakse ühte tekstifaili, mida on vajadusel kerge toimetada ja kuhu saab lisada omapoolseid kommentaare,
märkuseid, vms (workbook seda ei võimalda)
File > Output Manager > …
Tulemused paigutatakse Workbook’i
Tulemused paigutatakse Report’i