katseandmete analüüs i osa www .ut.ee/~tammarut/stat.htm

25
Katseandmete analüüs I osa http://www.ut.ee/~tammarut/stat.htm Vanemuise 46- 202

Upload: henry-pittman

Post on 14-Mar-2016

68 views

Category:

Documents


1 download

DESCRIPTION

Katseandmete analüüs I osa http:// www .ut.ee/~tammarut/stat.htm. Vanemuise 46-202. Alustamine. Tunnuste lisamine ja kopeerimine. Väärtustele ridade lisamine ja kopeerimine. t-testid, parameetrilised korrelatsioonid. mitteparameetrilised testid. tunnuse jaotuse kontrollimine. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

Katseandmete analüüsI osa

http://www.ut.ee/~tammarut/stat.htm

Vanemuise 46-202

Page 2: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

Alustamine

Väärtustele ridade lisamine ja kopeerimine

Page 3: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

t-testid, parameetrilised korrelatsioonid

mitteparameetrilised testidtunnuse jaotuse kontrollimine

Page 4: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

Tunnuse väärtustest histogrammi koostamine

Kahe pideva tunnuse omavahelise seose joonis

Faktortunnuse erinevate tasemete vaheliste jooniste koostamine

Page 5: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

Andmete sisestamine File > New... Tunnusenimed: double-click nimereale

Sorteerimine

Arvutamine:

nt. logaritmimiseks:v3=log(v2)

või eri tunnuste kombineerimiseks:

v5=‘kaal’/’vanus’

Tunnuste selekteerimine:Tools >...Include cases: sugu=‘isane’ and vanus=4

Sama teeb ka nupp:

Page 6: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

Märgi ära huvipakkuvad statistikud, nt: keskväärtus (Mean) mediaan (Median) mood (Mode) standardhälve (Standard Deviation (SD)) dispersioon (Variance) standardviga (Std. err. of mean (SE)) usalduspiirid (Conf. Limits for mean) variatsioonikoefitsient (Coefficient of Variation; Stat.7 puudub) kvartiilid (Lower and upper quartiles)

Kirjeldavad statistikud

Statistics > Basic statistics and tables > Descriptive statistics > Advanced

Page 7: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

Histogramm

Graphs > Histograms > Advanced

20%

30%

15% 15%

10%

5% 5%

1 2 3 4 5 6 70

1

2

3

4

5

6

7

No of obs

Variables: vali uuritav tunnus

Graph type: regular / multiple / double-Y

Fit type: Off / Normal / ...

50%

15% 15%10% 10%

0

2

4

6

8

10

12

No of obs

1 2 3 4 5 6 70

1

2

3

4

5

No of obs

em aste kaal isaste kaal

Show percentages (% tulpade kohale)

Statistics: Descriptive (Kirjeldavad

statistikud joonisele)

Intervals: Categories... (Tulpade arvu

muutmine)

Sel Cond SELECTCASES

Page 8: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

T-testStatistics > Basic statistics and tables > t-test, independent, by groups

em ane isane0

1

2

3

4

5

6

7

kaal

Mean Mean±SE Mean±SD

Meid huvitavad statistikud: t-value df p3.59 18 0.002

Page 9: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

T-testi aken

Vali uuritavad tunnused Dependent e sõltuv e response-tunnus

(t-testis tunnus, mille erinevust testitakse)Independent e sõltumatu e faktortunnus

(t-testis grupid, mida omavahel võrreldakse)

Advanced

Summary (testitulemused)Box plot (graafik)Categorized Normal Plots (normaaljaotuse testimine)

Levene’s test (dispersioonide

erinevuse testimine)

Quick Options

emane isane0

1

2

3

4

5

6

7

kaal

Mean Mean±SE Mean±SD

Variables:

Eelduste testimiseks

Page 10: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

Ühesuunaline ANOVA (dispersioonanalüüs)

Statistics > ANOVA > One-way ANOVA

Variables: Vali sõltuv ja sõltumatu (grupeeriv) muutuja; Vajuta OK > All effects (tulemuste tabel)

> More results > Summary > Whole model R (Adjusted R2 - mudeli seletusvõime näitaja)

Effect SS d.f. MS F pIntercept 194.94 1 194.94 96.62 <0.0001

vanus 23.7 2 11.85 5.87 0.012

Error 34.3 17 2.02

ndf (mudelivabadusastmed) ddf (vea

vabadusastmed)Eelduste testimine:More results>AssumptionsPlot means vs std deviations

Page 11: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

Mitteparameetriline ANOVA

Statistics > Nonparametrics > Comparing multiple independent samples

Summary: Kruskal-Wallis ANOVA & Median Test Multiple comparisons of mean ranks (mis grupid erinesid?)

Kruskal-Wallis ANOVA by Ranks; kaal (Näidisandmed) Independent (grouping) variable: sugu Kruskal-Wallis test: H ( 1, N= 20) =7.179669 p =0.0276

Mediaanitest Kruskal-Wallise ANOVA

Tulemused (meid huvitavad H, N ja p):

emane isane0

1

2

3

4

5

6

7

8

kaal

Median 25%-75% Min-Max

Page 12: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

Korrelatsioonid

Pearson (parameetriline)

Spearman (mitteparameetriline)

Statistics > Nonparametrics > Correlations

Compute: Detailed report Spearman R

20 0.59 3.12 0.0059

vanus & kaal

P-levelt(N-2)Spearman R

N

Options: Display detailed table of results

Statistics > Basic stat > Correlation matrices

0.61 0.37 3.28 0.0042 20

Nptr2r(X,Y)

Page 13: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

Lineaarne regressioon

Statistics > Advanced Linear/Nonlinear Models > General Linear Models > Simple regression (1 sõltumatu muutuja)

või Multiple regression (>1 sõltumatu muutuja) või Factorial regression (>1 sõltumatu muutuja + koosmõjud)

Variables: vali sõltuv ja sõltumatu (predictor e ennustav) muutuja

OK

Page 14: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

SS d.f MS F p

Intercept

Vanus

Kaal

Vanus*kaal

Error

147,7466 1 147,7466 60,82710 0,000001

45,7470 1 45,7470 18,83399 0,000507

9,6427 1 9,6427 3,96990 0,063666

7,1408 1 7,1408 2,93988 0,105718

38,8634 16 2,4290

All effects (Erinevate sõltumatute tunnuste mõju hindamiseks):

Whole Model R (Mudeli üldise seletusvõime hindamiseks):

0,89 0,79 0,75 148,34 3 49,45 38,86 16 2,43 20,36 0,00010

Multiple Multiple Adjusted SS df MS SS df MS F p R R2 R2 Model Model Model Resid. Resid. Resid.

Page 15: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

Regressioonivõrrand:y = a + bx

Report > Pred.equationVõi:

Graphs > Scatterplots > Advanced (linnuke Regression

equation ette)Või:

More results > Coefficients („Param.“ lahtrist saate

algoordinaadi ja b)

Eelduste paikapidavuse hindamine:

Jääkide jaotus: Resids > Residuals

Jääkide sõltuvus keskväärtustest: Resids > Obs & Resids

-6 -5 -4 -3 -2 -1 0 1 2 3 4 5

X <= Category Boundary

0

1

2

3

4

5

No.

of o

bs.

0 1 2 3 4 5 6 7 8 9 10 11

Observed Values

-5

-4

-3

-2

-1

0

1

2

3

4

5

Raw

Res

idua

ls

Page 16: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

Kond itsioon = 9,16 - 1,12 * kaal; 0,95 C onf.Int.

0 1 2 3 4 5 6 7 8kaal

0

2

4

6

8

10

12

Kondit sioon

r2 = 0,3891; r = -0,6238; p = 0,0033

Graafik regressiooni & korrelatsiooni illustreerimiseksGraphs > Scatterplots > Advanced

Korrelatsiooni puhul vali statistikud (Statistics > Corr. and p),

Regressiooni puhul regressioonivalem (Statistics > Regression (fit) equasion) ja

regressioonisirge usalduspiiridega (Regression bands > Confidence)

Page 17: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

Mitmesuunaline (Multiway) ANOVAKaks (või rohkem) faktortunnust

Statistics > ANOVA > Factorial ANOVA

Variables > Vali 1 sõltuv muutuja ja vähemalt 2 sõltumatut faktorit

OK > All effects

Intercept

sugu

vanus

sugu*vanus

Error

SS d.f MS F p

768,15 1 768,15 136,85 <0,0001

0,04 1 0,04 0,01 0,94

0,24 1 0,24 0,04 0,84

97,15 1 97,15 17,3 0,00074

89,81 16 5,61

Page 18: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

Joonis 2 faktori interaktsiooni illustreerimiseks

1. ANOVA tulemusteaknas All effects/Graphs2. Kliki interaktsiooni-rida aktiivseks > OK

F(1, 16)= 17,308, p= ,00074

emane isane123456789

1011121314

Veresuhkur

s inine punane

Page 19: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

ANCOVA e. Kovariatsioonanalüüs

Statistics > Advanced Linear/Nonlinear Models > General Linear Models > Analysis of covariance

Variables > Vali sõltuv tunnus, huvialune faktortunnus ja pidev kovariaat

OK > All effects

423,20 1 423,20 115,67 <0,0001

125,00 1 125,00 34,16 <0,0001

52,16 1 52,16 14,25 0,0015

62,20 17 3,66

SS d.f. MS F p

Intercept

kaal

sugu

Error

Page 20: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

LS Means e. kovariaadi mõjust puhastatud keskmised:

ANCOVA tulemusteaknas: Means > Least squares means

emane 7,915385

isane 3,684615

veresuhkur sugu mean

sugu; LS M eans; 0,95 confidence interva ls

C urrent e ffect: F (1, 17)= 14,255, p= ,00151

emane isane123456789

1011

Veresuhkur

Page 21: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

Graafiku toimetamineDouble-click graafiku peal avab toimetamise akna

Skaala muutmine: Axis scaling (X või Y) > Mode > Manual Edit step > Mode > Manual

Tunnusenime muutmine: Axis title (X või Y)

Tulpade muutmine: Plot Bars (tulpade värv ja muster) Plot Histogram (tulpade arv ja vahed)

Graafikule kirjutamine: Menüüribast Insert > Text > joonisele ilmub kast „Custom text“, mida saab toimetada.

Page 22: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

Graafiku toimetamine

Soovitud väärtuste märkimiseks joonisel:graafiku toimetamise aknas:

Axis: Scale values (“linnuke” custom labels ette)> Edit custom labels...

Kirjuta lisatavad väärtused ja neile vastavad tekstid, “linnuke” Grid etteja toimeta märkimisjoon silmatorkavamaks:

Gridlines...

Toimetatud graafiku Word-i saamiseks klõps parema hiireklahviga jaCopy graph (ja Paste Word-is)

võiSave graph (.wmf, .jpg formaadis ja Insert > Picture > From file Word-is)

Tulemuste toortabeli Word-i saamiseks kopeeri ja kleebi Report aknast.

Page 23: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

Andmete importimine ja eksportimine

Kopeerimine ja kleepimine teisest programmist.

Importimine Exelist: File > Open... > Import selected sheet to a workbook

Eksportimine teistesse formaatidesse (tekstifail, SPSS, SAS, LOTUS, .pdf):

File > Save as... > soovitavaks formaadiks kohandamise dialoogaken, nt. Exeli puhul...

Page 24: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

Tulemuste haldamine

1. Workbook – kõik analüüsid, joonised, jne paigutatakse ühte kausta,

mida on lihtne sirvida

2. Report – kõik tulemid paigutatakse ühte tekstifaili, mida on vajadusel kerge toimetada ja kuhu saab lisada omapoolseid kommentaare,

märkuseid, vms (workbook seda ei võimalda)

File > Output Manager > …

Page 25: Katseandmete analüüs I osa  www .ut.ee/~tammarut/stat.htm

Tulemused paigutatakse Workbook’i

Tulemused paigutatakse Report’i