statistiske test

30
Statistiske test Efteråret 2010 Jens Friis, AAU Hjemmeside : http://ak.aau.dk/jfj

Upload: liesel

Post on 23-Feb-2016

20 views

Category:

Documents


0 download

DESCRIPTION

Statistiske test. Efteråret 2010 Jens Friis, AAU Hjemmeside : http://ak.aau.dk/jfj. Kontinuerte fordelinger Definition: Tæthedsfunktion En sandsynlighedstæthedsfunktion på R er en integrabel funktion f : R →[0;∞[ hvor = 1. Definition: Kontinuert fordeling - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Statistiske test

Statistiske test

Efteråret 2010Jens Friis, AAU

Hjemmeside : http://ak.aau.dk/jfj

Page 2: Statistiske test

Kontinuerte fordelinger

Definition: TæthedsfunktionEn sandsynlighedstæthedsfunktion på R er en integrabel funktion f : R→[0;∞[hvor =1

dxxf )(

Definition: Kontinuert fordelingEn kontinuert sandsynlighedsfordeling er en sandsynlighedsfordeling,som har en sandsynlighedstæthedsfunktion f : funktionen

kaldes fordelingsfunktionen for en kontinuert fordeling på R

x

dttfxF )()(

Definition: middelværdi ,varians og spredningLad X være en stokastisk variabel med tæthedfunktion f(x)

Middelværdi : μ=E(X)=

Varians : σ2=E((X-μ)2)= Spredningen er σ

dxxxf )(

dxxfx )()( 2

Page 3: Statistiske test

Normalfordelingen er det klassiske eksempel på en kontinuert fordeling. Her er tæthedsfunktionen givet ved

2

2

2)(

22

1)(

x

exf

Middelværdien er μ og spredningen σ. Den stokastiske variabel med dennetæthedsfunktion siges at være N(μ, σ2) –fordelt.

Den normalfordelte stokastiske variabel, som har middelværdi0 og varians 1, kaldes sædvanligvis U, og den tilhørende tæt-hedsfunktion for φ , dvs. at

2

2

21)(

x

ex

Den tilsvarende fordelingsfunktion kaldes for Ф, dvs. at

xdttx )()(

Page 4: Statistiske test

Der gælder følgende :

)()()()(

abbUaPbXaP

Man kan derfor klare sig med kendskab til værdier af Ф, som ertabellagt og indlagt i de fleste computersystemer.

Undersøgelse af om et observationssæt kan betragtes somNormalfordelt: Apgar- fødselsvægt (SPSS) eller BMI – Geogear (SPSS)

Page 5: Statistiske test

Man kunne også have indført normalfordelingen således :

Definition En stokastisk variabel U siges at være u-fordelt eller N(0 , 1) -fordelt,hvis tæthedsfunktionen for U er givet ved

2

2

21)(

x

ex

Sætning: E(U) = 0 og V(x) = 1

DefinitionEn stokastisk variabel X = μ + σU, hvor μ R og σ R+ , siges at væreN(μ , σ2 ) -fordelt

Sætning: E(X) = μ og V(X) = σ2

Page 6: Statistiske test

SætningDen N(μ , σ2 ) –fordelte stokastiske variabel X har tæthedsfunktionen

2

2

2)(

22

1)(

x

exf

Bevis:

2

2

2)(

211)(1)(')()(

)()()()(

x

exxxfx

xUPxUPxXPxF

Page 7: Statistiske test

Hvorfor er normalfordelingen interessent?

Ja, det er den, fordi gennemsnittet af næsten alle målinger tilnærmelsesvis er normalfordelt.Mere præcist, så gælder den centrale grænseværdisætning : Lad X1, X2,……….Xn være indbyrdes uafhængige stokastiske variable, der følger samme

fordeling med middelværdi og spredning . Da er

n

X/

tilnærmelsesvis N(0,1) - fordelt

Man kan vise, at hvis X er b(n,p)-fordelt, er X tilnærmelsesvis normalfordelt N(µ, σ2 ) for n→ ∞ ,hvor µ = np og σ2 = np(1-p) .

Hvad var det nu lige binomialfordelingen er for noget ?

Page 8: Statistiske test

BinomialfordelingenEt basiseksperiment beskrives af et udfaldsrum E med to udfaldsucces (s) og fiasko (f), dvs. E={s,f}, hvor P(s)=p og P(f)=1-p.Basiseksperimemtet gentages n gange uafhængigt af hinanden.Hvis X betegner antal succes i de n gentagelser gælder der

nqppqn

qX qnq .....2,1,0,)1()(P

Eks. 5 uafhængige kast med en terning. X er antal 6’ere.

5...2,1,0,)65()

61(

5)(P 5

q

qqX qq

q 0 1 2 3 4 5

P(X=q) 0,402 0,462 0,161 0,032 0,003 0,000

Se også SPSS: poisBin6indlagte.sav

Sætning: E(X)=np ; V(X)=np(1-p)

Page 9: Statistiske test

Heraf følger , at hvis X binomialfordelt b(n, p) er

tilnærmelsesvis N( 0, 1)-fordelt

Lad os nu endelig komme til χ2 -fordelingen.

DefinitionLad X1, X2, ……Xn er indbyrdes uafhængige N(0, 1) –fordelte stokastiskevariable. Summen siges at være χ2- fordelt med n frihedsgrader.

n

i 1

2iX

SætningEn stokastisk variabel, som er χ2- fordelt med n frihedsgrader, har tæthedsfunktionen , hvor 0,

2)2/(1)( 2

112/

2/

xex

nxf

xnn

0

1)( dxexr xr

)1(X

pnpnp

Page 10: Statistiske test

Antag at X ̴ b(p, n) ̴ ≈ N(0, 1) ̴ ≈ χ2 , f = 1 )1(

Xpnp

np

2)

)1(X(

pnpnp

Hvis man har en stikprøve, som er binomialfordelt (fx stikprøve med svarmulighederneja/nej kan man benytte et χ2 -test, hvis man ønsker at teste hypotesen Ho : p = p0 . Den alternative hypotese er H1 : p ≠ p0

Antal ja Antal nej ialtobserveret x n-x n

forventet np0 n(1-p0) n

)1()(

)1()()1)((

)1()1(()(

00

20

00

02

000

0

20

0

202

pnpnpx

pnppnpnxnpnpx

pnpnxn

npnpx

som tilnærmelsesvis er χ2 –fordelt med 1 frihedsgrad. Dvs reglen er, at man udregner

forventetforventetobserveret 2)(

Det er klart, at store værdier er kritiske for accept af hypotesen.

Page 11: Statistiske test

Accept af hypoteser

Man arbejder med et såkaldt signifikansniveau, som sædvanligvis er 5% eller 1%.Signifikansniveauet er sandsynligheden for at forkaste en rigtig hypotese. Man kan da begå to fejl :

type 1 : forkaste en rigtig hypotese

type 2: acceptere en hypotese selv om den er forkert

For at kunne bedømme et tests styrke skal man studere sandsynligheden for at begåfejl af type 2. Det er ofte ret kompliceret, og indgår normalt ikke i indledende statistik-kurser.

Page 12: Statistiske test

Eksempel på χ2 -test med 1 frihedsgradI en meningsmåling har man spurgt 1500 vælgere om de vil stemme på Socialdemokratiet, hvis der var valg nu. Resultatet blev Antal ja Antal nej Ialt465 1035 1500

Afviger dette resultat signifikant fra hypotesen, at 30% vil stemme på partiet?Formuleret mere matematisk: X betegner antal stemmer på partiet og modellen er,at X ̴ b(1500, p) og nulhypotesen er H0 : p = 1/3 . H1 : p ≠ 1/3Følgende tabel udregnes :

Antal ja Antal nej I altobserveret 465 1035 1500

forventet 500 1000 1500

675.31000

)10001035(500

)500465( 222

Da 95%’s fraktilen er 3,84 accepteres hypotesen på et signifikansniveau på 5% .

Page 13: Statistiske test

Multinomialfordelingen

X = (X1, X2, ……….Xk) siges, at være multinomialfordelt b(n,p1,p2….pk) ,hvis p1+p2+…..pk=1 og

kxk

xx

kkk ppp

xxxnxXxXxXP .......

!.......!!),....,( 21

2121

2211

, hvor x1+x2+…..xk=n

På samme måde som ved binomialfordelingen kan man se på et basiseksperimentsom gentages n gange uafhængigt af hinanden. I stedet for succes eller fiasko er der k svarmuligheder. Dvs. at X1 er antal svar på kategori 1 X2 ” - - - - - - - - - - - - - - ” 2 . . . . Xk ”- - - - - - - - - - - - - - -” k

Page 14: Statistiske test

Som ved binomialfordelingen kan man teste, at de enkelte sandsynlighedsparametre antager givne værdier, dvs. at modellen er

X=(X1, X2, ……….Xk) er multinomialfordelt b(n,p1,p2….pk) , og nulhypotesen er

H0 : p1 = p01, p2 = p02,……..pk = p0k og

H1 : p1 ≠ p01, p2 ≠ p02,……..pk ≠ p0k

Igen kan man lave et χ2 - test , her med k-1 frihedsgrader. Igen er det

forventetforventetobserveret 2)(

En tommelfingerregel er, at for at anvende testet skal alle forventede værdier være større end 5.

Page 15: Statistiske test

Eksempel :Mendel avlede bønner, som gav følgende udbytte

form\ farve gule grønne

Runde 315 108

kantede 101 32

Da de stammede fra en krydsning af dobbelte heterozygotiske bønner, skulleudbyttet være i forholdet 9 : 3 : 3 : 1.Som model kan anvendes en multinomialfordeling b(556, p1, p2, p3, p4) .Nulhypotesen er H0 :

161,

163,

163,

169

4321 pppp

Følgende tabel udregnes :

i 1 2 3 4 sumobserveret 315 101 108 32 556

forventet 312,75 104,25 104,25 34,75 556

Page 16: Statistiske test

Eksempel fortsat: χ2 – testet med 3 frihedsgrader udregnes :

470,075,34

)75,3432(75,104

)75,104108(75,104

)75,104101(75,312

)75,312315( 22222

Da 95%’s fraktilen er 7,81 accepteres hypotesen på et signifikansniveau på 5%.

Page 17: Statistiske test

Sammenligning af flere multinomialfordelinger eller test for uafhængighed

Model : X1 = (X11, X12, ……….X1k) ̴ b(n1,p11,p12….p1k) X2 = (X21, X22, ……….X2k) ̴ b(n2,p21,p22….p2k) . . Xm = (Xm1, Xm2, ……..Xm2) ̴ b(nm,pm1,pm2….pmk)

Nulpypotese :

H0 : p11 = p21 = ….. = pm1

p12 = p22 =….. = pm2

. . p1k = p2k = …. = pmk

H1 : forskellige pr. kategori

Som test anvendes igen : forventet

forventetobserveret 2)( som er χ2 –fordelt med f = (m-1)(k-1) frihedsgrader . Også her bør de forventede værdier være større end 5.

Page 18: Statistiske test

Lad os lige se på en kontingenstabel over de observerede :

i \ j 1 . . .

j . . .

k sum

1 x11 x1j x1k x1.

.

.

i xij xi.

.

.

m xm1 xmj xmk xm.

sum x.1 x.j x.k n=x..

Læg mærke til, at det forventede antal i celle (i,j) er nnx

nx

nx i..j

..j ix

Man udregner søjlefrekvens gange rækkefrekvens gange samlet antal,altså tester man uafhængighed af de to inddelingskreterier.

Page 19: Statistiske test

Eksempel : For mange år siden lavede Dansk Skakunion en læserundersøgelse for deresmedlemsblad. Man spurgte bl.a. om Hvad foretrækker du? (sæt kryds) 1. at partierne bringes adskilt fra referater og nyheder 2. at partierne bringes sammen med referater og nyheder 3. ved ikke.Spillerne blev inddelt i spillerstyrke og resultatet blev:

svar/styrke

1 2 3 sum

1 15 43 3 61

2 30 97 21 148

3 36 98 25 159

4 39 67 30 136

sum 120 305 79 504

Page 20: Statistiske test

Hvis man vil teste om svarene er uafhængig af spillerstyrke er de fælles skøn over p’erne

50479,

504305,

504120

321 ppp

Tabellen med de forventede kan udregnes :

svarstyrke

1 2 3 sum

1 14,524 36,915 9,562 61

2 35,238 89,563 23,198 148

3 37,857 96,220 24,923 159

4 32,387 82,302 21,317 136

sum 120 305 79 504

Idet 317,2150479136 .......... 915,36

50430561;524,14

50412061

Da χ2 = 14,98 og f=(4-1)(3-1)=6 og 95%’s fraktilen er 12,59 forkastes hypotesenmed et signifikansniveau på 5%

Page 21: Statistiske test

Eksempel : for en del år siden undersøgte man om flere gange straffede personerhavde en én-ægget eller to-ægget tvillinge bror/søster. Resultatet blev :

observeret kriminel ikke kriminel

sum

én ægget 10 3 13

to ægget 2 15 17

sum 12 18 30

H0 : fordelingen på kriminel/ikke kriminel ed den samme for én- og to ægget. De forventede bliver

forventet ikke kriminel

sum

én ægget 5,2 7,8 13

to ægget 6,8 10,2 17

sum 12 18 30

Χ2 = 13,02 , f = (2-1)(2-1) = 1 . Da 95%’s fraktilen er 3,84 forkastes hypotesenmed et signifikans på 5%. Da 99%’s fraktilen er 6,63 kan også forkaste på et signifikansniveau på 1%.

Page 22: Statistiske test

Hvorfor er der det antal frihedsgrader ?

Ved hjælp af den såkaldte spaltningssætning kan man vise :

Hvis X1, X2, X3 …….,Xn er N(0,1) - fordelte, og der k lineære bånd mellem demer χ2 – fordelt med n - k frihedsgrader

n

ii

1

2X

I tilfældet med en m x k tabel er der m∙k – k – m + 1 = (m – 1) (k – 1) frihedsgrader

Beviser for denne sætning ligger langt ud over gymnasieniveau.

Et sidste eksempel : rygning og apgar-tal : vha. SPSS

Page 23: Statistiske test

u-test ved normalfordelte observationer.

Lad X1, X2, ……Xn er indbyrdes uafhængige N(μ, σ2) - fordelt stokastiskevariable. Der gælder da, at

er N(μ, , σ2/n) – fordelt .

Har man derfor et observationssæt x1, x2, ……xn , som antages at væreN(μ, σ2) – fordelt, hvor σ2 er kendt, kan hypotesen

H0 : μ = μ0

med H1 : μ ≠ μ0

testes med teststørrelsen , som under H0 er N(0, 1) – fordelt.

Acceptområder er mellem fraktilen og fraktilen,hvor er signifikansniveauet.

n

n

ii

1

XX

n

xu2

0

2/ 2/1

Page 24: Statistiske test

Nu er det sjældent, at man kender variansen i et observationssæt. Der er der oftesttale om et approksimativt u-test.Eks. I en meningsmåling har man spurgt 1500 vælgere om de vil stemme på Socialdemokratiet, hvis der var valg nu. Resultatet blev

Antal ja Antal nej Ialt465 1035 1500

Afviger dette resultat signifikant fra hypotesen, at 30% vil stemme på partiet?Formuleret mere matematisk: X betegner antal stemmer på partiet og modellen er,at X ̴ b(1500, p) og nulhypotesen er H0 : p = 0,30 . H1 : p ≠ 0,30Vi ved at under H0 er

))30.01(30.01500,30,01500(N X er approksimativt - fordelt.Teststørrelsen udregnes

845,031515

)30.01(30,0150030,01500465

Da 97,5%’s fraktilen er 1,96 accepteres hypotesen på et signifikansniveau på 5%.

Page 25: Statistiske test

t-test ved normalfordelte observationer.

Lad X1, X2, ……Xn er indbyrdes uafhængige N(μ, σ2) - fordelt stokastiskevariable. Der gælder da, at

er N(μ, , σ2/n) – fordelt .

Har man derfor et observationssæt x1, x2, ……xn , som antages at væreN(μ, σ2) – fordelt, hvor σ2 er ukendt, skal både μ og σ2 estimeres.Har man et konkret observationssæt x1, x2, ……xn , er estimatet

for μ : og

for σ2 :

Laver man en tilsvarende teststørrelse som ved u-testet, har man følgende situation:

n

n

ii

1

XX

n

xx

n

ii

1

1

)( 2

2

n

xxs

i

Page 26: Statistiske test

Hypotesen H0 : μ = μ0

med H1 : μ ≠ μ0

ønskes testet.

Teststørrelsen bliver

ns

xt2

0

Det ses, at er en stokastisk variabel, og derfor er t ikke

normalfordelt. Man kan vise, at estimatoren (s2) for σ2 er σ2χ2 - fordelt med n-1 frihedsgrader.Testoren t følger en såkaldt t-fordeling med n-1 frihedsgrader. t-fordelingenkonvergere mod N(0, 1) – fordelingen for n gående mod uendelig. t-fordelingenstæthedsfunktion er også symmetrisk om 0. Ellers fungerer alt som ved u-testet.

1

)XX(1

2

n

n

ii

Page 27: Statistiske test

Eksempel: Ved produktion af piller har man målt nicotamid-indholdet i 20 piller.Indholdet skal være 25mg. Ved stikprøven på 20 piller fik man følgende resultater:

22,67 23,29 23,40 23,56 23,76 23,83 23,95 24,21 24,50 24,6424,87 25,05 25,35 25,73 25,79 25,80 26,11 26,97 25,36 27,11

Model : Xi ̴ N(μ, σ2) for i=1 til 20 er uafhængige stokastiske variable.

H0 : μ = 25 , H1 : μ ≠ 25Parametrene estimeres

= 24,799 ; s2 = 1,5187

Teststørrelsen bliver

x

737,0

205187,1

25797,24

t

Da 2,5%’s fraktilen er -2,093 for 19 frihedsgrader, accepters hypotesen.

Page 28: Statistiske test

Sammenligning af to normalfordelte obsevationsrækker.På 13 hunde har man målt ph-værdien i arterielt blod før og efter indåndingen af CO2.Ændrer indåndingen af CO2 ph-værdien?

Nr normal CO2 differens1 7,42 7,26 0,162 7,52 7,30 0,223 7,36 7,26 0,104 7,43 7,39 0,045 7,43 7,38 0,056 7,15 6,69 0,467 7,50 7,32 0,188 7,34 7,26 0,089 7,45 7,23 0,2210 7,42 7,06 0,3611 7,53 7,34 0,1912 7,48 7,28 0,2013 7,42 7,29 0,13

Model for differensen:

Xi er uafh. N(μ, σ2)- fordelt for i=1,2…13

H0 : μ = 0 ; H1 : μ ≠ 0

Estimater :

= 0,1838 s2 = 0,014176

Teststørrelsen udregnes

x

566,5

13014176,0

01838,0

t

Da 97,5%’s fraktilen er 2,179 for 12 frihedsgrader forkastes hypotesen. 99,5%’s fraktilen er 3,055 og hypotesen vil også blive forkastet på 1%’s signifikansniveau.

Page 29: Statistiske test

Lineær regressionAntag at Yi for i = 1 til n er uafhængige N(μi, σ2) -fordelte således at

)( .xxii

Man kan vise at estimaterne for parametrene er

)(

))(( ;

1.

1..

*.*

n

ii

n

iii

xx

xxyyy

2

1.*.

2* ))((

21

n

iii xxyy

n

Man kan også vise, at estimatoren for β er - fordelt.))(

,(N

1

2.

2

n

ii xx

Man kan derfor teste hypotesen H0 : β = β0 med teststørrelsen

n

ii xx

t

1

2.

2*

0*

)(

som er t-fordelt med n-2 frihedsgrader under H0 .

Hvis β0 = 0 tester man uafhængighed af x og y værdierne.

Page 30: Statistiske test

Eksempel : Man for 28 patienter målt kreatininindholdet i blodet før og efterdødens indtræden. Er der en sammenhæng? Dataene kan ses i en excelfil.Der er en pæn lineær sammenhæng og parametrene estimeres.

28

1

2.x

22*** 4285,1)(SSD ; 01200,0 ; 012,1 ; 024,1

ii xxs

Man vil gerne teste hypotesen H0 : β = 1

131,0

4285,101200,0

000,1012,1

t

som er t-fordelt med 26 frihedsgrader. Da 97,5%’s fraktilen er 2,056accepteres hypotesen.

Dataene er analyseret vha. SPSS : kreatinin.sav