danske science gymnasier · web viewinv χ 2 (0.95,1) giver χ 2 -teststørrelsen svarende til...

15
DASG 2009 – 2010, Peter Brander og Hanne Østergaard, Næstved Gymnasium og HF χ 2 -test CHI2-test. Introduktion................................................ 1 NU må der tændes for Nspire!..........................................3 Og nu er det tid til nogle opgaver til eleverne:......................4 CHI2-test. Simulering.................................................. 4 En anden metode.......................................................4 Simulering af 24 kast med en terning..................................5 Flere opgaver.........................................................8 Sammenligning med den teoretiske fordeling............................9 CHI2-test. Opgaveløsning ved skriftlig eksamen?.......................10 Sidste opgaver.......................................................12 CHI2-test. Introduktion. Lad alle elever i klassen kaste en terning 24 gange og tælle hvor mange 1-ere, 2-ere, osv… de får. For en klasse med 30 elever kan det f.eks. se således ud: Elevnavn Anta l 1 Anta l 2 Anta l 3 Anta l 4 Anta l 5 Anta l 6 1 3 5 4 5 2 5 2 4 3 4 3 7 3 3 2 2 6 5 4 5 4 6 2 4 4 3 5 5 3 5 5 3 3 5 6 1 6 5 5 2 5 7 2 3 2 6 5 6 8 4 6 4 4 3 3 9 1 3 4 5 3 8 10 3 3 10 3 4 1 11 6 5 3 5 4 1 12 1 7 4 7 2 3 13 5 4 3 3 4 5 14 2 5 0 6 7 4 15 3 3 4 4 5 5 16 4 4 2 1 9 4 17 6 2 4 5 3 4 18 6 6 2 4 3 3 19 4 5 5 4 3 3 1

Upload: others

Post on 03-Feb-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

DASG 2009 – 2010, Peter Brander og Hanne Østergaard, Næstved Gymnasium og HF

-test

CHI2-test. Introduktion.1

NU må der tændes for Nspire!3

Og nu er det tid til nogle opgaver til eleverne:4

CHI2-test. Simulering.4

En anden metode4

Simulering af 24 kast med en terning5

Flere opgaver8

Sammenligning med den teoretiske fordeling9

CHI2-test. Opgaveløsning ved skriftlig eksamen?10

Sidste opgaver12

CHI2-test. Introduktion.

Lad alle elever i klassen kaste en terning 24 gange og tælle hvor mange 1-ere, 2-ere, osv… de får.

For en klasse med 30 elever kan det f.eks. se således ud:

Elevnavn

Antal

1

Antal 2

Antal 3

Antal

4

Antal 5

Antal

6

1

3

5

4

5

2

5

2

4

3

4

3

7

3

3

2

2

6

5

4

5

4

6

2

4

4

3

5

5

3

5

5

3

3

5

6

1

6

5

5

2

5

7

2

3

2

6

5

6

8

4

6

4

4

3

3

9

1

3

4

5

3

8

10

3

3

10

3

4

1

11

6

5

3

5

4

1

12

1

7

4

7

2

3

13

5

4

3

3

4

5

14

2

5

0

6

7

4

15

3

3

4

4

5

5

16

4

4

2

1

9

4

17

6

2

4

5

3

4

18

6

6

2

4

3

3

19

4

5

5

4

3

3

20

1

5

6

3

5

4

21

3

2

8

1

3

7

22

6

3

3

4

3

5

23

1

2

9

6

2

4

24

3

5

6

2

5

3

25

6

4

2

2

6

4

26

2

2

2

4

6

8

27

7

1

6

4

2

4

28

6

6

4

2

3

3

29

5

5

0

8

4

2

30

4

5

4

4

1

6

I denne klasse fik INGEN fire af hver, som de ellers havde forventet.

Hvordan sammenligner man eleverne. Se f.eks. elev 5 der aldrig får fire af noget som helst men heller aldrig er mere end 1 fra. Eller hvad med elev 30, der både har fire ettere, treere og firere, men også kun får én femmer.

Indfør derfor CHI2-testfaktoren

Nu kommer de tredive elevers resultater til at se således ud:

Elevnavn

χ2

χ2

1

2

1

2

3

1

3

3,5

1

4

2,5

1,5

5

1,5

1,5

6

5

2

7

4,5

2

8

1,5

2,5

9

7

2,5

10

12

3

11

4

3

12

8

Og sorteret efter størrelse:

3,5

13

1

3,5

14

8,5

3,5

15

1

3,5

16

9,5

4

17

2,5

4

18

3,5

4

19

1

4,5

20

4

5

21

10

6,5

22

2

7

23

11,5

8

24

3

8

25

4

8,5

26

8

9,5

27

6,5

9,5

28

3,5

10

29

9,5

11,5

30

3,5

12

Af tabellen kan man se, at elev 5 har en pænere serie end elev 30, selvom elev 5 aldrig fik præcis fire af nogen tal. Elev 5 har faktisk den fjerdepæneste serie i klassen, medens elev 30 ligger på en delt trettendeplads - omkring midten af klassen.

Man kan også se, at DET ER USANDSYNLIGT at ramme det ”forventede antal”. En CHI2-faktor på 2 er nok til at ligge i den bedste fjerdedel

Man kan også se, at det heller ikke er almindeligt at ramme dobbelt så mange af et bestemt slag som forventet. Alle der har ramt otte eller flere af et eller andet tal, ligger i den dårligste fjerdedel af klassen.

NU må der tændes for Nspire!

Åben et regneark og tast ”terningkast”, ”antal”, og ”forventet” i de tre første søjler.

Sæt cursoren et tilfældigt sted og vælg statistik, 4 stat tests, χ2 GOF. Vælg ”antal” som observeret. Vælg ”forventet” som forventet. Og skriv ”5” i frihedsgrader.

(Det er ret nemt at overbevise eleverne om at der må være 5 frihedsgrader ved kast af en terning. For hvis det hverken bliver en 1-er, en 2-er, 3-er, 4-er eller en 5-er, så er der ikke længere frihed. Så bliver det en 6-er.)

Her er resultatet for elev 1. χ2-faktoren bliver 2 ligesom vi havde udregnet. Det er altså langt hurtigere at udregne χ2-faktorer på Nspire end at gøre det i hånden.

Nedenunder står ”PVal” på 0,849145. Det tal betyder at der er 84,9% chance for at få en χ2-faktor, der er større end 2, når man laver dette forsøg.

Passer det med vores klasse?

Så af vores 30 elever skal 25,5 elever have en χ2-faktor, der er STØRRE end to. Og 4,5 elev skal have en χ2-faktor, der er mindre end to.

I vores statistik ser vi, at der er 5 elever der ligger under 2 og 22 elever der ligger over. Og 3 elever på præcis 2. Det kan være svært at afgøre hvor de skal tælles med. Sådan går det, når man kun kaster terningerne ganske få gange. Havde vi kastet terningerne 240 gange hver, var der ikke mange elever der havde fået præcis samme χ2-faktor.

Alle elever kan nu prøve igennem og se om Nspire kan forudsige, hvilken placering i klassen de har.

Stor er overraskelsen (det burde den da være), når det viser sig, at Nspire med forbløffende træfsikkerhed kan forudsige hvilken placering i klassen en elev har, selvom Nspire kun har elevens egne resultater. Ikke resten af klassens.

Man kan også spørge om nogen i klassen har fået et overordentligt usædvanligt resultat. Hvad med elev 10, der har en χ2-faktor på 12? Næh. Eleven regner hurtigt ud, at der er 3,5 % chance for at få et værre resultat, så i en klasse på 30 burde der faktisk sidde en elev med et værre resultat.

Og hvad med elev 13, der har en χ2-faktor på 1? Næh, der er 3,7 % chance for at komme tættere på nul end det. Så det er heller ikke overraskende.

Hvis der sidder nogle elever i klassen, der har snydt lidt, så har de altså ikke snydt så meget, at vi kan opdage det statistisk.

Og nu er det tid til nogle opgaver til eleverne:Opgave 1:

Efter 60 kast med en terning får elev A: 15 ettere, 7 toere, 10 treere, 14 firere, 9 femmere og blot 5 seksere.

Hvilken placering ville denne elev få i en klasse med 30 elever?

Opgave 2:

En anden elev får efter 60 kast: 7 ettere, 7 toere, 7 treere, 7 firere, 7 femmere og 25 seksere.

Hvilken placering ville denne elev få i en klasse med 30 elever? En klasse med 300 elever? En klasse med 3000 elever?

Har vi grund til at mistænke eleven for at snyde?

CHI2-test. Simulering.En anden metode

I det indledende eksempel har 30 elever hver kastet 24 gange med en terning, noteret udfaldene (antal ettere, toere osv.) og beregnet -teststørrelsen

Med 24 kast med en terning forventer vi lige mange af hvert udfald, nemlig 4, så forv er 4 og obs er det observerede antal ettere, toere, osv.

De 30 værdier af var naturligvis ikke ens, og hver elev kunne beregne sin placering blandt klassens resultater.

Så kunne man også få beregnet -teststørrelsen i et NSpire regneark med kommandoen og tilmed få beregnet sandsynligheden for at få et en -teststørrelse, som er større end eller lig med, altså sandsynligheden for at få et resultat, der er mindst lige så skævt. Men hvordan beregnes denne sandsynlighed? Det får vi ikke noget at vide om.

Nu vil vi prøve at gå en anden vej, nemlig gentage de 24 kast med en terning en hel masse gange. Det er noget besværligt og tidskrævende at bede hver elev om at gøre det, men heldigvis er det muligt at programmere NSpire til at gøre det for os.

Vi vil altså prøve at simulere[footnoteRef:2] de 24 kast med en terning omkring 1000 gange og derved undersøge eksperimentelt, om vi vil acceptere nulhypotesen, at alle udfald forekommer lige hyppigt. Ved denne metode beregner vi -teststørrelsen og ser, hvorledes denne værdi fordeler sig, men vi bruger ikke den teoretiske fordelingsfunktion. [2: Metoden er beskrevet af Bjørn Felsager, bl.a. i ”Den naturvidenskabelige metode”, som vi fik til et DASG-møde, men se også her: http://www.emu.dk/gym/tvaers/sciencegym/uv-mat.html ]

Simulering af 24 kast med en terning

Åbn et regneark i Nspire og skriv de seks forskellige udfald af terningkastet i kolonne A. Der skal gåseøjne om, altså ”etter” osv. Kolonnen har øverst oppe fået navnet udfald. Det er en variabel, vi kan referere til. Kolonne B har fået navnet simulering, og i denne kolonne kan vi simulere 24 kast med en terning. Det gøres med kommandoen

som skrives ind i formelfeltet i kolonne B, se nedenfor. Randsamp (udfald,24) vælger et tilfældigt udfald i kolonne A 24 gange og resultatet af hvert valg noteres i kolonne B. Det svarer til, at en elev kaster en terning 24 gange.

Stil nu cursoren et sted i kolonne B, højreklik og vælg Hurtiggraf. Så kommer der et prikdiagram, som man evt. kan lave om til et søjlediagram ved at højreklikke i grafområdet. Nu kan man se, hvordan kastene er fordelt. Prøv at taste Ctrl r, så udfører programmet en ny simulering af 24 kast med en terning. Samtidig med opdateres grafvinduet, så det nye resultat vises.

Nu skal -teststørrelsen for simuleringen beregnes. Først skal vi have talt antal udfald op. I kolonne C står der noget forklarende tekst: ”Antal ettere =” osv., og i kolonne D er antallet af ettere til seksere i simuleringen så talt sammen med kommandoen

osv. Kommandoen tæller altså antal ettere, toere osv. Kolonne E indeholder de forventede værdier, som jo er 4 af hver. Se nedenfor.

I kolonne F står der igen en forklarende tekst: ”Chi2-teststørrelse”, og i celle G1 er -teststørrelsen beregnet med kommandoen

Se ovenfor. Vi vil gerne have, at resultatet angives som decimaltal, og derfor står der til sidst.

Når det er gjort, skal man højreklikke i celle G1 og vælge Variable og Gem variabel og så give variablen et navn, fx chi2.

Indtil nu har vi ikke opnået andet end at se, at programmet kan simulere 24 kast med en terning og derefter beregne -teststørrelsen. Men hav tålmodighed, for lige om lidt begynder der at ske noget.

Nu er det tid til at gentage simuleringen og at opsamle -teststørrelsen, så man kan se hvordan fordelingen bliver, hvis de 24 kast med en terning gentages mange gange. -teststørrelsen opsamles i kolonne H, som hedder måling, se ovenfor, og hvor der i formelfeltet skrives

Her er variablen chi2 vores -teststørrelse fra før, og 0 betyder, at der opsamles manuelt. Det gøres ved at holde Ctrl-tasten nede og skiftevis taste r og ., altså taste Ctrl r for at udføre en simulering ovre i kolonne B, og Ctrl . for at lagre værdien af -teststørrelsen i kolonne H. Ved at indsætte en hurtig-graf over måling, vil værdierne afbildes, efterhånden som de genereres.

Så er det bare at gå i gang med at optage 1000 målinger. Det tager ikke så lang tid. Det er en god idé at tælle antallet af målinger. Det er gjort i celle G3 med kommandoen

Nu kan vi følge med og se, hvornår vi når op på 1000.

Efter 1000 målinger ser billedet sådan ud:

Man kan se, at den største værdi er 24,5 og den mindste er 0,5. Der er altså blandt de 1000 gange 24 kast ikke ét eneste, som er ligesom det forventede, for så ville -teststørrelsen være 0, idet der så stod (4-4)2 i tælleren i hvert led.

Hver elev kan nu beregne sandsynligheden for at få en -testværdi, som er større end eller lig med den værdi, som han/ hun har beregnet oprindeligt med det rigtige kast. Hvis en elev har fået teststørrelsen 8, som er skrevet ind i celle G5, kan man gøre det ved at tælle, hor mange af de simulerede teststørrelser, der er større end eller lig med værdien i G5, og så dividere det tal med det totale antal målinger, her 1000. Det er gjort i celle G6 med kommandoen

Så kommer resultatet i %. Som man kan se på forrige skærmdump er der altså i 17,5 % af kastene et resultat, som er større end eller lig med 8.

Er der nogen af eleverne, som har fået en -testværdi, som giver en sandsynlighed på under 5 %?

Man kan sætte sin -testværdi ind i grafvinduet. Det gøres ved først at markere grafvinduet og dernæst at klikke på Analyser, Plot værdi.

Flere opgaverOpgave 3

Kast 30 gange med en terning, noter udfaldene og beregn -teststørrelsen. Lav en simulering i NSpire af 1000 gange 30 kast med en terning.

Find sandsynligheden for af få en teststørrelse, som er mindst lige så skæv som din beregnede værdi.

Opgave 4

Knips 30 gange til en tændstikæske og noter hvilken side den lander på.

Nulhypotese: Antag at sandsynligheden for at tændstikæsken lander på en bestemt side afhænger af arealet af siden i forhold til hele arealet.

Beregn -teststørrelsen.

Lav en simulering i NSpire af 1000 gange 30 knips til en tændstikæske.

Find sandsynligheden for af få en teststørrelse, som er mindst lige så skæv som din beregnede værdi.

Opgave 5

Stor opgave om stoffer

En brochure fortæller, hvor mange procent af de unge, der har prøvet de forskellige stoffer.

Lav en spørgeskemaundersøgelse på gymnasiet. Nulhypotese: Gymnasieeleverne er normale.

Opgave 6

Stor opgave om forskelle

1. Køn/alder/klasse

2. Hvor mange timer arbejder du om ugen/dyrker du sport om ugen/bruger du på transport til og fra skole

3. Hvor mange penge bruger du på tøj / i kantinen / får du i lommepenge/ bruger du på at tale i telefon om måneden

Lav forskellige inddelingskriterier. Opstil selv nulhypotese.

Løs opgaven ved hjælp af simulering.

Sammenligning med den teoretiske fordeling

Inden vi går over til teoretiske beregninger af -teststørrelser og p-værdier, vil vi prøve at sammenligne den simulerede fordeling af terningkastet med den teoretiske fordelingsfunktion. Det gør vi ved at højreklikke i grafvinduet, vælge histogram, højreklikke igen og vælge skala, densitet, højreklikke endnu en gang, vælge søjleindstillinger og sætte bredden til 1. Så ser histogrammet ud som nedenfor, og vi kan nu få tegnet den teoretiske fordelingsfunktion. Det gør vi ved at vælge Analyser, Indsæt funktion, åbne kataloget over funktioner og vælge -fordelingsfunktionen med 5 frihedsgrader: Chi2Pdf(x,5), se nedenfor.

Med 1000 simuleringer passer den eksperimentelle og den teoretiske fordeling ganske pænt sammen. Den teoretisk beregnede p-værdi for -testværdien 8 er 15,6 % (beregnet inde i regnearket med kommandoen . Den beregnede værdi ligger altså lidt under den eksperimentelle værdi på 17,7 %.

Man kan også finde de 15,6 % grafisk ved at vælge Analyser, Skraver under funktion, og så sætte den nedre grænse til 8 og den øvre til uendelig.

Når eleverne et par gange har set, at deres simulerede passer med den teoretiske fordeling, er det måske passende at se på teoretisk beregnede værdier.

CHI2-test. Opgaveløsning ved skriftlig eksamen?

Eleverne må gerne bruge den eksperimentelle metode ved opgaveregning til skriftlig eksamen: ”Den eksperimentelle tilgang kan både indgå som en del af den mundtlige prøve og som en metode til besvarelsen af spørgsmål ved den skriftlige prøve.”[footnoteRef:3] Det er måske en god idé med den eksperimentelle metode, hvis eleverne kan gøre det på kort tid. Men de kan jo også bruge de teoretiske funktioner. Og de kan gøre det på mange forskellige måder. [3: Bjørn Grøn i forordet til Kursusmateriale_chi-i-anden_test_7_9_2009 http://www.emu.dk/gym/fag/ma/undervisningsforloeb/statistik/kursusmateriale_chi-i-anden_test_7_9_2009.pdf ]

I det følgende eksempel løser vi en opgave på to forskellige måder.

I en spørgeskemaundersøgelse er elever og lærere på skolen blevet spurgt om, hvor langt de har til skole. Tallene er givet i følgende tabel:

0 – 5 km

Over 5 km

Elever

350

409

Lærere

25

34

Vi vil undersøge nulhypotesen, om der er forskel på elever og lærere med hensyn til, hvor lang transport, de har til skolen.

I den første metode kan vi lave et skema til de forventede tal og i Grafregner (eller på lommeregner) beregne de forventede tal og derefter -teststørrelsen, som her bliver 0,308.

Så kan vi I Nspire åbne Lister og regneark og definere to tomme variable x_var og y_var, højreklikke og åbne Hurtiggraf, vælge de to variable på akserne, og nu kan vi tegne en graf ved at klikke på Analyser, Plot funktion og vælge chi2Pdf(x,1), hvor der skal stå 1 fordi der er én frihedsgrad. Funktionen findes under Hjælpeprogrammer, Katalog i venstre side af skærmen. Dernæst kan vi vælge Analyser, Plot værdi og skrive 0.308. Endelig kan vi vælge Analyser, Skraver under funktion, starte i 0,308 og ende i uendelig. Så kan vi se på grafen, at der er 58 % chance for at få et værre resultat. Vi godkender altså nulhypotesen.

I den anden metode skal vi vide, at vi tester for uafhængighed, og så kan vi løse opgaven på ved at bruge kommandoen -2vejstest, som regner på en matrix.

Vi vælger Grafregner, klikker vi på klikker på Matrix og opretter en 2x2-matrix, som skal have et navn, fx matrix. Så vælger vi Statistik, Stat test, -2vejstest og vælger den matrix, vi lige har oprettet. Så er den opgave løst:

Eksemplet ovenfor er lidt anderledes end eksemplet side 3 med 24 kast med en terning. Der testede vi for ”goodness of fit” med kommandoen -GOF, som regner på lister. Så de to typer af tests skrives altså ikke ind på samme måde i Nspire.

Hvis vi blot er interesserede i at finde p-værdien til en given -teststørrelse eller omvendt, kan det også lade sig gøre, se nedenfor. I den grafiske metode er der indsat en skyder, der styrer -teststørrelsen, og skraveringen under grafen viser den tilhørende p-værdi.

Vi kan også bruge to funktioner. Den første funktion:

giver -teststørrelsen svarende til p-værdien 5 %, når der er 1 frihedsgrad.

Den anden funktion:

giver p-værdien svarende til , når der er 1 frihedsgrad.

Sidste opgaverOpgave 7

Opgave om afstand mellem skole og bolig. I eksemplet ovenfor så vi, at vi ikke kunne se forskel på elever og lærere på en skole, når de blev spurgt om længden af deres skolevej. Spørgsmålet om længden af skolevejen var i virkeligheden stillet mere detaljeret end i eksemplet, som det fremgår af tabellen:

0 – 5 km

5 – 10 km

10 – 15 km

15 – 20 km

Over 20 km

Elever

350

92

108

93

116

Lærere

25

4

3

0

27

Opstil den relevante nulhypotese for at undersøge, om der er forskel på elever og lærere med hensyn til, hvor lang transport de har til skolen.

Beregn de forventede værdier og beregn -teststørrelsen

Er forskellen mellem de observerede og forventede resultater signifikant på 5 % niveau? På 1 % niveau?

Opgave 8

Find -teststørrelsen svarende til en p-værdi på 5 %, når antallet af frihedsgrader er henholdsvis 1, 2, 3, 4 og 5.

Vi har givet en -teststørrelse på 8. Find den dertil svarende p-værdi, når antallet af frihedsgrader er henholdsvis 1, 2, 3, 4 og 5.

Ved hvilken frihedsgrad vil blive accepteret på et 5 % signifikansniveau?

G

5