statistische verwerking van gegevens een korte...

36
Meten en experimenteren Statistische verwerking van gegevens Een korte inleiding 13 oktober 2006

Upload: others

Post on 30-Jul-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en experimenteren

Statistische verwerking van gegevensEen korte inleiding

13 oktober 2006

Page 2: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p2

Deel I

• Toevallige veranderlijken• Steekproef• Beschrijving van gegevens• Histogram• Gemiddelde en standaarddeviatie• Normale verdeling• Fouten en onzekerheden

Page 3: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p3

Toevallige veranderlijken

• experiment = meting van een bepaalde grootheid x uitgevoerd met een bepaald instrument volgens eenbepaalde procedure

• Een experiment wordt meestal beïnvloed doorverschillende factoren: vb bepaling verbruik van eenauto, meten valversnelling

• Het resultaat van een experiment is nooit exact reproduceerbaar

• De verschillende waarnemingen of resultaten van eenexperiment vertonen een spreiding

• Men noemt de grootheid x (het resultaat van hetexperiment) een toevallige of stochastischeveranderlijke

Page 4: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p4

Keuze van de steekproef

• Men wil meestal uit het experiment een fysischegrootheid bepalen, bvb de valversnelling

• Elk experiment wordt beïnvloedt door verschillendewillekeurige factoren

• Het is dus best om een groot aantal experimentenuit te voeren, at random (willekeurig) gekozen

• Dit is een steekproef waaruit men conclusies wenstte trekken over de fysische grootheid

• Men bekomt een verzameling gegevens{x1,x2,x3,…xn}

Page 5: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p5

Beschrijving van gegevens

• Na het uitvoeren van n experimenten beschikt menover een verzameling gegevens {x1,x2,x3,…xn}

• Men kan deze verzameling beschrijven via de volgende empirische grootheden :

• Aantal gegevens• steekproefgemiddelde: maat voor de locatie van de

gegevens• Steekproefvariantie en standaardafwijking: maat

voor de spreiding van de gegevens• De gegevens worden vaak voorgesteld in een

histogram

Page 6: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p6

Histogram

• De gegevens worden ingedeeld in klassen• Het histogram geeft een eerste informatie over

structuren (pieken, uniform ..) in de verdeling van gemeten grootheid

• De keuze van de breedte van de klassen hangt afvan de nauwkeurigheid waarmee men de grootheidgemeten heeft, van het aantal gegevens …

• Voorbeeld :men meet de lengte van een balk van 20 cm

Page 7: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p7

100 metingen lengte balk – 1mm lat

• in 10 klassen van elk 1mm • in 4 klassen van elk 2,5mm

Aan

talm

etin

gen

Lengte (mm)

Page 8: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p8

Gemiddelde en standaarddeviatie

• Een steekproef wordt gekarakteriseerd door de volgende grootheden:

• Rekenkundig gemiddelde

• Variantie

• Standaardafwijking of standaarddeviatie = s

1

1 n

ii

x xn =

= ∑

( )22

1

11

n

ii

s x xn =

= −− ∑

Page 9: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p9

x

s

Page 10: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p10

• Indien de steekproef oneindig groot wordt dan volgtde verdeling van de gemeten grootheid een normale of gaussische verdeling met

–gemiddelde waarde µ–standaardafwijking σ–Variantie σ2

–Waarschijnlijkheidsverdeling f(x)

Normale verdeling

( )( )2-- 221

2

x

f x eµσ

σ π=

Grootheid x

frequ

entie

Page 11: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p11

Normale verdeling

• 68% van de metingen ligt in het interval [µ-σ, µ+σ]

• 95% van de metingen ligt in het interval [µ-2σ, µ+2σ]

• 99,7% van de metingen ligtin het interval [µ-3σ, µ+3σ]

Page 12: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p12

Normale verdeling en steekproef

• Steekproef is nooit oneindig groot• Men benadert

– Gemiddelde µ door rekenkundig gemiddelde x– variantie σ2 door steekproefvariantie s2

• Standaardafwijking σ = statistische onzekerheid opéén meting van de grootheid

• Voorbeeld : meting lengte balk– 100 of 10000 metingen

Page 13: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p13

100 en 10000 metingen lengte balk

• 100 metingen • 10000 metingen + normale verdeling

ss

xx

Page 14: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p14

Fouten en onzekerheden

• Statistische onzekerheden– Te wijten aan toevallige fluctuaties in de metingen– De onzekerheid op de conclusie uit de metingen verkleint

wanneer men beschikt over een grotere steekproef– Men spreekt vaak van statistische ‘fout’

• Blunders = fouten die niet ingeschat kunnen worden

• Systematische fouten– Reproduceerbare fouten te wijten aan slecht afgesteld

apparaat– Bvb amperemeter meet systematisch te hoge stroom– De metingen herhalen geeft geen betere nauwkeurigheid en

geeft niet meer zekerheid over de conclusies uit de proef

Page 15: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p15

Deel II

• Herhaalde metingen: gemiddelde en variantie• Bewerkingen met stochastische veranderlijken• Voorplanten van statistische onzekerheden

Page 16: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p16

Een enkele meting

• Elk meetinstrument laat toe metingen uit te voerenmet een bepaalde onzekerheid

• Bvb weegschaal meet op 0,01g nauwkeurig• Bvb lat meet op 1mm nauwkeurig• …• Voor de meetapparaten die in het practicum

gebruikt zullen worden wordt de nauwkeurigheidgegeven in de syllabus of op het apparaat zelf

• Notatie:

( )bvb 50,00 0,01i ix sm g

±

= ±

Page 17: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p17

Herhaalde metingen

• De metingen herhalen levert een resultaat met eenkleinere onzekerheid

• Wanneer men N metingen uitvoert van een grootheidx, elk men een bepaalde onzekerheid si

• Dan zijn het gewogen gemiddelde en zijn variantie

{ }; 1,i ix s i N± =

212

1 1

1 1 en = met gewichten

N

i ii

x iN Ni

i ii i

w xx s w

sw w

=

= =

= =∑

∑ ∑

Page 18: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p18

Herhaalde metingen met zelfde fout

• Indien alle metingen dezelfde onzekerheid s bezitten (of hetzelfde gewicht) dan worden hetgemiddelde en zijn onzekerheid

• Bvb 100 metingen van 200mm lange balk met latmet 1mm nauwkeurigheid geven:– Elke meting : onzekerheid 1mm– Gemiddelde : onzekerheid 1/10mm

22

1

1 N

i xi

sx x sN N=

= =∑

Page 19: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p19

Bewerkingen met toevallige variabelen

• De metingen uitgevoerd in een of meerdereexperimenten zijn zelden zelf het eindresultaatwaarin men geïnteresseerd is

• Eenvoudig geval: ik bepaal mijn gewicht door elkeochtend op de weegschaal te staan

• De proeven uitgevoerd in de fysica bestaan meestaluit metingen van verschillende grootheden, elk met een onzekerheid

• Bewerkingen met die metingen leiden tot heteindresultaat

Page 20: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p20

Voorbeeld: bepaling valversnelling

• bepaling valversnelling g: laat een kogel vanop eenhoogte vallen en meet de tijd tot die de grond raakt

• Metingen van hoogte y en tijd t, elk met eenstatistische onzekerheid

• Valbeweging

• De valversnelling g wordt

• Vraag: welke is de onzekerheid op g?

20 0 0 0

1 met 0 en 02

y y v t at y v= + + = =

2

2ygt

=

Page 21: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p21

Voorplanten van onzekerheden 1

• Voor een groot aantal metingen geldt dat de onzekerheid op een enkele meting gelijk is aan de standaarddeviatie van de normale verdeling

• Voor f(u,v) = een functie van 2 variabelen (bvbhoogte en tijd bij valversnelling) krijgt men

( )22

1

1limN

iN ix x

→∞ == −∑

( )22

1

1limN

if N if f

→∞ == −∑ ( , )i i if f u v=

Page 22: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p22

Voorplanten van onzekerheden 2• De vraag is nu

• Voor een lineair verband geldt deze relatie altijd• Voor een niet-linear verband kan men de functie f

rond het maximum van de multidimensionelewaarschijnlijkheidsverdeling benaderen door eenraakvlak

• Dit geschiedt door een ontwikkeling in Taylorreeksrond het punt (u,v)

• Termen van 2de en hogere orde worden verwaarloosd

( , )?f f u v=

, ,( , ) ( , ) ( ) ( ) ...u v u vf ff u v f u v u u v vu v∂ ∂

= + − + − +∂ ∂

Page 23: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p23

Voortplanten van onzekerheden 3

• Variantie op f wordt

22

, ,( ) ( ) ( )i i u v i u vf ff f u u v vu v∂ ∂ − ≈ − + − ∂ ∂

22

, ,1

2 2 2 2

1 1

1

1lim ( ) ( )

1 1lim ( ) ( ) lim ( ) ( )

12 lim ( )( )

N

f i u v i u vN i

N N

i iN Ni i

N

i iN i

f fu u v vN u v

f fu u v vN u N v

f fu u v vN u v

σ→∞

=

→∞ →∞= =

→∞=

∂ ∂ ≈ − + − ∂ ∂

∂ ∂= − + −

∂ ∂

∂ ∂+ − −

∂ ∂

∑ ∑

Page 24: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p24

Voortplanten van onzekerheden 4

• Covariantie σuv is nul voor niet gecorreleerdeveranderlijken, wat in alle practica het geval is

• Voorbeeld: snelheid bepalen uit metingen van afstand x en tijd t

• Voor de steekproefvariantie geldt

2 2 2 2 2( ) ( ) 2f u v uvf f f fu v u v

σ σ σ σ∂ ∂ ∂ ∂≈ + +

∂ ∂ ∂ ∂

2 2 2 2 2( ) ( )f x t

xv tv vs s sx t

=

∂ ∂≈ +

∂ ∂

2vv v s= ±

Page 25: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p25

Deel III

• Bepalen van de beste rechte door de metingen• Methode van de kleinste kwadraten• Niet lineaire problemen

Page 26: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p26

Een lineaire fysische wet• Voorbeeld : bepaling veerconstante• Een veer wordt opgehangen aan een punt – men

hangt achtereenvolgens verschillende massa’sonderaan de veer – dit veroorzaakt een elongatie van de veer – men meet de positie x van het onderstepunt van de veer als functie van de massa m

elongatie vd veer ifv massa

05

1015202530

0 100 200 300 400 500

massa(g)

posi

tie(c

m

Blauw = MeetpuntenAlle posities zijngemeten met dezelfdeonzekerheid

Page 27: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p27

Bepalen van de beste rechte• Fysische wet

• vraag: wat is de veerconstante k voor deze veer?• Of: welke is de beste schatting van k uit deze

metingen?• de beste schatting van k geeft de beste rechte door

de meetpunten (m,x)

• Hoe bepaalt men de beste rechte door de meetpunten?

elongatie vd veer ifv massa

05

1015202530

0 100 200 300 400 500

massa(g)

posi

tie(c

m

of

veerconstanteg=valversnelling

gkx mg x mk

k

= =

=

x

Page 28: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p28

Methode van de kleinste kwadraten 1

• Uit N metingen {xi,yi±σi} schat men de beste rechtey=ax+b

• de beste schatting wordt bekomen door minimisatievan de χ2

• Vb verloop χ2 als functie van parameter a voor proef‘veer’

2 22

1

1 ( )N

i ii i

y ax bχσ=

= − −

0

5

10

15

20

25

30

-4 -3 -2 -1 0 1 2 3 4 5 6

rico a

chi2

a

χ2

Page 29: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p29

Mehtoden van de kleinste kwadraten 2

• Het minimum komt overeen met (partieel afleiden naarde parameters a en b)

• Algemene oplossing: zie cursus statistiek• Indien alle metingen yi dezelfde onzekerheid σy

bezitten: eenvoudig stelsel van 2 vgl en 2 onbekenden– Eerst 2de vergelijking oplossen naar b– Deze oplossing substitueren in 1ste vergelijking – geeft a– Dit invullen in oplossing voor b

2 2

0, 0a bχ χ∂ ∂

= =∂ ∂

Page 30: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p30

Oplossen van stelsel naar a en b

22

1 1

1 1 1

2

1 1 1 1

stel

1

1

N N

i ii i

N N N

i i i ii i i

N N N N

i i i i ii i i i

N x x

a N x y x y

b x y x x y

δ

δ

δ

= =

= = =

= = = =

= −

= −

= −

∑ ∑

∑ ∑ ∑

∑ ∑ ∑ ∑

Page 31: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p31

Schatting van onzekerheden op a,b

• Voortplanten van onzekerheden op yi naar a,b

• In praktijk is onzekerheid σy vaak niet gekend en kan berekend worden uit

22 2

1

22 2

1

N

a ii i

N

b ii i

ay

by

σ σ

σ σ

=

=

∂= ∂

∂= ∂

22

22 2

1

ya

Ny

b ii

N

x

σσ

δ

σσ

δ =

=

= ∑

i y iσ σ= ∀

2 2 2

1

1 ( )2

N

y y i ii

s y ax bN

σ=

= = − −− ∑

Page 32: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p32

Fysische wet is geen rechte

• Methode van de kleinste kwadraten is steeds geldig– zie cursus statistiek

• Men kan het probleem lineariseren• Bvb valbeweging: indien men t2 ipv t als ‘x’

variabele gebruikt bekomt men een rechte waarvande richtingscoëfficient = g

212

y gt=

Page 33: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p33

Deel IV

• Presentatie van resultaten• Aantal beduidende cijfers• Afronden van getalwaarden• Grafieken, tabellen, eenheden etc

Page 34: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p34

Aantal beduidende cijfers• Meest LINKSE cijfer (≠ 0) is meest beduidende cijfer

• Geen decimaal punt : minst beduidende cijfer is meest RECHTSE cijfer (≠ 0)

• Wel decimaal punt : : minst beduidende cijfer is meest RECHTSE cijfer, ook al is dit 0

• Aantal beduidende cijfers = aantal tussen meest en minst beduidende cijfers– 5280 : 3 beduidende cijfers– 5280, : 4 beduidende cijfers– 0,0094 : 2 beduidende cijfers– 3,010 x 104 : 4 beduidende cijfers

Page 35: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p35

Afronden van getalwaarden

• Resultaat van de proef: hoeveel beduidende cijfersmoet men geven?

• Men rond eerst de onzekerheid op het resultaat (de ‘fout’) af tot 2 of 3 beduidende cijfers

• Men kiest de meest aangepaste eenheden, bvbkeuze tussen 1,0mm (3 bed cijfers) 0,1cm (1 bedcijfer)

• Dan rond men het resultaat zelf af tot hetzelfdeaantal decimalen als de ‘fout’

Page 36: Statistische verwerking van gegevens Een korte inleidingcdeclerc/meten-en-experimenteren/inleiding... · Meten en Experimenteren 2006-2007 Analyse van gegevens p4 Keuze van de steekproef

Meten en Experimenteren2006-2007

Analyse van gegevens p36

Grafieken, tabellen, eenheden• Tabellen en grafieken geven een duidelijk overzicht

van de metingen – gebruik ze!

• Grafiek: geef assen een naam en eenheden• Kies de schaal zodanig dat de gegevens over het

gehele gebied verspreid zijn• Geef duidelijk de schalen aan van de assen

• Tabel: zet bovenaan de naam van de grootheid en de eenheden

• Vergeet eenheden niet bij het geven van resultatenvan metingen en berekeningen

• Zet titels boven grafieken en tabellen