statistische verwerking van gegevens een korte...
TRANSCRIPT
Meten en experimenteren
Statistische verwerking van gegevensEen korte inleiding
13 oktober 2006
Meten en Experimenteren2006-2007
Analyse van gegevens p2
Deel I
• Toevallige veranderlijken• Steekproef• Beschrijving van gegevens• Histogram• Gemiddelde en standaarddeviatie• Normale verdeling• Fouten en onzekerheden
Meten en Experimenteren2006-2007
Analyse van gegevens p3
Toevallige veranderlijken
• experiment = meting van een bepaalde grootheid x uitgevoerd met een bepaald instrument volgens eenbepaalde procedure
• Een experiment wordt meestal beïnvloed doorverschillende factoren: vb bepaling verbruik van eenauto, meten valversnelling
• Het resultaat van een experiment is nooit exact reproduceerbaar
• De verschillende waarnemingen of resultaten van eenexperiment vertonen een spreiding
• Men noemt de grootheid x (het resultaat van hetexperiment) een toevallige of stochastischeveranderlijke
Meten en Experimenteren2006-2007
Analyse van gegevens p4
Keuze van de steekproef
• Men wil meestal uit het experiment een fysischegrootheid bepalen, bvb de valversnelling
• Elk experiment wordt beïnvloedt door verschillendewillekeurige factoren
• Het is dus best om een groot aantal experimentenuit te voeren, at random (willekeurig) gekozen
• Dit is een steekproef waaruit men conclusies wenstte trekken over de fysische grootheid
• Men bekomt een verzameling gegevens{x1,x2,x3,…xn}
Meten en Experimenteren2006-2007
Analyse van gegevens p5
Beschrijving van gegevens
• Na het uitvoeren van n experimenten beschikt menover een verzameling gegevens {x1,x2,x3,…xn}
• Men kan deze verzameling beschrijven via de volgende empirische grootheden :
• Aantal gegevens• steekproefgemiddelde: maat voor de locatie van de
gegevens• Steekproefvariantie en standaardafwijking: maat
voor de spreiding van de gegevens• De gegevens worden vaak voorgesteld in een
histogram
Meten en Experimenteren2006-2007
Analyse van gegevens p6
Histogram
• De gegevens worden ingedeeld in klassen• Het histogram geeft een eerste informatie over
structuren (pieken, uniform ..) in de verdeling van gemeten grootheid
• De keuze van de breedte van de klassen hangt afvan de nauwkeurigheid waarmee men de grootheidgemeten heeft, van het aantal gegevens …
• Voorbeeld :men meet de lengte van een balk van 20 cm
Meten en Experimenteren2006-2007
Analyse van gegevens p7
100 metingen lengte balk – 1mm lat
• in 10 klassen van elk 1mm • in 4 klassen van elk 2,5mm
Aan
talm
etin
gen
Lengte (mm)
Meten en Experimenteren2006-2007
Analyse van gegevens p8
Gemiddelde en standaarddeviatie
• Een steekproef wordt gekarakteriseerd door de volgende grootheden:
• Rekenkundig gemiddelde
• Variantie
• Standaardafwijking of standaarddeviatie = s
1
1 n
ii
x xn =
= ∑
( )22
1
11
n
ii
s x xn =
= −− ∑
Meten en Experimenteren2006-2007
Analyse van gegevens p9
x
s
Meten en Experimenteren2006-2007
Analyse van gegevens p10
• Indien de steekproef oneindig groot wordt dan volgtde verdeling van de gemeten grootheid een normale of gaussische verdeling met
–gemiddelde waarde µ–standaardafwijking σ–Variantie σ2
–Waarschijnlijkheidsverdeling f(x)
Normale verdeling
( )( )2-- 221
2
x
f x eµσ
σ π=
Grootheid x
frequ
entie
Meten en Experimenteren2006-2007
Analyse van gegevens p11
Normale verdeling
• 68% van de metingen ligt in het interval [µ-σ, µ+σ]
• 95% van de metingen ligt in het interval [µ-2σ, µ+2σ]
• 99,7% van de metingen ligtin het interval [µ-3σ, µ+3σ]
Meten en Experimenteren2006-2007
Analyse van gegevens p12
Normale verdeling en steekproef
• Steekproef is nooit oneindig groot• Men benadert
– Gemiddelde µ door rekenkundig gemiddelde x– variantie σ2 door steekproefvariantie s2
• Standaardafwijking σ = statistische onzekerheid opéén meting van de grootheid
• Voorbeeld : meting lengte balk– 100 of 10000 metingen
Meten en Experimenteren2006-2007
Analyse van gegevens p13
100 en 10000 metingen lengte balk
• 100 metingen • 10000 metingen + normale verdeling
ss
xx
Meten en Experimenteren2006-2007
Analyse van gegevens p14
Fouten en onzekerheden
• Statistische onzekerheden– Te wijten aan toevallige fluctuaties in de metingen– De onzekerheid op de conclusie uit de metingen verkleint
wanneer men beschikt over een grotere steekproef– Men spreekt vaak van statistische ‘fout’
• Blunders = fouten die niet ingeschat kunnen worden
• Systematische fouten– Reproduceerbare fouten te wijten aan slecht afgesteld
apparaat– Bvb amperemeter meet systematisch te hoge stroom– De metingen herhalen geeft geen betere nauwkeurigheid en
geeft niet meer zekerheid over de conclusies uit de proef
Meten en Experimenteren2006-2007
Analyse van gegevens p15
Deel II
• Herhaalde metingen: gemiddelde en variantie• Bewerkingen met stochastische veranderlijken• Voorplanten van statistische onzekerheden
Meten en Experimenteren2006-2007
Analyse van gegevens p16
Een enkele meting
• Elk meetinstrument laat toe metingen uit te voerenmet een bepaalde onzekerheid
• Bvb weegschaal meet op 0,01g nauwkeurig• Bvb lat meet op 1mm nauwkeurig• …• Voor de meetapparaten die in het practicum
gebruikt zullen worden wordt de nauwkeurigheidgegeven in de syllabus of op het apparaat zelf
• Notatie:
( )bvb 50,00 0,01i ix sm g
±
= ±
Meten en Experimenteren2006-2007
Analyse van gegevens p17
Herhaalde metingen
• De metingen herhalen levert een resultaat met eenkleinere onzekerheid
• Wanneer men N metingen uitvoert van een grootheidx, elk men een bepaalde onzekerheid si
• Dan zijn het gewogen gemiddelde en zijn variantie
{ }; 1,i ix s i N± =
212
1 1
1 1 en = met gewichten
N
i ii
x iN Ni
i ii i
w xx s w
sw w
=
= =
= =∑
∑ ∑
Meten en Experimenteren2006-2007
Analyse van gegevens p18
Herhaalde metingen met zelfde fout
• Indien alle metingen dezelfde onzekerheid s bezitten (of hetzelfde gewicht) dan worden hetgemiddelde en zijn onzekerheid
• Bvb 100 metingen van 200mm lange balk met latmet 1mm nauwkeurigheid geven:– Elke meting : onzekerheid 1mm– Gemiddelde : onzekerheid 1/10mm
22
1
1 N
i xi
sx x sN N=
= =∑
Meten en Experimenteren2006-2007
Analyse van gegevens p19
Bewerkingen met toevallige variabelen
• De metingen uitgevoerd in een of meerdereexperimenten zijn zelden zelf het eindresultaatwaarin men geïnteresseerd is
• Eenvoudig geval: ik bepaal mijn gewicht door elkeochtend op de weegschaal te staan
• De proeven uitgevoerd in de fysica bestaan meestaluit metingen van verschillende grootheden, elk met een onzekerheid
• Bewerkingen met die metingen leiden tot heteindresultaat
Meten en Experimenteren2006-2007
Analyse van gegevens p20
Voorbeeld: bepaling valversnelling
• bepaling valversnelling g: laat een kogel vanop eenhoogte vallen en meet de tijd tot die de grond raakt
• Metingen van hoogte y en tijd t, elk met eenstatistische onzekerheid
• Valbeweging
• De valversnelling g wordt
• Vraag: welke is de onzekerheid op g?
20 0 0 0
1 met 0 en 02
y y v t at y v= + + = =
2
2ygt
=
Meten en Experimenteren2006-2007
Analyse van gegevens p21
Voorplanten van onzekerheden 1
• Voor een groot aantal metingen geldt dat de onzekerheid op een enkele meting gelijk is aan de standaarddeviatie van de normale verdeling
• Voor f(u,v) = een functie van 2 variabelen (bvbhoogte en tijd bij valversnelling) krijgt men
( )22
1
1limN
iN ix x
Nσ
→∞ == −∑
( )22
1
1limN
if N if f
Nσ
→∞ == −∑ ( , )i i if f u v=
Meten en Experimenteren2006-2007
Analyse van gegevens p22
Voorplanten van onzekerheden 2• De vraag is nu
• Voor een lineair verband geldt deze relatie altijd• Voor een niet-linear verband kan men de functie f
rond het maximum van de multidimensionelewaarschijnlijkheidsverdeling benaderen door eenraakvlak
• Dit geschiedt door een ontwikkeling in Taylorreeksrond het punt (u,v)
• Termen van 2de en hogere orde worden verwaarloosd
( , )?f f u v=
, ,( , ) ( , ) ( ) ( ) ...u v u vf ff u v f u v u u v vu v∂ ∂
= + − + − +∂ ∂
Meten en Experimenteren2006-2007
Analyse van gegevens p23
Voortplanten van onzekerheden 3
• Variantie op f wordt
22
, ,( ) ( ) ( )i i u v i u vf ff f u u v vu v∂ ∂ − ≈ − + − ∂ ∂
22
, ,1
2 2 2 2
1 1
1
1lim ( ) ( )
1 1lim ( ) ( ) lim ( ) ( )
12 lim ( )( )
N
f i u v i u vN i
N N
i iN Ni i
N
i iN i
f fu u v vN u v
f fu u v vN u N v
f fu u v vN u v
σ→∞
=
→∞ →∞= =
→∞=
∂ ∂ ≈ − + − ∂ ∂
∂ ∂= − + −
∂ ∂
∂ ∂+ − −
∂ ∂
∑
∑ ∑
∑
Meten en Experimenteren2006-2007
Analyse van gegevens p24
Voortplanten van onzekerheden 4
• Covariantie σuv is nul voor niet gecorreleerdeveranderlijken, wat in alle practica het geval is
• Voorbeeld: snelheid bepalen uit metingen van afstand x en tijd t
• Voor de steekproefvariantie geldt
2 2 2 2 2( ) ( ) 2f u v uvf f f fu v u v
σ σ σ σ∂ ∂ ∂ ∂≈ + +
∂ ∂ ∂ ∂
2 2 2 2 2( ) ( )f x t
xv tv vs s sx t
=
∂ ∂≈ +
∂ ∂
2vv v s= ±
Meten en Experimenteren2006-2007
Analyse van gegevens p25
Deel III
• Bepalen van de beste rechte door de metingen• Methode van de kleinste kwadraten• Niet lineaire problemen
Meten en Experimenteren2006-2007
Analyse van gegevens p26
Een lineaire fysische wet• Voorbeeld : bepaling veerconstante• Een veer wordt opgehangen aan een punt – men
hangt achtereenvolgens verschillende massa’sonderaan de veer – dit veroorzaakt een elongatie van de veer – men meet de positie x van het onderstepunt van de veer als functie van de massa m
elongatie vd veer ifv massa
05
1015202530
0 100 200 300 400 500
massa(g)
posi
tie(c
m
Blauw = MeetpuntenAlle posities zijngemeten met dezelfdeonzekerheid
Meten en Experimenteren2006-2007
Analyse van gegevens p27
Bepalen van de beste rechte• Fysische wet
• vraag: wat is de veerconstante k voor deze veer?• Of: welke is de beste schatting van k uit deze
metingen?• de beste schatting van k geeft de beste rechte door
de meetpunten (m,x)
• Hoe bepaalt men de beste rechte door de meetpunten?
elongatie vd veer ifv massa
05
1015202530
0 100 200 300 400 500
massa(g)
posi
tie(c
m
of
veerconstanteg=valversnelling
gkx mg x mk
k
= =
=
x
Meten en Experimenteren2006-2007
Analyse van gegevens p28
Methode van de kleinste kwadraten 1
• Uit N metingen {xi,yi±σi} schat men de beste rechtey=ax+b
• de beste schatting wordt bekomen door minimisatievan de χ2
• Vb verloop χ2 als functie van parameter a voor proef‘veer’
2 22
1
1 ( )N
i ii i
y ax bχσ=
= − −
∑
0
5
10
15
20
25
30
-4 -3 -2 -1 0 1 2 3 4 5 6
rico a
chi2
a
χ2
Meten en Experimenteren2006-2007
Analyse van gegevens p29
Mehtoden van de kleinste kwadraten 2
• Het minimum komt overeen met (partieel afleiden naarde parameters a en b)
• Algemene oplossing: zie cursus statistiek• Indien alle metingen yi dezelfde onzekerheid σy
bezitten: eenvoudig stelsel van 2 vgl en 2 onbekenden– Eerst 2de vergelijking oplossen naar b– Deze oplossing substitueren in 1ste vergelijking – geeft a– Dit invullen in oplossing voor b
2 2
0, 0a bχ χ∂ ∂
= =∂ ∂
Meten en Experimenteren2006-2007
Analyse van gegevens p30
Oplossen van stelsel naar a en b
22
1 1
1 1 1
2
1 1 1 1
stel
1
1
N N
i ii i
N N N
i i i ii i i
N N N N
i i i i ii i i i
N x x
a N x y x y
b x y x x y
δ
δ
δ
= =
= = =
= = = =
= −
= −
= −
∑ ∑
∑ ∑ ∑
∑ ∑ ∑ ∑
Meten en Experimenteren2006-2007
Analyse van gegevens p31
Schatting van onzekerheden op a,b
• Voortplanten van onzekerheden op yi naar a,b
• In praktijk is onzekerheid σy vaak niet gekend en kan berekend worden uit
22 2
1
22 2
1
N
a ii i
N
b ii i
ay
by
σ σ
σ σ
=
=
∂= ∂
∂= ∂
∑
∑
22
22 2
1
ya
Ny
b ii
N
x
σσ
δ
σσ
δ =
=
= ∑
i y iσ σ= ∀
2 2 2
1
1 ( )2
N
y y i ii
s y ax bN
σ=
= = − −− ∑
Meten en Experimenteren2006-2007
Analyse van gegevens p32
Fysische wet is geen rechte
• Methode van de kleinste kwadraten is steeds geldig– zie cursus statistiek
• Men kan het probleem lineariseren• Bvb valbeweging: indien men t2 ipv t als ‘x’
variabele gebruikt bekomt men een rechte waarvande richtingscoëfficient = g
212
y gt=
Meten en Experimenteren2006-2007
Analyse van gegevens p33
Deel IV
• Presentatie van resultaten• Aantal beduidende cijfers• Afronden van getalwaarden• Grafieken, tabellen, eenheden etc
Meten en Experimenteren2006-2007
Analyse van gegevens p34
Aantal beduidende cijfers• Meest LINKSE cijfer (≠ 0) is meest beduidende cijfer
• Geen decimaal punt : minst beduidende cijfer is meest RECHTSE cijfer (≠ 0)
• Wel decimaal punt : : minst beduidende cijfer is meest RECHTSE cijfer, ook al is dit 0
• Aantal beduidende cijfers = aantal tussen meest en minst beduidende cijfers– 5280 : 3 beduidende cijfers– 5280, : 4 beduidende cijfers– 0,0094 : 2 beduidende cijfers– 3,010 x 104 : 4 beduidende cijfers
Meten en Experimenteren2006-2007
Analyse van gegevens p35
Afronden van getalwaarden
• Resultaat van de proef: hoeveel beduidende cijfersmoet men geven?
• Men rond eerst de onzekerheid op het resultaat (de ‘fout’) af tot 2 of 3 beduidende cijfers
• Men kiest de meest aangepaste eenheden, bvbkeuze tussen 1,0mm (3 bed cijfers) 0,1cm (1 bedcijfer)
• Dan rond men het resultaat zelf af tot hetzelfdeaantal decimalen als de ‘fout’
Meten en Experimenteren2006-2007
Analyse van gegevens p36
Grafieken, tabellen, eenheden• Tabellen en grafieken geven een duidelijk overzicht
van de metingen – gebruik ze!
• Grafiek: geef assen een naam en eenheden• Kies de schaal zodanig dat de gegevens over het
gehele gebied verspreid zijn• Geef duidelijk de schalen aan van de assen
• Tabel: zet bovenaan de naam van de grootheid en de eenheden
• Vergeet eenheden niet bij het geven van resultatenvan metingen en berekeningen
• Zet titels boven grafieken en tabellen