staaf- en cirkeldiagram
DESCRIPTION
Staaf- en cirkeldiagram. Beschrijvende statistiek : het verzamelen van gegevens het overzichtelijk weergeven van de gegevens in tabellen en grafieken : turftabel frequentietabel staafdiagram cirkeldiagram. 4.1. 12 : 28 x 100 =. Voorbeeld 1a. 10 : 28 x 100 =. 2 : 28 x 100 =. - PowerPoint PPT PresentationTRANSCRIPT
Staaf- en cirkeldiagram
Beschrijvende statistiek :het verzamelen van gegevenshet overzichtelijk weergeven van de gegevens in tabellen en grafieken :
1.turftabel
2.frequentietabel
3.staafdiagram
4.cirkeldiagram
4.1
Voorbeeld 1a
bloedgroep turven frequentie rel.frequentie
O llll llll ll 12 42,9%
A llll llll 10 35,7%
B ll 2 7,1%
AB llll 4 14,3%
relatieve frequentie is de frequentie in procenten
rel.freq. = x 100%
rond relatieve frequenties af op één decimaal
Freq.
Totale freq.
totale freq. = 28
12 : 28 x 100 =
10 : 28 x 100 =
2 : 28 x 100 =4 : 28 x 100 =
Voorbeeld 1b
profiel turven frequentie sectorhoek
C&M llll l 6 77°
E&M llll llll l 11 141°
N&G llll l 6 77°
N&T llll 5 64°
sectorhoek = x 360°
rond sectorhoeken af op hele getallen
Freq.
Totale freq.
totale freq. = 28
6 : 28 x 360 =
11 : 28 x 360 =
6 : 28 x 360 =5 : 28 x 360 =
C&ME&MN&GN&T
bij een cirkeldiagram hoort een legenda
profiel
Voorbeeld 1c
er zijn 12 jongens
× 100% ≈ 42,9%
er zijn 16 meisjes
× 100% ≈ 57,1%
12 28
16 28
jongen/meisje
0
10
20
30
40
50
60
j m
relatievefrequentie
- bij een staafdiagram hoort een opschrift en informatie bij de assen - teken de staven even breed en los van elkaar
4.1
Histogram en frequentiepolygoon
een histogram of Kolommendiagram bij een freqentietabel met kwantitatieve gegevens (waarnemingsgetallen) op de horizontale as de kolommen liggen tegen elkaar aan
een freqentiepolygoon is een lijndiagram waarin de frequenties zijn uitgezet tegen de waarnemingsgetallen
als je de relatieve frequenties uitzet tegen de waarnemingsgetallen krijg je een relatieve-frequentiepolygoon
4.1
Voorbeeld 2
omvang gezin
frequentie
2 3
3 7
4 9
5 5
6 3
7 1
a
0
1
2
3
4
5
6
7
8
9
10
b
ᅵ2
ᅵ3
ᅵ4
ᅵ5
ᅵ6
ᅵ7
- in het midden van ieder staafje staat het waarnemingsgetal- de staven liggen in een histogram tegen elkaar
omvang gezin frequentie
aantal personen gezin
opgave 3
omvang gezin rel. freq.
2 10,7%
3 25%
4 32,1%
5 17,9%
6 10,7%
7 3,6%
c
0
5
10
15
20
25
30
35
1 2 3 4 5 6 7 8
omvang gezin frequentie
aantal personen gezin
d minder dan 4 personen3 + 7 = 10 leerlingen
× 100% ≈ 35,7%
minstens 4 personen9 + 5 + 3 + 1 = 18 personen
× 100% ≈ 64,3%
10 28
18 28
3 : 28 x 100 =
7 : 28 x 100 =
9 : 28 x 100 =
5 : 28 x 100 =
3 : 28 x 100 =
1 : 28 x 100 =
Voorbeeld 3
zakgeld turven frequentie
5-<10 llll 5
10-<15 llll l 6
15-<20 llll l 6
20-<25 llll ll 7
25-<30 lll 3
30-<35 l 1
- zijn er bij een statistisch onderzoek veel verschillende aarnemingsgetallen, dan maak je een indeling in klassen
- geef elke klasse dezelfde breedte- zorg voor 5 a 10 klassen
4.2
Voorbeeld 3
05 10 15 20 25
1
2
3
4
5
30 35
6
7
zakgeld in euro’s
frequentie
zakgeld freq.
5-<10 5
10-<15 6
15-<20 6
20-<25 7
25-<30 3
30-<35 1
de staven in een histogram tegen elkaar tekenen
Zakgeld van 4 Havo leerlingen per maandZakgeld van 4 Havo leerlingen per maand
Voorbeeld 3
0
1
2
3
4
5
6
7
zakgeld freq.
5-<10 5
10-<15 6
15-<20 6
20-<25 7
25-<30 3
30-<35 1
frequentie
zakgeld in euro’s5 10 15 20 25 30 35
∙
∙ ∙
∙
∙
∙
de klassenmiddens zijn de punten in een frequentiepolygoon
Zakgeld van 4 Havo leerlingen per maandZakgeld van 4 Havo leerlingen per maand
Voorbeeld 4
0 6 7 8 8 8
1 0 0 2 2 2 4 5 5 6 7 8 8
2 0 0 0 0 2 3 4 5 6 8
3 2
tientallen eenheden
ZAKGELD IN EURO
steel-bladdiagram
steel blad
a 15 komt 2 keer voorb kleinste bedrag is €6,-c het bedrag €20,- komt het vaakst voord de klassen zijn 0-<10 ; 10-<20 ; 20-<30 ; 30-<40
06 = 6
Cumulatieve frequenties
de cumulatieve frequentie krijg je door de frequentie van die klasse en de frequenties van de voorgaande klassen bij elkaar opgeteld
bij een cumulatieve frequentiepolygoon teken je de cumulatieve frequenties boven de rechtergrenzen van de klassen
begin op de horizontale as bij de linkergrens van de eerste klasseverbind de opeenvolgende punten door lijnstukken
4.2
opgave 12a
lengte frequentie cum. freq. rel. cum. freq.
155-<160 538 538 11,8%
160-<165 1135 1673 36,6%
165-<170 1218 2891 63,2%
170-<175 941 3832 83,3%
175-<180 657 4489 98,2%
170-<175 83 4572 100%
relatieve cumulatieve frequentie is de cumulatieve frequentie in procenten
cum.rel.freq. = x 100%
rond cum.rel.freq. af op één decimaal
cum. freq.
totale freq.
538 : 4572 x 100 =1673 : 4572 x 100 =2891 : 4572 x 100 =
3832 : 4572 x 100 =
cumulatieve frequentie is de frequentie van deze klasse en de voorgaande klassen bij elkaar opgeteld
4489 : 4572 x 100 =
4572 : 4572 x 100 =
0 + 538 =
538 + 1135 =
1673 + 1218 =
2891 + 941 =
3832 + 657 =
4489 + 83 =
opgave 12b
0
20
40
60
80
100lengte rel.cum.
freq
155-<160 11,8%
160-<165 36,6%
165-<170 63,2%
170-<175 83,3%
175-<180 98,2%
180-<185 100%
rel.cu
m.freq
lengte in cm.
∙155 160 165 170 175 180 185
∙
∙
∙
∙∙ ∙
zet de rel.cum.freq. boven de rechtergrenzen uit, begin bij de linkergrens
je eindigt altijd bij 100%
Diagrammen
histogram (zie par.2)frequentiepolygoon (zie par.2)steel-bladdiagram (zie par.2)staafdiagram
met een staafdiagram kon je in één oogopslag onderzoeksresultaten onderling vergelijkende staven zijn even breed en staan los van elkaar
lijndiagrameen lijndiagram laat zien hoe een verschijnsel zich in de loop van de tijd heeft ontwikkeldin een lijndiagram zijn de gegevens als punten uitgezet en daarna verbonden door lijnstukjes, tussenliggende punten hebben geen betekenis
cirkeldiagram (sectordiagram) brengt de procentuele (relatieve) verdeling in beeld
beelddiagramhoeveelheden worden aangegeven met figuurtjes
4.3
opgave 22
a is niet zo nauwkeurigb 15% is lid van de vakbond
totale beroepsbevolking was100 : 15 × 16,5 miljoen = 110 miljoen
c in de VS zijn relatief weinig werknemers lid van een vakbond, men komt schijnbaar als individu op voor het eigen belang
5 x 3% = 15%
Misleiding bij grafische weergave
Let bij grafieken op de volgende punten:1 staat er bij de grafiek een duidelijk opschrift?2 staat er voldoende informatie bij de assen?3 begint de verticale as bij 0? is er een scheurlijn gebruikt?
4.3
opgave 25
a de lengte en breedte van het biljet bij 2006 is 4 keer zo groot als bij het biljet van 2005
b de oppervlakte van het biljet bij 2006 is 42 = 16 keer zo groot als bij het biljet van 2005daardoor lijkt het of de winst 16 keer zo groot is
Centrummaten
gemiddeldehet gemiddelde van een serie waarnemingsgetallen is de som van die getallen
gedeeld door het aantal getallen
mediaaneerst de waarnemingsgetallen naar grootte rangschikkenbij oneven aantal getallen is de mediaan het middelste getalbij even aantal getallen is de mediaan het gemiddelde van de middelste twee
getallen
modusde modus is het waarnemingsgetal met de grootste frequentie
4.4
Voorbeeld 5 (zonder GR)
a gemiddelde = (3×2 + 4×4 + 5×6 + 6×5 + 7×4 + 8×4 + 9×3 + 10×2) : 30gemiddelde = 6,330 getallen 15e en 16e getal15e getal = 6 en 16e getal = 6mediaan = ( 6 + 6 ) : 2mediaan = 6het cijfer 5 komt 6 keer voormodus = 5
b modus, mediaan, gemiddeldec totaal was 189 en het aantal ll. was 30
30 + 4 = 34 leerlingen34 × 6,5 = 221221 – 189 = 32de vierde leerling 32 – (3 × 9) = 5
cijfer frequentie
3 2
4 4
5 6
6 5
7 4
8 4
9 3
10 2
het cijfer 3 komt 2 keer voor
Voorbeeld 5 (met GR)
a voer in lijst 1 = { 3, 4, 5, 6, 7, 8, 9, 10 }en lijst 2 = { 2, 4, 6, 5, 4, 4, 3, 2 }optie 1-Var Stats L1,L2 (TI)of 1VAR (casio)gemiddelde = 6,3mediaan = 6modus = 5
b modus, mediaan, gemiddeldec totaal was 189 en het aantal ll. was 30
30 + 4 = 34 leerlingen34 × 6,5 = 221221 – 189 = 32de vierde leerling 32 – (3 × 9) = 5
Voordelen en nadelen centrummaten
voordeel nadeel
modus • snel op te schrijven, weinig rekenwerk
• de enige centrummaat die bij kwalitatieve gegevens te gebruiken is
• geeft weinig informatie
• is niet altijd aanwezig
• een kleine verandering kan een geheel andere modus opleveren
mediaan • niet gevoelig voor uitschieters
• weinig rekenwerk
• alleen de volgorde van de waarnemingsgetallen is van belang, niet de grootte van de waarnemingsgetallen
gemiddelde • alle gegevens worden gebruikt
• iedereen kent deze centrummaat
• gevoelig voor uitschieters
4.4
Voorbeeld 6
aantal branduren
frequentie
1600-<2000 85
2000-<2400 75
2400-<2800 63
2800-<3200 58
3200-<3600 19
a klassenmiddens zijn1800, 2200, 2600, 3000 en 3400voer in lijst1 { 1800,2200,2600,3000,3400 } en lijst2 { 85,75,63,58,19 }optie 1 Var-Stats L1,L2 of 1VARgemiddelde ≈ 2401 uur
b GR mediaan = 2200 dus de mediaan ligt in de klasse 2000-< 2400
c de modale klasse is 1600-< 2000d 300 waarnemingsgetallen 150e en 151e getal
150 – 85 = 65e getal en 151 – 85 = 66e getal in klasse 2000-< 2400er zitten 75 getallen in deze klasse2000 + (65,5 : 75) × 400 ≈ 2349, dat is dus meer dan 2200
de klasse met de grootste frequentie is de modale klasse
om het gemiddelde te berekenen moet je eerst de klassenmiddens berekenen
Hoe teken je een boxplot?
1 bepaal de mediaan2 bepaal het eerste kwartiel (mediaan van de “1e” helft) en het derde kwartiel
(mediaan van de “2e” helft)3 teken een getallenlijn en zet het kleinste en grootste waarnemingsgetal,
de mediaan en de beide kwartielen boven de getallenlijn4 teken de boxplot
4.4
de volgende score’s zijn gehaald bij een test23 – 43 – 24 - 34 - 13 - 32 - 44 - 53 - 17 - 28 – 30 – 22 – 19schrijf de getallen van klein naar groot op13 – 17 – 19 – 22 – 23 – 24 – 28 – 30 – 32 – 34 – 43 – 44 – 53teken een getallenlijnkleinste waarnemingsgetal = 13grootste waarnemingsgetal = 53mediaan = 281e kwartiel (Q1) = (19 + 22) : 2 = 20,5
3e kwartiel (Q3) = (34 + 43) : 2 = 37,5
201510 25 30 35 40 45 50 55
voorbeeld
tussen 2 verticale streepjes altijd 25% van de waarnemingsgetallen
in de box 50%
4.4
Boxplot mbv de grafische rekenmachine
1 frequentie tabel makenstat edit 1 L1 (waarnemingsgetallen)
L2 (frequentie’s) invullen
2 boxplot berekenenstat calc 1 1 var stats L1,L2
(L1,+2 2nd 1,2)
3 boxplot tekenen2nd stat plot 1 on type ‘5e’ graph
4.4
De relatieve cumulatieve frequentiepolygoon kun je goed gebruiken om een boxplot te tekenen.
0
25
50
75
100
5 10 15 20 25
0% kleinste getal = 325% 1e kwartiel (Q1) = 10
50% mediaan = 1375% 3e kwartiel (Q3) = 20
100% grootste getal = 24
relatieve cumulatieve frequentie
0 5 10 15 20 25
3 10 13 20 24
boxplot
∙
∙
∙
∙
∙
4.4
Spreidingsmaten
vaak wordt naast een centrummaat een zogenaamde spreidingsmaat berekend om aan te geven hoever de data in een verdeling uitelkaar liggen
spreidingsbreedte : verschil tussen het grootste en kleinste getal
kwartielafstand : verschil tussen het 1e en 3e kwartiel (Q3 – Q1)
4.4
opgave 42
a bij elke klas is de mediaan 3 km.b nee, de mediaan is bij elke klas hetzelfdec in klas 4A zit 50% tussen 1 en 5 km
in klas 4B zit 50% tussen 2 en 4 kmd in klas 4A is de spreiding het grootst
in klas 4C is de spreiding het kleinst
De standaardafwijking
de meest gebruikte spreidingsmaat is de standaardafwijkingom de standaardafwijking te berekenen moet je eerst van elk
waarnemingsgetal berekenen hoe ver het van het gemiddelde afligtzo krijg je bij elk waarnemingsgetal x de deviatie dd = x – x ( de afwijking van het gemiddelde )standaardafwijking σ = √gemiddelde van (x – x)2 het berekenen van σ doe je met (TI) 1-Var Stats L1,L2 σx
of (Casio) 1VAR xσn
4.4
opgave 49
a voer in lijst 1 = {4.8,4.9,5.0,5.1,5.2,5.3,5.4} en lijst 2 = {2,4,10,18,12,3,1}
optie 1-Var Stats L1,L2 of 1VAR geeftminX = 4,8 ; Q1 = 5 ; Med = 5,1 ; Q3 = 5,2 ; maxX = 5,4
mediaan = 5,1kwartielafstand = Q3 – Q1 = 5,2 – 5 = 0,2
spreidingsbreedte = maxX – minX = 5,4 – 4,8 = 0,6b schatting σ = 0,3 2σ = 0,6
2σ = spreidingsbreedte = 0,6 dat kan nietc GR x ≈ 5,09 en σ ≈ 0,12
gemiddelde ≈ 5,09 kg en de standaardafwijking ≈ 0,12 kg
gewicht 4,8 4,9 5,0 5,1 5,2 5,3 5,4
freq. 2 4 10 18 12 3 1
Notaties op de GR
x : het gemiddeldeσ : de standaardafwijkingσx : de standaardafwijking (TI)xσn : de standaardafwijking (Casio)n : het totale aantal waarnemingenminX : het kleinste waarnemingsgetalmaxX : het grootste waarnemingsgetalQ1 : het eerste kwartiel
Q3 : het derde kwartiel
Med : de mediaan (het tweede kwartiel)
4.4
De populatie is de totale groep waarop het onderzoek betrekking heeft.Een steekproef is representatief als zij een juiste afspiegeling is van de gehele
populatie- de steekproef moet voldoende groot zijn- de steekproef is aselect
In een gelote steekproef heeft elk element van de populatie dezelfde kans om in de steekproef te komen.
In een gelaagde steekproef komen duidelijk te onderscheiden groepen in dezelfde verhouding voor als in de gehele populatie.
Bij een systematische steekproef genereer je één toevalsgetal. de andere steekproefelementen volgen hieruit door met vaste stappen door de gehele populatie te lopen. voor de stapgrootte deel je de populatieomvang door de steekproefomvang.
4.5
opgave 60
leeftijd man vrouw
0-< 18 × 50 = 8,20
dus 8
18-< 48
48 en ouder
50 305
25 305
× 50 = 4,10 dus 4
× 50 = 12,30 dus 12
× 50 = 11,48 dus 11
× 50 = 6,56 dus 7
× 50 = 7,38 dus 7
75 305
70 305
40 305
45 305
totaal = 50 + 70 + 25 + 40 + 75 + 45 = 305 patiënten
het aantal is 8 + 11 + 4 + 7 + 12 + 7 = 49om aan een steekproeflengte van 50 te komen kiezen we een extra man van 18-< 48
Oefen opgave1
134 135 124 120
116 124 127 129
111 122 128 115
119 123 125 116
130 121 121 127
119 123 112 131
124 133 128 137
127 115 129 121
126 132 116 120
130 119 113 114
Maak een frequentieverdeling van deze gegevens. ( eerste klasse 110 -< 115)
Bereken de drie centrummaten op twee manieren.
Teken het bijbehorend histogram.
Maak m.b.v. de relatieve gecumuleerde frequentie grafiek de boxplot.
Wat is de spreidingsbreedte, de kwartielsafstand en de standaardafwijking?
Lengte van gereserveerde ski's
Lengte maat
( in cm f
110 -< 115 4
115 -< 120 8
120 -< 125 11
125 -< 130 9
130 -< 135 6
135 -< 140 2
40
gemiddelde 123,88
modus 122,5
nr v/d mediaan 20,5
mediaan 121,14
m112,5117,5122,5127,5132,5137,5
f*m450940
13481148795275
4955
0110 115 120 125 130
2
4
6
8
10
135 140
12
Skilengte in cm
frequentie
Lengte van gereserveerde ski’sLengte van gereserveerde ski’s
Gecum. freq.verdeling
klassegrens abs. rel.
-< 110 0 0,0
-< 115 4 10,0
-< 120 12 30,0
-< 125 23 57,5
-< 130 32 80,0
-< 135 38 95,0
-< 140 40 100,0
Gecumuleerde relatieve verdeling ski lengtes.
0,0
20,0
40,0
60,0
80,0
100,0
100 110 120 130 140 150
skilengte in cm
%
Standaardafwijking=6,71
minX=110
Q1=117,5
Med=122,5
Q3=127,5
maxX=140
Kwartielsafstand = 10
110 119 128 140124