elementere kwantitatiewe metodes gqm105 (b.com)
DESCRIPTION
B.Com (Ondernemingsbestuur)TRANSCRIPT
ElementêreKwantitatiewe Metodes
a k a d e m i aAkademia MSW (Maatskappyregistrasienommer: 2005/024616/08) is voorwaardelik by die Departement van Hoër Onderwys en Opleiding tot
31 Desember 2016 as privaat hoëronderwysinstelling geregistreer ingevolge die Wet op Hoër Onderwys, 1997, Registrasienommer: 2011/HE08/005.
Akademia is deel van die Solidariteit Beweging
w w w. a k a d e m i a . a c . z a
ElementêreKwantitatiewe Metodes
© Kopiereg 2014
Onder redaksie van: Paul JN Steyn, BA (PU vir CHO), THOD (POK), DEd (Unisa)
Skrywer: Johann Smith
Onderwysontwerp, bladuitleg & taalversorging: Dr. Daleen van Niekerk
’n Publikasie van Akademia. Alle regte voorbehou.
Adres: H/v D.F. Malan- & Eendrachtstraat, Kloofsig, Pretoria
Posadres: Posbus 11760, Centurion, 0046
Webtuiste: www.akademia.ac.za
Geen gedeelte van hierdie boek mag sonder die skriftelike toestemming van die uitgewers
gereproduseer of in enige vorm of deur enige middel weergegee word nie,
hetsy elektronies of deur fotokopiëring, plaat- of bandopnames, vermikrofilming
of enige ander stelsel van inligtingsbewaring nie. Enige ongemagtigde weergawe van hierdie werk sal as ’n
skending van kopiereg beskou word en die dader sal aanspreeklik gehou word onder siviele asook strafreg.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 1
Inhoudsopgawe
Programoorsig ................................................................................................................. 1
Inleiding ............................................................................................................................. 5
Vakleeruitkomste ........................................................................................................... 6
Woordomskrywing vir evaluering ........................................................................... 7
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek ................... 9
1.1 Studie-eenheid leeruitkomstes ........................................................................................... 9
1.2 Voorgeskrewe handboek .................................................................................................... 9
1.3 Hoe kan jy jou begrip verbeter? ....................................................................................... 10
1.4 Inleiding ................................................................................................................................ 11
1.5 Basiese begrippe en beginsels van statistiek ................................................................ 12
1.5.1 Wat is statistiek? ............................................................................................................. 12
1.5.2 Data .................................................................................................................................. 15
1.5.3 Selfevalueringsvrae........................................................................................................ 17
1.6 Beskrywende statistiek ...................................................................................................... 17
1.6.1 Grafiese beskrywende statistiek vir kategoriese data .............................................. 18
1.6.2 Grafiese voorstelling van numeriese data: Een veranderlike .................................. 22
1.6.3 Grafiese voorstelling van numeriese data: Twee veranderlikes ............................. 26
1.6.4 Pareto se kurwe .............................................................................................................. 30
1.6.5 Excel ................................................................................................................................. 30
1.6.6 Selfevalueringsvrae: Hoofstuk 2 .................................................................................. 30
1.7 Numeriese beskrywende statistiek .................................................................................. 30
1.7.1 Maatstawwe van lokaliteit <sentrale neiging> ........................................................... 30
1.7.2 Nie-sentrale maatstawwe van lokaliteit ....................................................................... 38
1.7.3 Maatstawwe van spreiding ............................................................................................ 41
1.7.4 Maatstawwe van skeefheid ........................................................................................... 44
1.7.5 Keuse van statistiek en MS Excel ................................................................................ 48
1.7.6 Selfevaluering: Hoofstuk 3 ............................................................................................ 48
1.8 Samevatting ........................................................................................................................ 48
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 2
Studie-eenheid 2: Waarskynlikhede en steekproewe ..................................... 51
2.1 Studie-eenheid leeruitkomstes ......................................................................................... 51
2.2 Voorgeskrewe handboek .................................................................................................. 51
2.3 Hoe kan jy jou begrip verbeter? ....................................................................................... 52
2.4 Inleiding ................................................................................................................................ 52
2.5 Waarskynlikhede ................................................................................................................ 53
2.5.1 Basiese beginsels en konsepte van waarskynlikhede ............................................. 53
2.5.2 Berekening van waarskynlikhede ................................................................................ 56
2.5.3 Waarskynlikheidsreëls ................................................................................................... 58
2.5.4 Telreëls: Permutasies en kombinasies ....................................................................... 59
2.5.5 Selfevalueringsvrae........................................................................................................ 62
2.6 Waarskynlikheidsverspreidings ........................................................................................ 62
2.6.1 Diskrete waarskynlikheidsverspreidings ..................................................................... 64
2.6.2 Die normaalverdeling ..................................................................................................... 67
2.6.3 Selfevalueringsvrae........................................................................................................ 71
2.7 Steekproewe ....................................................................................................................... 71
2.7.1 Steekproefmetodes ........................................................................................................ 71
2.7.2 Die steekproefverspreiding ........................................................................................... 72
2.7.3 Selfevalueringsvrae........................................................................................................ 74
2.8 Samevatting ........................................................................................................................ 74
Studie-eenheid 3: Vertrouensintervalle en hipotesetoetsing: Deel I ......... 75
3.1 Studie-eenheid leeruitkomstes ......................................................................................... 75
3.2 Voorgeskrewe handboek .................................................................................................. 75
3.3 Hoe kan jy jou begrip verbeter? ....................................................................................... 76
3.4 Inleiding ................................................................................................................................ 76
3.5 Vertrouensintervalle ........................................................................................................... 77
3.5.1 Puntberamings en vertrouensintervalle ...................................................................... 77
3.5.2 Vertrouensinterval vir µ: � bekend ............................................................................... 77
3.5.3 Vertrouensinterval vir µ: � bekend ............................................................................... 79
3.5.4 Selfevalueringsvrae........................................................................................................ 80
3.6 Hipotesetoetsing vir een populasie .................................................................................. 81
3.6.1 Hipotesetoetsing ............................................................................................................. 81
3.6.2 Hipotesetoetsing vir ʼn populasiegemiddeld (slegs een � en � is bekend) ............ 83
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 3
3.6.3 Hipotesetoetsing vir ʼn populasiegemiddeld (slegs een � en � is onbekend) ....... 83
3.6.4 Hipotesetoetsing deur die p-waarde te gebruik ......................................................... 83
3.6.5 Selfevalueringsvrae........................................................................................................ 84
3.7 Samevatting ........................................................................................................................ 84
Studie-eenheid 4: Hipotesetoetsing: Deel II ........................................................ 87
4.1 Studie-eenheid leeruitkomstes ......................................................................................... 87
4.2 Voorgeskrewe handboek .................................................................................................. 87
4.3 Hoe kan jy jou begrip verbeter? ....................................................................................... 88
4.4 Inleiding ................................................................................................................................ 88
4.5 Hipotesetoets: Vergelyking van twee populasies .......................................................... 88
4.5.1 Verskil tussen die gemiddelde in onafhanklike steekproewe, σ bekend ............... 89
4.5.2 Verskil tussen twee gemiddeldes: Onafhanklike steekproewe en σ is onbekend 90
4.5.3 Die verskil tussen twee gemiddeldes: Steekproewe is nie onafhanklik nie .......... 91
4.5.4 Selfevalueringsvrae........................................................................................................ 92
4.6 Hipotesetoets: �� ............................................................................................................... 92
4.6.1 Die ��-toets ..................................................................................................................... 92
4.6.2 Selfevalueringsvrae........................................................................................................ 94
4.7 Hipotesetoets: ANOVA ...................................................................................................... 94
4.7.1 ANOVA en die F-statistiek ............................................................................................ 94
4.7.2 Selfevalueringsvrae........................................................................................................ 96
4.8 Samevatting ........................................................................................................................ 97
Afrikaans/Engelse terme ........................................................................................... 98
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 4
Programoorsig
Inleiding tot
elementêre
kwantitatiewe metodes
GQM105
Studie-eenheid 1:
Basiese beginsels en
beskrywende
statistiek
Studie-eenheid 2:
Waarskynlikhede en
steekproewe
Studie-eenheid 3:
Vertrouensintervalle
en hipotesetoetsing,
Deel I
Studie-eenheid 4:
Hipotesetoetsing,
Deel II
Bedryfsetiek
GBE105
Studie-eenheid 1: Die etiese
dimensie van sake
Studie-eenheid 2: Teorieë oor etiek
en sake
Studie-eenheid 3: Etiek in die
sakeomgewing
Studie-eenheid 4: Etiese besluitneming
in sake
Studie-eenheid 5: Die bestuur van etiese prestasie
Ondernemings-
bestuur I
GBM105
Studie-eenheid 1: Inleiding tot
Ondernemings-bestuur
Studie-eenheid 2: Die nuwe
sakeonderneming
Studie-eenheid 3: Algemene
bestuursbeginsels
Studie-eenheid 4: Bestuursfunksies
Deel I
Studie-eenheid 5: Bestuursfunksies
Deel II
Inleiding tot
Bedryfsinligting-
stelsels
GBI105
Studie-eenheid 1: Inleiding tot
bedryfsinligting-stelsels
Studie-eenheid 2: Inligtingstegnologie-
infrastruktuur
Studie-eenheid 3: Toepassings van bedryfsinligting-stelsels: Deel I
Studie-eenheid 4: Toepassings van bedryfsinligting-stelsels: Deel II
Studie-eenheid 5: Die bestuur van bedryfsinligting-
stelsels
Bedryfs-
kommunikasie
GBC105
Studie-eenheid 1: Grondbeginsels van
bedryfs-kommunikasie
Studie-eenheid 2: Verbale
kommunikasie in die werksplek
Studie-eenheid 3: Interne en eksterne
interaksie
Handelsreg
GCL105
Studie-eenheid 1: Inleiding tot Handelsreg
Studie-eenheid 2: Algemene beginsels
van Kontraktereg
Studie-eenheid 3: Kontrakte
Studie-eenheid 4: Ander aspekte van
Handelsreg
Ekonomie
GEC105
Studie-eenheid 1: Mikro-ekonomie:
Deel I
Studie-eenheid 2: Mikro-ekonomie:
Deel II
Studie-eenheid 3: Makro-ekonomie:
Deel I
Studie-eenheid 4: Makro-ekonomie:
Deel II
Studie-eenheid 5: Makro-ekonomie:
Deel III
BCom Ondernemingsbestuur
Eerste Jaar
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 5
Inleiding
Elementêre kwantitatiewe metodes behels ʼn aantal statistiese tegnieke wat die interpretasie
van ʼn verskeidenheid data vergemaklik. Die tipes en volumes van data wat deur
organisasies versamel word, maak dit soms moeilik of onmoontlik om hierdie data deur blote
observasies te interpreteer. ʼn Verskeidenheid statistieke en statistiese berekeninge maak
hierdie interpretasie moontlik en makliker.
Hierdie vak word hoofsaaklik in vier afdelings verdeel. Eerstens, word ʼn inleiding verskaf oor
die aard van, en behoefte aan, statistiese berekeninge.
Wanneer data versamel word, moet die aard van die data op ʼn beskrywende manier
voorgestel word. Hierdie statistieke, wat beide grafieke en numeriese berekeninge insluit,
word beskrywende statistiek genoem. Studie-eenheid 1 bespreek onderskeidelik die
grafiese en numeriese voorstelling van data.
Die derde afdeling verskaf ʼn grondslag vir inferensiële of afleidende statistiek (inferential
statistics) – die berekeninge wat gebruik word om ʼn kleiner groep data (steekproef) op ʼn
groter groep (populasie) van toepassing te maak. Waarskynlikhede,
waarskynlikheidsverspreidings, en steekproewe en steekproefverspreidings word in Studie-
eenheid 2 bespreek.
Die laaste afdeling wat in hierdie vak behandel word, is hipotesetoetsing. Hier word sekere
stellings oor eienskappe van die populasie (of populasies) statisties getoets.
Studie-eenheid 3 verskaf ʼn grondslag vir hipotesetoetsing. Die wyse waarop ʼn hipotese, wat
met ʼn enkele populasiegemiddeld te make het, getoets word, word ook hier bespreek.
Studie-eenheid 4 bou hierop voort deur ander gevalle van hipotesetoetsing te bespreek. Dit
sluit, onder andere, hipotesetoetsing ten opsigte van gemiddelde oor twee of meer
populasies in.
Voorgeskrewe handboek
Vir hierdie vak is die volgende handboek voorgeskryf:
Wegner, T. 2013. Applied business statistics. 3rd Ed. Claremont: Juta.
Die gedeeltes wat betrekking het op die inhoud van die studie-eenhede sal telkens aangedui
word. Die gids sal jou dan deur die handboek begelei en poog om moeilike gedeeltes toe te
lig; om aan te vul waar nodig en om die belangrike gedeeltes uit te wys.
Vir eksamendoeleindes moet jy dus die voorgeskrewe gedeeltes in die handboek,
asook hierdie begeleidingsgids bestudeer.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 6
Aanbevole bron
English – Afrikaans Glossary Of Statistical Terms, Editors: Faans Steyn, Chris Smit, Corna
Vorster, July 2009.
http://www.sastat.org.za/sites/default/files/documents/files/Eng_Afr_fin.pdf
http://www.sastat.org.za/sites/default/files/documents/files/Afr_Eng_fin.pdf
(Hierdie bronne is aanlyn beskikbaar en verskaf Afrikaanse vertalings vir Engelse statistiese
terme en selfs eenvoudige definisies. Dit is ʼn baie handige bron wanneer ʼn mens twyfel oor
die korrekte vertaling, konteks en betekenis.)
Vakleeruitkomste
Kennis en begrip
Na voltooiing van die vak INLEIDING TOT ELEMENTÊRE KWANTITATIEWE METODES
sal jy in staat wees om jou kennis en begrip te demonstreer van:
• Numeriese en grafiese beskrywende statistiek
• Waarskynlikhede en waarskynlikheidsverspreidings
• Steekproewe en steekproefverspreidings
• Vertrouensintervalle
• Hipotesetoetsing
Vaardighede
Jy sal ook in staat wees om:
• Data grafies voor te stel
• Data deur middel van basiese numeriese beskrywende statistiek voor te stel
• Basiese waarskynlikheidsberekeninge te doen
• Vertrouensintervalle op te stel
• ʼn Verskeidenheid tipes hipoteses te toets
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 7
Woordomskrywing vir evaluering
In die afdeling oor selfevaluering, asook in die werkopdragte sal daar van jou verwag word
om sekere take te verrig. Dit is belangrik dat jy presies weet wat van jou verwag word. Die
woordelys hieronder sal jou hiermee help.
Werkwoord Omskrywing
Wanneer daar van jou
verwag word om te:
Moet jy die volgende doen:
Lys Lys die name/items wat bymekaar hoort
Identifiseer Eien (ken uit) en selekteer die regte antwoorde
Verduidelik Ondersoek die moontlikhede, oorweeg en skryf dan jou
antwoord (verklaring/verduideliking) neer
Beskryf Omskryf die konsep of woorde duidelik
Kategoriseer/
klassifiseer
Bepaal tot watter klas, groep, afdeling bepaalde
items/voorwerpe behoort
Analiseer Om iets te ontleed
Evalueer Bepaal die waarde van ʼn stelling/stelsel/beleid/ens
Toepas Pas die teoretiese beginsels toe in ʼn praktiese probleem
Hersien Evalueer, verbeter en/of wysig ʼn beleid/dokument/stelsel/ens
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 8
Notas
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 9
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek
1.1 Studie-eenheid leeruitkomstes
Kennis en begrip
Na voltooiing van Studie-eenheid 1 sal jy in staat wees om jou kennis en begrip te
demonstreer van die volgende:
• Basiese statistiese begrippe
• Grafiese beskrywende statistiek
• Numeriese beskrywende statistiek
Vaardighede
Jy sal ook in staat wees om:
• basiese statistiese begrippe te omskryf.
• ʼn keuse tussen ʼn verskeidenheid grafieke en tabelle te maak om verskillende data
grafiese voor te stel.
• verskillende numeriese beskrywende statistieke te bereken.
• ʼn keuse tussen ʼn verskeidenheid numeriese beskrywende statistieke te maak om
data voor te stel.
1.2 Voorgeskrewe handboek
Wegner, T. 2013. Applied business statistics. 3rd Ed. Claremont: Cape Town.
Vir die doeleindes van hierdie studie-eenheid moet jy die volgende afdelings bestudeer:
Hoofstuk 1, Paragraaf 1.1 – 1.11
Hoofstuk 2, Paragraaf 2.1 – 2.7, 2.9
Hoofstuk 3, Paragraaf 3.1 – 3.7, 3.9
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 10
1.3 Hoe kan jy jou begrip verbeter?
Jy moet seker maak dat jy die volgende terminologie verstaan:
Sleutelwoord Omskrywing
Afleidende statistiek Statistieke wat gebruik word om gevolgtrekkings ten opsigte
van elemente in die populasie te maak.
Beskrywende
statistiek
Grafieke en numeriese waardes wat die data wat versamel is
beskryf. Dit word gedoen voordat enige afleidings gemaak
word.
Data Die fisiese waardes (getalle) wat aan ʼn veranderlike toegeken
word.
Diskrete data Data wat slegs uit heelgetalle bestaan. (Daar is dus geen
waardes tussen byvoorbeeld 1 en 2 nie)
Ewekansige
veranderlike
Enige eienskap van ʼn populasie wat van belang is, wat
versamel en geanaliseer word.
Kolomgrafiek ʼn Grafiek wat frekwensies per kategorie voorstel.
Kontinue data Data wat uit reële getalle bestaan. Daar is dus, byvoorbeeld, ʼn
oneindige hoeveelheid waardes tussen 1 en 2 (bv. 1.0001).
Kumulatiewe
frekwensieveelhoek
ʼn Grafiek van ʼn kumulatiewe frekwensieverspreiding.
Meervoudige
kolomgrafiek
ʼn Kolomgrafiek wat twee kategorieë (in plaas van een) se
frekwensies voorstel, byvoorbeeld ouderdomme vir mans en
vroue.
Reikwydte Die verskil tussen die maksimum en minimum waardes in ʼn
steekproef.
Sirkelgrafiek ʼn Grafiek wat verskillende proporsies van ʼn geheel (100%)
voorstel.
Steekproef ʼn Kleiner groep wat vanuit ʼn populasie verkry word.
Eienskappe van die steekproef kan gemeet word en word
gebruik om gevolgtrekkings van dieselfde eienskappe van die
populasie te maak.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 11
1.4 Inleiding
Statistiek behels die verwerking van data na inligting deur middel van wiskundige
berekeninge. Om statistiek moontlik te maak, moet data kwantitatief (numeries) wees of
gekwantifiseer (na getalle omgeskakel) word. Hierdie studie-eenheid verskaf ʼn inleiding tot
Statistiek, en bespreek die verskillende aspekte van beskrywende statistiek.
Daar word na twee tipes beskrywende statistiek gekyk: grafies en numeries. Die doel van
beskrywende statistiek is om ʼn oorsig oor die data te gee. (Daarna kan afleidende statistiek
toegepas word, om sekere afleidings van ʼn groter groep, of populasie, te maak.)
Wat tabelle en grafieke betref, word daar eerstens gekyk na die grafiese voorstelling van
kategoriese data waar slegs een veranderlike betrokke is. Dan word datastelle met meer as
een veranderlike ondersoek. In die tweede plek word daar na numeriese data gekyk. Weer
eens word die verskillende wyses waarop een, en dan twee, veranderlikes voorgestel kan
word, bespreek. Hoofstuk 2 en 3 in die handboek bestaan uit ʼn verskeidenheid hulpmiddels.
Dit is die statistikus se taak om te bepaal watter van hierdie hulpmiddels die beste gepas sal
wees vir ʼn spesifieke situasie. Die figuur hieronder (Figuur 1.1) stel die uitleg van Hoofstuk 2
en 3 grafies voor.
Figuur 1. 1: Oorsig oor Hoofstuk 2 en 3
(Bron: Wegner, 2013: 26 – 100)
Statistiek
Beskrywend
Tabelle en
grafieke (Hoofstuk 2)
Kategoriese data
(2.2)
Een veranderlike
Twee
veranderlikes
Numeriese data
(2.3)
Een veranderlike
Twee
veranderlikes
Die Pareto kurwe Excel
Numeries
(Hoofstuk 3)
Sentrale neiging
(3.2)
Nie-sentrale
neiging
Verspreiding
Skeefheid
Houer-en-
stipping
Afleidend
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 12
1.5 Basiese begrippe en beginsels van statistiek
Bestudeer die handboek: Hoofstuk 1, paragraaf 1.1 – 1.11.
Hoofstuk 1 in die handboek is nie ʼn lang hoofstuk nie. Dit mag die verkeerdelike indruk skep
dat hierdie hoofstuk nie belangrik is nie. Niks kan egter verder van die waarheid af wees nie.
Die belangrikste kernbegrippe word in hierdie hoofstuk bespreek. ʼn Student wat nie deeglik
bewus is van die inhoud van hierdie hoofstuk nie, sal die res van die handboek uiters
uitdagend vind.
Die doel van hierdie begeleidingsgids is nie om die handboek te herhaal nie. Dus sal daar
nie ʼn definisie en beskrywing van elke begrip in die handboek verskaf word nie. Sommige
van die begrippe sal egter in meer detail beskryf word.
1.5.1 Wat is statistiek?
Bestudeer die handboek: Paragraaf 1.1 tot 1.5
Om hierdie te vraag te beantwoord is dit belangrik om eers na die definisies in paragraaf 1.1
in die handboek te kyk. Daar word onderskei tussen terme soos bestuursbesluitneming,
inligting, data en statistiek. Data het nie enige waarde, indien dit nie na inligting verwerk
word nie. Statistiek is een van die stel hulpmiddels wat hier verwerking nodig maak.
Statistiek het te make met kwantitatiewe data, met ander woorde, data wat in syfers
omgeskakel is. In die meeste gevalle word data waarop statistiese berekeninge uitgevoer
moet word, van die begin af as data versamel.
Voorbeeld
Kyk na die volgende vrae. Watter van hierdie vrae versamel statistiese data?
• Hoe voel jy oor die e-tolstelsel?
• Hoe oud is jy (in jare)?
• Wat was die punt wat jy vir Statistiek behaal het?
• Op ʼn skaal van 1 tot 10, dui aan hoe tevrede jy met die dosent is.
Al die bogenoemde vrae, behalwe die eerste een, versamel kwantitatiewe data. Dit is
egter moontlik om, deur ʼn verskeidenheid tegnieke, data wat nie kwantitatief is nie, in
getalle om te skakel. Daar word verwys na die kwantifisering van kwalitatiewe data.
Hierdie is ʼn omvattende proses wat nie in hierdie vak bespreek sal word nie.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 13
Paragraaf 1.2 in die handboek beskryf die taal van Statistiek. Die volgende voorbeeld sal
poog om elk van hierdie terme te illustreer:
Voorbeeld
Daar is 30 000 werknemers by Maatskappy X. Ek wil graag weet hoe gereeld hierdie
werknemers by restaurante eet, maar hierdie data is nie beskikbaar nie. Ek besluit om die
werknemers hieroor uit te vra. Omdat ek nie die tyd en geld het om al 30 000 werknemers
te vra nie, kies ek ʼn kleiner groep van 1 000 werknemers uit die groter groep. Ek kies
hierdie groep sodat hulle so ver as moontlik verteenwoordigend van die 30 000 is. Ek vra
elk van hierdie werknemers hoeveel keer per jaar hy/sy by ʼn restaurant uiteet. Ek kry ʼn
gemiddeld van 14.75 keer per jaar.
• Ewekansige veranderlike (random variable): Die hoeveelheid keer wat ʼn
werknemer in Maatskappy X per jaar by ʼn restaurant eet, in hierdie geval 14.75.
• Data: Die 1 000 antwoorde wat ek versamel het.
• Populasie (population): Die totale hoeveelheid individue waarvoor ek afleidings wil
maak, gebaseer of my statistiese analise (die 30 000 werknemers). Belangrik:
Die steekproef moet altyd uit die populasie saamgestel word. Ek kon dus nie my
1 000 werknemers vanaf ʼn ander onderneming as Maatskappy X gevind het nie.
• Populasie parameter (population parametre): Die spesifieke eienskap van die
populasie wat ek wil meet, in hierdie geval die gemiddelde hoeveelheid kere
wat ʼn werknemer (van die 30 000) uiteet in ʼn jaar.
• Steekproef (sample): Die 1 000 werknemers (nie hul antwoorde nie) wat
verteenwoordigend van die volledige groep werknemers (30 000) behoort te wees.
• Steekproef-eenheid (Sampling unit): Elkeen van hierdie werknemers wat in die
steekproef voorkom, is ʼn steekproef-eenheid.
• Steekproef statistiek (sample statistic): Omdat ek nie die data vir al die
werknemers in die populasie kan meet nie, moet ek ʼn statistiek in die steekproef
gebruik om die soortgelyke statistiek in die populasie te skat. Dus is die
gemiddelde hoeveelheid kere wat werknemers in die steekproef uiteet, my
steekproef statistiek.
• Grootte (N en n). Die grootte van die steekproef (n) was 1 000. Die grootte van die
populasie (N) is 30 000.
• Proporsie (p). Die steekproef se proporsie van die populasie, was 0.033
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 14
(1 000/30 000).
Vir nog voorbeelde, sien gerus Tabel 1.1 in die handboek.
Statistiek behels ʼn verskeidenheid berekeninge. Om ʼn som te doen en die woorde
"gemiddelde hoeveelheid keer wat ʼn werknemer in die steekproef by ʼn restaurant eet" te
gebruik, sal hierdie somme bemoeilik. Vir hierdie rede word daar standaardsimbole gebruik
om sekere veranderlikes voor te stel. Vir ʼn gemiddeld word, byvoorbeeld, µ en x̄ (vir die
populasie- en steekproefgemiddelde, onderskeidelik) gebruik.
Waarom verskillende simbole vir populasie- en steekproefstatistieke? Die
steekproefstatistiek sal in die meeste gevalle die enigste statistiek wees wat bereken gaan
word. As die statistikus nie foute maak nie, is hierdie statistiek 100% akkuraat. Die
steekproefstatistiek word egter slegs gebruik om die ooreenkomstige populasiestatistiek te
beraam. Daarom is dit belangrik dat daar onderskei word tussen die statistiek wat bereken is
(steekproef) en die statistiek wat beraam word (in die populasie). Sien Tabel 1.2 in die
handboek vir die simbole wat gebruik word vir die belangrikste statistieke. Die name van
hierdie statistieke word in Figuur 1.2 hieronder opgesom:
Figuur 1. 2: Belangrike statistieke
(Bron: Aangepas uit Wegner, 2013:6)
Paragraaf 1.3 in die handboek beskryf ʼn paar belangrike komponente van statistiek wat die
grondslag vorm vir die wyse waarop die res van die handboek gestruktureer is. Hierdie
studie-eenheid sal beskrywende statistiek (descriptive statistics) bespreek. Enige
Gemiddeld
•(Mean)
Standaardafwyking
•(Standard deviation)
Variansie
•(Variance)
Grootte
•van steekproef of populasie, met ander woorde, hoeveel mense (of objekte) was in die
steekproef of populasie?
Proporsie
•(Proportion)
Korrelasie
•(Correlation)
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 15
kwantitatiewe studie sal gewoonlik begin deur die data te beskryf (sonder om
gevolgtrekkings te maak). Hierdie beskrywings kan in die vorm van grafieke wees, maar sal
tipies ʼn aantal statistieke (soos gemiddelde en standaardafwykings) ook insluit. Daarna word
sekere afleidings ten opsigte van die resultate gemaak. Hierdie afleidings word
inferensiële/afleidende statistiek (inferential statistics) genoem.
Figuur 1.2 in die handboek demonstreer hoe die populasie, steekproef, statistieke en
statistiese modellering bymekaar pas.
Paragraaf 1.5 in die handboek verskaf ʼn oorsig waar statistiek in die sakewêreld gebruik kan
word. Hierdie lys is natuurlik nie volledige nie. Statistiek kan op ʼn verskeidenheid wyses in
verskillende kontekste toegepas word.
1.5.2 Data
Bestudeer die handboek: Paragraaf 1.5 – 1.11
Statistiek is gebaseer op data. As hierdie data van swak kwaliteit is (byvoorbeeld as gevolg
van foute met die versameling), maak dit nie saak hoe goed die kwaliteit van die statistiese
ontleding is nie. Die inligting wat verkry word, sal foutief wees. Beskou weer die voorbeeld
van Maatskappy X in paragraaf 1.5.1 hierbo genoem. Daar is gevind dat die gemiddelde
werknemer 14.75 per jaar by restaurante eet. Gestel nou dat die vraag nie ʼn tydsperiode (in
hierdie geval die afgelope jaar) gespesifiseer het nie. Sommige respondente mag antwoord
hoeveel keer hul per week, dag of maand uiteet. Die inligting sal steeds foutief wees,
ongeag hoe akkuraat die gemiddeld bereken is.
ʼn Goeie navorser sal dus twee belangrike aspekte in ag moet neem:
• Hoe kan die kwaliteit van data verseker word?
• Wat is die beste statistiese metode om gevolgtrekkings oor die populasie te kan
maak?
� Eienskappe van data
Elke statistiese metode (byvoorbeeld die berekening van ʼn gemiddeld) het ʼn aantal
voorwaardes wat nagekom moet word voordat die metode gebruik kan word. Die
belangrikste voorwaardes hou gewoonlik verband met die aard van die data.
Dit is belangrik om te onderskei tussen die aard van data en meetskale (of vlakke) van
data. Eersgenoemde beskryf slegs sekere eienskappe van die data, terwyl laasgenoemde
verband hou met die wyse waarop data versamel word. Beide bogenoemde word, vir meer
duidelikheid, in Figuur 1.3 beskryf.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 16
Figuur 1. 3: Eienskappe en vlakke van data
(Bron: Wegner, 2013: 10 – 11)
Soos reeds genoem, kan kwalitatiewe data op ʼn kwantitatiewe wyse gemeet word. Kyk
byvoorbeeld na die volgende vraag: "Wat is jou gunsteling restaurant?". Hoe sal ʼn mens ʼn
antwoord op hierdie vraag kan kwantifiseer? Hoe doen ʼn mens somme met "Spur" en
"Dros"?
Die antwoord lê in die gebruik van nominale veranderlikes. Elke restaurant kry ʼn nommer,
byvoorbeeld:
• Spur = 1
• Dros = 2
• Bessie se kombuis = 3
Uit die aard van die saak is hierdie data baie beperk. ʼn Mens kan nie ʼn gemiddelde uitwerk
nie (Wat beteken ʼn 2.6 in hierdie geval?). Dit is egter moontlik om uit te vind wat die
gemiddelde ouderdom is van respondente wat Spur besoek, teenoor die ouderdom van
respondente wat ander restaurante besoek. Dus kan hierdie kategorieë gebruik word vir
statistiese berekeninge. Die statistiese metodes wat met hierdie tipe data gebruik kan word,
is egter beperk. Sien Figuur 1.4 vir meer inligting oor die data tipes/vlakke. Dit is belangrik
om hierdie vlakke te verstaan, omdat dit in die meeste gevalle sal bepaal watter statistiese
toets gebruik kan word.
Eie
nsk
ap
pe Kwalitatief vs Kwantitatief
Diskreet vs kontinue data Vla
kke Nominaal
Ordinaal
Interval
Ratio
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 17
Figuur 1. 4: Vlakke van data
(Bron: Wegner, 2013: 10 – 11)
Paragraaf 1.8 in die handboek beskryf die bronne waar data vandaan gekry kan word, terwyl
paragraaf 1.9 in die handboek beskryf hoe hierdie data versamel moet word. Die handboek
beskryf slegs drie vorme van dataversameling – daar is meer. Hierdie drie metodes is egter
van groot belang en voldoende vir die doel van hierdie vak.
1.5.3 Selfevalueringsvrae
Voltooi al die oefeninge aan die einde van Hoofstuk 1 in die handboek. Die antwoord op
hierdie vrae is aan die einde van die handboek. Dit is belangrik dat jy nie na die antwoorde
kyk voordat jy die vrae heeltemal voltooi het nie, selfs al sukkel jy om ʼn vraag te voltooi.
Belangrik:
Moenie met Hoofstuk 2 begin voordat jy Hoofstuk 1 ten volle verstaan nie. Indien daar enige
begrippe is wat vir jou onduidelik is, kontak jou dosent om te verseker dat jy oor die nodige
grondslag beskik om die res van die handboek te kan baasraak.
1.6 Beskrywende statistiek
Bestudeer die handboek: Hoofstuk 2, paragraaf 2.1 – 2.7, 2.9.
As gevolg van die groot verskeidenheid berekeninge wat gedoen moet word, gaan die uitleg
van hierdie begeleidingsgids verskil van ander begeleidingsgidse in hierdie program. Die
doel van ʼn begeleidingsgids is nie om bloot inligting in die handboek te herhaal nie, maar om
dit te vereenvoudig en meer verteerbaar vir die student te maak. In hoofstukke (soos
•Gewoonlike slegs kategorieë
•Bv. manlike en vroulik
Nominale data
•Die spesifeke getalle stel nie slegs kategorieë voor nie, maar het ʼn waarde, bv. 1 is
groter as 2
•Bv. maatskappygrootte (mikro, klein, medium, groot)
Ordinale data
•Gewoonlik gebruik met vrae wat skale (rating scales) bevat.
•Die afstand tussen verskillende opsies is ewe groot.
Interval data
•Die data is kontinu. Daar is dus enige hoeveelheid data wat tussen twee waardes
voorkom.
•Bv. salaris (tussen R1 000 en R2000 in onbeperkte hoeveelheid antwoorde).
Ratio data
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 18
Hoofstuk 2), waar ʼn verskeidenheid statistieke en grafieke bespreek word, sal die
begeleidingsgids poog om ʼn opsomming van elke statistiek (of grafiek) te verskaf. Vrae soos
die volgende sal beantwoord word:
• Waarvoor word die statistiek (of grafiek) gebruik?
• Hoe word die statistiek bereken (of grafiek) opgestel?
• Hoe word die resultate (of grafiek) geïnterpreteer.
Dit is dus belangrik om te onthou dat die begeleidingsgids nie die handboek vervang nie,
maar bloot aanvul.
1.6.1 Grafiese beskrywende statistiek vir kategoriese data
Bestudeer die handboek: Paragraaf 2.2
In paragraaf 1.6 is die verskillende tipes data beskryf. Nominale data is gewoonlik kategories
van aard. Die voorbeeld van die gunsteling restaurante behels kategoriese data.
Kategoriese data kan grafies op die volgende wyses voorgestel word:
� Kategoriese frekwensietabel
Hierdie tabel dui aan hoeveel keer elke kategorie deur respondente genoem is. ʼn Voorbeeld
word in Figuur 1.5 voorgestel.
Gunsteling
restaurant
Telling (count) Persentasie
Spur 370 37%
Dros 250 25%
Bessie se
kombuis
380 38%
1000 100%
Figuur 1. 5: Voorbeeld van ʼn frekwensietabel
� Kolomgrafiek (bar chart)
Hierdie grafiek stel frekwensies (bv. hoeveel keer ʼn restaurant as gunsteling genoem is)
grafies voor.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 19
Figuur 1. 6: ʼn Kolomgrafiek
� Sirkelgrafiek (pie chart)
Hierdie grafiek word gebruik om die proporsie van elke kategorie as deel van alle
respondente te vertoon. Figuur 1.7 verskaf ʼn voorbeeld.
Figuur 1. 7: ʼn Sirkelgrafiek
Kyk ook na Voorbeeld 2.1 in die handboek.
Soms is daar meer as een veranderlike wat gemeet word. In plaas van ʼn gunsteling
restaurant, kan die respondente ook gevra word om hul geslag (manlik of vroulik) aan te dui.
Sodoende kan daar bepaal word of die gunsteling restaurante van mans en vroue verskil.
Die volgende is wyses waarop kategoriese data met meer as een veranderlikes voorgestel
kan word.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 20
Moenie deurmekaar raak nie: Kategorie vs. veranderlike
Ons onderskei hier tussen veranderlikes en kategorieë. In die restaurant voorbeeld, is daar
drie kategorieë (Spur, Dros en Bessie se kombuis), maar slegs een veranderlike (gunsteling
restaurant). In die voorbeelde hieronder is daar twee veranderlikes (gunsteling restaurant en
geslag), wat elk ʼn aantal kategorieë bevat:
• Veranderlike 1: Gunsteling restaurant. 3 kategorieë:
o Kategorie 1: Spur
o Kategorie 2: Dros
o Kategorie 3: Bessie se kombuis
• Veranderlike 2: Geslag. 2 kategorieë:
o Kategorie 1: Manlik
o Kategorie 2: Vroulik
Die veranderlike vorm dus die grondslag waarvolgens kategorieë geskep word.
� Kruis-tabuleringstabel (cross-tabulation table)
ʼn Tabel wat beide een veranderlike se frekwensies verdeel volgens ʼn tweede veranderlike,
byvoorbeeld:
Restaurant
Geslag
Totaal
Manlik Vroulik
Spur 250 120 370
Dros 180 70 250
Bessie se kombuis 50 330 380
Totaal 480 520 1000
Figuur 1. 8: ʼn Kruis-tabuleringstabel
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 21
Uit bogenoemde is dit duidelik:
• dat daar meer vroulike (n=520) respondente as manlike (n=480) respondente was.
• dat daar meer manlike respondente was wat van Spur en Dros gehou het, as
vroulike respondente (250 en 180 vs. 120 en 70).
• dat die vroulike respondente meer van Bessie se kombuis hou as mans, asook dat
vroulike respondente se gunsteling restaurant oor die algemeen Bessie se kombuis
is.
� Stapel-kolomgrafiek (Stacked bar chart)
Hierdie grafiek is soortgelyk aan ʼn gewone kolomgrafiek, hoewel die frekwensies van ʼn
spesifieke kategorie verdeel word volgens die proporsie van ʼn tweede veranderlike. Kyk na
die voorbeeld in Figuur 1.9.
Figuur 1. 9: ʼn Stapel-kolomgrafiek
� Meervoudige kolomgrafiek (multiple bar chart)
Hierdie grafiek is soortgelyk aan die stapel-kolomgrafiek, maar die waardes vir beide
kategorieë word langs mekaar vertoon (in plaas van binne-in dieselfde kolom). Figuur 1.10
verskaf ʼn voorbeeld:
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 22
Figuur 1. 10: ʼn Meervoudige kolomgrafiek
Sien ook Voorbeeld 2.2 in die handboek vir meer inligting.
1.6.2 Grafiese voorstelling van numeriese data: Een veranderlike
Bestudeer die handboek: Paragraaf 2.3
Paragraaf 1.6.1 hierbo het kategoriese data bespreek. Kategoriese data is gewoonlik
kwalitatiewe data wat gekwantifiseer word deur dit in kategorieë te plaas. Hierdie paragraaf
bespreek nou numeriese data (ordinaal, interval en ratio) en die wyses waarop dit grafies
voorgestel kan word. Hierdie grafiese voorstelling behels grafieke en tabelle.
Een numeriese veranderlike
Vir die doel van hierdie paragraaf, sal die volgende voorbeeld gebruik word.
Die volgende inligting word van Maatskappy X verkry:
• Die ouderdom van 1 000 van hul werknemers uit ʼn ewekansige steekproef. Die
hoogste ouderdom is 67 en die jongste is 18.
� Numeriese frekwensieverspreiding
Hierdie verspreiding deel alle data in intervalle op. Dan word bepaal hoeveel van alle
waardes in elke interval aangetref word. Hierdie is dus ʼn poging om iets soos ratio-data na
kategoriese data om te skakel. Waarom sal ʼn mens dit wil doen? In hierdie geval is die doel
bloot om data beter te vertoon.
Om hierdie verspreiding te bepaal, moet die volgende eers verkry word:
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 23
• Reikwydte (range): hoogste waarde - laagste waarde (dus 67 - 18 = 49).
• Interval wydte. Eerstens, moet op die hoeveelheid intervalle besluit word. Daarna
moet die grootte van elke interval bepaal word. Gestel dus ons wil 5 intervalle hê. Die
berekening is dan soos volg:
o Reikwydte/hoeveelheid intervalle
o = 49/5
o = 9.8 ≈ 10
o Elke interval sal dus 10 jaar groot wees
• Verdeel nou alle data (die 1 000 ouderdomme) in hierdie groepe op. Dit is belangrik
dat ʼn enkele respondent se ouderdom slegs in een kategorie ingedeel word.
Figuur 1.11 stel hierdie verdeling grafies voor:
Interval (10 jaar) Frekwensies
(Hoeveel respondente val in die
kategorie?)
18 – 27 400
28 – 37 290
38 – 47 190
48 – 57 90
58 – 69 30
Totaal 1000
Figuur 1. 11: Numeriese frekwensieverspreiding
� Histogram
ʼn Histogram is ʼn grafiese voorstelling van bogenoemde numeriese frekwensieverspreiding
en lyk soos ʼn kolomgrafiek. Figuur 1.12 stel ʼn histogram vir bogenoemde data voor.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 24
Figuur 1. 12: ʼn Histogram
Interpretasie: Uit hierdie histogram is dit duidelik dat Maatskappy X se menslike hulpbronne
uit jonger personeel bestaan. Hoe hoër die ouderdom is, hoe minder personeel val in
daardie kategorie. (Hierdie gevolgtrekking kan natuurlik slegs gemaak word, indien die 1 000
personeel wat ondersoek is, verteenwoordigend is van die totale personeelkorps van
Maatskappy X.)
� Kumulatiewe frekwensieverspreiding
Die kumulatiewe frekwensieverspreiding is ʼn tabel wat presies dieselfde is as die gewone
numeriese frekwensieverspreiding. ʼn Bykomende kolom word egter bygesit om die totale
frekwensies vir ʼn kategorie, plus die frekwensies van alle kategorieë wat sodanige kategorie
voorafgaan, te vertoon. Kyk na Figuur 1.13 hieronder vir meer duidelikheid (die laaste kolom
met beskrywings is nie deel van hierdie tabel nie – dit is slegs in hierdie figuur ingevoeg ter
verduideliking):
Interval
(10 jaar)
Frekwensies
(Hoeveel respondente
val in die kategorie?)
Kumulatiewe
frekwensie
(Notas ter
verduideliking)
18 – 27 400 400
28 – 37 290 690 400+290
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 25
38 – 47 190 880 400+290+190
48 – 57 90 970 400+290+190+90
58 – 69 30 1000 400+290+190+90+30
Totaal 1000
Figuur 1. 13: Kumulatiewe frekwensieverspreiding
Die laaste kumulatiewe frekwensie sal altyd n wees. Met ander woorde, dit sal altyd
dieselfde wees as al die frekwensies saamgevoeg. (Onthou, n stel die grootte van die
steekproef voor, met ander woorde, die hoeveelheid mense van Maatskappy X wat ons
vraag beantwoord het.)
� Kumulatiewe frekwensieveelhoek
ʼn Kumulatiewe frekwensieveelhoek (Ogive) is die grafiese voorstelling van ʼn kumulatiewe
frekwensietabel. Dit is ʼn lyngrafiek. Figuur 1.14 stel hierdie veelhoek vir bogenoemde data
voor:
Figuur 1. 14: ʼn Kumulatiewe frekwensieveelhoek om kumulatiewe frekwensies grafies
voor te stel
Sien ook Voorbeeld 2.5 in die handboek vir meer inligting.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 26
� Houer-en-punt-stipping-grafiek (Box plot)
Die houer-en-stipping-grafiek word in Hoofstuk 3 in die handboek in meer detail behandel.
Hierdie grafiek vertoon die minimum- en maksimumwaardes, asook ʼn verskeidenheid
waardes wat tussen die minimum en maksimum voorkom. Voorbeelde sluit in die mediaan,
gemiddelde en kwantiele (sal later behandel word).
1.6.3 Grafiese voorstelling van numeriese data: Twee veranderlikes
Bestudeer die handboek: Paragraaf 2.3 (vervolg)
Vir gevalle waar twee veranderlikes gemeet word, sal die volgende voorbeeld gebruik word:
Maatskappy A wil ʼn ouderdomsprofiel van hul kliënte opstel. Hulle wil sien wat die
ouderdomme van hul kliënte is (Veranderlike 1), maar ook hoeveel geld hul kliënte per
besoek aan die winkel spandeer (Veranderlike 2). Beide hierdie data is ratio data.
� Spreidingstipping
Hierdie grafiek (scatter plot) plaas elke respondent se antwoord op beide vrae as ʼn enkele
kolletjie op ʼn grafiek. Gestel Maatskappy A het die twee vrae (1. Hou oud is jy?, 2. Hoeveel
geld spandeer jy op ʼn keer by die winkel?) vir vyftien respondente gevra. Die antwoorde
word in die tabel hieronder opgesom:
Respondent nommer Ouderdom Hoeveel geld spandeer
1 18 350
2 70 150
3 24 500
4 29 1500
5 27 1000
6 34 1700
7 43 2500
8 40 2000
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 27
9 19 400
10 21 450
11 65 130
12 60 170
13 20 410
14 70 50
15 38 3000
Figuur 1. 15: ʼn Puntediagram
Let daarop dat die hoogste waardes tussen ongeveer 35 en 45 gevind word.
� Tendensgrafiek (Trendline)
Hierdie grafiek stel tipies verandering oor tyd voor. Die horisontale as stel tyd voor en die
vertikale as stel ʼn tweede veranderlike voor. Figuur 1.16 stel die verkope van produkte by
Maatskappy A oor ʼn tydperk van 12 maande voor.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 28
Figuur 1. 16: ʼn Lyngrafiek wat ʼn tendens voorstel
� Lorenz-kurwe
Die Lorenz-kurwe vergelyk twee veranderlikes se kumulatiewe frekwensies met mekaar. Die
doel is om te bepaal watter persentasie van een veranderlike, verantwoordelik is vir watter
persentasie van ʼn ander veranderlike. Beskou die volgende voorbeeld:
ʼn Spesifieke land het ʼn bevolking van 10 miljoen mense. Van hierdie 10 miljoen betaal slegs
3.5 miljoen belasting. Die totale belasting wat ingesamel word, is US$ 100 000 miljoen. Die
volgende tabel dui aan hoeveel van 3.5 miljoen belastingbetalers sekere persentasies van
die totale belasting betaal:
Hoeveelheid
belasting:
Kategorie
Hoeveelheid mense in hierdie
kategorie
Geld wat betaal word deur hierdie
kategorie
n
% van
totale
belasting-
betalers
Kumula-
tiewe % $
% van
totale
inkomste
Kumula-
tiewe %
0 – $5 000 1 495 000 43% 43% 1 500 000 15% 15%
$5 001 –
$10 000
700 000 20% 63% 2 000 000 20% 35%
$10 001 –
$15 000
600 000 17% 80% 2 000 000 20% 55%
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 29
$15 001 –
$20 000
400 000 11% 91% 2 500 000 25% 80%
$20 001 –
$25 000
250 000 7% 98% 1 000 000 10% 90%
$25 001 –
$25 000
55 000 2% 100% 1 000 000 10% 100%
TOTAAL 3 500 000 100% 10 000 000 100%
Let op die volgende:
• Ons maak die aanname dat niemand meer as $25 000 aan belasting betaal het nie.
• Elke kategorie is presies ewe groot ten opsigte van die bogrens en ondergrens (bv.
$0 en $5 000.
As die hoeveelheid mense wat belasting betaal in verhouding is tot die hoeveelheid
belasting wat deur elke kategorie betaal word, sal die Lorenz-kurwe ʼn reguit lyn gewees het.
Hoe verder die kurwe egter van ʼn reguitlyn afwyk, hoe groter is die verskil tussen die
hoeveelheid mense in ʼn kategorie en die hoeveelheid geld wat deur die kategorie bygedra
word. In Figuur 1.17 kan gesien word dat die twee kumulatiewe waardes nie proporsioneel is
nie. Die boonste lyn is die reguitlyn, terwyl die onderste grafiek die Lorenz-kurwe voorstel.
Figuur 1. 17: Die Lorenz-kurwe en ʼn reguitlyn
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 30
1.6.4 Pareto se kurwe
Bestudeer die handboek: Paragraaf 2.4
Pareto se kurwe is ʼn grafiese voorstelling wat veral nuttig is om vrae ten opsigte van
kwaliteitskontrole te beantwoord. ʼn Tipiese vraag wat hierdie kurwe sal probeer antwoord is:
"Uit 25 moontlike redes vir ʼn spesifieke probleem, wat is die drie mees algemene redes?"
Pareto se reël veronderstel dat die 80% kleiner probleme onderskei moet word van die 20%
kritieke probleme. Daar word van ʼn histogram/kolomgrafiek gebruik gemaak om hierdie
kurwe te skep.
Bestudeer paragraaf 2.4 in die handboek om Pareto se kurwe beter te verstaan en toe te
pas. Werk veral deur Voorbeeld 2.9 in die handboek.
1.6.5 Excel
Bestudeer die handboek: Paragraaf 2.5.
Aan die einde van elke hoofstuk is daar ʼn geleentheid vir die student om die teorie in
Microsoft Excel toe te pas. Hierdie toepassings is veral belangrik vir die werkopdragte,
omdat moontlike groot hoeveelhede data gebruik kan word. Dit is dus belangrik dat die
student kennis dra van Excel en alle berekeninge (en grafieke) wat in Excel gedoen moet
word.
1.6.6 Selfevalueringsvrae: Hoofstuk 2
Daar is 24 vrae aan die einde van Hoofstuk 2. Voltooi al hierdie vrae. ʼn Groot hoeveelheid
van hierdie vrae moet in Microsoft Excel gedoen word. Die CD met hierdie data word in die
agterkant van die handboek verskaf.
1.7 Numeriese beskrywende statistiek
Bestudeer die handboek: Paragraaf 3.1 – 3.7, 3.9.
Hoewel grafieke en tabelle ʼn goeie oorsig oor data kan gee, kan statistiese waardes meer
spesifieke beskrywings verskaf. Hierdie statistieke fokus veral op lokaliteit, spreiding en
vorm van data. Daar word na ʼn aantal statistieke in elk van hierdie drie kategorieë gekyk.
1.7.1 Maatstawwe van lokaliteit
Bestudeer die handboek: Paragraaf 3.2.
Maatstawwe van lokaliteit (measures of central tendency) verskaf ʼn aanduiding van watter
waarde “tipies” of “in die middel” van alle waardes is. Die bekendste voorbeeld van ʼn
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 31
maatstaf van lokaliteit, is wat in die algemene taal bekend staan as die “gemiddeld”. In
Statistiek word daar verwys na die rekenkundige gemiddeld.
� Rekenkundige gemiddeld
Hierdie statistiek, vir die steekproef voorgestel deur x̄, word bepaal deur al die numeriese
waardes bymekaar te tel, en dan te deel deur die hoeveelheid waardes. Die formule is in
die handboek aangeteken as Formule 3.1 in Paragraaf 3.2 en kan opgesom word soos volg:
x̄ = die som van alle observasies (waardes)/hoeveelheid observasies (waardes)
Voorbeeld
Die ouderdomme van 10 werknemers by Maatskappy X is:
18, 20, 32, 26, 70, 55, 34, 43, 53, 31
Die gemiddelde ouderdom is:
(18 + 20 + 32 + 26 + 70 + 55 + 34 + 43 + 53 + 31)/10
= 382/10
= 38.2 jaar
Doen Voorbeeld 3.1 in die handboek om te verseker dat jy die rekenkundige gemiddeld
verstaan.
� Mediaan
Die tweede maatstaf van lokaliteit, is die mediaan. Om die mediaan te bereken, moet alle
waardes van kleinste na grootste sorteer word. Die getal wat presies in die middel is, word
die mediaan genoem. As daar twee getalle in die middel is, word die rekenkundige
gemiddeld van die twee getalle in die middel bereken om die mediaan te verkry.
Daar is nie ʼn formule in die handboek vir die mediaan nie.
Voorbeeld 1:
Die ouderdomme van 11 werknemers by Maatskappy A is:
18, 20, 32, 26, 70, 55, 34, 43, 53, 31, 22
Bereken die mediaan:
Stap 1: Sorteer die waardes van klein na groot:
18 20 22 26 31 32 34 43 53 55 70
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 32
Stap 2: Vind die waarde in die middel
18 20 22 26 31 32 34 43 53 55 70
Die mediaan is dus 32
Voorbeeld 2:
Die ouderdomme van 10 werknemers by Maatskappy A is:
18, 20, 32, 26, 70, 55, 34, 43, 53, 31
Bereken die mediaan:
Stap 1: Sorteer die waardes van klein na groot
18 20 26 31 32 34 43 53 55 70
Stap 2: Vind die middelste waarde
Omdat daar 10 waardes is, is daar nie ʼn enkele middelste waarde nie. Die middelste
waardes is 32 en 34. Die rekenkundige gemiddeld moet dus van hierdie twee waardes
bereken word:
Mediaan = (32 + 34)/2
33
Doen nou Voorbeeld 3.2 (a) en (b) in die handboek.
� Mediaan vir kategorieë of gegroepeerde waardes
ʼn Mediaan kan ook vir kategorieë bereken word deur Formule 3.2 in die handboek te
gebruik.
Voorbeeld
Interval
(10 jaar)
Frekwensies Kumulatiewe
frekwensie
18 – 27 400 400
28 – 37 290 690
38 – 47 190 880
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 33
48 – 57 90 970
58 – 69 30 1000
Totaal 1000
Bereken die mediaan vir bogenoemde waardes.
In hierdie geval is dit moeiliker omdat dit baie tyd sal neem om ʼn duisend waardes van klein
na groot te rangskik. Om die mediaan te vind, moet die volgende stappe gevolg word:
Stap 1: Vind die posisie van die mediaan. Soos reeds gesê is die mediaan presies in die
middel van alle waardes, indien die waardes sorteer is. Dus is die mediaan by posisie:
1 000/2 = 500
Met ander woorde, as al 1 000 waardes van klein na groot rangskik is, sal die 500ste waarde
die mediaan wees.
Stap 2: Deur na die kumulatiewe frekwensie-kolom te kyk, bepaal in watter kategorie die
500ste waarde sal voorkom. Die eerste kategorie eindig by die 400ste waarde, die tweede
kategorie eindig by die 690ste waarde. Die 500ste waarde sal dus êrens in die tweede
kategorie (28 – 37) voorkom.
Stap 3: Gebruik die formule om die presiese plek te bepaal:
Me = Ome + �[����� ]
��
• Ome = 28 jaar
• c = die grootte van die interval = 10 jaar
• n = steekproefgrootte = 1 000
• Fme = frekwensie van mediaan interval = 290
• f(<) = kumulatiewe frekwensie van die interval voor die mediaaninterval = 400
Dus is:
Me = 28 + ��[�������]
���
= 31.44
Doen nou Voorbeeld 3.3 in die handboek.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 34
� Modus
ʼn Derde maatstaf van lokaliteit is die modus. Die modus is die enkele waarde wat die
meeste kere voorkom. Hierdie maatstaf is veral nuttig vir kategoriese data. Vir kategoriese
data kan die modus bereken word deur eenvoudig die frekwensies van elke kategorie met
mekaar te vergelyk.
Voorbeeld:
Bereken die modus.
Deur bloot na die bogenoemde tabel te kyk, is dit duidelik dat Bessie se kombuis die
gewildste is. Dus is die modus "Bessie se kombuis". In hierdie geval is die modus nie ʼn
getal nie, maar ʼn kategorie.
Met ratio data kan dit egter gebeur dat daar uit ʼn 1 000 waardes nie een waarde is wat
tweemaal herhaal word nie. Dink byvoorbeeld aan die pryse van kruideniersware. In so ʼn
geval sal ʼn modus niksseggend wees. (As die bedrag van R25.88 drie keer genoem is, maar
die bedrae R70.55, R70.56, R70.10, R70.80 en R70.00 ook voorkom, is die modus van
R25.88 dan werklik akkuraat?) Vir hierdie doel word die modus geskat deur al die data in
intervalle in te deel. Daarna word die interval met die voorafgaande en opeenvolgende
interval vergelyk om ʼn modus te bepaal.
Voorbeeld
Nota: Hierdie tabel is effens aangepas vir hierdie oefening en is dus nie dieselfde as die
tabel wat vir vorige voorbeelde gebruik is nie.
Interval
(10 jaar)
Frekwensies Kumulatiewe
frekwensie
18 – 27 290 290
Restaurant Frekwensies
Spur 370
Dros 250
Bessie se kombuis 380
Totaal 1000
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 35
28 – 37 400 690
38 – 47 190 880
48 – 57 90 970
58 – 69 30 1000
Totaal 1000
Bereken die modus.
In hierdie geval is die doelwit om te bepaal watter ouderdom die meeste voorkom. Die
interval met die meeste frekwensies is 28 – 37 (met 400 van alle respondente wat in hierdie
kategorie val). Hierdie is dus die modale interval. Beskou nou die formule in die handboek
(Formule 3.3). Die waardes in die formule kan soos volg vervang word:
• Omo = onderste grens van die modale interval = 28 jaar
• c = wydte van die modale interval = 10 jaar
• fm = frekwensie van die modale interval = 400 respondente
• fm-1 = frekwensie wat die modale interval voorafgaan = 290 respondente (dit sou nul
gewees het indien die modale interval ook die eerste interval was)
• fm+1 = frekwensie wat na die modale interval voorkom = 190 (dit sou nul gewees het
indien die modale interval die laaste interval was).
M0 = 28 + ��[�������]
����� ��������
= 28 + �������
= 28 + 3.44
= 31.44
Dus is die modus 31.44, wat beteken dat die meeste respondente se ouderdom benader kan
word na 31.44.
Hoe toets ek of my antwoord korrek is?
Wat ook al die modus is, dit moet steeds in die modale interval wees. As die modus wat
bereken is, dus minder as 28 was of meer as 37, was die antwoord verkeerd.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 36
Doen nou Voorbeeld 3.4 in die handboek.
� Meetkundige gemiddeld
Die meetkundige gemiddeld word gebruik om die gemiddelde persentasie verandering in
data te bepaal. Die formule word as Formule 3.4 in die handboek gegee.
Voorbeeld
Die prys van motors by ʼn spesifieke handelaar het vir die laaste vyf jaar jaarliks gestyg. Die
tabel hieronder stel die persentasieverhogings per jaar voor.
2013 5%
2012 4%
2011 8%
2010 3%
2009 2%
2008 1%
Bereken die meetkundige gemiddeld van die persentasieverhogings.
Die formule is reeds in die handboek gegee en die waardes kan soos volg uiteengesit word:
• n = 6 jaar
• x1, x2, x3, x4, x5 en x6 = 5%, 4%, 8%, 3%, 2%, en 1% onderskeidelik. Vir die doel van
hierdie formule, word die persentasie egter anders uitgedruk. ʼn 5% verhoging is
eintlik 1.05 keer die vorige jaar se bedrag. Dus word 5% as 1.05 uitgedruk.
Dus GM = √�. ����. ����. ����. � ��. ����. ��!
= √�!�!
=1.034 ≈ 3.4%
Waarom kan ons nie die rekenkundige gemiddeld gebruik nie?
Persentasieverhogings behels ʼn faktor waarmee ʼn bedrag (of ander waarde) vermenigvuldig
moet word, in die voorbeeld hierbo was dit 1.05 in die eerste jaar. Ons wil dus ʼn gemiddelde
faktor bereken waarmee ʼn bedrag jaarliks vermenigvuldig moet word om dieselfde
verhoging oor die ses jaar periode te verkry. Vir hierdie rede is die meetkundige gemiddeld
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 37
meer akkuraat om gemiddelde persentasieverhogings te bepaal. Die rekenkundige
gemiddeld sal egter nuttig wees om die gemiddelde randwaarde van die rente/opbrengs te
bepaal.
Hierdie stelling kan met die volgende voorbeeld gedemonstreer word:
ʼn Bedrag van R100 word belê:
• Jaar 1 verdien die bedrag 10% rente. Dus is die rente R10 en die bedrag is R110.
• Jaar 2 verdien die bedrag (nou R110) 5% rente. Dus is die rente R5.50 en die bedrag
is R115.50
• Jaar 3 verdien die bedrag (nou R115.50) 3% rente. Dus is die rente R3.47 en die
bedrag is R118.97.
Die meetkundige gemiddeld van die persentasieverhogings van die bedrag is 1.06 (dus 6%).
Die rekenkundige gemiddeld van die rente is (10 + 5.50 + 3.47)/3 = R6.32
Dus is die gemiddelde jaarlikse styging 6% (R100 x 1.06) en die gemiddelde jaarlikse rente
(in randwaarde) is R6.32.
(Nota: In hierdie geval is dit toevallig dat die meetkundige gemiddeld en rekenkundige
gemiddeld vir die data dieselfde is. Dit is egter ʼn uitsondering. Die meetkundige gemiddeld is
altyd groter of dieselfde as die rekenkundige gemiddeld)
Doen nou Voorbeeld 3.5 in die handboek.
� Geweegde rekenkundige gemiddeld
Kyk na die volgende voorbeeld:
ʼn Restaurant-eienaar wil graag weet wat die gemiddelde koste per kilogram meel is. Hy het
80kg meel in die vorige maand gekoop. Die meel is by verskillende verskaffers gekoop. Die
strokies dui op die volgende aankope:
Koste per kilogram Kilogram
Week 1 R9.50 10
Week 2 R10.00 4
Week 3 R9.80 6
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 38
Week 4 R7.40 60
Totaal R36.7 80kg
Wat is gemiddelde koste per kilogram? As die rekenkundige gemiddeld gebruik sou word,
sou dit maklik wees om die vier weke se koste per kilogram bymekaar te tel en deur 4 te
deel. Die antwoord sal egter nie so akkuraat wees nie. Week 4 se bedrag behoort meer
gewig te dra, omdat die eienaar meer meel teen daardie prys gekoop het.
In ʼn geval waar al die waardes nie dieselfde gewig dra nie, word die geweegde
rekenkundige gemiddeld gebruik. Elke waarde word met sy gewig vermenigvuldig, bymekaar
getel en dan deur die som van die gewigte (in hierdie geval die totale kilogram) gedeel. Vir ʼn
beter illustrasie sal die rekenkundige gemiddeld en geweegde rekenkundige gemiddeld met
mekaar vergelyk word:
Rekenkundige gemiddeld = (9.50 + 10.00 + 9.80 + 7.40) / 4 = R9.18 per kilogram
Volgens die rekenkundige gemiddeld het die eienaar gemiddeld R9.18 per kilogram meel
betaal.
Geweegde rekenkundige gemiddeld
= [(9.50 x 10) + (10.00 x 4) + (9.80 x 6) + (7.40 x 60)] / 80
= R7.97 per kilogram.
Omdat die hoeveelheid kilogram wat teen elke prys aangekoop is, ook nou in ag geneem is,
verskil die gemiddelde koste per kilogram drasties. In werklikheid het die eienaar dus
gemiddeld R7.97 per kilogram betaal.
Doen nou Voorbeeld 3.6 in die handboek.
1.7.2 Nie-sentrale maatstawwe van lokaliteit
Bestudeer die handboek: Paragraaf 3.3.
Die vorige maatstawwe van lokaliteit was gemoeid met een of ander "middelpunt" of sentrale
punt. Daar is egter maatstawwe van lokaliteit wat nie met die middelpunt van data te make
het nie. Hierdie maatstawwe is kwantiele en persentiele.
� Kwantiele
Kwantiele is maatstawwe wat geordende data in vier ewe groot dele (kwarte) deel. Die
statistikus moet die spesifieke waardes bepaal wat sorg dat daar ewe veel waardes in elke
kwantiel is. Daar kan tussen die volgende kwantiele onderskei word:
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 39
• Q1: Hierdie is die spesifieke waarde wat skeiding maak tussen die laagste 25% van
alle waarnemings/observasies en die oorblywende 75%.
• Q2: Hierdie is die waarde wat presies in die middel van die waardes voorkom en dus
die data presies in die helfte deel. (Dit is dus die mediaan van die data.)
• Q3: Hierdie is die waarde wat die boonste 25% van alle waarnemings skei van die
oorblywende 75%.
Om ʼn kwantiel te bepaal is eintlik eenvoudig. Die stappe is soos volg:
• Sorteer die waardes van klein na groot.
• Bepaal hoeveel waarnemings/observasie (getalle) in die datastel voorkom.
• Tel 1 by hierdie getal en deel dit deur 4.
• Die antwoord is die posisie van Q1 (afgerond na die naaste heelgetal).
• Die formule vir die eerste kwantiel is dus (n+1) / 4, waar n = die hoeveelheid
observasies.
Die posisies van die drie kwantiele is dan:
• Q1= (n+1)/4
• Q2 = (n+1)/2 (Dit is ook die posisie van die mediaan)
• Q3 = (n+1)/4x3
As hierdie posisie gevind is (en afgerond is tot die naaste heelgetal), kan die spesifieke
waarde wat by elke kwantiel voorkom, bloot afgelees word. Soms wil ʼn mens egter ʼn meer
akkurate kwantiel bereken.
Voorbeeld
Beskou die volgende data. Die boonste ry verteenwoordig die waardes van die data. Die
onderste ry dui die plekke van die data aan.
10 30 34 39 40 45 50 67 70 78 79 80 90 92 95 96 97 98 99 99
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Die eerste kwantiel se posisie is by
(n+1) / 4
= 21/4 = 5.25
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 40
As die breuk geïgnoreer word, is die posisie 5. Die waarde wat by posisie 5 voorkom, is 40.
Hierdie is dus ʼn benaderde waarde van die eerste kwantiel.
Om ʼn meer akkurate waarde te bepaal, kan Formule 3.6 in die handboek gebruik word met
die volgende waardes:
• Benaderde kwantielwaarde (hierbo bereken) = 40
• Breukdeel van kwantielposisie (dus breukdeel van 5.25) = 0.25
• Waarde na kwantielposisie = waarde by posisie 6 = 45
Kwantielwaarde = 40 + 0.25 x (4 - 40)
= 40 + 1.25
= 41.25
Dus: 25% van alle waardes is kleiner of gelyk aan 41.25.
(Nota: Vir die benaderde posisie in bogenoemde formule, word die posisie nie afgerond nie,
maar die breuk word bloot verwyder.)
Doen self:
• Bereken nou die boonste kwantiel (Q3) van die data hierbo genoem. (Die antwoord is
95.75.)
• Doen nou Voorbeeld 3.7 in die handboek.
• Soos met die mediaan, is die volledige data nie altyd beskikbaar nie, maar slegs
kategorieë. Die formule om die mediaan te bereken, is aangepas om die kwantiele
ook te bereken. Hierdie formule word in die handboek verskaf as Formules 3.7 en
3.8 vir die eerste en derde kwantiel onderskeidelik. Maak seker dat jy hierdie
formules verstaan.
• Doen nou Voorbeeld 3.8 in die handboek.
� Persentiele
ʼn Persentiel is soortgelyk aan ʼn kwantiel. Waar kwantiele die data in kwarte deel, sal
persentiele die data in 100 gelyke dele deel. Die 25e en 75e persentiele is dus dieselfde as
die eerste en derde kwantiele. Die 50e persentiel is dan ook dieselfde as die 2e kwantiel, wat
gelyk is aan die mediaan. Om die persentiele te bereken, is soortgelyk aan die formules vir
kwantiele. Om die posisie van die xe persentiel te bereken, word die volgende formule
gebruik:
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 41
�� + � #
Die waarde van die persentiel word dan op dieselfde manier bereken as die kwantiele.
1.7.3 Maatstawwe van spreiding
Bestudeer die handboek: Paragraaf 3.4
Gestel ʼn bemarkingsagentskap wil ʼn advertensie-veldtog loods wat spesifiek op ʼn sekere
ouderdomsgroep gefokus is. In ʼn steekproef word die volgende ouderdomme gevind:
14 15 16 13 90 95
Die rekenkundige gemiddeld van hierdie ouderdomme is 40.5. As die agentskap egter hul
advertensieveldtog rig op mense wat 40 jaar oud is, sal dit ʼn mislukking wees. (Daar is nie
een kliënt in bogenoemde steekproef wat naby aan 40 jaar oud is nie.)
Daar het dus ʼn behoefte ontstaan om die akkuraatheid van die rekenkundige gemiddeld te
bepaal. Met ander woorde, daar moet bepaal word op watter wyse al die verskillende
waardes rondom die gemiddeld versprei is. Die statistieke wat hiervoor gebruik word, word
die maatstawwe van spreiding genoem.
Die reikwydte
Die reikwydte is reeds vroeër bespreek. Hierdie statistiek bepaal bloot hoe ver die grootste
en kleinste waardes van mekaar is.
Voorbeeld
Bereken die reikwydte van die volgende getalle:
14 15 16 13 90 95
Die formule vir die reikwydte word as Formule 3.9 in die handboek weergegee:
xmax = die kleinste waarde = 13
xmin = die grootste waarde = 95
Die reikwydte is dus: 95 – 13 = 82. Hierdie groot reikwydte behoort al reeds ʼn aanduiding te
gee dat die gemiddeld deur groot verskille in die waardes beïnvloed kan word. (As die
reikwydte, byvoorbeeld, 2 of 3 was, sou die gemiddeld moontlik baie meer akkuraat gewees
het).
Die reikwydte word egter deur uitskieters beïnvloed. Daarom word meer akkurate
maatstawwe van spreiding benodig.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 42
Doen Voorbeeld 3.9 in die handboek.
� Variansie en standaardafwyking
Variansie en standaardafwyking word hier saam bespreek omdat die standaardafwyking
bloot die vierkantswortel van die variansie is:
Variansie se simbool is s2 en standaardafwyking is s. (Hierdie is die simbole vir die
standaardafwyking en variansie van die steekproef. Ooreenkomstige simbole vir die
populasie se standaardafwyking en variansie is $ en $�)
Die formule om die variansie te bereken word as Formule 3.10 in die handboek verskaf.
Hierdie formule mag intimiderend lyk. Dit is egter heel eenvoudig. Kyk weer na die
verskillende ouderdomme.
14 15 16 13 90 95
Die getalle, asook die rekenkundige gemiddeld van 40.5, word op die getallelyn hieronder
aangedui.
Volg die volgende stappe:
• Vir elke waarde:
o Bereken hoe ver hierdie waarde van die gemiddeld af is: (xi - x̄)
o Kwadreer hierdie antwoord (om van moontlik negatiewe getalle ontslae te raak).
Wat beteken die Σ-teken? Alles aan die regterkant van die Σ moet bymekaar
getel word.
• Tel nou al hierdie gekwadreerde afstande bymekaar en deel dit deur die n-1.
(Onthou, n is die hoeveelheid waardes wat geobserveer is.)
Vir bogenoemde geval, sal die stappe dus soos volg uitgevoer word:
Die gemiddeld is 40.5.
Begin eers deur die boonste gedeelte van die breuk (in Formule 3.10 in die handboek) te
bereken.
%�#& − # ̄�
= (14 - 40.5) 2 + (15 - 40.5) 2 + (16 - 40.5) 2 + (13 - 40.5) 2 + (90 - 40.5) 2 + (95 - 40.5) 2
= (-26.5) 2 + (-25.5) 2 + (-24.5) 2 + (-27.5) 2 + (49.5)2 + (54.5) 2
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 43
= 702.25 + 650.25 + 600.25 + 756.25 + 2450.25 + 2970.25
= 8 129.50
Hierdie getal word dan deur n-1 gedeel, n-1 = 6-1 = 5.
Dus
8129.505
= 1 625.9
Dus is s2 = 1 625.9
Wat beteken hierdie getal? Die variansie is nie in dieselfde eenheid (jare) as wat die data is
nie en is dus moeilik om te interpreteer. Om hierdie rede word die vierkantswortel van die
variansie verkry. Hierdie statistiek, s, staan bekend as die standaardafwyking en word in
dieselfde eenheid gemeet as die oorspronklike data.
s = √/��
= √1625.91
= 40.32 jaar.
Wat beteken ʼn standaardafwyking van 40.32 jaar?
Dit beteken dat die gemiddelde afstand tussen elke waarde en die rekenkundige gemiddeld,
40.32 is:
• Hoe groter hierdie getal is, hoe verder is die waardes van die gemiddeld versprei.
• Daar kan dus gesê word dat bogenoemde gemiddeld nie baie "akkuraat" is as
aanduiding van alle waardes nie.
• As die standaardafwyking vir die ouderdomme, byvoorbeeld, 2 of 3 jaar was, kon
daar met redelike sekerheid gesê word dat die meeste ouderdomme baie naby aan
die gemiddeld is. Die advertensieveldtog kan dus met meer sekerheid op die
gemiddelde ouderdom gefokus word.
Doen nou Voorbeeld 3.10 en 3.11 in die handboek.
Dit is nie op hierdie stadium belangrik om Figuur 3.3 in die handboek (die normaal-kromme)
te verstaan nie. Wanneer hipotesetoetsing later bespreek word, sal daar weer na hierdie
kromme gekyk word. Wat egter belangrik is, is om te besef dat die rekenkundige gemiddeld
(x̄) en die standaardafwyking (s) ʼn belangrike rol hier speel.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 44
Variansiekoëffisiënt
In hierdie stadium weet ons dat, vir die ouderdomme wat hierbo genoem is, ʼn
standaardafwyking van 40.32 baie groot is en dat die data nie rondom die gemiddeld van
40.5 gesentreer is nie. Die besluit of die standaardafwyking "groot" of "klein" is, is egter
subjektief in hierdie geval.
Voorbeeld
Datastel A het ʼn gemiddeld van 40.5 en ʼn standaardafwyking van 40.32. Datastel B het ʼn
gemiddeld van 13 598 en ʼn standaardafwyking van 1 250. Watter standaardafwyking is die
"grootste"? Dit is duidelik dat 1 250 ʼn groter getal as 40.32 is, maar die gemiddeld moet
altyd in ag geneem word as die standaardafwyking geïnterpreteer word. Om hierdie rede is
die variansiekoëffisiënt (CV) geskep.
Die formule word as Formule 3.13 in die handboek weergegee. In eenvoudige terme is:
CV = s / x̄
Vir datastel A (en ook die ouderdomsvoorbeeld) is:
CV = 40.32 / 40.5
= 0.996
Vir datastel B is:
CV = 1 250 / 13 598
= 0.092
Hoe groter die CV is, hoe groter is die standaardafwyking ten opsigte van die gemiddeld en
hoe minder "akkuraat" is die rekenkundige gemiddeld. Die tweede datastel se gemiddeld is
dus ʼn baie beter aanduiding van die gemiddelde waarde as die eerste datastel.
Doen nou Voorbeeld 3.12 in die handboek.
1.7.4 Maatstawwe van skeefheid
Bestudeer die handboek: Paragraaf 3.5 – 3.6.
Die wyse waarop data rondom die gemiddeld versprei is, kan grafies en numeries voorgestel
word. ʼn Histogram met relatiewe klein intervalle, kan hierdie data grafies voorstel. Daar word
onderskei tussen drie wyses waarop data rondom die gemiddeld versprei word:
� Simmetrie
Die waardes word simmetries rondom die gemiddeld versprei. Dit beteken dat die
frekwensies van waardes aan die linkerkant en die frekwensies van waardes aan die
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 45
regterkant ooreenstem. Figuur 1.18 hieronder is ʼn voorbeeld van ʼn simmetriese verdeling.
(Die handboek gebruik ʼn lyngrafiek om hierdie verdelings voor te stel. Vir alle verdere
verduidelikings sal die lyngrafieke gebruik word).
Figuur 1. 18: ʼn Simmetriese verdeling van data
In bogenoemde grafiek is die rekenkundige gemiddeld, die mediaan en die modus dieselfde
getal wees.
� Positiewe skeefheid
Die waardes met die grootste frekwensies sal na die linkerkant van die gemiddeld neig. Die
"stert" gedeelte is dus aan die regterkant. Figuur 1.19 stel ʼn dataverspreiding voor wat
positief skeef is.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 46
Figuur 1. 19: ʼn Datastel wat positief skeef is
In bogenoemde datastel sal die mediaan kleiner as die gemiddeld wees. Die modus sal
egter die kleinste getal wees (in hierdie geval 6.5).
� Negatief skeef
In hierdie geval sal die grootste frekwensies aan die regtekant van die gemiddeld voorkom.
Die waardes wat dus die meeste voorkom, sal almal groter as die gemiddeld wees.
Figuur 1.20 stel ʼn datastel voor wat negatief skeef is.
Figuur 1. 20: ʼn Datastel wat negatief skeef is
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 47
In hierdie geval sal die gemiddeld die kleinste wees, gevolg deur die mediaan en dan deur
die modus.
� Pearson se koëffisiënt van skeefheid
Hoewel data se simmetrie grafies voorgestel kan word, is dit ook moontlik om bereken te
word. Hiervoor word Pearson se koëffisiënt van skeefheid (SKp) gebruik. Die formule word
as Formule 3.14 in die handboek gegee. Hierdie formule kan, soos die berekening van die
standaardafwyking, tydrowend wees. Om hierdie rede, is daar ʼn tweede formule gegee om
as beraming van hierdie statistiek te dien. Die beraming se formule word as Formule 3.15 in
die handboek gegee.
Interpretasie
Skp kan enige getal wees:
• As hierdie getal 0 is (met ander woorde Skp = 0), is die data simmetries om die
gemiddeld versprei.
• As hierdie getal groter as nul is (met ander woorde Skp > 0), is die data positief
skeef.
• As hierdie getal kleiner as nul is (met ander woorde Skp < 0), is die data negatief
skeef.
Die grootte van die getal bepaal hoe ver die data positief of negatief skeef is.
Doen Voorbeeld 3.13 in die handboek. Hierdie voorbeeld verwag van jou om:
• Skp te bereken
• Skp te benader/beraam
• Skp te interpreteer
� Die houer-en-stipping-grafiek
Die houer-en-stipping-grafiek is ʼn spesiale maatstaf wat gebruik kan word om vyf belangrike
statistiese waardes grafies voor te stel. Hierdie waardes is reeds bespreek:
• Minimumwaarde
• Q1 of die onderste kwantiel
• Q2 of M2, die mediaan
• Q3 of die boonste kwantiel
• Maksimumwaarde
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 48
Bestudeer Paragraaf 3.6 in die handboek om meer inligting ten opsigte van die houer-en-
stipping-grafiek te vind. Dit is belangrik dat ʼn houer-en-stipping-grafiek geïnterpreteer kan
word.
Doen nou Voorbeeld 3.14 in die handboek.
1.7.5 Keuse van statistiek en MS Excel
Bestudeer die handboek: Paragraaf 3.7 – 3.8.
Wanneer word die rekenkundige gemiddeld gebruik? Wanneer is dit beter om ʼn mediaan of
modus te bereken? Wanneer is ʼn reikwydte voldoende en wanneer is ʼn standaardafwyking
nodig? Die keuse van die regte statistiek om te gebruik, is net so belangrik soos die korrekte
berekening daarvan. Om, byvoorbeeld, ʼn rekenkundige gemiddeld vir kwantitatiewe,
kategoriese data te bereken, is nutteloos en kan glad nie geïnterpreteer word nie. In so ʼn
geval sal ʼn modus baie meer inligting oor die data kan weergee.
Die kriteria vir, en kriteria van, beskrywende statistieke word in Paragraaf 3.7 weergegee.
Al die statistieke en grafieke wat in hierdie afdeling van die studie-eenheid bespreek is, kan
ook in Microsoft Excel bereken word. Dit is belangrik dat die student al hierdie statistieke
met die hand kan bereken. Dit is egter handig – veral in die praktyk – vir studente om
Microsoft Excel hiervoor te gebruik. Dit is egter moontlik dat die antwoorde in Excel en dié
wat met die hand bereken is, effens kan verskil. Die rede is dat Excel geen waardes afrond
nie.
1.7.6 Selfevaluering: Hoofstuk 3
Doen al die oefeninge aan die einde van Hoofstuk 3. Daar is 26 oefeninge. As jy hierdie vrae
korrek kan beantwoord, het jy numeriese beskrywende statistiek onder die knie!
1.8 Samevatting
Statistiek is ʼn versameling beginsels en tegnieke wat gebruik kan word om data na inligting
om te skakel sodat dit vir besluitneming gebruik kan word. Dit is dus belangrik dat hierdie
data van hoë kwaliteit is. Data kan kwalitatief of kwantitatief wees. Kwalitatiewe data kan in
woorde beskryf word, maar kan ook numeries voorgestel word. Data kan ook diskreet of
kontinu wees. Die vlakke waarop data gemeet kan word, is (van die laagste na die hoogste
vlak) nominaal, ordinaal, interval en ratio. Data kan, onder andere, deur observasies,
vraelyste en eksperimente versamel word.
Figuur 1.21 dui aan watter grafiese beskrywende statistiek in watter gevalle gebruik kan
word:
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 49
Figuur 1. 21: Verskillende opsies beskrywende statistiek
Grafiese
beskrywende
statistiek
Kategoriese data
Een veranderlike
Kategoriese
frekwensietabel
Kolomgrafiek
Sirkelgrafiek
Twee
veranderlikes
Kruis-
tabuleringstabel
Gestapelde
kolomgrafiek
Meervoudige
kolomgrafiek
Numeriese data
Een veranderlike
Numeriese
frekwensie-
verspreiding
Histogram
Kumulatiewe
frekwensie-
verspreiding
Ogive
Boksplot
Scatterplot
Lyngrafiek
Lorenz-kurwe
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 50
Notas
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 2: Waarskynlikhede en steekproewe Bladsy 51
Studie-eenheid 2: Waarskynlikhede en steekproewe
2.1 Studie-eenheid leeruitkomstes
Kennis en begrip
Na voltooiing van Studie-eenheid 2 sal jy in staat wees om jou kennis en begrip te
demonstreer van die volgende:
• Inleiding tot waarskynlikhede
• Waarskynlikheidsverspreidings
• Steekproewe en steekproefverspreidings
Vaardighede
Jy sal ook in staat wees om:
• tussen verskillende waarskynlikheidsbegrippe en -reëls te onderskei.
• basiese waarskynlikheidsberekeninge te doen.
• tussen diskrete en kontinue waarskynlikheidsverspreidings te onderskei.
• die eienskappe van die normaalverdeling te identifiseer.
• waarskynlikhede met die formules van waarskynlikheidsverspreidings te bereken
• steekproefmetodes te evalueer en die korrekte steekproefmetode vir ʼn spesifieke
situasie te kies.
• ʼn normaalverdeling gebruik om ʼn steekproefverspreiding te konseptualiseer.
2.2 Voorgeskrewe handboek
Wegner, T. 2013. Applied Business Statistics. 3rd ed. Claremont: Juta.
Hoofstuk 4: Paragraaf 4.1 – 4.9
Hoofstuk 5: Paragraaf 5.1 – 5.10
Hoofstuk 6: Paragraaf 6.1 – 6.4, 6.6, 6.8
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 52
2.3 Hoe kan jy jou begrip verbeter?
Jy moet seker maak dat jy die volgende terminologie verstaan:
Sleutelwoord Omskrywing
Gesamentlik
uitputbaar
Gebeurtenisse waarvan die waarskynlikhede, indien dit
bymekaar getel word, 1 is.
Normaalverdeling ʼn Klokvormige verdeling van waarskynlikhede. Vir ʼn
standaard-normaalverdeling is die gemiddeld 0 en die
standaardafwyking 1.
Onderling
uitsluitend
Twee gebeurtenisse wat nie tegelyktydig kan plaasvind nie.
Samevoeging Die waarskynlikheid dat ten minste een van twee
gebeurtenisse sal plaasvind.
Snyding Die waarskynlikheid dat twee gebeurtenisse beide sal
plaasvind.
Statisties
onafhanklik
Een gebeurtenis beïnvloed nie die waarskynlikheid dat ʼn
ander gebeurtenis sal plaasvind nie.
Vlak van sekerheid Die sekerheid waarmee die navorser ʼn gevolgtrekking oor die
populasie wil maak, gebaseer op data wat deur ʼn steekproef
verkry is. Die vlak van sekerheid is gewoonlik 90%, 95% of
99%.
Voorwaardelike
waarskynlikheid
Die waarskynlikheid dat een gebeurtenis sal plaasvind,
gegewe dat ʼn ander (statisties afhanklike) gebeurtenis wel
plaasgevind het.
2.4 Inleiding
ʼn Navorser wil dikwels voorspellings maak: Wat is die kans dat verkope gaan toeneem? Wat
is die waarskynlikheid dat die aandelemark gaan daal? Om hierdie vrae te beantwoord, moet
waarskynlikhede bereken word. Praktiese voorspellings soos hierdie is egter nie die enigste
rede waarom waarskynlikhede in die sillabus ingesluit is nie. Dit vorm ook die basis waarop
hipotesetoetsing, ʼn onderwerp wat in Studie-eenheid 3 en 4 bespreek word, gedoen word.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 2: Waarskynlikhede en steekproewe Bladsy 53
Hierdie studie-eenheid gaan ʼn agtergrond oor waarskynlikhede bied. Daar gaan gekyk word
na verskillende beginsels en reëls van waarskynlikhede. Daarna gaan na spesifieke
waarskynlikheidsverspreidings gekyk word.
Laastens, word steekproewe in meer detail bespreek. ʼn Steekproef is ʼn kleiner versameling
van elemente (mense, produkte, ensovoorts) wat uit die groter populasie geneem word. ʼn
Steekproef word dan gebruik om gevolgtrekkings ten opsigte van die populasie te maak. Die
rasionaal onderliggend aan die gebruik van ʼn steekproef vir hierdie gevolgtrekkings, word in
hierdie studie-eenheid bespreek.
2.5 Waarskynlikhede
Bestudeer die handboek: Paragraaf 4.1 – 4.9
Waarskynlikhede vorm, tot ʼn mate, die grondslag vir statistiese afleidings. Die volgende
vraag word dikwels gevra: "Met hoeveel sekerheid kan ek ʼn afleiding, ten opsigte van ʼn
populasie op ʼn resultaat van ʼn steekproef, baseer?"
Voorbeeld
Navorsing word gedoen om werknemers van Maatskappy X se mening oor ʼn nuwe reël te
toets. Omdat daar 30 000 werknemers is, word ʼn steekproef gebruik om die gevolgtrekkings
te maak. Die steekproef bestaan uit 1 000 personeellede. Uit hierdie 1 000 werknemers is
60% positief oor die nuwe reël. Die vraag ontstaan nou:
Met hoeveel sekerheid kan gesê word dat 60% van die 30 000 werknemers ook positief oor
die nuwe reël is? Met ander woorde, met hoeveelheid sekerheid kan die 60% op die hele
populasie van toepassing gemaak word?
Ten opsigte van waarskynlikhede kan die vraag herfraseer word na: "Wat is die
waarskynlikheid dat ek ʼn fout gaan maak, indien ek dieselfde (60%) aanname oor die
populasie maak?" In die meeste gevalle probeer statistici hierdie waarskynlikheid onder 0.05
(of 5%) hou.
Om hierdie vraag konsekwent te kan beantwoord, is dit belangrik om ʼn goeie agtergrond oor
waarskynlikhede te verkry.
2.5.1 Basiese beginsels en konsepte van waarskynlikhede
Bestudeer die handboek: Paragraaf 4.1 – 4.4
Woord van waarskuwing:
Die student word weer daaraan herinner dat die begeleidingsgids bloot ʼn hulpmiddel is
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 54
om die handboek deur te werk. Dit is egter van uiterste belang om die handboek deur te
werk en alles in die genoemde paragrawe te lees.
Daar word onderskei tussen subjektiewe en objektiewe waarskynlikhede. Subjektiewe
waarskynlikheid kan nie statisties gestaaf word nie en word nie in statistiese berekeninge
gebruik nie. Byvoorbeeld, een vriend sê aan ʼn ander "daar is ʼn baie goeie waarskynlikheid
dat ek aan die slaap gaan raak as ons daardie film kyk". Die kanse dat daar statistiese data
bestaan vir hierdie stelling is skaars.
Vir die doel van hierdie vak word na objektiewe waarskynlikheid verwys. Dit is
waarskynlikhede wat deur statistiek bereken kan word. Die formule van ʼn basiese
waarskynlikheid word deur Formule 4.1 in die handboek voorgestel.
Doen Voorbeeld 4.1 in die handboek om te verseker dat jy die formule wel kan gebruik.
ʼn Waarskynlikheid word as getal tussen 0 en 1 voorgestel (met 0 en 1 ingesluit). Hierdie
waarskynlikheid kan op drie wyses bereken word. Figuur 2.1 stel hierdie wyses grafies voor:
Figuur 2. 1: Wyses om waarskynlikhede af te lei
(Wegner, 2013:102)
Waarskynlikhede het ook spesifieke eienskappe. Om hierdie eienskappe bloot te
memoriseer gaan nutteloos wees. Elkeen van hierdie eienskappe maak sin. Dit help dus om
hierdie eienskappe aan die hand van die voorbeelde in die handboek te leer. Hierdie
eienskappe word in paragraaf 4.3 in die handboek bespreek. Die eienskappe is:
•Die uitkomste is vooraf bekend
•Bv. as ʼn munt gegooi word, is dit bekend dat die uitkoms slegs een van twee kan
wees. Die waarskynlikheid is dus altyd 0.5
A priori
•Die waardes van r en n is nie bekend nie (sien Formule 4.1 in die handboek),
maar kan deur dataversameling wel gevind word
•Bv. Voorbeeld 4.2 in die handboek
Empiries
•Deur die gebruik van sekere waarskynlikheidsverspreidings kan waarskynlikhede
vir spesifieke geleenthede bepaal word.
•Sien Hoofstuk 5.
Wiskundig
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 2: Waarskynlikhede en steekproewe Bladsy 55
• ʼn Waarskynlikheid is altyd tussen 0 en 1, met 0 en 1 ingesluit. (Bv. die
waarskynlikheid dat dit volgende week gaan reën is 0.7; die waarskynlikheid dat ek
die Lotto gaan wen is 0.00000002.)
• Indien iets onmoontlik is, is die waarskynlikheid dat dit gaan gebeur, 0. (Bv. die
waarskynlikheid dat ek vanaand op Mars gaan beland, is 0).
• As iets definitief gaan gebeur, is die waarskynlikheid 1. (Bv. die waarskynlikheid dat
ek eendag sal doodgaan, is 1.)
• As die waarskynlikhede van alle moontlik gebeurtenisse bymekaar getel word, is die
antwoord 1. (Die handboek verskaf ʼn kort voorbeeld onder paragraaf 4.3 in die
handboek om hierdie reël beter te illustreer.)
• Die waarskynlikheid dat iets nie gaan gebeur nie, is dieselfde as 1, minus die
waarskynlikheid dat dit wel gaan gebeur.
Bestudeer hierdie eienskappe in die handboek. Maak ook seker dat jy die Wiskundige
formules vir elk van hierdie reëls ken voordat jy verder gaan.
Doen nou Voorbeeld 4.2 in die handboek om te sien hoe hierdie eienskappe toegepas
kan word.
Paragraaf 4.4 verduidelik vyf belangrike basiese statistiese konsepte. Hierdie konsepte is
afkomstig van algemene versamelingsleer (set theory). Die vyf begrippe is:
• Snyding (intersection) van gebeurtenisse (events)
• Samevoeging (union) van gebeurtenisse
• Onderling uitsluitend (mutually exclusive) gebeurtenisse
• Gesamentlik uitputbare (Collectively exhaustive) gebeurtenisse
• Statisties-onafhanklike gebeurtenisse.
Werk baie noukeurig deur Voorbeeld 4.3 in die handboek. Hierdie voorbeeld verskaf ʼn
datastel waarmee elk van die bogenoemde begrippe wiskundig, sowel as grafies
voorgestel word.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 56
2.5.2 Berekening van waarskynlikhede
Bestudeer die handboek: Paragraaf 4.5
In paragraaf 4.5 word drie waarskynlikhede bereken:
• Marginale waarskynlikhede. Hierdie is die waarskynlikheid dat ʼn enkele
gebeurtenis sal plaasvind. Byvoorbeeld: Die waarskynlikheid dat dit volgende week
gaan reën, is 0.4. Daar is slegs een waarskynlikheid wat bereken moet word. Die
formule hiervoor is reeds in die handboek as Formule 4.1 gegee.
Doen Voorbeeld 4.4 (Vraag (a) en (b)) in die handboek om te verstaan hoe ʼn
marginale waarskynlikheid bereken word.
• Gesamentlike waarskynlikheid (joint probability). In hierdie geval word die
waarskynlikheid dat twee gebeurtenisse gelyktydig plaasvind, bereken. Bv. wat is
die waarskynlikheid dat dit volgende week tegelyktydig gaan reën en gaan hael?
(Hierdie waarskynlikheid word ook voorgestel deur die snyding-beginsel hierbo
genoem.)
Nota: Hoewel die gesamentlike waarskynlikheid in die tabel verkry kon word (sien
Voorbeeld 4.4), is daar ook ʼn formule om hierdie waarskynlikheid te bereken. Die
gesamentlike waarskynlikheid van geleentheid A en B se formule is:
P(A∩B) = P(A) x P(B)
Doen Voorbeeld 4.4 (Vraag (c)) in die handboek om te verstaan hoe ʼn
gesamentlike waarskynlikheid verkry kan word.
• Voorwaardelike waarskynlikheid (conditional probability) is die waarskynlikheid dat
ʼn spesifieke gebeurtenis (A) sal plaasvind, gegewe dat ʼn ander gebeurtenis (B) wel
plaasgevind het. Dit beteken dat die feit dat B wel plaasgevind het, die steekproef in
so ʼn mate verminder dat dit A se waarskynlikheid sal beïnvloed. Die formule om ʼn
voorwaardelike waarskynlikheid te meet, word as Formule 4.2 in die handboek
verskaf.
Voorbeeld
Uit ʼn groep van 100 personeellede, is 30 ingenieurs, 20 administratiewe personeel
en 50 verkoopspersoneel. Uit dieselfde groep personeellede is 25 in Johannesburg,
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 2: Waarskynlikhede en steekproewe Bladsy 57
50 in Pretoria en 25 in Kaapstad. Gegewe dat ʼn spesifieke personeellid in
Johannesburg is, wat is die kans dat sodanige personeellid ook ʼn ingenieur is?
Oplossing:
Gestel A: Die personeellid is ʼn ingenieur.
Gestel B: Die personeellid is in Johannesburg.
Die formule vir die voorwaardelike waarskynlikheid, vereis dat P(A∩B) bereken moet
word:
P(A∩B)
= P(A) x P(B)
= 30/100 x 25/100
= 0.075
Die formule vereis ook dat P(B) bereken moet word:
P(B)
= 25/100
= 0.25
Vervang hierdie nou in Formule 4.2 in die handboek in:
P(A/B) = 3�4∩5 3�5
= �.�67�.�7
= 0.3
Daar is dus ʼn 0.3 waarskynlikheid (of 30% kans) dat ʼn werknemer ʼn ingenieur is, as
dit bekend is dat hierdie werknemer wel in Johannesburg is.
Doen nou Voorbeeld 4.4 (Vraag (d)) in die handboek. Hierdie voorbeeld vereis nie
van jou om P(A∩B) te bereken nie, omdat dit bloot van die tabel afgelees kan
word.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 58
2.5.3 Waarskynlikheidsreëls
Bestudeer die handboek: Paragraaf 4.6
Om P(A∪B) en P(A∩B) te bereken is nie moeilik nie.
P(A∪B)
Om hierdie statistiek te bereken moet die vraag gevra word:
Is die gebeurtenisse onderling uitsluitend? Met ander woorde, is dit moontlik dat A en B
gelyktydige kan plaasvind of nie? Indien dit nie moontlik is vir twee gebeurtenisse om tegelyk
plaas te vind nie (onderling uitsluitend), dan is die formule ʼn eenvoudige optelsom:
P(A∪B) = P(A) + P(B)
Indien dit egter wel moontlik is dat die twee geleenthede tegelyk kan plaasvind, moet die
gedeelte waar snyding plaasvind, afgetrek word. Dan is die formule:
P(A∪B) = P(A) + P(B) - P(A∩B)
Om laasgenoemde formule beter te verstaan, kan daar na die Venn-diagram gekyk word.
Verwys na Figuur 2.2 hieronder:
Figuur 2. 2: ʼn Venn-diagram om die optelreël te verduidelik
Wanneer P(A) bereken word, word die hele linkerkantste "sirkel" in berekening gebring.
Wanneer P(B) bereken word, word die hele regterkantse "sirkel" in berekening gebring. Die
gedeelte wat in die wit spasie in die middel lê, word dus twee keer in berekening gebring.
Om te verhoed dat daardie gedeelte (wat voorgestel word deur P(A∩B)) twee keer in ag
geneem word, word P(A∩B) dus weer afgetrek.
Hierdie formules word as Formule 4.3 en Formule 4.4 in die handboek verskaf.
Voltooi nou Voorbeeld 4.5 (Vraag (a) en (b)) in die handboek om die bogenoemde optelreëls
beter te verstaan.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 2: Waarskynlikhede en steekproewe Bladsy 59
P(A∩B)
Die formule om hierdie waarskynlikheid te bereken, is reeds gegee. Die formule wat vroeër
gegee is (naamlik P(A∩B) = P(A) x P(B)) kan slegs gebruik word, indien A en B statisties
onafhanklik is. Dit beteken dat A en B mekaar nie kan beïnvloed nie.
Die vermenigvuldigingsreël is dus:
• Indien A en B statisties onafhanklik is:
P(A∩B) = P(A) x P(B)
• Indien A en B nie statisties onafhanklik is nie:
P(A∩B) = P(A/B) x P(B)
Doen nou Voorbeeld 4.5 (Vraag (c) en (d)) in die handboek om die
vermenigvuldigingsreël beter te verstaan.
Nog ʼn wyse om waarskynlikhede te bereken en grafies voor te stel, is deur middel van
waarskynlikheidsboomdiagramme (probabilities trees).
Lees deur Paragraaf 4.7 en voltooi Voorbeeld 4.6 om waarskynlikheidsboomdiagramme
te verstaan.
2.5.4 Telreëls: Permutasies en kombinasies
Bestudeer die handboek: Paragraaf 4.8
In Paragraaf 4.8 in die handboek word twee telreëls verduidelik. Die eerste behels
permutasies en die tweede, kombinasies.
Om die verskil tussen permutasies en kombinasies te verstaan, kan Voorbeeld 4.7
(permutasies) en Voorbeeld 4.8 (kombinasies) in die handboek voltooi word. Belangrik:
Kyk ook na die formule vir n faktor (n!) verskaf as Formule 4.8 in die handboek.
Die grootste verskil tussen permutasies en kombinasies, is die belangrikheid van volgorde
by eersgenoemde, terwyl volgorde nie van toepassing is by laasgenoemde nie.
Om hierdie verskil te verduidelik, kyk na die volgende twee datastelle:
Datastel A: 2, 4, 6, 8, 10
Datastel B: 4, 6, 8, 10, 2
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 60
Hierdie is twee verskillende permutasies (omdat die volgorde verskil, selfs al is die waardes
dieselfde), maar slegs een kombinasie (omdat die volgorde nie saak maak nie).
� Permutasiereël
Kyk dan na die volgende voorbeeld:
ʼn Onderwyser laat tien kinders daagliks in ʼn ry staan. Om dit interessant te maak, moet die
kinders elke dag ʼn nuwe volgorde vorm. Hoeveel dae gaan dit neem voordat die kinders
elke moontlike volgorde gebruik het?
Dag Plek
1
Plek
2
Plek
3
Plek
4
Plek
5
Plek
6
Plek
7
Plek
8
Plek
9
Plek
10
1 Jan Sarie Jessy Karin Willem Petra Bossie Barry Rian Juan
2 Sarrie Jessy Karin Willem Petra Bossie Barry Rian Juan Jan
3 Jessy Karin Willem Petra Bossie Barry Rian Juan Jan Sarie
4 ... ... ... ... ... ... ... ... ... ...
n!
In hierdie geval is n = 10. Dit is dus die hoeveelheid kinders wat in die ry sorteer word.
Omdat daar nie ʼn subgroep van kinders uit die 10 geneem word nie, is die formule redelik
eenvoudig.
Die hoeveelheid permutasies (wyses waarop die kinders in die ry sorteer kan word), is n!
Omdat n = 10 kinders:
n! = 10 x 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1 (Sien Formule 4.8 in die handboek)
= 3 628 800
Dus, sal die kinders meer as 3.5 miljoen dae neem om al die moontlike kombinasies op te
gebruik!
Gestel nou dat die onderwyser besluit om drie kinders uit die groep te kies. Een word as die
klaskaptein gekies, ʼn ander word as die klassekretaris gekies en die derde word as die
klastesourier gekies. Hierdie drie persone word uit 10 totale leerders gekies. Hoeveel
verskillende kombinasies is moontlik?
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 2: Waarskynlikhede en steekproewe Bladsy 61
Dag Klaskaptein Sekretaris Tesourier
1 Jan Jessy Willem
2 Jan Jessy Rian
3 Willem Jessy Rian
4 Willem Jan Bessie
... ... ... ...
?
Omdat daar nou ʼn subset uit die groter groep leerders gekies word, word Formule 4.10 in
die handboek gebruik. Die volgorde is ook belangrik (kaptein, sekretaris, tesourier), dus is dit
ʼn permutasie.
Die formule is:
nPr = �!
���: !
= ��!
����� !
= �;�<<��
6=;=7=�=�=�=�
= 720
Daar is dus 720 moontlike samestellings van die leierskapkomitee vir die klas van tien
leerders.
Doen nou Voorbeeld 4.9 om permutasies onder die knie te kry.
� Kombinasiereël
Waar ʼn kombinasie ter sprake is, is die volgorde nie van toepassing nie. Daar word dus
meer na versamelings gekyk. Kyk weer na die klas-van-tien voorbeeld hierbo genoem:
Die onderwyseres besluit om nie portefeuljes (klaskaptein, sekretaris en tesourier) aan die
kinders toe te ken nie. Daar word bloot drie kinders gekies om op die komitee te dien. Daar
is dus nou ʼn groep kinders (n) waaruit drie kinders gekies moet word (r). As die onderwyser
elke dag ʼn ander komitee uit die tien kinders wil aanstel, hoeveel dae sal sy kan aanhou
totdat alle moontlike unieke kombinasies gebruik is?
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 62
Die volgorde waarin die kinders gekies word, is nie belangrik nie (almal se plekke op die
komitee is dieselfde). Dus word daar nie van permutasies gebruik gemaak nie, maar
kombinasies.
Gebruik Formule 4.11 in die handboek:
nCr = �!
:!���: !
= ��!�!�6!
= �;�<<���; �7���
= 120
Na 120 dae, sal die onderwyser alle moontlik kombinasies van kinders op die komitee gehad
het.
2.5.5 Selfevalueringsvrae
Daar is 21 vrae aan die einde van Hoofstuk 4. Beantwoord al hierdie vrae. Dit is baie werk
en gaan heelwat tyd in beslag neem, maar dit sal jou help om te verseker dat jy die werk
onder die knie het.
2.6 Waarskynlikheidsverspreidings
Bestudeer die handboek: Paragraaf 5.1 tot 5.10.
In Hoofstuk 4 in die handboek is waarskynlikhede bereken deur data te versamel (empiries).
Waarskynlikhede kan ook wiskundig bereken word deur sogenaamde waarskynlikheids-
verspreidings. Hoofstuk 5 bespreek drie verskillende waarskynlikheidsverspreidings. Die
normaalverspreiding is veral belangrik, omdat hierdie verspreiding die grondslag vorm vir
statistiek wat in die res van die vak bespreek word.
ʼn Waarskynlikheidsverspreiding is ʼn lys van alle moontlike uitkomste van ʼn ewekansige
(random) veranderlike met elk se waarskynlikhede. Byvoorbeeld, ʼn eenvoudige
waarskynlikheidsverspreiding is dié van ʼn muntstuk wat gegooi word. Die uitkomste wanneer
ʼn muntstuk gegooi word, kan kop of stert wees. Daar is dus slegs twee moontlike
uitkomstes. Die waarskynlikheid van beide is 0.5. Dus sal die waarskynlikheidsverspreiding
vir ʼn muntstuk wat gegooi wees, soos volg lyk:
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 2: Waarskynlikhede en steekproewe Bladsy 63
Moontlike uitkoms Waarskynlikheid
Kop 0.5
Stert 0.5
Tabel 2. 1: Waarskynlikheidsverspreiding vir ʼn muntstuk wat gegooi word
Hierdie is natuurlik ʼn eenvoudige voorbeeld. Daar is slegs twee moontlike uitkomste. In
ander gevalle kan daar meer moontlike uitkomste wees. Die uitkomste hoef ook nie
noodwendig heelgetalle te behels nie. Byvoorbeeld, wanneer na salarisse verwys word, is
daar ʼn sekere waarskynlikheid dat iemand R1 000.00 salaris kry. Daar is ʼn ander
waarskynlikheid dat iemand R1 000.01 salaris kry en nog ʼn ander waarskynlikheid dat
iemand R1 000.02 salaris kry. Laasgenoemde is ʼn tipiese voorbeeld van ʼn kontinue
waarskynlikheidsverspreiding.
Waarskynlikheidsverspreidings word in twee kategorieë verdeel. Hierdie kategorieë, asook
die verskillende verspreidings wat in elk voorkom, word in Figuur 2.3 grafies voorgestel. (Let
wel: Die paragraafnommers wat in die figuur aangedui word, verwys na die paragrawe in die
handboek.)
Figuur 2. 3: Kategorieë van waarskynlikheidsverspreidings
(Bron: Wegner, 2013:125 – 142)
Waarskynlikheids-
verspreidings
Diskreet (par 5.3)
Binominaal
(par 5.4)
Poisson (par 5.5)
Kontinue (par 5.6)
Normaal (par 5.7)
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 64
2.6.1 Diskrete waarskynlikheidsverspreidings
Bestudeer die handboek: Paragraaf 5.3 – 5.5.
ʼn Diskrete veranderlike is enige veranderlike wat slegs spesifieke waardes kan aanneem.
Hierdie waardes is gewoonlik heelgetalle. Waardes soos A, B, C, D en E kan egter ook as
diskrete waardes gesien word. Die vraag wat gevra word om te toets of ʼn waarde diskreet is,
is: "Is dit bekend watter waarde hierdie spesifieke waarde voorafgaan?". Byvoorbeeld, dit is
bekend dat 4 voor 5 is, en dat 6 na 5 is (as daar van heelgetalle gepraat word). Dit is ook
bekend dat C na B kom en dat D na C is (as daar van die alfabet gepraat word). Vir nog ʼn
voorbeeld kan daar na Paragraaf 5.3 in die handboek verwys word.
Die tweede kategorie van verspreidings, is kontinue verspreidings. In hierdie geval is daar ʼn
oneindige hoeveelheid waardes tussen enige twee waardes. Byvoorbeeld, watter waarde is
tussen 1 en 3 as daar na kontinue getalle verwys word? Die waarde 2 is wel tussen 1 en 3,
maar die waarde 2.5 ook; en die waarde 2.501 en die waarde 2.000000015 ook. Daar is dus
ʼn oneindige hoeveelheid waardes wat tussen 1 en 3 is. ʼn Beskrywing van kontinue
verspreidings word in Paragraaf 5.6 in die handboek verskaf.
Die diskrete waarskynlikheidsverspreidings sluit die binominale en poisson-verspreidings
in. Elk word kortliks hieronder bespreek.
� Binominale waarskynlikheidsverspreiding
Die binominale verspreiding word gebruik vir enige gebeurtenisse wat slegs een van twee
uitkomste kan hê. ʼn Voorbeeld is reeds hierbo genoem: ʼn Muntstuk wat gegooi word. Die
waarskynlikheid vir ʼn spesifieke uitkoms is egter nie altyd 0.5 nie. Dit mag gebeur dat die
twee uitkomste se waarskynlikhede onderskeidelik 0.3 en 0.7 is. ʼn Diskrete veranderlike volg
ʼn binominale verspreiding as dit aan die vereistes voldoen wat in Paragraaf 5.4 in die
handboek verskaf word.
Voorbeeld
(Hierdie voorbeeld dien as voorbereiding vir Voorbeeld 5.1 in die handboek.)
ʼn Maatskappy verhuur motors. Onder hierdie motors is Opel motors beskikbaar. Uit
ondervinding weet die bestuur van die maatskappy dat 1 uit elke 4 kliënte, ʼn Opel verkies.
Dus is die waarskynlikheid van ʼn “sukses” (ʼn Opel word gehuur) 0.25. (Dit word bereken
deur p(sukses) = 1/4)
Vraag 1: Wat is die waarskynlikheid dat ʼn enkele kliënt wat by die maatskappy instap, ʼn
Opel sal verkies?
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 2: Waarskynlikhede en steekproewe Bladsy 65
Die antwoord op hierdie vraag is eenvoudig. Hierdie waarskynlikheid is reeds bekend en is
0.25.
Vraag 2: Wat is die waarskynlikheid dat ʼn enkele kliënt wat by die maatskappy instap, nie ʼn
Opel gaan kies nie?
Die antwoord is weer eens redelik eenvoudig:
p(mislukking) = 1 – p (sukses)
= 1 - 0.25
= 0.75
Vraag 3: Wat is die waarskynlikheid dat, as vyf kliënte by die winkel instap, twee van hierdie
kliënte elk ʼn Opel gaan huur?
Dit is op hierdie stadium dat die antwoord nie so ooglopend is nie en ʼn formule benodig
word. Hierdie formule word as Formule 5.1 in die handboek verskaf. Die formule bestaan uit
ʼn aantal elemente. In hierdie geval is dit:
• n = die grootte van die steekproef (in hierdie geval kyk ons na 5 kliënte)
• x = die hoeveelheid suksesvolle uitkomste (in hierdie geval, is ons op soek na die
waarskynlikheid dat daar twee suksesvolle uitkomste sal wees, met ander woorde,
dat twee van die vyf kliënte wel ʼn Opel sal huur)
• p = die waarskynlikheid van ʼn sukses (met ander woorde, die waarskynlikheid dat
een kliënt ʼn Opel sal huur)
• (1-p) = die waarskynlikheid van ʼn mislukking
• nCx = Hier word ʼn kombinasie bereken. Verwys na paragraaf 2.6.4 hierbo om jou
geheue te verfris. In hierdie geval, word die kombinasie met n = 5 en x = 2 gevind,
dus 5C2.
Doen Voorbeeld 5.1 in die handboek.
Vraag 3 hierbo is dieselfde vraag wat in Voorbeeld 5.1 in die handboek gevra word. Die
inligting wat hierbo verskaf word, behoort vir jou ʼn idee te gee hoe om hierdie voorbeeld te
voltooi. Hou in gedagte:
• Jy moet eers die vier voorwaardes vir ʼn binominale verspreiding toets, voordat
Formule 5.1 in die handboek toegepas kan word.
• ʼn Goeie idee sal wees om eers die kombinasie (nCx) te bereken en dan die res van
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 66
die formule te bepaal.
Uitdaging:
Gestel die vraag in Voorbeeld 5.1 het gelees:
Wat is die waarskynlikheid dat ten minste twee van die vyf kliënte ʼn Opel sou kies? Hoe
sou ʼn mens dan te werk gaan? Die antwoord lê daarin om die vraag in diskrete eenhede op
te breek. Indien ten minste twee kliënte wel ʼn Opel kies, beteken dit dat twee, drie, vier of vyf
kliënte ʼn Opel kies. In hierdie geval moet die waarskynlikheid vir:
• x = 2,
• x = 3,
• x = 4 en
• x = 5,
bereken word en bymekaar getel word.
Dus: Wanneer die woorde "ten minste", "meer as", "minder as", ensovoorts gebruik word,
moet die waarskynlikhede vir alle moontlike waardes van x wat aan daardie vereiste
voldoen, bepaal word.
Doen nou Voorbeeld 5.2 in die handboek. Hierdie voorbeeld maak gebruik van woorde
soos "ten minste" of "meer as". Omdat daar met diskrete waardes gewerk word, is dit
maklik om die verskillende x-waardes te bepaal.
� Poisson-verspreiding
Die poisson-verspreiding verwys na die hoeveelheid keer wat iets binne-in ʼn spesifieke
tydperk of spasie, of volume, plaasgevind het. Byvoorbeeld, die hoeveelheid kere wat ʼn
masjien in ʼn agt-uurskof gebreek het. Die vraag wat dus gevra word, is soos volg: Wat is die
waarskynlikheid dat iets x keer sal gebeur in ʼn spesifieke tyd, as dit bekend is dat dit
gemiddeld a keer in dieselfde tydperk gebeur? Byvoorbeeld, as ʼn masjien gemiddeld vier
keer per dag breek (a = 4), wat is die waarskynlikheid dat ʼn masjien drie keer per dag sal
breek (x = 3, bereken p(3))? Of, wat is die waarskynlikheid dat ʼn masjien ten minste twee
keer per dag sal breek (x>= 2). Of, wat is die waarskynlikheid dat ʼn masjien ten minste vier
keer in ʼn twee-dag periode sal breek?
Dit is belangrik dat die tydsperiode in ag geneem moet word. As a (die gemiddelde
hoeveelheid kere wat die gebeurtenis plaasvind) per dag bepaal word, maar die vraag dui op
ʼn tweedag-periode, moet die nodige aanpassing gedoen word. Die formule om ʼn
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 2: Waarskynlikhede en steekproewe Bladsy 67
waarskynlikheid in ʼn poisson-verspreiding te bepaal, word in die handboek as Formule 5.3
weergegee.
Doen Voorbeeld 5.3 in die handboek.
• Vraag (a) is bloot ʼn toepassing van die formule met a = 5 en x = 3.
• Vraag (b) vereis van jou om drie waarskynlikhede met die formule te bereken en
bymekaar te tel. Hierdie waarskynlikhede is p(0), p(1) en p(2).
• Vraag (c) is ʼn uitdaging. Hier word van jou verwag om die waarskynlikheid vir alle
waardes bo 4 te bereken. Maar daar is ʼn oneindige hoeveelheid waardes bo 4! Die
antwoord is eintlik eenvoudig. Ons weet dat, as al die waarskynlikhede van ʼn
poisson-verspreiding bymekaar getel word, die getal 1 verkry sal word. Dus, as die
waarskynlikhede van alle x-waardes van 4 en minder bereken word, en dan van 1
afgetrek word, sal die waarskynlikheid van alle x-waardes bo 4 verkry word.
• Vraag (d) verander aan die tydsperiode. Dus, moet a aangepas word. Omdat a = 5
per dag, sal a = 10 vir twee dae. Verder kan die formule gewoonweg gebruik word.
� Beskrywende statistiek vir poisson en binominale waarskynlikheidsverspreidings
Die gemiddeld en standaardafwyking kan ook vir hierdie verspreidings bereken word.
(Onthou: Die verspreiding is bloot ʼn versameling van waarskynlikhede, met ander woorde, ʼn
groep getalle tussen 0 en 1).
Die gemiddeld en standaardafwyking vir die binominale verspreiding word bereken deur
Formule 5.2 in die handboek. Die gemiddeld en standaardafwyking vir poisson-verspreidings
word verskaf in Formule 5.4 in die handboek.
2.6.2 Die normaalverdeling
Bestudeer die handboek: Paragraaf 5.6 en 5.7
Die normaalverdeling word gebruik om enige waardes (nie slegs heelgetalle nie) voor te stel.
In Paragraaf 5.7 in die handboek word die eienskappe van ʼn normaalverdeling verskaf.
Alle data wat versamel word, sal natuurlik nie ʼn normaalverdeling hê nie. Een datastel kan ʼn
gemiddeld van 10 000 hê, terwyl ʼn ander ʼn gemiddeld van -17 kan hê (ʼn normaalverdeling
se gemiddeld is 0). Die normaalverdeling vorm egter die basis. Dit is belangrik om eers te
verstaan hoe die normaalverdeling werk en hoe om waarskynlikhede vanaf ʼn
normaalverdeling te verkry. Daarna kan hierdie metode aangepas word vir datastelle met
ander gemiddelde en standaardafwykings.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 68
Vir Voorbeeld 5.4 kan daar aangeneem word dat data perfek normaal versprei is, met ander
woorde, die verdeling het ʼn gemiddeld van 0 en ʼn standaardafwyking van 1. Vanaf
Voorbeeld 5.5 word die data meer realisties voorgestel. Die gemiddelde en
standaardafwykings verander en daar word gekyk na wyses om steeds die waarskynlikhede
te meet.
ʼn Tipiese vraag wat met ʼn normaalverdeling beantwoord kan word, is:
Data is normaal versprei met ʼn gemiddeld van 0 en standaardafwyking van 1. Indien ʼn
spesifieke waarde ewekansig uit die data geneem word, wat is die waarskynlikheid dat
hierdie waarde tussen 0 en 2.33 sal wees?
Hoe om ʼn waarskynlikheid uit ʼn normaalverdeling te kry:
• Teken die normaalverdeling om ʼn beter oorsig te kry.
• Maak ʼn kruisie op die x-as om vir jouself ʼn aanduiding te gee waar die spesifieke
waarde sal voorkom. Merk hierdie waarde as z (met ander woorde, vir die voorbeeld
hierbo genoem, sal z, 2.33 wees).
• Kleur die oppervlakte tussen 0 en z in.
• Bereken nou die oppervlakte.
Vind die oppervlakte
Om die oppervlakte te bereken, is kompleks. Om hierdie rede is daar aan die einde van die
handboek ʼn tabel opgestel met die oppervlaktes tussen 0 en ʼn groot verskeidenheid z-
waardes. Om die oppervlakte in die z-tabel (Tabel 1, Aanhangsel 1 in die handboek) te vind,
kan jy die volgende stappe volg:
• Neem die z-waarde (byvoorbeeld 2.35).
• Soek die syfers voor die desimaal, asook die eerste syfer na die desimaal in die
linkerkantste kolom van die tabel (in hierdie geval, vind 2.3).
• Soek nou die tweede desimaal (in hierdie geval 0.05) in die eerste ry van die tabel.
• Vind nou die plek waar hierdie ry (2.3) en kolom (0.05) kruis. Die waarde wat op
daardie kruising voorkom, is die oppervlakte tussen 0 en 2.35 (in hierdie geval is dit
0.49061.
• Interpretasie: Die waarskynlikheid dat ʼn waarde in ʼn normaalverdeling tussen 0 en
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 2: Waarskynlikhede en steekproewe Bladsy 69
2.35 sal wees, is 0.49061
Jy kan dus bloot die z-waarde neem (Tabel 1, Aanhangsel A in die handboek)
Doen nou Voorbeeld 5.4 in die handboek.
Wenke:
• Vraag (a) is redelik eenvoudig en kan bloot van die tabel afgelees word.
• Vraag (b) werk met ʼn negatiewe getal. Maar omdat die twee helftes van die
normaalverdeling presies simmetries is, is die waarskynlikheid om ʼn getal tussen 0
en -2.3 te kry, presies dieselfde as die waarskynlikheid om ʼn getal tussen 0 en 2.3
(positief) te kry. Dus kan die oppervlakte tussen 0 en 2.3 bepaal word – dit sal
presies dieselfde wees vir die oppervlakte tussen 0 en -2.3.
• Vraag (c) vereis nie die oppervlakte tussen 0 en ʼn getal nie, maar van die
oppervlakte aan die regterkant van ʼn getal. Dit is egter bekend dat die totale
oppervlakte onder die normaalverdeling 1 is (alle moontlike waarskynlikhede) en,
omdat die twee helfte simmetries is, is die oppervlakte aan die regtekant 0.5 (en die
linkerkant is ook 0.5). Vir hierdie voorbeeld kan die oppervlakte tussen 0 en 1.82
bereken word, en dan afgetrek word van 0.5 om die oppervlakte aan die regterkant
van 1.82 te bepaal.
• Vraag (d) is nog ʼn bietjie moeiliker. Die oppervlakte tussen -2.1 en 1.32 moet
bereken word. Omdat die twee helftes simmetries is, kan die oppervlakte aan die
linkerkant van 0 bereken word. Dan kan die oppervlakte aan die regterkant van 0
bereken word. As die twee oppervlaktes bymekaar getel word, word die totale
oppervlakte gevind.
• Vraag (e) verskil van Vraag (d) omdat die oppervlakte nie aan 0 raak nie. Die
oppervlakte tussen 1.24 en 2.075 moet bereken word. Hierdie oppervlakte is egter
die verskil tussen twee oppervlaktes:
o 0 tot 1.24 se oppervlakte en
o 0 tot 2.075 se oppervlakte
Deur hierdie twee oppervlaktes van mekaar af te trek, sal die oppervlakte tussen
1.24 en 2.075 bereken word.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 70
Belangrik: Uit hierdie voorbeeld kan gesien word hoe belangrik dit is om eers die
normaalverdeling te teken voordat enige berekenings gedoen word.
Gestel die gemiddeld van ʼn verspreiding getalle is 20 (en nie 0 nie) en die
standaardafwyking is 4 (en nie 1 nie). Gestel ons wil weet wat die waarskynlikheid is dat ʼn
waarde tussen 20 en 22 sal voorkom. Daar is nie ʼn 20 of 22 in die z-tabel nie! Die getal 20
en 22 is nie z-waardes nie, omdat die verdeling nie ʼn standaard-normaalverdeling is nie.
Die voorwaarde vir ʼn standaard-normaalverdeling is ʼn gemiddeld van 0 en
standaardafwyking van 1. Hoe kan ʼn mens dan die oppervlak bereken?
Hoewel daar nie ʼn z-waarde gegee word nie, is dit moontlik om die z-waarde te bereken.
Wanneer ʼn z-waarde bereken is, is dit maklik om die oppervlak, en dus die waarskynlikheid
te bereken. Die formule vir ʼn z-waarde (as die gemiddeld en standaardafwyking nie 0 en 1
onderskeidelik is nie) word in Formule 5.6 in die handboek gegee.
Lees die verduideliking direk na Voorbeeld 5.4 in die handboek. Doen dan Voorbeeld 5.5
in die handboek. Onthou, sodra die z-waarde gevind is, word die oefeninge presies
dieselfde as in Voorbeeld 5.4 gedoen.
Vind nou die x-waarde vir ʼn waarskynlikheid
In bogenoemde voorbeelde is ʼn waarde (z of x) gegee en die waarskynlikheid (p) is bepaal
deur die oppervlakte te bereken. (Met ʼn standaard-normaalverdeling is die z-waarde
gebruik, maar indien die gemiddeld nie 0 is en/of die standaardafwyking nie 1 is nie, word ʼn
x-waarde gegee en die z-waarde word eers bereken.)
Vir die volgende voorbeelde, word die waarskynlikhede (p) gegee en daar word van jou
verwag om die z-waarde of x-waarde te vind.
Doen Voorbeeld 5.6 in die handboek.
In hierdie voorbeeld word daar van jou verwag om die z-waarde te vind. Om dit te doen,
word die oppervlakte in die z-tabel gevind, en dan word die ooreenkomstige z-waarde in
die ry en kolom bloot afgelees.
Om die x-waarde te vind, vereis ʼn bykomende stap. Eerstens, word die z-waarde gevind, en
dan word die z-waarde, die gemiddeld en die standaardafwyking in Formule 5.6 (in die
handboek) ingelees. Sodoende kan die x-waarde gevind word.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 2: Waarskynlikhede en steekproewe Bladsy 71
Doen Voorbeeld 5.7 in die handboek.
Hierdie voorbeeld is soortgelyk aan Voorbeeld 5.6, maar dit maak nie gebruik van ʼn
standaard-normaalverdeling (met ʼn gemiddeld van 0 en standaardafwyking van 1) nie.
2.6.3 Selfevalueringsvrae
Daar is 26 vrae aan die einde van Hoofstuk 5 in die handboek. Doen al hierdie vrae om te
verseker dat jy ʼn behoorlike grondslag het vir verdere werk wat behandel gaan word.
2.7 Steekproewe
Bestudeer die handboek: Paragraaf 6.1 – 6.4, 6.6, 6.8
Nota: Hoewel die berekening en interpretasie van steekproefproporsies ʼn baie belangrike
deel van die wetenskap van Statistiek uitmaak, is dit nie in hierdie sillabus ingesluit nie.
Soos reeds genoem, is dit nie altyd moontlik om ʼn spesifieke statistiek vir ʼn hele populasie
te bereken nie. Om hierdie rede word ʼn steekproef geneem. Onthou dat ʼn steekproef ʼn
kleiner groepering is van waardes wat uit die populasie kom. ʼn Steekproef moet ook sover
as moontlik verteenwoordigend van die populasie wees.
2.7.1 Steekproefmetodes
Bestudeer die handboek: Paragraaf 6.1 – 6.2
Daar is ʼn verskeidenheid metodes waarop steekproewe gevind kan word. Die aard van die
steekproefmetode het ʼn groot invloed op die wyse waarop die steekproef die populasie
verteenwoordig. Ewekansige (random) steekproefmetodes lewer meer verteenwoordigende
steekproewe as nie-ewekansige metodes. Ongelukkig is ewekansige steekproewe dikwels
moeiliker om in die hande te kry. Die verskillende metodes word in paragraaf 6.2 in die
handboek verduidelik en kortliks in Tabel 2.2 hieronder opgesom.
Ewekansige steekproefneming
Elke lid van die populasie het ʼn ewe groot
kans om deel van die steekproef uit te maak.
Nie-ewekansige steekproefneming
Elke lid van die populasie het nie dieselfde
kans om deel van die steekproef uit te maak
nie.
Eenvoudige ewekansige streekproefneming
(Simple random sampling)
Sistematiese steekproefneming (Systematic
Geriefsteekproefneming (Convenience
sampling)
Oordeelsteekproefneming (Judgement
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 72
random sampling)
Gestratifiseerde steekproefneming (Stratified
random sampling)
Trossteekproefneming (Cluster random
sampling)
Sampling)
Kwotasteekproefneming (Quota sampling)
Sneeubalsteekproefneming (Snowball
sampling)
Tabel 2. 2: Steekproefmetodes
(Bron: Wegner, 2013:153 – 157)
Aan die einde van Paragraaf 6.2 in die handboek, word die voordele van ewekansige
steekproefneming uiteengesit. Die skrywer gaan selfs so ver om te sê dat data wat op ʼn nie-
ewekansige wyse versamel is, nie gebruik kan word om afleidende statistiek te bereken nie.
Dit is egter nie waar nie. In die praktyk word afleidings dikwels op grond van data wat op
hierdie wyse versamel is, gemaak. Die navorser moet egter in hierdie gevalle deeglik bewus
wees van die feit dat die data – en dus, die afleidings – met groot sorg geïnterpreteer word,
veral wanneer besluite ten opsigte van die populasie op grond van hierdie data gemaak
word.
2.7.2 Die steekproefverspreiding
Handboek, paragraaf 6.3 – 6.4 en 6.6.
Hoewel daar nie berekeninge in hierdie paragraaf ingesluit word nie, word daar in diepte
verduidelik waarom die steekproef se gemiddeld en standaardafwyking as benadering tot dié
van die populasie gebruik word. Die belangrikheid van die standaardfout (standard error)
word ook beskryf.
Wanneer ʼn navorser ʼn statistiek uit die steekproef bereken, kan hy of sy nooit ten volle seker
wees dat die populasiestatistiek presies dieselfde sal wees nie. Daar bestaan egter metodes
om te bepaal met watter mate van sekerheid hierdie steekproefstatistiek op die populasie
van toepassing gemaak kan word. Die rasionaal wat die grondslag hiervoor lê, word in
Paragraaf 6.4 bespreek. Paragraaf 6.6 beskryf hoe hierdie beginsels op die verskil tussen
twee steekproewe van toepassing gemaak word.
Belangrik vir die pad vorentoe
Hoewel die volgende terminologie later weer aangeraak word, sal dit nuttig wees om op
hierdie stadium daarvan bewus te wees:
• Vlak van sekerheid: Hierdie is ʼn persentasie tussen 0 en 100. In die meeste gevalle
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 2: Waarskynlikhede en steekproewe Bladsy 73
sal die vlak van sekerheid 90%, 95% of 99% wees. Hierdie getal word vooraf deur
die navorser bepaal en beantwoord die vraag: Hoe seker wil ek wees dat die
resultate wat ek gekry het, werklik op die populasie van toepassing gemaak kan
word? Indien akkuraatheid van kritieke belang is (en foute katastrofiese gevolge kan
hê), sal die vlak van sekerheid hoër wees as wanneer, byvoorbeeld, marknavorsing
gedoen word.
• p-waarde. Hierdie is ʼn statistiek wat die betroubaarheid van die berekende statistiek
aandui. Die p-waarde is ʼn getal tussen 0 en 1. Hoe nader die getal aan 0 is, hoe
meer betroubaar is die statistiek wat bereken is. Die p-waarde word ook saam met
die vlak van betroubaarheid geïnterpreteer. Indien die vlak van betroubaarheid 95%
is, moet die p-waarde kleiner as 0.05 (5%) wees. In die geval van ʼn 99% vlak van
betroubaarheid, moet die p-waarde kleiner as 0.01 wees.
Voorbeeld
ʼn Maatskappy wil weet of daar ʼn verskil is tussen die inkomste van mans en van vroue
onder sy moontlike kliënte. Uit ʼn steekproef word die volgende data verkry:
x̄mans = R23 500
x̄vroue = R19 300
x̄mans - x̄vroue = R4 200
p = 0.043
Vraag: Is daar ʼn verskil tussen die salarisse van mans en vroue?
Antwoord: Die navorser moes vooraf besluit het hoe seker die maatskappy van die
resultate wil wees. In die meeste gevalle sal die navorser ʼn vlak van sekerheid van 95%
kies. Dit beteken dat die resultate slegs aanvaar kan word, indien p kleiner as 0.05 is. In
hierdie geval is dit wel so en die maatskappy kan aanvaar dat, vir die populasie, mans ʼn
groter salaris as vroue kry.
Indien die vlak van sekerheid op 99% bepaal is, moet die p-waarde kleiner as 0.01 wees. Dit
is nie die geval nie en die resultate kan dus nie aanvaar word nie.
Is dit ʼn slegte ding as die p-waarde te groot is?
Sommige beginner-navorsers glo dat die navorsing misluk het, indien die p-waarde groter is
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 74
as wat toelaatbaar is. Dit is natuurlik nie waar nie. In die tweede geval hierbo genoem (vlak
van sekerheid = 99%), sal die navorser se gevolgtrekking wees:
Daar is nie voldoende bewyse om 99% of meer seker te wees dat daar ʼn noemenswaardige
verskil tussen die salarisse van mans en vroue bestaan nie. Dus sal daar aangeneem word
mans en vroue se salarisse gelyk is.
Die volgende hoofstukke in die handboek sal die tema van hipotesetoetsing in meer detail
bespreek.
2.7.3 Selfevalueringsvrae
Daar is geen selfevalueringsvrae vir Hoofstuk 6 nie.
2.8 Samevatting
Hierdie studie-eenheid het die beginsels van waarskynlikhede en steekproewe bespreek.
Daar word onderskei tussen subjektiewe en objektiewe waarskynlikhede – statistiek word
gebruik om laasgenoemde te bereken op een van drie wyses: 1) a priori, 2) empiries en 3)
wiskundig.
Vyf belangrike konsepte betrokke by stelteorie wat vir waarskynlikhede gebruik kan word is
1) snyding, 2) samevoeging, 3) onderling uitsluitend, 4) gesamentlik uitputbare en 5)
statisties onafhanklike gebeure. Daar word onderskei tussen twee belangrike konsepte waar
telreëls van toepassing is, naamlik permutasies en kombinasies. Elk kan nuttig wees om
waarskynlikhede te bereken. Die grootste verskil tussen hierdie twee, is die feit dat volgorde
belangrik is by permutasies, maar nie by kombinasies nie.
Daar word tussen twee kategorieë van waarskynlikheidverspreidings onderskei: 1) Diskrete
verspreidings, wat die binominale en poisson-verspreidings insluit en 2) kontinue
verspreiding waarvan die normaalverdeling die bekendste is. Die normaalverdeling vorm ook
die grondslag van z-toetse en t-toetse, wat later in die vak bespreek word.
Steekproefmetodes word in twee kategorieë verdeel. Die eerste kategorie, ewekansige
steekproefneming, bevat 1) eenvoudige ewekansige steekproefneming, 2) sistematiese
steekproefneming, 3) gestratifiseerde steekproefneming, en 4) trossteekproefneming. Die
tweede kategorie, naamlik nie-ewekansige steekproefneming, bestaan uit 1)
geriefsteekproefneming, 2) oordeelsteekproefneming, 3) kwotasteekproefneming, 4)
sneeubalsteekproefneming. Ewekansige steekproefneming lei gewoonlik tot steekproewe
wat meer verteenwoordigend van die populasie is. Die steekproefverspreiding verduidelik
waarom steekproewe as benaderings vir die populasie gebruik kan word.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 3: Vertrouensintervalle en hipotesetoetsing: Deel I Bladsy 75
Studie-eenheid 3: Vertrouensintervalle en hipotesetoetsing: Deel I
3.1 Studie-eenheid leeruitkomstes
Kennis en begrip
Na voltooiing van Studie-eenheid 3 sal jy in staat wees om jou kennis en begrip te
demonstreer van die volgende:
• Vertrouensintervalle
• Hipotesetoetsing van ʼn enkele populasie se gemiddeld
Vaardighede
Jy sal ook in staat wees om:
• ʼn vertrouensinterval en die faktore wat die grootte daarvan beïnvloed, te bespreek.
• ʼn vertrouensinterval vir ʼn populasiegemiddeld op te stel, indien die
populasiestandaardafwyking bekend is (z-limiete).
• ʼn vertrouensinterval vir ʼn populasiegemiddeld op te stel, indien die
populasiestandaardafwyking nie bekend is nie (t-limiete).
• die vyf stappe van hipotesetoetsing te identifiseer en toe te pas.
• hipotesetoetsing vir ʼn populasiegemiddeld te doen as die
populasiestandaardafwyking bekend is (z-toets).
• hipotesetoetsing vir ʼn populasiegemiddeld te doen as die
populasiestandaardafwyking nie bekend is nie (t-toets).
• ʼn p-waarde te interpreteer en vir hipotesetoetsing te gebruik.
3.2 Voorgeskrewe handboek
Wegner, T. 2013. Applied business statistics. 3rd Ed. Claremont: Juta.
Vir die doeleindes van hierdie studie-eenheid moet jy die volgende afdelings bestudeer:
Hoofstuk 7: Paragraaf 7.1 – 7.8 en 7.10, 7.11
Hoofstuk 8: Paragraaf 8.1 – 8.4 en 8.6 – 8.8
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 76
3.3 Hoe kan jy jou begrip verbeter?
Jy moet seker maak dat jy die volgende terminologie verstaan:
Sleutelwoord Omskrywing
Alternatiewe
hipotese
Die stelling wat aanvaar sal word, indien die nulhipotese
verwerp word.
Hipotesetoets ʼn Statistiese toets wat bepaal of ʼn spesifieke stelling (ʼn
hipotese) waar is. Hierdie toets word op data vanaf ʼn
steekproef gedoen en word gebruik om aannames ten opsigte
van die populasie te maak.
Nulhipotese Die hipotese wat statisties getoets is en aanvaar dat die status
quo waar is. Hierdie hipotese bevat gewoonlik die = teken.
Peil van betekenis ʼn Waarde tussen 0 en 1 wat aandui teen watter sekerheid die
navorser gevolgtrekkings oor die populasie wil maak. Hierdie
waarde word vanaf die vlak van sekerheid verkry.
Puntberaming Die beraming van ʼn spesifieke getal (statistiek), soos ʼn
gemiddeld of standaardafwyking van die populasie. Hierdie
beraming word gedoen met data wat vanaf ʼn steekproef
verkry word.
Vertrouensinterval ʼn Ondergrens en bogrens wat die area waarin ʼn spesifieke
getal (byvoorbeeld, ʼn populasiegemiddeld) met die grootste
waarskynlikheid sal voorkom.
3.4 Inleiding
Een van die belangrikste gebruike van Statistiek is om steekproefdata te gebruik om
gevolgtrekkings ten opsigte van die populasie te maak. Hierdie tipe berekeninge word
inferensiële/afleidende statistiek (inferential statistics) genoem. Statistiese afleidings word
verdeel tussen hipotesetoetsing en vooruitskatting. Laasgenoemde is nie deel van die
omvang van hierdie vak nie en sal dus nie behandel word nie. Die res van hierdie vak sal
dus aan vertrouensintervalle en hipotesetoetsing gewy word.
Vertrouensintervalle is een manier om ʼn beraming te maak ten opsigte van die gemiddeld
van ʼn populasie. Dit behels die stel van ʼn onderste en boonste grens van ʼn interval waarin
die populasiegemiddeld sal voorkom. Die data wat vir die stel van hierdie grense gebruik
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 3: Vertrouensintervalle en hipotesetoetsing: Deel I Bladsy 77
word, word deur ʼn steekproef gevind. Vertrouensintervalle word eerste bespreek en kan
gevind word in Hoofstuk 7 in die handboek.
Hipotesetoetsing behels die toets van ʼn stelling, wat ʼn hipotese genoem word. Die eerste
tipe hipotese wat getoets word, is ʼn beraming van die gemiddeld van ʼn enkele populasie.
Hierdie tipe hipotesetoets word in Hoofstuk 8 in die handboek bespreek.
3.5 Vertrouensintervalle
Bestudeer die handboek: Paragraaf 7.1 – 7.8 en 7.10 – 7.11
3.5.1 Puntberamings en vertrouensintervalle
Bestudeer die handboek: Paragraaf 7.1 – 7.3
Voordat vertrouensintervalle bereken kan word, is dit belangrik om eerstens, te onderskei
tussen twee begrippe: Puntberaming en beraming van ʼn vertrouensinterval.
ʼn Puntberaming word gemaak wanneer ʼn spesifieke statistiek (byvoorbeeld ʼn gemiddeld) vir
ʼn steekproef bereken word, en dan as beraming vir populasie gebruik word. (Verwys na
Paragraaf 7.2 in die handboek vir voorbeelde.)
Wanneer ʼn vertrouensinterval bereken word, word twee grense vir ʼn spesifieke statistiek
bereken. Die populasiestatistiek sal dan, teen ʼn vasgestelde sekerheid, in hierdie interval
voorkom. (Verwys na Paragraaf 7.3 in die handboek vir ʼn volledige definisie.)
3.5.2 Vertrouensinterval vir µ: � bekend
Bestudeer die handboek: Paragraaf 7.4 – 7.6
Die eerste formule wat gebruik word, neem aan dat die populasiegemiddeld �$ bekend is.
Dit is egter nie altyd die geval nie. Paragraaf 7.7 en 7.8 bespreek hoe vertrouensintervalle
bereken kan word as $ nie bekend is nie en die steekproefstandaardafwyking (s) gebruik
moet word.
Soos vroeër genoem, is µ die simbool vir die populasiegemiddeld, byvoorbeeld, die
gemiddelde salaris van alle kliënte, die gemiddelde ouderdom van studente en die
gemiddelde hoeveelheid keer ʼn persoon van ʼn spesifieke pad gebruik maak. Om µ te
beraam, word ʼn steekproef uit die populasie getrek en die gemiddeld van die steekproef, x̄,
word bereken. Laasgenoemde (x̄) word dan gebruik om µ te beraam.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 78
Vraag:
x̄ = 78
Kan ek dus aanneem dat µ ook 78 is?
Antwoord:
Die antwoord is nie so eenvoudig nie. ʼn Meer korrekte antwoord sal wees:
"Ek kan met 95% sekerheid sê dat µ tussen 75.624 en 80.376 sal wees".
Vir hierdie rede word vertrouensintervalle gebruik.
Dit is dus nie altyd moontlik om die presiese populasiegemiddeld te bepaal nie, veral nie
wanneer ʼn groot mate van sekerheid nodig is nie. Om hierdie rede word die
steekproefstatistieke gebruik om ʼn interval op te stel waarin die populasiegemiddeld sal
voorkom. ʼn Tipiese gevolgtrekking wat met ʼn vertrouensinterval gemaak kan word, is: "daar
kan met 95% sekerheid gesê word dat die gemiddelde salaris van alle kliënte tussen
R10 000 en R15 000 is".
Doen Voorbeeld 7.1 in die handboek.
Die doel van ʼn vertrouensinterval is om, met die hulp van steekproefstatistieke, ʼn bogrens
en ondergrens te bepaal waarin die populasiegemiddeld sal val.
Die formule wat gebruik word, is Formule 7.2 in die handboek
Die waarde wat benodig word, word soos volg verkry:
• Vlak van sekerheid (%): Hierdie word deur die navorser besluit. (In Voorbeeld 7.1
word hierdie waarde verskaf.)
• x̄: Hierdie is die steekproefgemiddeld. Dit word bereken deur alle waardes bymekaar
te tel en dit dan deur die hoeveelheid waardes (n) te deel. (In hierdie voorbeeld word
x̄ gegee.)
• z: Die z-waarde word uit die z-tabel aan die einde van die handboek verkry.
• $: Hierdie is die populasiestandaardafwyking. Vir Voorbeeld 7.1 word aangeneem
dat die populasiestandaardafwyking bekend is. Hierdie waarde word gegee.
• n: Hierdie is die hoeveelheid waardes wat gebruik is om x̄ te bereken – dit is die
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 3: Vertrouensintervalle en hipotesetoetsing: Deel I Bladsy 79
steekproefgrootte.
Paragraaf 7.5 bespreek drie belangrike faktore wat die grootte van ʼn vertrouensinterval kan
beïnvloed. Hulle is:
• Die vlak van sekerheid verlang: Hoe hoër die vlak van vertroue is, hoe groter sal
die vertrouensinterval wees.
• Die steekproefgrootte: ʼn Groter steekproef sal (indien alle ander veranderlikes
konstant bly) meer verteenwoordigend wees van die populasie. Dus sal die
vertrouensinterval kleiner kan wees vir dieselfde vlak van sekerheid.
• Die populasie se standaardafwyking. Hoe kleiner ʼn standaardafwyking is, hoe
nader is die meeste waardes aan die gemiddeld. Dit beteken dat die
vertrouensinterval kleiner sal wees.
Doen Voorbeeld 7.2 in die handboek
Hierdie voorbeeld dui aan hoe die vlak van sekerheid die vertrouensinterval kan
beïnvloed.
Doen Voorbeeld 7.3 in die handboek.
Doen Voorbeeld 7.4 in die handboek
Voorbeeld 7.4 dui aan hoe groot ʼn vertrouensinterval word as die standaardafwyking van
die populasie groot is. Probeer hierdie voorbeeld en verander die
populasiestandaardafwyking na 250. Kyk hoe die vertrouensintervalle verskil.
Waarom bereken ons vertrouensintervalle? Paragraaf 7.6 in die handboek verduidelik die
rasionaal waarop vertrouensintervalle gebaseer is. Lees deur hierdie paragraaf om ʼn beter
oorsig oor die gebruik van vertrouensintervalle te verkry.
3.5.3 Vertrouensinterval vir µ: � bekend
Dit gebeur dikwels in praktyk dat geen statistieke van die populasie bekend is nie, dus, is $
nie beskikbaar nie. In so ʼn geval moet die steekproef se standaardafwyking (s) gebruik
word.
Wat is die verskil?
Die formule en prosedure om die vertrouensinterval te bereken, bly dieselfde. Al wat
verander is dat t- in plaas van z-waardes gebruik word.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 80
Om ʼn t-waarde te bereken
Die t-waarde word ook van ʼn tabel afgelees. Hierdie tabel is in die handboek as Tabel 2 in
Aanhangsel A verskaf. Die tabel vereis twee waardes wat gebruik moet word:
• df: Die grade van vryheid (degrees of freedom) word bereken deur n-1, waar n die
steekproefgrootte is.
• ∝ word van die vlak van sekerheid verkry. Vir 95% is ∝ = 0.05.
Die t-waarde sal dan verkry word deur die kolom met die ∝-waarde en die ry met die df-
waarde te kruis.
Doen Voorbeeld 7.5
Gebruik formule 7.3 in die handboek om die vraag te voltooi, en die t-tabel om die t-
waardes te vind.
3.5.4 Selfevalueringsvrae
Doen die volgende vrae aan die einde van Hoofstuk 7 in die handboek:
• Vraag 2
• Vraag 4
• Vraag 5 (a)
• Vraag 6 (a) en (d)
• Vraag 7 (a), (b) en (e)
• Vraag 8 (a) en (b)
• Vraag 9 (a)
• Vraag 10 (a), (b), (c) en (e)
• Vraag 11 (a)
• Vraag 12 (a) en (b)
• Vraag 13 (a), (b) en (c)
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 3: Vertrouensintervalle en hipotesetoetsing: Deel I Bladsy 81
3.6 Hipotesetoetsing vir een populasie
Bestudeer die handboek: Paragraaf 8.1 – 8.4, en 8.6 – 8.8
3.6.1 Hipotesetoetsing
Bestudeer die handboek: Paragraaf 8.1 – 8.2
ʼn Hipotese is ʼn stelling wat deur statistiese berekening aanvaar of verwerp kan word. Die
res van die handboek wat in hierdie vak behandel gaan word (Hoofstuk 8 tot 11) behels
hipotesetoetsing.
Elke hipotese wat getoets word, kan (en moet) op twee wyses weergegee word:
• Nulhipotese: Hierdie hipotese behels die formulering wat statisties getoets of
verwerp gaan word. Die nulhipotese het altyd ʼn = teken (of ≤ of ≥ teken). Die
nulhipotese word normaalweg as die status quo aanvaar, tensy die statistiese toets
(hipotesetoets) genoegsame bewyse lewer om die nulhipotese te verwerp – ten
gunste van die alternatiewe hipotese.
• Alternatiewe hipotese: Die alternatiewe hipotese is die formulering van die hipotese
wat die teenoorgestelde van die nulhipotese voorstel. As die nulhipotese verwerp
word, word die bewoording in die alternatiewe hipotese in die gevolgtrekking gebruik.
Voorbeeld
ʼn Maatskappy wil bepaal of die gemiddelde ouderdom (A) van hul teikenmark bo 18 is.
Die nul (H0) en alternatiewe (H1) hipoteses sal soos volg voorgestel word:
H0: A ≤ ��
H1:A > ��
Belangrik: Die twee hipotese mag onder geen omstandighede dieselfde stelling maak nie;
daarom word slegs die > teken vir die alternatiewe hipotese gegee.
As die statistiese toets H0 verwerp, sal die bestuur tot die gevolgtrekking kom dat die
gemiddelde ouderdom van hul teikenmark groter as 18 is. Indien die statistiese toets H0 nie
verwerp nie, sal die bestuur tot die gevolgtrekking kom dat die gemiddelde ouderdom van
hul teikenmark 18 of jonger is.
Daar word ook tussen drie tipes hipoteses onderskei. Dit is belangrik om die regte tipe te
kies, omdat dit ʼn invloed op die statistiese berekeninge sal hê. Hierdie tipes word in meer
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 82
detail onder Stap 1, Paragraaf 8.2 in die handboek, beskryf en word in Figuur 3.1 hieronder
opgesom:
Figuur 3. 1: Tipes hipoteses
(Bron: Wegner, 2013: 188 – 189)
Om ʼn hipotese te toets, word vyf stappe gevolg. Hierdie stappe word in Paragraaf 8.2 in die
handboek in detail beskryf. Hierdie stappe vorm die grondslag vir alle werk wat in die res van
hierdie vak behandel word. Dit is dus belangrik om alles wat in Paragraaf 8.2 in die
handboek bespreek word, ten volle te verstaan.
Stap 1 beskryf die tipes hipoteses, asook die nul- en alternatiewe hipoteses, soos hierbo
bespreek.
Stap 2 bespreek die kriteria waarvolgens die nulhipotese verwerp sal word. Die vlak van
sekerheid word gebruik om die area, waar die hipotese nie verwerp sal word nie, uit een te
sit. Die betekenispeil (level of significance) word dan gebruik om die area (oppervlakte) waar
die nulhipotese verwerp sal word, te spesifiseer. Hierdie statistiek, voorgestel deur die C-
teken, word vanaf die vlak van sekerheid verkry en is gewoonlik 0.01, 0.05 of 0.1.
Dit is ook belangrik om na die grafiese voorstelling van hierdie areas te kyk. Vir hipoteses
wat nie rigting (> en <) aandui nie, word C se waarde in twee gedeel om beide "sterte" van
die normaalverdeling in te sluit. Die z- of t-statistieke wat gebruik word, sal dus verskil vir die
twee tipes hipotese. Vir oefening is dit ʼn goeie idee om die normaalverdeling hier te
teken en die toetsstatistiek (in Stap 3 bereken) daarop aan te dui.
Die derde stap behels die berekening van die toetsstatistiek. Hierdie is die statistiek wat met
die C vergelyk moet word om te bepaal of H0 verwerp gaan word. Die toetsstatistiek word
bereken met data wat van die steekproef verkry word en, afhangende van of die
populasiegemiddeld bekend is, $ of s.
In Stap 4 word die toetsstatistiek met die C en die areas van aanvaarding en verwerping
vergelyk. Indien die toetsstatistiek binne die area van aanvaarding (90%, 95% of 99% van
Tweekantige (Two sided) hipotese
•Gebruik nie groter of kleiner as tekens nie. Toets slegs of ʼn populasieveranderlike gelyk of
ongelyk is aan ʼn spesifieke waarde
Regskantige (One-sided upper tailed) hipotese
•Bepaal of die populasieveranderlike groter as ʼn spesifieke waarde is
Linkskantige (One-sided lower tailed) hipotese
•Bepaal of die populasieveranderlike kleiner is as ʼn spesifieke waarde
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 3: Vertrouensintervalle en hipotesetoetsing: Deel I Bladsy 83
die totale area) val, word H0 nie verwerp nie. Indien dit egter in die area van verwerping val,
word H0 verwerp.
In die vyfde stap word gevolgtrekkings gemaak. ʼn Tipiese gevolgtrekking is: Die gemiddelde
ouerdom van ons teikenmark is hoër as 18.
3.6.2 Hipotesetoetsing vir ʼn populasiegemiddeld (slegs een � en � is bekend)
Bestudeer die handboek: Paragraaf 8.3
Die eerste hipotesetoetse wat gedoen word, is vir ʼn enkele populasiegemiddeld. Daar sal
later na meer gemiddelde en die verskille tussen gemiddelde gekyk word. Soos met
vertrouensintervalle, word daar gekyk na populasies waar $ bekend is en dié waar $ nie
bekend is nie. Vir alle hipotesetoetse sal dieselfde vyf stappe gebruik word.
Doen nou Voorbeeld 8.1 in die handboek
Hierdie voorbeeld pas die vyf stappe van hipotesetoetsing toe op data waar die
populasiestandaardafwyking (A) bekend is.
Onthou: dit is belangrik om altyd die normaalverdeling te teken en die areas van
aanvaarding en verwerping te teken en dan die betrokke z-waardes en toetsstatistieke
daarop aan te dui. Sodoende is dit baie makliker om te bepaal of die hipotese verwerp
kan word.
3.6.3 Hipotesetoetsing vir ʼn populasiegemiddeld (slegs een � en � is onbekend)
Bestudeer die handboek: Paragraaf 8.4
Soos met vertrouensintervalle word die t-statistiek gebruik wanneer $ onbekend is. Verder
bly die hipotesetoets dieselfde.
Doen Voorbeeld 8.3 in die handboek
Hier word van jou verwag om self s te bereken. Verwys weer na Hoofstuk 3 in die handboek
hiervoor.
3.6.4 Hipotesetoetsing deur die p-waarde te gebruik
Bestudeer die handboek: Paragraaf 8.6
Die p-waarde is in Studie-eenheid 2 reeds bespreek. Waar Studie-eenheid 2 die
interpretasie van die p-waarde beskryf het, word daar in Paragraaf 8.6 in die handboek
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 84
aangedui hoe hierdie waarde bereken kan word. Hierdie is dus ʼn alternatiewe wyse om ʼn
hipotesetoets te doen.
Hoofstuk 8 in die handboek het reeds beskryf hoe C gevind kan word. Die p-waarde word
met C vergelyk. Indien die p-waarde kleiner is as C, word H0 verwerp.
Waar die C-waarde die oppervlak van die verwerparea voorstel, word die toetsstatistiek (z-
of t-waarde) gebruik om p te bereken – p is dus ook ʼn oppervlakte.
p-waardes word in die praktyk gebruik wanneer statistiese ontledings deur programmatuur
gedoen word. Dit is dus belangrik om hiervan bewus te wees en ʼn p-waarde te kan
interpreteer.
3.6.5 Selfevalueringsvrae
Doen die volgende vrae aan die einde van Hoofstuk 8 in die handboek
• Vraag 5
• Vraag 6 (a) en (b) vir (i) tot (v)
• Vraag 7 (a) – (c)
• Vraag 8 (a) – (c)
• Vraag 9 (a) en (b)
• Vraag 10 (a) – (c)
• Vraag 11 (a) en (c)
• Vraag 12 (a)
• Vraag 13 (a)
• Vraag 14 (a)
3.7 Samevatting
ʼn Puntberaming word gemaak wanneer ʼn spesifieke statistiek (byvoorbeeld ʼn gemiddeld) vir
ʼn steekproef bereken word, en dan as beraming vir populasie gebruik word. Wanneer ʼn
vertrouensinterval bereken word, word twee grense vir ʼn spesifieke statistiek bereken. Die
populasiestatistiek sal dan, teen ʼn vasgestelde sekerheid, in hierdie interval voorkom.
Vertrouensintervalle kan onder verskeie omstandighede bereken word: 1) As die
populasiestandaardafwyking bekend is en 2) as die populasiestandaardafwyking nie bekend
is nie.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 3: Vertrouensintervalle en hipotesetoetsing: Deel I Bladsy 85
ʼn Hipotese is ʼn stelling wat deur statistiese berekening aanvaar of verwerp kan word. Deur
hipotesetoetsing wat met data uit die steekproef gedoen word, word bepaal of die hipotese
verwerp word al dan nie. Daar word tussen die volgende hipoteses onderskei:
1) tweekantige hipotese, 2) regskantige hipotese en 3) linkskantige hipotese.
Wanneer ʼn hipotese vir ʼn enkele populasiegemiddeld bereken word, word verskillende
toetse gebruik afhangende van of die populasiestandaardafwyking bekend is. Indien hierdie
standaardafwyking bekend is, word die z-toets gebruik. Indien nie, word die t-toets gebruik.
Enige hipotesetoets bestaan uit 5 stappe. Hierdie stappe is 1) formuleer die hipotese,
2) bepaal die areas van aanvaarding en verwerping (en dus die kritieke waarde), 3) bereken
die toetsstatistiek (in hierdie geval die z- of t-statistiek), 4) vergelyk die toetsstatistiek met die
areas van aanvaarding en verwerping en 5) maak bestuursgevolgtrekkings.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 86
Notas
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 4: Hipotesetoetsing: Deel II Bladsy 87
Studie-eenheid 4: Hipotesetoetsing: Deel II
4.1 Studie-eenheid leeruitkomstes
Kennis en begrip
Na voltooiing van Studie-eenheid 4 sal jy in staat wees om jou kennis en begrip te
demonstreer van die volgende:
• Hipotesetoetsing: Die verskil tussen die gemiddelde van twee populasies
• Hipotesetoetsing: Die D�- toets
• Hipotesetoetsing: Die verskil tussen gemiddeldes van meer as twee populasies
Vaardighede
Jy sal ook in staat wees om:
• ʼn hipotesetoets te doen om die verskil tussen twee onafhanklike
populasiegemiddelde te bepaal, as die populasiestandaardafwyking bekend is (z-
toets).
• ʼn hipotesetoets te doen om die verskil tussen twee onafhanklike
populasiegemiddelde te bepaal, as die populasiestandaardafwyking nie bekend is
nie (t-toets).
• ʼn hipotesetoets te doen om die verskil tussen twee afhanklike populasiegemiddelde
te bepaal (gepaarde t-toets).
• die D�- toets te doen om sodoende te toets of twee faktore afhanklik of onafhanklik
van mekaar is.
• ʼn ANOVA toets te doen deur die F-statistiek te bereken
4.2 Voorgeskrewe handboek
Wegner, T. 2013. Applied business statistics. 3rd Ed. Claremont: Juta.
• Hoofstuk 9,
• Hoofstuk 10
• Hoofstuk 11
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 88
4.3 Hoe kan jy jou begrip verbeter?
Jy moet seker maak dat jy die volgende terminologie verstaan:
Sleutelwoord Omskrywing
D� ʼn Statistiek wat gebruik word om die afhanklikheid tussen
waargeneemde frekwensies en verwagte frekwensies te toets.
ANOVA ʼn Statistiese toets wat die verskil tussen die gemiddelde van
meer as twee populasies vergelyk.
F-statistiek Die statistiek wat gebruik word om ʼn ANOVA toets uit te voer.
Gepaarde t-toets ʼn Toets wat gebruik word om die verskil tussen gemiddelde uit
twee afhanklike steekproewe te meet.
4.4 Inleiding
In Studie-eenheid 3 is die eerste tipe hipotesetoets bekendgestel: Die gemiddeld van ʼn
enkele populasie. In Studie-eenheid 4 word nog drie hipotesetoetse bespreek: Die verskil
tussen gemiddelde van twee populasies (byvoorbeeld manlike en vroulike kliënte), die D�-
toets (uitgespreek Chi-squared) en die ANOVA toets (Analise van variansie).
Wanneer die verskil tussen twee gemiddeldes bereken word, moet die aard van die data ook
in ag geneem word. Die twee steekproewe kan afhanklik of onafhanklik van mekaar wees. ʼn
Hipotesetoets van onafhanklike data moet ook in ag neem of die
populasiestandaardafwyking bekend is of nie. Daar sal dus drie verskillende hipotesetoetse
in hierdie studie-eenheid bespreek word.
Die D�-toets vergelyk individuele frekwensies: waargeneemde waardes word vergelyk met
verwagte waardes. Die hipotesetoets sal dan bepaal of data ʼn verwagte patroon volg.
Die ANOVA toets word gebruik om die verskil tussen gemiddelde van meer as twee
populasies te toets. Hierdie toets bepaal slegs of alle gemiddeldes van die verskeie
populasies gelyk is.
4.5 Hipotesetoets: Vergelyking van twee populasies
Bestudeer die handboek: Paragraaf 9.1 – 9.4 en 9.7 – 9.8
In Hoofstuk 8 in die handboek was die gemiddeld van een populasie se gemiddeld met ʼn
getal vergelyk. In Hoofstuk 9 word daar na twee verskillende gemiddeldes gekyk. Die
hipotese bepaal dan of daar ʼn verskil tussen hierdie twee gemiddeldes bestaan. Daar word
na drie verskillende gevalle gekyk. Hierdie drie gevalle word in Figuur 4.1 opgesom:
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 4: Hipotesetoetsing: Deel II Bladsy 89
Figuur 4. 1: Verskillende omstandighede waar twee populasiegemiddeldes vergelyk word
(Bron: Wegner: Hoofstuk 9)
4.5.1 Verskil tussen die gemiddelde in onafhanklike steekproewe, σ bekend
Bestudeer die handboek: Paragraaf 9.2
Die eerste geval behels die vergelyking van twee gemiddeldes waar die
populasiestandaardafwyking bekend is (en die z-statistiek gebruik kan word). Die
steekproewe is ook nie afhanklik van mekaar nie (die gemiddelde word nie van dieselfde
groep bereken nie.)
Dieselfde stappe vir hipotesetoetsing word gevolg (verwys na Studie-eenheid 3).
Stap 1 behels die formulering van ʼn nul- en alternatiewe hipotese. Hierdie is dieselfde as in
Hoofstuk 8 in die handboek, hoewel die µ met µ1 - µ2 vervang sal word, omdat daar na die
verskil verwys word. (Onthou dat die verskil tussen hierdie twee gemiddeldes ook ʼn enkele
getal is en dus maklik in ʼn vergelyk gebruik kan word: Bv. H0: µ1 - µ2>0 of µ1 - µ2<0.
In Stap 2 word die areas van aanvaarding en verwerping bereken. Hierdie is dieselfde as in
Hoofstuk 8 waar die z-statistiek gebruik is.
Stap 3 behels die berekening van die toetsstatistiek. Die toetsstatistiek word volgens
Formule 9.1 in die handboek bereken. Hoewel hierdie formule anders is as by ander
hipotesetoetsing, word die z-statistiek op dieselfde wyse geïnterpreteer. Stap 4 en 5 sal dus
dieselfde wees as vorige hipotesetoetse.
• Bv, die verskil tussen gemiddelde verkope by tak 1 en tak 2.
• Paragraaf 9.2 in die handboek
Steekproewe is onafhanklik van mekaar, σσσσ is bekendis bekendis bekendis bekend
• Paragraaf 9.3 in die handboek
Steekproewe is onafhanklik van mekaar, σσσσ is onbekendis onbekendis onbekendis onbekend
• Bv, die verskil tussen werknemers se afwesighede in maand 1 en maand 2
• Die werknemers bly dieselfde, maar die tyd of omstandighede verander
• Paragraaf 9.4 in die handboek
Steekproewe is nie onafhanklik nie
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 90
Vir die z-statistiek in hierdie geval, word die volgende waardes benodig (sien Formule 9.1 in
die handboek):
• x̄1 en x̄2: Hierdie is die gemiddelde van die twee, onafhanklik steekproewe wat
gevind is.
• n1 en n2: Hierdie is die groottes van die twee verskillende steekproewe
• σ1 en σ2: Die standaardafwyking van die twee populasies van waar die steekproewe
verkry is.
• α: Die alfa-waarde word verkry vanaf die vlak van sekerheid en kan 0.01, 0.05 of 0.1
wees.
Doen nou Voorbeeld 9.1 in die handboek
Vraag (a) behels ʼn tweekantige hipotesetoets.
Vraag (b) behels ʼn eenkantige hipotesetoets.
Stap 2 en stap 4 sal veral deur hierdie verskil beïnvloed word.
4.5.2 Verskil tussen twee gemiddeldes: Onafhanklike steekproewe en σ is onbekend
Bestudeer die handboek: Paragraaf 9.3
Wanneer die populasiestandaardafwyking nie bekend is nie, word die t-statistiek in plaas
van die z-statistiek gebruik. Vir hierdie tipe hipotese word ʼn ander formule (as vir een
populasie) gebruik. Die stappe van hipotesetoetsing word gevolg:
Stap 1 is dieselfde as in Paragraaf 4.5.2 hierbo.
Stap 2 verskil van die hipotese wat in Paragraaf 4.5.2 hierbo getoets is. Omdat die t-
statistiek gebruik word as toetsstatistiek, sal die kritieke waarde ook ʼn t-statistiek wees (en
nie ʼn z-statistiek nie). Om die kritieke waarde te kry, word die grade van vryheid (df) en C
gebruik.
• α is reeds verkry vanaf die vlak van sekerheid.
• df word verkry deur die formule n1 + n2 - 2 (n1 en n2 stel onderskeidelik die eerste en
tweede steekproewe se groottes voor).
In Stap 3 word die toetsstatistiek bereken. Hiervoor word Formule 9.2 in die handboek
gebruik. Hierdie formule mag dalk intimiderend voorkom, maar al die waardes wat daarvoor
benodig word, is reeds bekend:
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 4: Hipotesetoetsing: Deel II Bladsy 91
• x̄1 en x̄2: Hierdie word uit die steekproewe bereken.
• µ1 en µ2: Die nulhipotese aanvaar dat die twee populasies se gemiddelde dieselfde
is. Dus is die verskil tussen hierdie twee waardes 0 en kan buite rekening gelaat
word.
• n1 en n2: Die groottes van die twee steekproewe.
• s1 en s2: Die standaardafwykings van die twee steekproewe.
In Stap 4 en Stap 5 word die toetsstatistiek met die kritieke waarde vergelyk en ʼn
gevolgtrekking word gemaak. Hierdie is dieselfde as in Paragraaf 4.5.1 hierbo.
Doen nou Voorbeeld 9.2 in die handboek.
4.5.3 Die verskil tussen twee gemiddeldes: Steekproewe is nie onafhanklik nie
Bestudeer die handboek: Paragraaf 9.4
Hierdie tipe hipotese word gebruik wanneer ʼn steekproef twee maal uit dieselfde populasie
verkry word, maar op verskillende tye, of onder verskillende omstandighede. Soos by
Paragraaf 4.5.1 en 4.5.1 hierbo, word die verskil tussen die twee gemiddeldes ook gebruik.
Daar word egter van die t-statistiek gebruik gemaak, met ʼn nuwe formule. (Hierdie statistiese
toets word die gepaarde t-toets, of matched-pair t-test genoem.) Die verskil tussen hierdie
twee gemiddelde word as µd voorgestel.
Die stappe vir hipotesetoetsing kan soos volg beskryf word:
Stap 1 behels die formulering van die hipotesestellings. Hierdie stap word soos in alle vorige
gevalle uitgevoer, met die uitsonder dat µd in die hipotesestellings gebruik word,
byvoorbeeld:
H0: µd = 0
In Stap 2 word die areas van aanvaarding en verwerping weer uiteengesit. Omdat daar met
die t-statistiek gewerk gaan word, sal die t-tabel hiervoor gebruik word. Verder is hierdie stap
dieselfde as vorige hipotesetoetse waar die t-statistiek as kritieke waarde gebruik is.
Om die t-statistiek in Stap 3 te bereken, word Formule 9.5 in die handboek gegee. Hiervoor
word die volgende benodig:
• x̄d: Hierdie statistiek kan bereken word deur Formule 9.3 in die handboek te gebruik.
Dit word bepaal deur die verskil tussen elke stel waardes (bv. werknemer A se
afwesighede in Maand 1, minus dieselfde werknemer se afwesighede in Maand 2)
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 92
bymekaar te tel, en dan te deel deur die hoeveelheid observasies (bv. hoeveelheid
werknemers).
• µd: Die populasiegemiddeld van die verskille is nie bekend nie, maar word gelyk
gestel aan nul, omdat dit so deur die nulhipotese bepaal word.
• sd: Hierdie statistiek word deur middel van Formule 9.4 in die handboek bereken.
• n is die hoeveelheid elemente in die steekproef.
Stap 4 en Stap 5 is weer eens dieselfde as vorige hipotesetoetse.
Doen nou Voorbeeld 9.3 in die handboek
4.5.4 Selfevalueringsvrae
Voltooi die volgende vrae aan die einde van Hoofstuk 9:
• Vraag 1
• Vraag 2
• Vraag 6
• Vraag 7 (a) – (d)
• Vraag 8 (a) – (c)
• Vraag 9
• Vraag 10
• Vraag 11 (a) en (b)
• Vraag 12
• Vraag 13 (a) – (c)
• Vraag 14
4.6 Hipotesetoets: ��
4.6.1 Die ��-toets
Bestudeer die handboek: Paragraaf 10.1 – 10.2
Die N�-statistiek word gebruik om die onafhanklikheid van ʼn spesifieke veranderlike te toets
deur waarneembare en verwagte frekwensies met mekaar te vergelyk. Dieselfde vyf
stappe vir hipotesetoetsing word gebruik, terwyl die formule vir N� (Chai squared) as
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 4: Hipotesetoetsing: Deel II Bladsy 93
Formule 10.1 in die handboek gegee word. Die data wat vir hierdie toets verskaf word, sal in
tabelvorm voorkom, waar r die hoeveelheid rye en c die hoeveelheid kolomme in hierdie
tabel sal voorstel.
Die vyf stappe vir hipotesetoetsing word gevolg:
Tydens Stap 1 word die nul- en alternatiewe hipotesestellings geformuleer. Omdat twee
stelle data (waarvan slegs een stel fisies versamel is) met mekaar vergelyk word, sal die
hipotesestellings anders voorkom. In die voorbeeld wat gedoen gaan word (Voorbeeld 10.1),
sal die nulhipotese aandui dat geen verwantskap tussen geobserveerde en verwagte
waardes bestaan nie. Dit beteken dat hierdie twee stelle data onafhanklik is. Die
alternatiewe hipotese sal aandui dat die twee stelle data wel verwant is.
Stap 2: Die areas van aanvaarding en verwerping van die nulhipotese sal anders bereken
word as vir vorige hipotesetoetse. In hierdie geval word die N�-tabel gebruik (Tabel 3,
Aanhangsel A in die handboek).
Om die kritieke waarde in die N�-tabel te vind, is die volgende nodig:
• df: (grade van vryheid, of degrees of freedom): Die formule vir df word as
Formule 10.2 in die handboek verskaf. Die hoeveelheid rye en kolomme word vir
hierdie formule benodig.
• α-waarde: Hierdie word verkry deur die voorafbepaalde vlak van sekerheid en sal
tipies 0.01, 0.05 of 0.1 wees.
Waar die df-kolom en die α-ry kruis, sal die kritieke waarde vir N� gevind word.
Om die toetsstatistiek in Stap 3 te bereken, is ʼn redelike omslagtige proses, maar nie moeilik
nie. Om die berekening te vergemaklik word N� deur middel van ʼn tabel bepaal. Elke stap in
die formule word dan as ʼn kolom weergegee (sien Voorbeeld 10.1, Tabel 10.5 in die
handboek vir verwysing). Die volgende kolomme kom in die tabel wat hiervoor gebruik word,
voor:
• Kolom 1: Die waarneembare waardes word hier uiteengesit. Hierdie data is deur ʼn
steekproef versamel en stel die frekwensies voor. Die waarneembare waardes word
deur die simbool fo voorgestel.
• Kolom 2: Die verwagte waardes. Hierdie waardes moet bereken word deur
Formule 10.3 in die handboek en die waarneembare waardes as grondslag te
gebruik. Die verwagte waardes word deur die simbool fe voorgestel.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 94
• Kolom 3: Hierdie kolom behels die deel van die D�-formule aan die bokant van die
breuk, naamlik (fo-fe)�. Die verskil tussen die twee waardes word gekwadreer om
moontlike negatiewe getalle, positief te maak.
• Kolom 4: Al die waardes wat in die vorige kolomme bereken is, word nou
saamgevoeg in die formule vir D�. Die Σ-teken in die formule beteken dat al die
waardes in die laaste kolom bymekaar getel moet word om die D�-toetsstatistiek te
verkry.
Stap 4 en 5 behels weer eens die interpretasie van die toetsstatistiek (D�).
Om die berekening van die toetsstatistiek N� beter te verstaan, moet bostaande beskrywing
saam met Voorbeeld 10.1 in die handboek deurgewerk word.
Doen nou Voorbeeld 10.1 in die handboek.
4.6.2 Selfevalueringsvrae
Doen die volgende vrae aan die einde van Hoofstuk 10 in die handboek:
• Vraag 5
• Vraag 6 (a) en (b)
• Vraag 7 (a) en (b)
• Vraag 8 (a) – (c)
4.7 Hipotesetoets: ANOVA
4.7.1 ANOVA en die F-statistiek
Bestudeer die handboek: Paragraaf 11.1 – 11.5.
Die t-toets en z-toets is vroeër gebruik om die verskil tussen twee populasies se
gemiddeldes te bereken. ANOVA (Analysis of Variance) word gebruik om die verskille
tussen meer as twee populasiegemiddeldes te toets.
Die toetsstatistiek word die F-statistiek genoem. Om hierdie statistiek te bereken neem tyd,
omdat dit deur ʼn groot aantal ander berekeninge voorafgegaan moet word. Dit is egter nie
ingewikkelde formules nie. Die beste manier om ʼn F-statistiek te bereken, is om by die
formule (Formule 11.10 in die handboek) te begin. Die formule lyk eenvoudig, omdat dit
bloot uit twee veranderlikes bestaan: MST en MSE, maar MSE en MST moet ook bereken
word en die veranderlikes wat vir elk van hierdie benodig word, vereis ook ʼn aantal
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 4: Hipotesetoetsing: Deel II Bladsy 95
berekeninge. Die volgende terminologie sal by die berekening van die F-statistiek gevind
word (die terminologie sal aan die hand van Tabel 11.1 in die handboek bespreek word):
• Grade van vryheid (degrees of freedom): Hier word verwys na d1 en d2:
o d1 is die grade van vryheid vir elkeen van die kleiner steekproewe.
Voorbeeld 11.1 in die handboek het drie kleiner steekproewe wat onderskeidelik
uit 6, 4 en 5 waardes bestaan.
o d2 is die grade van vryheid vir die totale steekproef (dus A, B en C saamgevoeg)
wat in hierdie geval uit 15 waardes bestaan.
o SST: Formule 11.4 in die handboek word gebruik om dit te bereken. Die verskil
tussen die totale gemiddeld en die gemiddeld van elke steekproef word bepaal,
gekwadreer en met die hoeveelheid waardes in daardie kategorie
vermenigvuldig, en dan bymekaar getel.
o SSE: Formule 11.5 word gebruik om dit te bereken. Hier word die verskil tussen
elke steekproef se gemiddeld en elke waarde van die steekproef bereken,
gekwadreer en bymekaar getel. Die waardes wat sodoende vir die drie
steekproewe gevind word, word dan ook bymekaar getel om SSE te verkry.
o MST: MST word verkry deur Formule 11.8 in die handboek te gebruik. Dit deel
SST deur df1.
o MSE: MSE word verkry deur Formule 11.9 in die handboek te gebruik. Dit deel
SSE deur df2.
o F-statistiek: Hierdie is die kritieke waarde wat bereken word vir
hipotesetoetsing. Die formule hiervan word as Formule 11.10 in die handboek
weergegee.
Die F-statistiek kan dus stelselmatig bereken word deur die volgende stappe te volg:
• Bereken SST (Formule 11.4 in die handboek)
• Bereken SSE (Formule 11.5)
• Bepaal k-1
• Bepaal N-k
• Bereken MST (Formule 11.8)
• Bereken MSE (Formule 11.9
• Bereken die F-statistiek
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 96
Moet ek hierdie stappe onthou?
Dit is nie nodig om hierdie stappe te memoriseer nie. Hierdie stappe kan van die F-statistiek
se formule afgelei word. Byvoorbeeld, om die F-statistiek te bereken, word ʼn waarde vir
MSE en MST benodig. Uit MSE se formule word dit duidelik dat ʼn waarde vir SSE benodig
word. Net so, sal uit MST se formule duidelik word dat ʼn waarde vir SST benodig word. As
SST en SSE bereken is, kan jy voortgaan met die berekening van MSE en MST en as MSE
en MST bereken is, kan die waardes in die F-statistiek se formule geplaas word.
Om leesbaarheid te vergemaklik, word die verskillende waardes wat bereken moet word, in
ʼn sogenaamde ANOVA tabel geplaas. Hierdie tabel se formaat en struktuur word in
Tabel 11.4 in die handboek verskaf. Die tabel word toepas op Voorbeeld 11.1 in Tabel 11.3
in die handboek.
Doen nou Voorbeeld 11.1 om te verseker dat jy die F-statistiek kan bereken.
4.7.2 Selfevalueringsvrae
Doen die volgende vrae aan die einde van Hoofstuk 11 in die handboek:
• Vraag 4
• Vraag 5
• Vraag 7 (a) – (d)
• Vraag 8 (a) en (b)
• Vraag 9 (a) en (b)
• Vraag 10
• Vraag 11 (a) – (c)
• Vraag 12 (a) – (c)
• Vraag 13 (a) – (e)
• Vraag 14 (a) – (d)
• Vraag 15 (a) – (d)
GQM105 Inleiding tot elementêre kwantitatiewe metodes
Studie-eenheid 4: Hipotesetoetsing: Deel II Bladsy 97
4.8 Samevatting
Om die verskil tussen die gemiddelde van twee populasies te toets, moet ʼn besluit tussen
die z-toets, t-toets of die gepaarde t-toets gemaak word. Vir onafhanklike populasies waar
die populasiestandaardafwyking bekend is, word die z-toets gebruik. Vir onafhanklike
populasies waar die populasiestandaardafwyking nie bekend is nie, word die t-toets gebruik.
Vir afhanklike populasies (byvoorbeeld dieselfde respondente en dieselfde veranderlikes
word getoets onder verskillende omstandighede) word die gepaarde t-toets gedoen.
Die D�- toets word hoofsaaklik gebruik om waarneembare frekwensies te vergelyk met dié
van ʼn verwagte verspreiding. Met hierdie toets kan bepaal word of data ʼn sekere patroon
(soos ʼn normaalverdeling) volg.
Die F-statistiek word gebruik om die ANOVA toets te doen. Hierdie toets bepaal slegs of alle
gemiddeldes (van die onderskeie populasies) dieselfde is. Indien die nulhipotese (dat alle
gemiddelde dieselfde is) verwerp word, is dit steeds moontlik om met ʼn t-toets of z-toets
(sien Hoofstuk 8) te bepaal of enige twee pare gemiddelde dieselfde is.
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 98
Afrikaans/Engelse terme
Afrikaans Engels
Alternatiewe hipotese Alternative hypothesis
Analise van variansie (ANOVA) Analysis of variance
Beskrywende statistiek Descriptive statistics
Betekenispeil Level of significance
Houer-en-punt-stipping Box plot
Ewekansige veranderlike Random variable
Gepaarde t-toets Matched pair t-test
Gesamentlik uitputbaar Collectively exhaustive
Gesamentlike waarskynlikhede Joint probabilities
Hipotese (meervoud: Hipoteses) Hypothesis (Meervoud: Hypotheses)
Inferensiële/Afleidende statistiek Inferential statistics
Kolomgrafiek Bar chart
Kombinasie Combination
Kwalitatief Qualitative
Kwantiel Quartile
Kwantitatief Quantitative
Mediaan Median
Meervoudige kolomgrafiek Multiple bar chart
Modus Mode
Normale verdeling Normal distribution
Nulhipotese Null/Zero hypothesis
Onderling uitsluitend Mutually exclusive
GQM105 Inleiding tot elementêre kwantitatiewe metodes
©akademia (MSW) Bladsy 99
Permutasie Permutation
Populasie Population
Puntberaming Point estimate
Reikwydte Range
Rekenkundige gemiddeld Arithmetic mean
Samevoeging Union
Sirkelgrafiek Pie chart
Skeefheid Skewness
Snyding Intersection
Standaardafwyking Standard deviation
Steekproef Sample
Steekproef-eenheid Sampling unit
Uitskieters Outliers
Variansie Variance
Vertrouensinterval Confidence interval
Vlak van sekerheid Level of confidence
Voorwaardelike waarskynlikheid Conditional probabilities
Vraelyste Surveys / Questionnaires
Waarskynlikheidsboomdiagram Probability tree
Elementêre Kwantitatiewe Metodes (GQM105)Handboek: Wegner, T. 2013. Applied business statistics. 3rd Ed. Claremont: Juta.
Elementêre kwantitatiewe metodes behels ’n aantal statistiese tegnieke wat die interpretasie van ’nverskeidenheid data vergemaklik. Die tipes en volumes van data wat deur organisasies versamel word,maak dit soms moeilik of onmoontlik om hierdie data deur blote observasies te interpreteer. ’nVerskeidenheid statistieke en statistiese berekeninge maak hierdie interpretasie moontlik en makliker.
Hierdie vak word hoofsaaklik in vier afdelings verdeel. Eerstens, word ’n inleiding verskaf oor die aardvan, en behoefte aan, statistiese berekeninge.
Wanneer data versamel word, moet die aard van die data op ’n beskrywende manier voorgestelword. Hierdie statistieke, wat beide grafieke en numeriese berekeninge insluit, word beskrywendestatistiek genoem. Studie-eenheid 1 bespreek onderskeidelik die grafiese en numeriese voorstellingvan data.
Die derde afdeling verskaf ’n grondslag vir inferensiële of afleidende statistiek (inferential statistics)– die berekeninge wat gebruik word om ’n kleiner groep data (steekproef) op ’n groter groep(populasie) van toepassing te maak. Waarskynlikhede, waarskynlikheidsverspreidings, en steekproeween steekproefverspreidings word in Studie-eenheid 2 bespreek. Die laaste afdeling wat in hierdie vakbehandel word, is hipotesetoetsing. Hier word sekere stellings oor eienskappe van die populasie (ofpopulasies) statisties getoets.
Studie-eenheid 3 verskaf ’n grondslag vir hipotesetoetsing. Die wyse waarop hipotese, wat met ’nenkele populasiegemiddeld te doen het, getoets word, word ook hier bespreek.
Studie-eenheid 4 bou hierop voort deur ander gevalle van hipotesetoetsing te bespreek. Dit sluit,onder andere, hipotesetoetsing ten opsigte van gemiddelde oor twee of meer populasies in.
a k a d e m i aAkademia MSW (Maatskappyregistrasienommer: 2005/024616/08) is voorwaardelik by die Departement van Hoër Onderwys en Opleiding tot
31 Desember 2016 as privaat hoëronderwysinstelling geregistreer ingevolge die Wet op Hoër Onderwys, 1997, Registrasienommer: 2011/HE08/005.
Akademia is deel van die Solidariteit Beweging
w w w. a k a d e m i a . a c . z a