elementere kwantitatiewe metodes gqm105 (b.com)

ElementêreKwantitatiewe Metodes

a k a d e m i aAkademia MSW (Maatskappyregistrasienommer: 2005/024616/08) is voorwaardelik by die Departement van Hoër Onderwys en Opleiding tot

31 Desember 2016 as privaat hoëronderwysinstelling geregistreer ingevolge die Wet op Hoër Onderwys, 1997, Registrasienommer: 2011/HE08/005.

Akademia is deel van die Solidariteit Beweging

w w w. a k a d e m i a . a c . z a

ElementêreKwantitatiewe Metodes

© Kopiereg 2014

Onder redaksie van: Paul JN Steyn, BA (PU vir CHO), THOD (POK), DEd (Unisa)

Skrywer: Johann Smith

Onderwysontwerp, bladuitleg & taalversorging: Dr. Daleen van Niekerk

’n Publikasie van Akademia. Alle regte voorbehou.

Adres: H/v D.F. Malan- & Eendrachtstraat, Kloofsig, Pretoria

Posadres: Posbus 11760, Centurion, 0046

Webtuiste: www.akademia.ac.za

Geen gedeelte van hierdie boek mag sonder die skriftelike toestemming van die uitgewers

gereproduseer of in enige vorm of deur enige middel weergegee word nie,

hetsy elektronies of deur fotokopiëring, plaat- of bandopnames, vermikrofilming

of enige ander stelsel van inligtingsbewaring nie. Enige ongemagtigde weergawe van hierdie werk sal as ’n

skending van kopiereg beskou word en die dader sal aanspreeklik gehou word onder siviele asook strafreg.

GQM105 Inleiding tot elementêre kwantitatiewe metodes

©akademia (MSW) Bladsy 1

Inhoudsopgawe

Programoorsig ................................................................................................................. 1

Inleiding ............................................................................................................................. 5

Vakleeruitkomste ........................................................................................................... 6

Woordomskrywing vir evaluering ........................................................................... 7

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek ................... 9

1.1 Studie-eenheid leeruitkomstes ........................................................................................... 9

1.2 Voorgeskrewe handboek .................................................................................................... 9

1.3 Hoe kan jy jou begrip verbeter? ....................................................................................... 10

1.4 Inleiding ................................................................................................................................ 11

1.5 Basiese begrippe en beginsels van statistiek ................................................................ 12

1.5.1 Wat is statistiek? ............................................................................................................. 12

1.5.2 Data .................................................................................................................................. 15

1.5.3 Selfevalueringsvrae........................................................................................................ 17

1.6 Beskrywende statistiek ...................................................................................................... 17

1.6.1 Grafiese beskrywende statistiek vir kategoriese data .............................................. 18

1.6.2 Grafiese voorstelling van numeriese data: Een veranderlike .................................. 22

1.6.3 Grafiese voorstelling van numeriese data: Twee veranderlikes ............................. 26

1.6.4 Pareto se kurwe .............................................................................................................. 30

1.6.5 Excel ................................................................................................................................. 30

1.6.6 Selfevalueringsvrae: Hoofstuk 2 .................................................................................. 30

1.7 Numeriese beskrywende statistiek .................................................................................. 30

1.7.1 Maatstawwe van lokaliteit <sentrale neiging> ........................................................... 30

1.7.2 Nie-sentrale maatstawwe van lokaliteit ....................................................................... 38

1.7.3 Maatstawwe van spreiding ............................................................................................ 41

1.7.4 Maatstawwe van skeefheid ........................................................................................... 44

1.7.5 Keuse van statistiek en MS Excel ................................................................................ 48

1.7.6 Selfevaluering: Hoofstuk 3 ............................................................................................ 48

1.8 Samevatting ........................................................................................................................ 48



Studie-eenheid 2: Waarskynlikhede en steekproewe ..................................... 51

2.1 Studie-eenheid leeruitkomstes ......................................................................................... 51

2.2 Voorgeskrewe handboek .................................................................................................. 51


2.4 Inleiding ................................................................................................................................ 52

2.5 Waarskynlikhede ................................................................................................................ 53

2.5.1 Basiese beginsels en konsepte van waarskynlikhede ............................................. 53

2.5.2 Berekening van waarskynlikhede ................................................................................ 56

2.5.3 Waarskynlikheidsreëls ................................................................................................... 58

2.5.4 Telreëls: Permutasies en kombinasies ....................................................................... 59


2.6 Waarskynlikheidsverspreidings ........................................................................................ 62

2.6.1 Diskrete waarskynlikheidsverspreidings ..................................................................... 64

2.6.2 Die normaalverdeling ..................................................................................................... 67


2.7 Steekproewe ....................................................................................................................... 71

2.7.1 Steekproefmetodes ........................................................................................................ 71

2.7.2 Die steekproefverspreiding ........................................................................................... 72


2.8 Samevatting ........................................................................................................................ 74

Studie-eenheid 3: Vertrouensintervalle en hipotesetoetsing: Deel I ......... 75




3.4 Inleiding ................................................................................................................................ 76

3.5 Vertrouensintervalle ........................................................................................................... 77

3.5.1 Puntberamings en vertrouensintervalle ...................................................................... 77

3.5.2 Vertrouensinterval vir µ: � bekend ............................................................................... 77

3.5.3 Vertrouensinterval vir µ: � bekend ............................................................................... 79


3.6 Hipotesetoetsing vir een populasie .................................................................................. 81

3.6.1 Hipotesetoetsing ............................................................................................................. 81

3.6.2 Hipotesetoetsing vir ŉ populasiegemiddeld (slegs een � en � is bekend) ............ 83



3.6.3 Hipotesetoetsing vir ŉ populasiegemiddeld (slegs een � en � is onbekend) ....... 83

3.6.4 Hipotesetoetsing deur die p-waarde te gebruik ......................................................... 83


3.7 Samevatting ........................................................................................................................ 84

Studie-eenheid 4: Hipotesetoetsing: Deel II ........................................................ 87




4.4 Inleiding ................................................................................................................................ 88

4.5 Hipotesetoets: Vergelyking van twee populasies .......................................................... 88

4.5.1 Verskil tussen die gemiddelde in onafhanklike steekproewe, σ bekend ............... 89

4.5.2 Verskil tussen twee gemiddeldes: Onafhanklike steekproewe en σ is onbekend 90

4.5.3 Die verskil tussen twee gemiddeldes: Steekproewe is nie onafhanklik nie .......... 91


4.6 Hipotesetoets: �� ............................................................................................................... 92

4.6.1 Die ��-toets ..................................................................................................................... 92


4.7 Hipotesetoets: ANOVA ...................................................................................................... 94

4.7.1 ANOVA en die F-statistiek ............................................................................................ 94


4.8 Samevatting ........................................................................................................................ 97

Afrikaans/Engelse terme ........................................................................................... 98



Programoorsig

Inleiding tot

elementêre

kwantitatiewe metodes

GQM105

Studie-eenheid 1:

Basiese beginsels en

beskrywende

statistiek

Studie-eenheid 2:

Waarskynlikhede en

steekproewe

Studie-eenheid 3:

Vertrouensintervalle

en hipotesetoetsing,

Deel I

Studie-eenheid 4:

Hipotesetoetsing,

Deel II

Bedryfsetiek

GBE105

Studie-eenheid 1: Die etiese

dimensie van sake

Studie-eenheid 2: Teorieë oor etiek

en sake

Studie-eenheid 3: Etiek in die

sakeomgewing

Studie-eenheid 4: Etiese besluitneming

in sake

Studie-eenheid 5: Die bestuur van etiese prestasie

Ondernemings-

bestuur I

GBM105

Studie-eenheid 1: Inleiding tot

Ondernemings-bestuur

Studie-eenheid 2: Die nuwe

sakeonderneming

Studie-eenheid 3: Algemene

bestuursbeginsels

Studie-eenheid 4: Bestuursfunksies

Deel I

Studie-eenheid 5: Bestuursfunksies

Deel II

Inleiding tot

Bedryfsinligting-

stelsels

GBI105

Studie-eenheid 1: Inleiding tot

bedryfsinligting-stelsels

Studie-eenheid 2: Inligtingstegnologie-

infrastruktuur

Studie-eenheid 3: Toepassings van bedryfsinligting-stelsels: Deel I

Studie-eenheid 4: Toepassings van bedryfsinligting-stelsels: Deel II

Studie-eenheid 5: Die bestuur van bedryfsinligting-

stelsels

Bedryfs-

kommunikasie

GBC105

Studie-eenheid 1: Grondbeginsels van

bedryfs-kommunikasie

Studie-eenheid 2: Verbale

kommunikasie in die werksplek

Studie-eenheid 3: Interne en eksterne

interaksie

Handelsreg

GCL105

Studie-eenheid 1: Inleiding tot Handelsreg

Studie-eenheid 2: Algemene beginsels

van Kontraktereg

Studie-eenheid 3: Kontrakte

Studie-eenheid 4: Ander aspekte van

Handelsreg

Ekonomie

GEC105

Studie-eenheid 1: Mikro-ekonomie:

Deel I

Studie-eenheid 2: Mikro-ekonomie:

Deel II

Studie-eenheid 3: Makro-ekonomie:

Deel I


Deel II


Deel III

BCom Ondernemingsbestuur

Eerste Jaar



Inleiding

Elementêre kwantitatiewe metodes behels ŉ aantal statistiese tegnieke wat die interpretasie

van ŉ verskeidenheid data vergemaklik. Die tipes en volumes van data wat deur

organisasies versamel word, maak dit soms moeilik of onmoontlik om hierdie data deur blote

observasies te interpreteer. ŉ Verskeidenheid statistieke en statistiese berekeninge maak

hierdie interpretasie moontlik en makliker.

Hierdie vak word hoofsaaklik in vier afdelings verdeel. Eerstens, word ŉ inleiding verskaf oor

die aard van, en behoefte aan, statistiese berekeninge.

Wanneer data versamel word, moet die aard van die data op ŉ beskrywende manier

voorgestel word. Hierdie statistieke, wat beide grafieke en numeriese berekeninge insluit,

word beskrywende statistiek genoem. Studie-eenheid 1 bespreek onderskeidelik die

grafiese en numeriese voorstelling van data.

Die derde afdeling verskaf ŉ grondslag vir inferensiële of afleidende statistiek (inferential

statistics) – die berekeninge wat gebruik word om ŉ kleiner groep data (steekproef) op ŉ

groter groep (populasie) van toepassing te maak. Waarskynlikhede,

waarskynlikheidsverspreidings, en steekproewe en steekproefverspreidings word in Studie-

eenheid 2 bespreek.

Die laaste afdeling wat in hierdie vak behandel word, is hipotesetoetsing. Hier word sekere

stellings oor eienskappe van die populasie (of populasies) statisties getoets.

Studie-eenheid 3 verskaf ŉ grondslag vir hipotesetoetsing. Die wyse waarop ŉ hipotese, wat

met ŉ enkele populasiegemiddeld te make het, getoets word, word ook hier bespreek.

Studie-eenheid 4 bou hierop voort deur ander gevalle van hipotesetoetsing te bespreek. Dit

sluit, onder andere, hipotesetoetsing ten opsigte van gemiddelde oor twee of meer

populasies in.

Voorgeskrewe handboek

Vir hierdie vak is die volgende handboek voorgeskryf:

Wegner, T. 2013. Applied business statistics. 3rd Ed. Claremont: Juta.

Die gedeeltes wat betrekking het op die inhoud van die studie-eenhede sal telkens aangedui

word. Die gids sal jou dan deur die handboek begelei en poog om moeilike gedeeltes toe te

lig; om aan te vul waar nodig en om die belangrike gedeeltes uit te wys.

Vir eksamendoeleindes moet jy dus die voorgeskrewe gedeeltes in die handboek,

asook hierdie begeleidingsgids bestudeer.



Aanbevole bron

English – Afrikaans Glossary Of Statistical Terms, Editors: Faans Steyn, Chris Smit, Corna

Vorster, July 2009.

http://www.sastat.org.za/sites/default/files/documents/files/Eng_Afr_fin.pdf

http://www.sastat.org.za/sites/default/files/documents/files/Afr_Eng_fin.pdf

(Hierdie bronne is aanlyn beskikbaar en verskaf Afrikaanse vertalings vir Engelse statistiese

terme en selfs eenvoudige definisies. Dit is ŉ baie handige bron wanneer ŉ mens twyfel oor

die korrekte vertaling, konteks en betekenis.)

Vakleeruitkomste

Kennis en begrip

Na voltooiing van die vak INLEIDING TOT ELEMENTÊRE KWANTITATIEWE METODES

sal jy in staat wees om jou kennis en begrip te demonstreer van:

• Numeriese en grafiese beskrywende statistiek

• Waarskynlikhede en waarskynlikheidsverspreidings

• Steekproewe en steekproefverspreidings

• Vertrouensintervalle

• Hipotesetoetsing

Vaardighede

Jy sal ook in staat wees om:

• Data grafies voor te stel

• Data deur middel van basiese numeriese beskrywende statistiek voor te stel

• Basiese waarskynlikheidsberekeninge te doen

• Vertrouensintervalle op te stel

• ŉ Verskeidenheid tipes hipoteses te toets



Woordomskrywing vir evaluering

In die afdeling oor selfevaluering, asook in die werkopdragte sal daar van jou verwag word

om sekere take te verrig. Dit is belangrik dat jy presies weet wat van jou verwag word. Die

woordelys hieronder sal jou hiermee help.

Werkwoord Omskrywing

Wanneer daar van jou

verwag word om te:

Moet jy die volgende doen:

Lys Lys die name/items wat bymekaar hoort

Identifiseer Eien (ken uit) en selekteer die regte antwoorde

Verduidelik Ondersoek die moontlikhede, oorweeg en skryf dan jou

antwoord (verklaring/verduideliking) neer

Beskryf Omskryf die konsep of woorde duidelik

Kategoriseer/

klassifiseer

Bepaal tot watter klas, groep, afdeling bepaalde

items/voorwerpe behoort

Analiseer Om iets te ontleed

Evalueer Bepaal die waarde van ŉ stelling/stelsel/beleid/ens

Toepas Pas die teoretiese beginsels toe in ŉ praktiese probleem

Hersien Evalueer, verbeter en/of wysig ŉ beleid/dokument/stelsel/ens



Notas


Studie-eenheid 1: Basiese beginsels en beskrywende statistiek Bladsy 9

Studie-eenheid 1: Basiese beginsels en beskrywende statistiek

1.1 Studie-eenheid leeruitkomstes

Kennis en begrip

Na voltooiing van Studie-eenheid 1 sal jy in staat wees om jou kennis en begrip te

demonstreer van die volgende:

• Basiese statistiese begrippe

• Grafiese beskrywende statistiek

• Numeriese beskrywende statistiek

Vaardighede


• basiese statistiese begrippe te omskryf.

• ŉ keuse tussen ŉ verskeidenheid grafieke en tabelle te maak om verskillende data

grafiese voor te stel.

• verskillende numeriese beskrywende statistieke te bereken.

• ŉ keuse tussen ŉ verskeidenheid numeriese beskrywende statistieke te maak om

data voor te stel.

1.2 Voorgeskrewe handboek

Wegner, T. 2013. Applied business statistics. 3rd Ed. Claremont: Cape Town.

Vir die doeleindes van hierdie studie-eenheid moet jy die volgende afdelings bestudeer:

Hoofstuk 1, Paragraaf 1.1 – 1.11

Hoofstuk 2, Paragraaf 2.1 – 2.7, 2.9

Hoofstuk 3, Paragraaf 3.1 – 3.7, 3.9



1.3 Hoe kan jy jou begrip verbeter?

Jy moet seker maak dat jy die volgende terminologie verstaan:

Sleutelwoord Omskrywing

Afleidende statistiek Statistieke wat gebruik word om gevolgtrekkings ten opsigte

van elemente in die populasie te maak.

Beskrywende

statistiek

Grafieke en numeriese waardes wat die data wat versamel is

beskryf. Dit word gedoen voordat enige afleidings gemaak

word.

Data Die fisiese waardes (getalle) wat aan ŉ veranderlike toegeken

word.

Diskrete data Data wat slegs uit heelgetalle bestaan. (Daar is dus geen

waardes tussen byvoorbeeld 1 en 2 nie)

Ewekansige

veranderlike

Enige eienskap van ŉ populasie wat van belang is, wat

versamel en geanaliseer word.

Kolomgrafiek ŉ Grafiek wat frekwensies per kategorie voorstel.

Kontinue data Data wat uit reële getalle bestaan. Daar is dus, byvoorbeeld, ŉ

oneindige hoeveelheid waardes tussen 1 en 2 (bv. 1.0001).

Kumulatiewe

frekwensieveelhoek

ŉ Grafiek van ŉ kumulatiewe frekwensieverspreiding.

Meervoudige

kolomgrafiek

ŉ Kolomgrafiek wat twee kategorieë (in plaas van een) se

frekwensies voorstel, byvoorbeeld ouderdomme vir mans en

vroue.

Reikwydte Die verskil tussen die maksimum en minimum waardes in ŉ

steekproef.

Sirkelgrafiek ŉ Grafiek wat verskillende proporsies van ŉ geheel (100%)

voorstel.

Steekproef ŉ Kleiner groep wat vanuit ŉ populasie verkry word.

Eienskappe van die steekproef kan gemeet word en word

gebruik om gevolgtrekkings van dieselfde eienskappe van die

populasie te maak.



1.4 Inleiding

Statistiek behels die verwerking van data na inligting deur middel van wiskundige

berekeninge. Om statistiek moontlik te maak, moet data kwantitatief (numeries) wees of

gekwantifiseer (na getalle omgeskakel) word. Hierdie studie-eenheid verskaf ŉ inleiding tot

Statistiek, en bespreek die verskillende aspekte van beskrywende statistiek.

Daar word na twee tipes beskrywende statistiek gekyk: grafies en numeries. Die doel van

beskrywende statistiek is om ŉ oorsig oor die data te gee. (Daarna kan afleidende statistiek

toegepas word, om sekere afleidings van ŉ groter groep, of populasie, te maak.)

Wat tabelle en grafieke betref, word daar eerstens gekyk na die grafiese voorstelling van

kategoriese data waar slegs een veranderlike betrokke is. Dan word datastelle met meer as

een veranderlike ondersoek. In die tweede plek word daar na numeriese data gekyk. Weer

eens word die verskillende wyses waarop een, en dan twee, veranderlikes voorgestel kan

word, bespreek. Hoofstuk 2 en 3 in die handboek bestaan uit ŉ verskeidenheid hulpmiddels.

Dit is die statistikus se taak om te bepaal watter van hierdie hulpmiddels die beste gepas sal

wees vir ŉ spesifieke situasie. Die figuur hieronder (Figuur 1.1) stel die uitleg van Hoofstuk 2

en 3 grafies voor.

Figuur 1. 1: Oorsig oor Hoofstuk 2 en 3

(Bron: Wegner, 2013: 26 – 100)

Statistiek

Beskrywend

Tabelle en

grafieke (Hoofstuk 2)

Kategoriese data

(2.2)

Een veranderlike

Twee

veranderlikes

Numeriese data

(2.3)

Een veranderlike

Twee

veranderlikes

Die Pareto kurwe Excel

Numeries

(Hoofstuk 3)

Sentrale neiging

(3.2)

Nie-sentrale

neiging

Verspreiding

Skeefheid

Houer-en-

stipping

Afleidend



1.5 Basiese begrippe en beginsels van statistiek

Bestudeer die handboek: Hoofstuk 1, paragraaf 1.1 – 1.11.

Hoofstuk 1 in die handboek is nie ŉ lang hoofstuk nie. Dit mag die verkeerdelike indruk skep

dat hierdie hoofstuk nie belangrik is nie. Niks kan egter verder van die waarheid af wees nie.

Die belangrikste kernbegrippe word in hierdie hoofstuk bespreek. ŉ Student wat nie deeglik

bewus is van die inhoud van hierdie hoofstuk nie, sal die res van die handboek uiters

uitdagend vind.

Die doel van hierdie begeleidingsgids is nie om die handboek te herhaal nie. Dus sal daar

nie ŉ definisie en beskrywing van elke begrip in die handboek verskaf word nie. Sommige

van die begrippe sal egter in meer detail beskryf word.

1.5.1 Wat is statistiek?

Bestudeer die handboek: Paragraaf 1.1 tot 1.5

Om hierdie te vraag te beantwoord is dit belangrik om eers na die definisies in paragraaf 1.1

in die handboek te kyk. Daar word onderskei tussen terme soos bestuursbesluitneming,

inligting, data en statistiek. Data het nie enige waarde, indien dit nie na inligting verwerk

word nie. Statistiek is een van die stel hulpmiddels wat hier verwerking nodig maak.

Statistiek het te make met kwantitatiewe data, met ander woorde, data wat in syfers

omgeskakel is. In die meeste gevalle word data waarop statistiese berekeninge uitgevoer

moet word, van die begin af as data versamel.

Voorbeeld

Kyk na die volgende vrae. Watter van hierdie vrae versamel statistiese data?

• Hoe voel jy oor die e-tolstelsel?

• Hoe oud is jy (in jare)?

• Wat was die punt wat jy vir Statistiek behaal het?

• Op ŉ skaal van 1 tot 10, dui aan hoe tevrede jy met die dosent is.

Al die bogenoemde vrae, behalwe die eerste een, versamel kwantitatiewe data. Dit is

egter moontlik om, deur ŉ verskeidenheid tegnieke, data wat nie kwantitatief is nie, in

getalle om te skakel. Daar word verwys na die kwantifisering van kwalitatiewe data.

Hierdie is ŉ omvattende proses wat nie in hierdie vak bespreek sal word nie.



Paragraaf 1.2 in die handboek beskryf die taal van Statistiek. Die volgende voorbeeld sal

poog om elk van hierdie terme te illustreer:

Voorbeeld

Daar is 30 000 werknemers by Maatskappy X. Ek wil graag weet hoe gereeld hierdie

werknemers by restaurante eet, maar hierdie data is nie beskikbaar nie. Ek besluit om die

werknemers hieroor uit te vra. Omdat ek nie die tyd en geld het om al 30 000 werknemers

te vra nie, kies ek ŉ kleiner groep van 1 000 werknemers uit die groter groep. Ek kies

hierdie groep sodat hulle so ver as moontlik verteenwoordigend van die 30 000 is. Ek vra

elk van hierdie werknemers hoeveel keer per jaar hy/sy by ŉ restaurant uiteet. Ek kry ŉ

gemiddeld van 14.75 keer per jaar.

• Ewekansige veranderlike (random variable): Die hoeveelheid keer wat ŉ

werknemer in Maatskappy X per jaar by ŉ restaurant eet, in hierdie geval 14.75.

• Data: Die 1 000 antwoorde wat ek versamel het.

• Populasie (population): Die totale hoeveelheid individue waarvoor ek afleidings wil

maak, gebaseer of my statistiese analise (die 30 000 werknemers). Belangrik:

Die steekproef moet altyd uit die populasie saamgestel word. Ek kon dus nie my

1 000 werknemers vanaf ŉ ander onderneming as Maatskappy X gevind het nie.

• Populasie parameter (population parametre): Die spesifieke eienskap van die

populasie wat ek wil meet, in hierdie geval die gemiddelde hoeveelheid kere

wat ŉ werknemer (van die 30 000) uiteet in ŉ jaar.

• Steekproef (sample): Die 1 000 werknemers (nie hul antwoorde nie) wat

verteenwoordigend van die volledige groep werknemers (30 000) behoort te wees.

• Steekproef-eenheid (Sampling unit): Elkeen van hierdie werknemers wat in die

steekproef voorkom, is ŉ steekproef-eenheid.

• Steekproef statistiek (sample statistic): Omdat ek nie die data vir al die

werknemers in die populasie kan meet nie, moet ek ŉ statistiek in die steekproef

gebruik om die soortgelyke statistiek in die populasie te skat. Dus is die

gemiddelde hoeveelheid kere wat werknemers in die steekproef uiteet, my

steekproef statistiek.

• Grootte (N en n). Die grootte van die steekproef (n) was 1 000. Die grootte van die

populasie (N) is 30 000.

• Proporsie (p). Die steekproef se proporsie van die populasie, was 0.033



(1 000/30 000).

Vir nog voorbeelde, sien gerus Tabel 1.1 in die handboek.

Statistiek behels ŉ verskeidenheid berekeninge. Om ŉ som te doen en die woorde

"gemiddelde hoeveelheid keer wat ŉ werknemer in die steekproef by ŉ restaurant eet" te

gebruik, sal hierdie somme bemoeilik. Vir hierdie rede word daar standaardsimbole gebruik

om sekere veranderlikes voor te stel. Vir ŉ gemiddeld word, byvoorbeeld, µ en x̄ (vir die

populasie- en steekproefgemiddelde, onderskeidelik) gebruik.

Waarom verskillende simbole vir populasie- en steekproefstatistieke? Die

steekproefstatistiek sal in die meeste gevalle die enigste statistiek wees wat bereken gaan

word. As die statistikus nie foute maak nie, is hierdie statistiek 100% akkuraat. Die

steekproefstatistiek word egter slegs gebruik om die ooreenkomstige populasiestatistiek te

beraam. Daarom is dit belangrik dat daar onderskei word tussen die statistiek wat bereken is

(steekproef) en die statistiek wat beraam word (in die populasie). Sien Tabel 1.2 in die

handboek vir die simbole wat gebruik word vir die belangrikste statistieke. Die name van

hierdie statistieke word in Figuur 1.2 hieronder opgesom:

Figuur 1. 2: Belangrike statistieke

(Bron: Aangepas uit Wegner, 2013:6)

Paragraaf 1.3 in die handboek beskryf ŉ paar belangrike komponente van statistiek wat die

grondslag vorm vir die wyse waarop die res van die handboek gestruktureer is. Hierdie

studie-eenheid sal beskrywende statistiek (descriptive statistics) bespreek. Enige

Gemiddeld

•(Mean)

Standaardafwyking

•(Standard deviation)

Variansie

•(Variance)

Grootte

•van steekproef of populasie, met ander woorde, hoeveel mense (of objekte) was in die

steekproef of populasie?

Proporsie

•(Proportion)

Korrelasie

•(Correlation)



kwantitatiewe studie sal gewoonlik begin deur die data te beskryf (sonder om

gevolgtrekkings te maak). Hierdie beskrywings kan in die vorm van grafieke wees, maar sal

tipies ŉ aantal statistieke (soos gemiddelde en standaardafwykings) ook insluit. Daarna word

sekere afleidings ten opsigte van die resultate gemaak. Hierdie afleidings word

inferensiële/afleidende statistiek (inferential statistics) genoem.

Figuur 1.2 in die handboek demonstreer hoe die populasie, steekproef, statistieke en

statistiese modellering bymekaar pas.

Paragraaf 1.5 in die handboek verskaf ŉ oorsig waar statistiek in die sakewêreld gebruik kan

word. Hierdie lys is natuurlik nie volledige nie. Statistiek kan op ŉ verskeidenheid wyses in

verskillende kontekste toegepas word.

1.5.2 Data

Bestudeer die handboek: Paragraaf 1.5 – 1.11

Statistiek is gebaseer op data. As hierdie data van swak kwaliteit is (byvoorbeeld as gevolg

van foute met die versameling), maak dit nie saak hoe goed die kwaliteit van die statistiese

ontleding is nie. Die inligting wat verkry word, sal foutief wees. Beskou weer die voorbeeld

van Maatskappy X in paragraaf 1.5.1 hierbo genoem. Daar is gevind dat die gemiddelde

werknemer 14.75 per jaar by restaurante eet. Gestel nou dat die vraag nie ŉ tydsperiode (in

hierdie geval die afgelope jaar) gespesifiseer het nie. Sommige respondente mag antwoord

hoeveel keer hul per week, dag of maand uiteet. Die inligting sal steeds foutief wees,

ongeag hoe akkuraat die gemiddeld bereken is.

ŉ Goeie navorser sal dus twee belangrike aspekte in ag moet neem:

• Hoe kan die kwaliteit van data verseker word?

• Wat is die beste statistiese metode om gevolgtrekkings oor die populasie te kan

maak?

� Eienskappe van data

Elke statistiese metode (byvoorbeeld die berekening van ŉ gemiddeld) het ŉ aantal

voorwaardes wat nagekom moet word voordat die metode gebruik kan word. Die

belangrikste voorwaardes hou gewoonlik verband met die aard van die data.

Dit is belangrik om te onderskei tussen die aard van data en meetskale (of vlakke) van

data. Eersgenoemde beskryf slegs sekere eienskappe van die data, terwyl laasgenoemde

verband hou met die wyse waarop data versamel word. Beide bogenoemde word, vir meer

duidelikheid, in Figuur 1.3 beskryf.



Figuur 1. 3: Eienskappe en vlakke van data

(Bron: Wegner, 2013: 10 – 11)

Soos reeds genoem, kan kwalitatiewe data op ŉ kwantitatiewe wyse gemeet word. Kyk

byvoorbeeld na die volgende vraag: "Wat is jou gunsteling restaurant?". Hoe sal ŉ mens ŉ

antwoord op hierdie vraag kan kwantifiseer? Hoe doen ŉ mens somme met "Spur" en

"Dros"?

Die antwoord lê in die gebruik van nominale veranderlikes. Elke restaurant kry ŉ nommer,

byvoorbeeld:

• Spur = 1

• Dros = 2

• Bessie se kombuis = 3

Uit die aard van die saak is hierdie data baie beperk. ŉ Mens kan nie ŉ gemiddelde uitwerk

nie (Wat beteken ŉ 2.6 in hierdie geval?). Dit is egter moontlik om uit te vind wat die

gemiddelde ouderdom is van respondente wat Spur besoek, teenoor die ouderdom van

respondente wat ander restaurante besoek. Dus kan hierdie kategorieë gebruik word vir

statistiese berekeninge. Die statistiese metodes wat met hierdie tipe data gebruik kan word,

is egter beperk. Sien Figuur 1.4 vir meer inligting oor die data tipes/vlakke. Dit is belangrik

om hierdie vlakke te verstaan, omdat dit in die meeste gevalle sal bepaal watter statistiese

toets gebruik kan word.

Eie

nsk

ap

pe Kwalitatief vs Kwantitatief

Diskreet vs kontinue data Vla

kke Nominaal

Ordinaal

Interval

Ratio



Figuur 1. 4: Vlakke van data

(Bron: Wegner, 2013: 10 – 11)

Paragraaf 1.8 in die handboek beskryf die bronne waar data vandaan gekry kan word, terwyl

paragraaf 1.9 in die handboek beskryf hoe hierdie data versamel moet word. Die handboek

beskryf slegs drie vorme van dataversameling – daar is meer. Hierdie drie metodes is egter

van groot belang en voldoende vir die doel van hierdie vak.

1.5.3 Selfevalueringsvrae

Voltooi al die oefeninge aan die einde van Hoofstuk 1 in die handboek. Die antwoord op

hierdie vrae is aan die einde van die handboek. Dit is belangrik dat jy nie na die antwoorde

kyk voordat jy die vrae heeltemal voltooi het nie, selfs al sukkel jy om ŉ vraag te voltooi.

Belangrik:

Moenie met Hoofstuk 2 begin voordat jy Hoofstuk 1 ten volle verstaan nie. Indien daar enige

begrippe is wat vir jou onduidelik is, kontak jou dosent om te verseker dat jy oor die nodige

grondslag beskik om die res van die handboek te kan baasraak.

1.6 Beskrywende statistiek

Bestudeer die handboek: Hoofstuk 2, paragraaf 2.1 – 2.7, 2.9.

As gevolg van die groot verskeidenheid berekeninge wat gedoen moet word, gaan die uitleg

van hierdie begeleidingsgids verskil van ander begeleidingsgidse in hierdie program. Die

doel van ŉ begeleidingsgids is nie om bloot inligting in die handboek te herhaal nie, maar om

dit te vereenvoudig en meer verteerbaar vir die student te maak. In hoofstukke (soos

•Gewoonlike slegs kategorieë

•Bv. manlike en vroulik

Nominale data

•Die spesifeke getalle stel nie slegs kategorieë voor nie, maar het ŉ waarde, bv. 1 is

groter as 2

•Bv. maatskappygrootte (mikro, klein, medium, groot)

Ordinale data

•Gewoonlik gebruik met vrae wat skale (rating scales) bevat.

•Die afstand tussen verskillende opsies is ewe groot.

Interval data

•Die data is kontinu. Daar is dus enige hoeveelheid data wat tussen twee waardes

voorkom.

•Bv. salaris (tussen R1 000 en R2000 in onbeperkte hoeveelheid antwoorde).

Ratio data



Hoofstuk 2), waar ŉ verskeidenheid statistieke en grafieke bespreek word, sal die

begeleidingsgids poog om ŉ opsomming van elke statistiek (of grafiek) te verskaf. Vrae soos

die volgende sal beantwoord word:

• Waarvoor word die statistiek (of grafiek) gebruik?

• Hoe word die statistiek bereken (of grafiek) opgestel?

• Hoe word die resultate (of grafiek) geïnterpreteer.

Dit is dus belangrik om te onthou dat die begeleidingsgids nie die handboek vervang nie,

maar bloot aanvul.

1.6.1 Grafiese beskrywende statistiek vir kategoriese data

Bestudeer die handboek: Paragraaf 2.2

In paragraaf 1.6 is die verskillende tipes data beskryf. Nominale data is gewoonlik kategories

van aard. Die voorbeeld van die gunsteling restaurante behels kategoriese data.

Kategoriese data kan grafies op die volgende wyses voorgestel word:

� Kategoriese frekwensietabel

Hierdie tabel dui aan hoeveel keer elke kategorie deur respondente genoem is. ŉ Voorbeeld

word in Figuur 1.5 voorgestel.

Gunsteling

restaurant

Telling (count) Persentasie

Spur 370 37%

Dros 250 25%

Bessie se

kombuis

380 38%

1000 100%

Figuur 1. 5: Voorbeeld van ŉ frekwensietabel

� Kolomgrafiek (bar chart)

Hierdie grafiek stel frekwensies (bv. hoeveel keer ŉ restaurant as gunsteling genoem is)

grafies voor.



Figuur 1. 6: ŉ Kolomgrafiek

� Sirkelgrafiek (pie chart)

Hierdie grafiek word gebruik om die proporsie van elke kategorie as deel van alle

respondente te vertoon. Figuur 1.7 verskaf ŉ voorbeeld.

Figuur 1. 7: ŉ Sirkelgrafiek

Kyk ook na Voorbeeld 2.1 in die handboek.

Soms is daar meer as een veranderlike wat gemeet word. In plaas van ŉ gunsteling

restaurant, kan die respondente ook gevra word om hul geslag (manlik of vroulik) aan te dui.

Sodoende kan daar bepaal word of die gunsteling restaurante van mans en vroue verskil.

Die volgende is wyses waarop kategoriese data met meer as een veranderlikes voorgestel

kan word.



Moenie deurmekaar raak nie: Kategorie vs. veranderlike

Ons onderskei hier tussen veranderlikes en kategorieë. In die restaurant voorbeeld, is daar

drie kategorieë (Spur, Dros en Bessie se kombuis), maar slegs een veranderlike (gunsteling

restaurant). In die voorbeelde hieronder is daar twee veranderlikes (gunsteling restaurant en

geslag), wat elk ŉ aantal kategorieë bevat:

• Veranderlike 1: Gunsteling restaurant. 3 kategorieë:

o Kategorie 1: Spur

o Kategorie 2: Dros

o Kategorie 3: Bessie se kombuis

• Veranderlike 2: Geslag. 2 kategorieë:

o Kategorie 1: Manlik

o Kategorie 2: Vroulik

Die veranderlike vorm dus die grondslag waarvolgens kategorieë geskep word.

� Kruis-tabuleringstabel (cross-tabulation table)

ŉ Tabel wat beide een veranderlike se frekwensies verdeel volgens ŉ tweede veranderlike,

byvoorbeeld:

Restaurant

Geslag

Totaal

Manlik Vroulik

Spur 250 120 370

Dros 180 70 250

Bessie se kombuis 50 330 380

Totaal 480 520 1000

Figuur 1. 8: ŉ Kruis-tabuleringstabel



Uit bogenoemde is dit duidelik:

• dat daar meer vroulike (n=520) respondente as manlike (n=480) respondente was.

• dat daar meer manlike respondente was wat van Spur en Dros gehou het, as

vroulike respondente (250 en 180 vs. 120 en 70).

• dat die vroulike respondente meer van Bessie se kombuis hou as mans, asook dat

vroulike respondente se gunsteling restaurant oor die algemeen Bessie se kombuis

is.

� Stapel-kolomgrafiek (Stacked bar chart)

Hierdie grafiek is soortgelyk aan ŉ gewone kolomgrafiek, hoewel die frekwensies van ŉ

spesifieke kategorie verdeel word volgens die proporsie van ŉ tweede veranderlike. Kyk na

die voorbeeld in Figuur 1.9.

Figuur 1. 9: ŉ Stapel-kolomgrafiek

� Meervoudige kolomgrafiek (multiple bar chart)

Hierdie grafiek is soortgelyk aan die stapel-kolomgrafiek, maar die waardes vir beide

kategorieë word langs mekaar vertoon (in plaas van binne-in dieselfde kolom). Figuur 1.10

verskaf ŉ voorbeeld:



Figuur 1. 10: ŉ Meervoudige kolomgrafiek

Sien ook Voorbeeld 2.2 in die handboek vir meer inligting.

1.6.2 Grafiese voorstelling van numeriese data: Een veranderlike


Paragraaf 1.6.1 hierbo het kategoriese data bespreek. Kategoriese data is gewoonlik

kwalitatiewe data wat gekwantifiseer word deur dit in kategorieë te plaas. Hierdie paragraaf

bespreek nou numeriese data (ordinaal, interval en ratio) en die wyses waarop dit grafies

voorgestel kan word. Hierdie grafiese voorstelling behels grafieke en tabelle.

Een numeriese veranderlike

Vir die doel van hierdie paragraaf, sal die volgende voorbeeld gebruik word.

Die volgende inligting word van Maatskappy X verkry:

• Die ouderdom van 1 000 van hul werknemers uit ŉ ewekansige steekproef. Die

hoogste ouderdom is 67 en die jongste is 18.

� Numeriese frekwensieverspreiding

Hierdie verspreiding deel alle data in intervalle op. Dan word bepaal hoeveel van alle

waardes in elke interval aangetref word. Hierdie is dus ŉ poging om iets soos ratio-data na

kategoriese data om te skakel. Waarom sal ŉ mens dit wil doen? In hierdie geval is die doel

bloot om data beter te vertoon.

Om hierdie verspreiding te bepaal, moet die volgende eers verkry word:



• Reikwydte (range): hoogste waarde - laagste waarde (dus 67 - 18 = 49).

• Interval wydte. Eerstens, moet op die hoeveelheid intervalle besluit word. Daarna

moet die grootte van elke interval bepaal word. Gestel dus ons wil 5 intervalle hê. Die

berekening is dan soos volg:

o Reikwydte/hoeveelheid intervalle

o = 49/5

o = 9.8 ≈ 10

o Elke interval sal dus 10 jaar groot wees

• Verdeel nou alle data (die 1 000 ouderdomme) in hierdie groepe op. Dit is belangrik

dat ŉ enkele respondent se ouderdom slegs in een kategorie ingedeel word.

Figuur 1.11 stel hierdie verdeling grafies voor:

Interval (10 jaar) Frekwensies

(Hoeveel respondente val in die

kategorie?)

18 – 27 400

28 – 37 290

38 – 47 190

48 – 57 90

58 – 69 30

Totaal 1000

Figuur 1. 11: Numeriese frekwensieverspreiding

� Histogram

ŉ Histogram is ŉ grafiese voorstelling van bogenoemde numeriese frekwensieverspreiding

en lyk soos ŉ kolomgrafiek. Figuur 1.12 stel ŉ histogram vir bogenoemde data voor.



Figuur 1. 12: ŉ Histogram

Interpretasie: Uit hierdie histogram is dit duidelik dat Maatskappy X se menslike hulpbronne

uit jonger personeel bestaan. Hoe hoër die ouderdom is, hoe minder personeel val in

daardie kategorie. (Hierdie gevolgtrekking kan natuurlik slegs gemaak word, indien die 1 000

personeel wat ondersoek is, verteenwoordigend is van die totale personeelkorps van

Maatskappy X.)

� Kumulatiewe frekwensieverspreiding

Die kumulatiewe frekwensieverspreiding is ŉ tabel wat presies dieselfde is as die gewone

numeriese frekwensieverspreiding. ŉ Bykomende kolom word egter bygesit om die totale

frekwensies vir ŉ kategorie, plus die frekwensies van alle kategorieë wat sodanige kategorie

voorafgaan, te vertoon. Kyk na Figuur 1.13 hieronder vir meer duidelikheid (die laaste kolom

met beskrywings is nie deel van hierdie tabel nie – dit is slegs in hierdie figuur ingevoeg ter

verduideliking):

Interval

(10 jaar)

Frekwensies

(Hoeveel respondente

val in die kategorie?)

Kumulatiewe

frekwensie

(Notas ter

verduideliking)

18 – 27 400 400

28 – 37 290 690 400+290



38 – 47 190 880 400+290+190

48 – 57 90 970 400+290+190+90

58 – 69 30 1000 400+290+190+90+30

Totaal 1000

Figuur 1. 13: Kumulatiewe frekwensieverspreiding

Die laaste kumulatiewe frekwensie sal altyd n wees. Met ander woorde, dit sal altyd

dieselfde wees as al die frekwensies saamgevoeg. (Onthou, n stel die grootte van die

steekproef voor, met ander woorde, die hoeveelheid mense van Maatskappy X wat ons

vraag beantwoord het.)

� Kumulatiewe frekwensieveelhoek

ŉ Kumulatiewe frekwensieveelhoek (Ogive) is die grafiese voorstelling van ŉ kumulatiewe

frekwensietabel. Dit is ŉ lyngrafiek. Figuur 1.14 stel hierdie veelhoek vir bogenoemde data

voor:

Figuur 1. 14: ŉ Kumulatiewe frekwensieveelhoek om kumulatiewe frekwensies grafies

voor te stel

Sien ook Voorbeeld 2.5 in die handboek vir meer inligting.



� Houer-en-punt-stipping-grafiek (Box plot)

Die houer-en-stipping-grafiek word in Hoofstuk 3 in die handboek in meer detail behandel.

Hierdie grafiek vertoon die minimum- en maksimumwaardes, asook ŉ verskeidenheid

waardes wat tussen die minimum en maksimum voorkom. Voorbeelde sluit in die mediaan,

gemiddelde en kwantiele (sal later behandel word).

1.6.3 Grafiese voorstelling van numeriese data: Twee veranderlikes

Bestudeer die handboek: Paragraaf 2.3 (vervolg)

Vir gevalle waar twee veranderlikes gemeet word, sal die volgende voorbeeld gebruik word:

Maatskappy A wil ŉ ouderdomsprofiel van hul kliënte opstel. Hulle wil sien wat die

ouderdomme van hul kliënte is (Veranderlike 1), maar ook hoeveel geld hul kliënte per

besoek aan die winkel spandeer (Veranderlike 2). Beide hierdie data is ratio data.

� Spreidingstipping

Hierdie grafiek (scatter plot) plaas elke respondent se antwoord op beide vrae as ŉ enkele

kolletjie op ŉ grafiek. Gestel Maatskappy A het die twee vrae (1. Hou oud is jy?, 2. Hoeveel

geld spandeer jy op ŉ keer by die winkel?) vir vyftien respondente gevra. Die antwoorde

word in die tabel hieronder opgesom:

Respondent nommer Ouderdom Hoeveel geld spandeer

1 18 350

2 70 150

3 24 500

4 29 1500

5 27 1000

6 34 1700

7 43 2500

8 40 2000



9 19 400

10 21 450

11 65 130

12 60 170

13 20 410

14 70 50

15 38 3000

Figuur 1. 15: ŉ Puntediagram

Let daarop dat die hoogste waardes tussen ongeveer 35 en 45 gevind word.

� Tendensgrafiek (Trendline)

Hierdie grafiek stel tipies verandering oor tyd voor. Die horisontale as stel tyd voor en die

vertikale as stel ŉ tweede veranderlike voor. Figuur 1.16 stel die verkope van produkte by

Maatskappy A oor ŉ tydperk van 12 maande voor.



Figuur 1. 16: ŉ Lyngrafiek wat ŉ tendens voorstel

� Lorenz-kurwe

Die Lorenz-kurwe vergelyk twee veranderlikes se kumulatiewe frekwensies met mekaar. Die

doel is om te bepaal watter persentasie van een veranderlike, verantwoordelik is vir watter

persentasie van ŉ ander veranderlike. Beskou die volgende voorbeeld:

ŉ Spesifieke land het ŉ bevolking van 10 miljoen mense. Van hierdie 10 miljoen betaal slegs

3.5 miljoen belasting. Die totale belasting wat ingesamel word, is US$ 100 000 miljoen. Die

volgende tabel dui aan hoeveel van 3.5 miljoen belastingbetalers sekere persentasies van

die totale belasting betaal:

Hoeveelheid

belasting:

Kategorie

Hoeveelheid mense in hierdie

kategorie

Geld wat betaal word deur hierdie

kategorie

n

% van

totale

belasting-

betalers

Kumula-

tiewe % $

% van

totale

inkomste

Kumula-

tiewe %

0 – $5 000 1 495 000 43% 43% 1 500 000 15% 15%

$5 001 –

$10 000

700 000 20% 63% 2 000 000 20% 35%

$10 001 –

$15 000

600 000 17% 80% 2 000 000 20% 55%



$15 001 –

$20 000

400 000 11% 91% 2 500 000 25% 80%

$20 001 –

$25 000

250 000 7% 98% 1 000 000 10% 90%

$25 001 –

$25 000

55 000 2% 100% 1 000 000 10% 100%

TOTAAL 3 500 000 100% 10 000 000 100%

Let op die volgende:

• Ons maak die aanname dat niemand meer as $25 000 aan belasting betaal het nie.

• Elke kategorie is presies ewe groot ten opsigte van die bogrens en ondergrens (bv.

$0 en $5 000.

As die hoeveelheid mense wat belasting betaal in verhouding is tot die hoeveelheid

belasting wat deur elke kategorie betaal word, sal die Lorenz-kurwe ŉ reguit lyn gewees het.

Hoe verder die kurwe egter van ŉ reguitlyn afwyk, hoe groter is die verskil tussen die

hoeveelheid mense in ŉ kategorie en die hoeveelheid geld wat deur die kategorie bygedra

word. In Figuur 1.17 kan gesien word dat die twee kumulatiewe waardes nie proporsioneel is

nie. Die boonste lyn is die reguitlyn, terwyl die onderste grafiek die Lorenz-kurwe voorstel.

Figuur 1. 17: Die Lorenz-kurwe en ŉ reguitlyn



1.6.4 Pareto se kurwe


Pareto se kurwe is ŉ grafiese voorstelling wat veral nuttig is om vrae ten opsigte van

kwaliteitskontrole te beantwoord. ŉ Tipiese vraag wat hierdie kurwe sal probeer antwoord is:

"Uit 25 moontlike redes vir ŉ spesifieke probleem, wat is die drie mees algemene redes?"

Pareto se reël veronderstel dat die 80% kleiner probleme onderskei moet word van die 20%

kritieke probleme. Daar word van ŉ histogram/kolomgrafiek gebruik gemaak om hierdie

kurwe te skep.

Bestudeer paragraaf 2.4 in die handboek om Pareto se kurwe beter te verstaan en toe te

pas. Werk veral deur Voorbeeld 2.9 in die handboek.

1.6.5 Excel

Bestudeer die handboek: Paragraaf 2.5.

Aan die einde van elke hoofstuk is daar ŉ geleentheid vir die student om die teorie in

Microsoft Excel toe te pas. Hierdie toepassings is veral belangrik vir die werkopdragte,

omdat moontlike groot hoeveelhede data gebruik kan word. Dit is dus belangrik dat die

student kennis dra van Excel en alle berekeninge (en grafieke) wat in Excel gedoen moet

word.

1.6.6 Selfevalueringsvrae: Hoofstuk 2

Daar is 24 vrae aan die einde van Hoofstuk 2. Voltooi al hierdie vrae. ŉ Groot hoeveelheid

van hierdie vrae moet in Microsoft Excel gedoen word. Die CD met hierdie data word in die

agterkant van die handboek verskaf.

1.7 Numeriese beskrywende statistiek

Bestudeer die handboek: Paragraaf 3.1 – 3.7, 3.9.

Hoewel grafieke en tabelle ŉ goeie oorsig oor data kan gee, kan statistiese waardes meer

spesifieke beskrywings verskaf. Hierdie statistieke fokus veral op lokaliteit, spreiding en

vorm van data. Daar word na ŉ aantal statistieke in elk van hierdie drie kategorieë gekyk.

1.7.1 Maatstawwe van lokaliteit


Maatstawwe van lokaliteit (measures of central tendency) verskaf ŉ aanduiding van watter

waarde “tipies” of “in die middel” van alle waardes is. Die bekendste voorbeeld van ŉ



maatstaf van lokaliteit, is wat in die algemene taal bekend staan as die “gemiddeld”. In

Statistiek word daar verwys na die rekenkundige gemiddeld.

� Rekenkundige gemiddeld

Hierdie statistiek, vir die steekproef voorgestel deur x̄, word bepaal deur al die numeriese

waardes bymekaar te tel, en dan te deel deur die hoeveelheid waardes. Die formule is in

die handboek aangeteken as Formule 3.1 in Paragraaf 3.2 en kan opgesom word soos volg:

x̄ = die som van alle observasies (waardes)/hoeveelheid observasies (waardes)

Voorbeeld

Die ouderdomme van 10 werknemers by Maatskappy X is:

18, 20, 32, 26, 70, 55, 34, 43, 53, 31

Die gemiddelde ouderdom is:

(18 + 20 + 32 + 26 + 70 + 55 + 34 + 43 + 53 + 31)/10

= 382/10

= 38.2 jaar

Doen Voorbeeld 3.1 in die handboek om te verseker dat jy die rekenkundige gemiddeld

verstaan.

� Mediaan

Die tweede maatstaf van lokaliteit, is die mediaan. Om die mediaan te bereken, moet alle

waardes van kleinste na grootste sorteer word. Die getal wat presies in die middel is, word

die mediaan genoem. As daar twee getalle in die middel is, word die rekenkundige

gemiddeld van die twee getalle in die middel bereken om die mediaan te verkry.

Daar is nie ŉ formule in die handboek vir die mediaan nie.

Voorbeeld 1:

Die ouderdomme van 11 werknemers by Maatskappy A is:

18, 20, 32, 26, 70, 55, 34, 43, 53, 31, 22

Bereken die mediaan:

Stap 1: Sorteer die waardes van klein na groot:

18 20 22 26 31 32 34 43 53 55 70



Stap 2: Vind die waarde in die middel

18 20 22 26 31 32 34 43 53 55 70

Die mediaan is dus 32

Voorbeeld 2:

Die ouderdomme van 10 werknemers by Maatskappy A is:

18, 20, 32, 26, 70, 55, 34, 43, 53, 31

Bereken die mediaan:

Stap 1: Sorteer die waardes van klein na groot

18 20 26 31 32 34 43 53 55 70

Stap 2: Vind die middelste waarde

Omdat daar 10 waardes is, is daar nie ŉ enkele middelste waarde nie. Die middelste

waardes is 32 en 34. Die rekenkundige gemiddeld moet dus van hierdie twee waardes

bereken word:

Mediaan = (32 + 34)/2

33

Doen nou Voorbeeld 3.2 (a) en (b) in die handboek.

� Mediaan vir kategorieë of gegroepeerde waardes

ŉ Mediaan kan ook vir kategorieë bereken word deur Formule 3.2 in die handboek te

gebruik.

Voorbeeld

Interval

(10 jaar)

Frekwensies Kumulatiewe

frekwensie

18 – 27 400 400

28 – 37 290 690

38 – 47 190 880



48 – 57 90 970

58 – 69 30 1000

Totaal 1000

Bereken die mediaan vir bogenoemde waardes.

In hierdie geval is dit moeiliker omdat dit baie tyd sal neem om ŉ duisend waardes van klein

na groot te rangskik. Om die mediaan te vind, moet die volgende stappe gevolg word:

Stap 1: Vind die posisie van die mediaan. Soos reeds gesê is die mediaan presies in die

middel van alle waardes, indien die waardes sorteer is. Dus is die mediaan by posisie:

1 000/2 = 500

Met ander woorde, as al 1 000 waardes van klein na groot rangskik is, sal die 500ste waarde

die mediaan wees.

Stap 2: Deur na die kumulatiewe frekwensie-kolom te kyk, bepaal in watter kategorie die

500ste waarde sal voorkom. Die eerste kategorie eindig by die 400ste waarde, die tweede

kategorie eindig by die 690ste waarde. Die 500ste waarde sal dus êrens in die tweede

kategorie (28 – 37) voorkom.

Stap 3: Gebruik die formule om die presiese plek te bepaal:

Me = Ome + �[�� ]

��

• Ome = 28 jaar

• c = die grootte van die interval = 10 jaar

• n = steekproefgrootte = 1 000

• Fme = frekwensie van mediaan interval = 290

• f(<) = kumulatiewe frekwensie van die interval voor die mediaaninterval = 400

Dus is:

Me = 28 + ��[��]

��

= 31.44

Doen nou Voorbeeld 3.3 in die handboek.



� Modus

ŉ Derde maatstaf van lokaliteit is die modus. Die modus is die enkele waarde wat die

meeste kere voorkom. Hierdie maatstaf is veral nuttig vir kategoriese data. Vir kategoriese

data kan die modus bereken word deur eenvoudig die frekwensies van elke kategorie met

mekaar te vergelyk.

Voorbeeld:

Bereken die modus.

Deur bloot na die bogenoemde tabel te kyk, is dit duidelik dat Bessie se kombuis die

gewildste is. Dus is die modus "Bessie se kombuis". In hierdie geval is die modus nie ŉ

getal nie, maar ŉ kategorie.

Met ratio data kan dit egter gebeur dat daar uit ŉ 1 000 waardes nie een waarde is wat

tweemaal herhaal word nie. Dink byvoorbeeld aan die pryse van kruideniersware. In so ŉ

geval sal ŉ modus niksseggend wees. (As die bedrag van R25.88 drie keer genoem is, maar

die bedrae R70.55, R70.56, R70.10, R70.80 en R70.00 ook voorkom, is die modus van

R25.88 dan werklik akkuraat?) Vir hierdie doel word die modus geskat deur al die data in

intervalle in te deel. Daarna word die interval met die voorafgaande en opeenvolgende

interval vergelyk om ŉ modus te bepaal.

Voorbeeld

Nota: Hierdie tabel is effens aangepas vir hierdie oefening en is dus nie dieselfde as die

tabel wat vir vorige voorbeelde gebruik is nie.

Interval

(10 jaar)

Frekwensies Kumulatiewe

frekwensie

18 – 27 290 290

Restaurant Frekwensies

Spur 370

Dros 250

Bessie se kombuis 380

Totaal 1000



28 – 37 400 690

38 – 47 190 880

48 – 57 90 970

58 – 69 30 1000

Totaal 1000

Bereken die modus.

In hierdie geval is die doelwit om te bepaal watter ouderdom die meeste voorkom. Die

interval met die meeste frekwensies is 28 – 37 (met 400 van alle respondente wat in hierdie

kategorie val). Hierdie is dus die modale interval. Beskou nou die formule in die handboek

(Formule 3.3). Die waardes in die formule kan soos volg vervang word:

• Omo = onderste grens van die modale interval = 28 jaar

• c = wydte van die modale interval = 10 jaar

• fm = frekwensie van die modale interval = 400 respondente

• fm-1 = frekwensie wat die modale interval voorafgaan = 290 respondente (dit sou nul

gewees het indien die modale interval ook die eerste interval was)

• fm+1 = frekwensie wat na die modale interval voorkom = 190 (dit sou nul gewees het

indien die modale interval die laaste interval was).

M0 = 28 + ��[��]

��

= 28 + ��

= 28 + 3.44

= 31.44

Dus is die modus 31.44, wat beteken dat die meeste respondente se ouderdom benader kan

word na 31.44.

Hoe toets ek of my antwoord korrek is?

Wat ook al die modus is, dit moet steeds in die modale interval wees. As die modus wat

bereken is, dus minder as 28 was of meer as 37, was die antwoord verkeerd.




� Meetkundige gemiddeld

Die meetkundige gemiddeld word gebruik om die gemiddelde persentasie verandering in

data te bepaal. Die formule word as Formule 3.4 in die handboek gegee.

Voorbeeld

Die prys van motors by ŉ spesifieke handelaar het vir die laaste vyf jaar jaarliks gestyg. Die

tabel hieronder stel die persentasieverhogings per jaar voor.

2013 5%

2012 4%

2011 8%

2010 3%

2009 2%

2008 1%

Bereken die meetkundige gemiddeld van die persentasieverhogings.

Die formule is reeds in die handboek gegee en die waardes kan soos volg uiteengesit word:

• n = 6 jaar

• x1, x2, x3, x4, x5 en x6 = 5%, 4%, 8%, 3%, 2%, en 1% onderskeidelik. Vir die doel van

hierdie formule, word die persentasie egter anders uitgedruk. ŉ 5% verhoging is

eintlik 1.05 keer die vorige jaar se bedrag. Dus word 5% as 1.05 uitgedruk.

Dus GM = √�. ��. ��. ��. � ��. ��. ��!

= √�!�!

=1.034 ≈ 3.4%

Waarom kan ons nie die rekenkundige gemiddeld gebruik nie?

Persentasieverhogings behels ŉ faktor waarmee ŉ bedrag (of ander waarde) vermenigvuldig

moet word, in die voorbeeld hierbo was dit 1.05 in die eerste jaar. Ons wil dus ŉ gemiddelde

faktor bereken waarmee ŉ bedrag jaarliks vermenigvuldig moet word om dieselfde

verhoging oor die ses jaar periode te verkry. Vir hierdie rede is die meetkundige gemiddeld



meer akkuraat om gemiddelde persentasieverhogings te bepaal. Die rekenkundige

gemiddeld sal egter nuttig wees om die gemiddelde randwaarde van die rente/opbrengs te

bepaal.

Hierdie stelling kan met die volgende voorbeeld gedemonstreer word:

ŉ Bedrag van R100 word belê:

• Jaar 1 verdien die bedrag 10% rente. Dus is die rente R10 en die bedrag is R110.

• Jaar 2 verdien die bedrag (nou R110) 5% rente. Dus is die rente R5.50 en die bedrag

is R115.50

• Jaar 3 verdien die bedrag (nou R115.50) 3% rente. Dus is die rente R3.47 en die

bedrag is R118.97.

Die meetkundige gemiddeld van die persentasieverhogings van die bedrag is 1.06 (dus 6%).

Die rekenkundige gemiddeld van die rente is (10 + 5.50 + 3.47)/3 = R6.32

Dus is die gemiddelde jaarlikse styging 6% (R100 x 1.06) en die gemiddelde jaarlikse rente

(in randwaarde) is R6.32.

(Nota: In hierdie geval is dit toevallig dat die meetkundige gemiddeld en rekenkundige

gemiddeld vir die data dieselfde is. Dit is egter ŉ uitsondering. Die meetkundige gemiddeld is

altyd groter of dieselfde as die rekenkundige gemiddeld)


� Geweegde rekenkundige gemiddeld

Kyk na die volgende voorbeeld:

ŉ Restaurant-eienaar wil graag weet wat die gemiddelde koste per kilogram meel is. Hy het

80kg meel in die vorige maand gekoop. Die meel is by verskillende verskaffers gekoop. Die

strokies dui op die volgende aankope:

Koste per kilogram Kilogram

Week 1 R9.50 10

Week 2 R10.00 4

Week 3 R9.80 6



Week 4 R7.40 60

Totaal R36.7 80kg

Wat is gemiddelde koste per kilogram? As die rekenkundige gemiddeld gebruik sou word,

sou dit maklik wees om die vier weke se koste per kilogram bymekaar te tel en deur 4 te

deel. Die antwoord sal egter nie so akkuraat wees nie. Week 4 se bedrag behoort meer

gewig te dra, omdat die eienaar meer meel teen daardie prys gekoop het.

In ŉ geval waar al die waardes nie dieselfde gewig dra nie, word die geweegde

rekenkundige gemiddeld gebruik. Elke waarde word met sy gewig vermenigvuldig, bymekaar

getel en dan deur die som van die gewigte (in hierdie geval die totale kilogram) gedeel. Vir ŉ

beter illustrasie sal die rekenkundige gemiddeld en geweegde rekenkundige gemiddeld met

mekaar vergelyk word:

Rekenkundige gemiddeld = (9.50 + 10.00 + 9.80 + 7.40) / 4 = R9.18 per kilogram

Volgens die rekenkundige gemiddeld het die eienaar gemiddeld R9.18 per kilogram meel

betaal.

Geweegde rekenkundige gemiddeld

= [(9.50 x 10) + (10.00 x 4) + (9.80 x 6) + (7.40 x 60)] / 80

= R7.97 per kilogram.

Omdat die hoeveelheid kilogram wat teen elke prys aangekoop is, ook nou in ag geneem is,

verskil die gemiddelde koste per kilogram drasties. In werklikheid het die eienaar dus

gemiddeld R7.97 per kilogram betaal.


1.7.2 Nie-sentrale maatstawwe van lokaliteit


Die vorige maatstawwe van lokaliteit was gemoeid met een of ander "middelpunt" of sentrale

punt. Daar is egter maatstawwe van lokaliteit wat nie met die middelpunt van data te make

het nie. Hierdie maatstawwe is kwantiele en persentiele.

� Kwantiele

Kwantiele is maatstawwe wat geordende data in vier ewe groot dele (kwarte) deel. Die

statistikus moet die spesifieke waardes bepaal wat sorg dat daar ewe veel waardes in elke

kwantiel is. Daar kan tussen die volgende kwantiele onderskei word:



• Q1: Hierdie is die spesifieke waarde wat skeiding maak tussen die laagste 25% van

alle waarnemings/observasies en die oorblywende 75%.

• Q2: Hierdie is die waarde wat presies in die middel van die waardes voorkom en dus

die data presies in die helfte deel. (Dit is dus die mediaan van die data.)

• Q3: Hierdie is die waarde wat die boonste 25% van alle waarnemings skei van die

oorblywende 75%.

Om ŉ kwantiel te bepaal is eintlik eenvoudig. Die stappe is soos volg:

• Sorteer die waardes van klein na groot.

• Bepaal hoeveel waarnemings/observasie (getalle) in die datastel voorkom.

• Tel 1 by hierdie getal en deel dit deur 4.

• Die antwoord is die posisie van Q1 (afgerond na die naaste heelgetal).

• Die formule vir die eerste kwantiel is dus (n+1) / 4, waar n = die hoeveelheid

observasies.

Die posisies van die drie kwantiele is dan:

• Q1= (n+1)/4

• Q2 = (n+1)/2 (Dit is ook die posisie van die mediaan)

• Q3 = (n+1)/4x3

As hierdie posisie gevind is (en afgerond is tot die naaste heelgetal), kan die spesifieke

waarde wat by elke kwantiel voorkom, bloot afgelees word. Soms wil ŉ mens egter ŉ meer

akkurate kwantiel bereken.

Voorbeeld

Beskou die volgende data. Die boonste ry verteenwoordig die waardes van die data. Die

onderste ry dui die plekke van die data aan.

10 30 34 39 40 45 50 67 70 78 79 80 90 92 95 96 97 98 99 99

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Die eerste kwantiel se posisie is by

(n+1) / 4

= 21/4 = 5.25



As die breuk geïgnoreer word, is die posisie 5. Die waarde wat by posisie 5 voorkom, is 40.

Hierdie is dus ŉ benaderde waarde van die eerste kwantiel.

Om ŉ meer akkurate waarde te bepaal, kan Formule 3.6 in die handboek gebruik word met

die volgende waardes:

• Benaderde kwantielwaarde (hierbo bereken) = 40

• Breukdeel van kwantielposisie (dus breukdeel van 5.25) = 0.25

• Waarde na kwantielposisie = waarde by posisie 6 = 45

Kwantielwaarde = 40 + 0.25 x (4 - 40)

= 40 + 1.25

= 41.25

Dus: 25% van alle waardes is kleiner of gelyk aan 41.25.

(Nota: Vir die benaderde posisie in bogenoemde formule, word die posisie nie afgerond nie,

maar die breuk word bloot verwyder.)

Doen self:

• Bereken nou die boonste kwantiel (Q3) van die data hierbo genoem. (Die antwoord is

95.75.)

• Doen nou Voorbeeld 3.7 in die handboek.

• Soos met die mediaan, is die volledige data nie altyd beskikbaar nie, maar slegs

kategorieë. Die formule om die mediaan te bereken, is aangepas om die kwantiele

ook te bereken. Hierdie formule word in die handboek verskaf as Formules 3.7 en

3.8 vir die eerste en derde kwantiel onderskeidelik. Maak seker dat jy hierdie

formules verstaan.

• Doen nou Voorbeeld 3.8 in die handboek.

� Persentiele

ŉ Persentiel is soortgelyk aan ŉ kwantiel. Waar kwantiele die data in kwarte deel, sal

persentiele die data in 100 gelyke dele deel. Die 25e en 75e persentiele is dus dieselfde as

die eerste en derde kwantiele. Die 50e persentiel is dan ook dieselfde as die 2e kwantiel, wat

gelyk is aan die mediaan. Om die persentiele te bereken, is soortgelyk aan die formules vir

kwantiele. Om die posisie van die xe persentiel te bereken, word die volgende formule

gebruik:



�� + � #

Die waarde van die persentiel word dan op dieselfde manier bereken as die kwantiele.

1.7.3 Maatstawwe van spreiding


Gestel ŉ bemarkingsagentskap wil ŉ advertensie-veldtog loods wat spesifiek op ŉ sekere

ouderdomsgroep gefokus is. In ŉ steekproef word die volgende ouderdomme gevind:

14 15 16 13 90 95

Die rekenkundige gemiddeld van hierdie ouderdomme is 40.5. As die agentskap egter hul

advertensieveldtog rig op mense wat 40 jaar oud is, sal dit ŉ mislukking wees. (Daar is nie

een kliënt in bogenoemde steekproef wat naby aan 40 jaar oud is nie.)

Daar het dus ŉ behoefte ontstaan om die akkuraatheid van die rekenkundige gemiddeld te

bepaal. Met ander woorde, daar moet bepaal word op watter wyse al die verskillende

waardes rondom die gemiddeld versprei is. Die statistieke wat hiervoor gebruik word, word

die maatstawwe van spreiding genoem.

Die reikwydte

Die reikwydte is reeds vroeër bespreek. Hierdie statistiek bepaal bloot hoe ver die grootste

en kleinste waardes van mekaar is.

Voorbeeld

Bereken die reikwydte van die volgende getalle:

14 15 16 13 90 95

Die formule vir die reikwydte word as Formule 3.9 in die handboek weergegee:

xmax = die kleinste waarde = 13

xmin = die grootste waarde = 95

Die reikwydte is dus: 95 – 13 = 82. Hierdie groot reikwydte behoort al reeds ŉ aanduiding te

gee dat die gemiddeld deur groot verskille in die waardes beïnvloed kan word. (As die

reikwydte, byvoorbeeld, 2 of 3 was, sou die gemiddeld moontlik baie meer akkuraat gewees

het).

Die reikwydte word egter deur uitskieters beïnvloed. Daarom word meer akkurate

maatstawwe van spreiding benodig.



Doen Voorbeeld 3.9 in die handboek.

� Variansie en standaardafwyking

Variansie en standaardafwyking word hier saam bespreek omdat die standaardafwyking

bloot die vierkantswortel van die variansie is:

Variansie se simbool is s2 en standaardafwyking is s. (Hierdie is die simbole vir die

standaardafwyking en variansie van die steekproef. Ooreenkomstige simbole vir die

populasie se standaardafwyking en variansie is $ en $�)

Die formule om die variansie te bereken word as Formule 3.10 in die handboek verskaf.

Hierdie formule mag intimiderend lyk. Dit is egter heel eenvoudig. Kyk weer na die

verskillende ouderdomme.

14 15 16 13 90 95

Die getalle, asook die rekenkundige gemiddeld van 40.5, word op die getallelyn hieronder

aangedui.

Volg die volgende stappe:

• Vir elke waarde:

o Bereken hoe ver hierdie waarde van die gemiddeld af is: (xi - x̄)

o Kwadreer hierdie antwoord (om van moontlik negatiewe getalle ontslae te raak).

Wat beteken die Σ-teken? Alles aan die regterkant van die Σ moet bymekaar

getel word.

• Tel nou al hierdie gekwadreerde afstande bymekaar en deel dit deur die n-1.

(Onthou, n is die hoeveelheid waardes wat geobserveer is.)

Vir bogenoemde geval, sal die stappe dus soos volg uitgevoer word:

Die gemiddeld is 40.5.

Begin eers deur die boonste gedeelte van die breuk (in Formule 3.10 in die handboek) te

bereken.

%�#& − # ̄�

= (14 - 40.5) 2 + (15 - 40.5) 2 + (16 - 40.5) 2 + (13 - 40.5) 2 + (90 - 40.5) 2 + (95 - 40.5) 2

= (-26.5) 2 + (-25.5) 2 + (-24.5) 2 + (-27.5) 2 + (49.5)2 + (54.5) 2



= 702.25 + 650.25 + 600.25 + 756.25 + 2450.25 + 2970.25

= 8 129.50

Hierdie getal word dan deur n-1 gedeel, n-1 = 6-1 = 5.

Dus

8129.505

= 1 625.9

Dus is s2 = 1 625.9

Wat beteken hierdie getal? Die variansie is nie in dieselfde eenheid (jare) as wat die data is

nie en is dus moeilik om te interpreteer. Om hierdie rede word die vierkantswortel van die

variansie verkry. Hierdie statistiek, s, staan bekend as die standaardafwyking en word in

dieselfde eenheid gemeet as die oorspronklike data.

s = √/��

= √1625.91

= 40.32 jaar.

Wat beteken ŉ standaardafwyking van 40.32 jaar?

Dit beteken dat die gemiddelde afstand tussen elke waarde en die rekenkundige gemiddeld,

40.32 is:

• Hoe groter hierdie getal is, hoe verder is die waardes van die gemiddeld versprei.

• Daar kan dus gesê word dat bogenoemde gemiddeld nie baie "akkuraat" is as

aanduiding van alle waardes nie.

• As die standaardafwyking vir die ouderdomme, byvoorbeeld, 2 of 3 jaar was, kon

daar met redelike sekerheid gesê word dat die meeste ouderdomme baie naby aan

die gemiddeld is. Die advertensieveldtog kan dus met meer sekerheid op die

gemiddelde ouderdom gefokus word.

Doen nou Voorbeeld 3.10 en 3.11 in die handboek.

Dit is nie op hierdie stadium belangrik om Figuur 3.3 in die handboek (die normaal-kromme)

te verstaan nie. Wanneer hipotesetoetsing later bespreek word, sal daar weer na hierdie

kromme gekyk word. Wat egter belangrik is, is om te besef dat die rekenkundige gemiddeld

(x̄) en die standaardafwyking (s) ŉ belangrike rol hier speel.



Variansiekoëffisiënt

In hierdie stadium weet ons dat, vir die ouderdomme wat hierbo genoem is, ŉ

standaardafwyking van 40.32 baie groot is en dat die data nie rondom die gemiddeld van

40.5 gesentreer is nie. Die besluit of die standaardafwyking "groot" of "klein" is, is egter

subjektief in hierdie geval.

Voorbeeld

Datastel A het ŉ gemiddeld van 40.5 en ŉ standaardafwyking van 40.32. Datastel B het ŉ

gemiddeld van 13 598 en ŉ standaardafwyking van 1 250. Watter standaardafwyking is die

"grootste"? Dit is duidelik dat 1 250 ŉ groter getal as 40.32 is, maar die gemiddeld moet

altyd in ag geneem word as die standaardafwyking geïnterpreteer word. Om hierdie rede is

die variansiekoëffisiënt (CV) geskep.

Die formule word as Formule 3.13 in die handboek weergegee. In eenvoudige terme is:

CV = s / x̄

Vir datastel A (en ook die ouderdomsvoorbeeld) is:

CV = 40.32 / 40.5

= 0.996

Vir datastel B is:

CV = 1 250 / 13 598

= 0.092

Hoe groter die CV is, hoe groter is die standaardafwyking ten opsigte van die gemiddeld en

hoe minder "akkuraat" is die rekenkundige gemiddeld. Die tweede datastel se gemiddeld is

dus ŉ baie beter aanduiding van die gemiddelde waarde as die eerste datastel.


1.7.4 Maatstawwe van skeefheid

Bestudeer die handboek: Paragraaf 3.5 – 3.6.

Die wyse waarop data rondom die gemiddeld versprei is, kan grafies en numeries voorgestel

word. ŉ Histogram met relatiewe klein intervalle, kan hierdie data grafies voorstel. Daar word

onderskei tussen drie wyses waarop data rondom die gemiddeld versprei word:

� Simmetrie

Die waardes word simmetries rondom die gemiddeld versprei. Dit beteken dat die

frekwensies van waardes aan die linkerkant en die frekwensies van waardes aan die



regterkant ooreenstem. Figuur 1.18 hieronder is ŉ voorbeeld van ŉ simmetriese verdeling.

(Die handboek gebruik ŉ lyngrafiek om hierdie verdelings voor te stel. Vir alle verdere

verduidelikings sal die lyngrafieke gebruik word).

Figuur 1. 18: ŉ Simmetriese verdeling van data

In bogenoemde grafiek is die rekenkundige gemiddeld, die mediaan en die modus dieselfde

getal wees.

� Positiewe skeefheid

Die waardes met die grootste frekwensies sal na die linkerkant van die gemiddeld neig. Die

"stert" gedeelte is dus aan die regterkant. Figuur 1.19 stel ŉ dataverspreiding voor wat

positief skeef is.



Figuur 1. 19: ŉ Datastel wat positief skeef is

In bogenoemde datastel sal die mediaan kleiner as die gemiddeld wees. Die modus sal

egter die kleinste getal wees (in hierdie geval 6.5).

� Negatief skeef

In hierdie geval sal die grootste frekwensies aan die regtekant van die gemiddeld voorkom.

Die waardes wat dus die meeste voorkom, sal almal groter as die gemiddeld wees.

Figuur 1.20 stel ŉ datastel voor wat negatief skeef is.

Figuur 1. 20: ŉ Datastel wat negatief skeef is



In hierdie geval sal die gemiddeld die kleinste wees, gevolg deur die mediaan en dan deur

die modus.

� Pearson se koëffisiënt van skeefheid

Hoewel data se simmetrie grafies voorgestel kan word, is dit ook moontlik om bereken te

word. Hiervoor word Pearson se koëffisiënt van skeefheid (SKp) gebruik. Die formule word

as Formule 3.14 in die handboek gegee. Hierdie formule kan, soos die berekening van die

standaardafwyking, tydrowend wees. Om hierdie rede, is daar ŉ tweede formule gegee om

as beraming van hierdie statistiek te dien. Die beraming se formule word as Formule 3.15 in

die handboek gegee.

Interpretasie

Skp kan enige getal wees:

• As hierdie getal 0 is (met ander woorde Skp = 0), is die data simmetries om die

gemiddeld versprei.

• As hierdie getal groter as nul is (met ander woorde Skp > 0), is die data positief

skeef.

• As hierdie getal kleiner as nul is (met ander woorde Skp < 0), is die data negatief

skeef.

Die grootte van die getal bepaal hoe ver die data positief of negatief skeef is.

Doen Voorbeeld 3.13 in die handboek. Hierdie voorbeeld verwag van jou om:

• Skp te bereken

• Skp te benader/beraam

• Skp te interpreteer

� Die houer-en-stipping-grafiek

Die houer-en-stipping-grafiek is ŉ spesiale maatstaf wat gebruik kan word om vyf belangrike

statistiese waardes grafies voor te stel. Hierdie waardes is reeds bespreek:

• Minimumwaarde

• Q1 of die onderste kwantiel

• Q2 of M2, die mediaan

• Q3 of die boonste kwantiel

• Maksimumwaarde



Bestudeer Paragraaf 3.6 in die handboek om meer inligting ten opsigte van die houer-en-

stipping-grafiek te vind. Dit is belangrik dat ŉ houer-en-stipping-grafiek geïnterpreteer kan

word.


1.7.5 Keuse van statistiek en MS Excel


Wanneer word die rekenkundige gemiddeld gebruik? Wanneer is dit beter om ŉ mediaan of

modus te bereken? Wanneer is ŉ reikwydte voldoende en wanneer is ŉ standaardafwyking

nodig? Die keuse van die regte statistiek om te gebruik, is net so belangrik soos die korrekte

berekening daarvan. Om, byvoorbeeld, ŉ rekenkundige gemiddeld vir kwantitatiewe,

kategoriese data te bereken, is nutteloos en kan glad nie geïnterpreteer word nie. In so ŉ

geval sal ŉ modus baie meer inligting oor die data kan weergee.

Die kriteria vir, en kriteria van, beskrywende statistieke word in Paragraaf 3.7 weergegee.

Al die statistieke en grafieke wat in hierdie afdeling van die studie-eenheid bespreek is, kan

ook in Microsoft Excel bereken word. Dit is belangrik dat die student al hierdie statistieke

met die hand kan bereken. Dit is egter handig – veral in die praktyk – vir studente om

Microsoft Excel hiervoor te gebruik. Dit is egter moontlik dat die antwoorde in Excel en dié

wat met die hand bereken is, effens kan verskil. Die rede is dat Excel geen waardes afrond

nie.

1.7.6 Selfevaluering: Hoofstuk 3

Doen al die oefeninge aan die einde van Hoofstuk 3. Daar is 26 oefeninge. As jy hierdie vrae

korrek kan beantwoord, het jy numeriese beskrywende statistiek onder die knie!

1.8 Samevatting

Statistiek is ŉ versameling beginsels en tegnieke wat gebruik kan word om data na inligting

om te skakel sodat dit vir besluitneming gebruik kan word. Dit is dus belangrik dat hierdie

data van hoë kwaliteit is. Data kan kwalitatief of kwantitatief wees. Kwalitatiewe data kan in

woorde beskryf word, maar kan ook numeries voorgestel word. Data kan ook diskreet of

kontinu wees. Die vlakke waarop data gemeet kan word, is (van die laagste na die hoogste

vlak) nominaal, ordinaal, interval en ratio. Data kan, onder andere, deur observasies,

vraelyste en eksperimente versamel word.

Figuur 1.21 dui aan watter grafiese beskrywende statistiek in watter gevalle gebruik kan

word:



Figuur 1. 21: Verskillende opsies beskrywende statistiek

Grafiese

beskrywende

statistiek

Kategoriese data

Een veranderlike

Kategoriese

frekwensietabel

Kolomgrafiek

Sirkelgrafiek

Twee

veranderlikes

Kruis-

tabuleringstabel

Gestapelde

kolomgrafiek

Meervoudige

kolomgrafiek

Numeriese data

Een veranderlike

Numeriese

frekwensie-

verspreiding

Histogram

Kumulatiewe

frekwensie-

verspreiding

Ogive

Boksplot

Scatterplot

Lyngrafiek

Lorenz-kurwe



Notas


Studie-eenheid 2: Waarskynlikhede en steekproewe Bladsy 51

Studie-eenheid 2: Waarskynlikhede en steekproewe


Kennis en begrip



• Inleiding tot waarskynlikhede

• Waarskynlikheidsverspreidings

• Steekproewe en steekproefverspreidings

Vaardighede


• tussen verskillende waarskynlikheidsbegrippe en -reëls te onderskei.

• basiese waarskynlikheidsberekeninge te doen.

• tussen diskrete en kontinue waarskynlikheidsverspreidings te onderskei.

• die eienskappe van die normaalverdeling te identifiseer.

• waarskynlikhede met die formules van waarskynlikheidsverspreidings te bereken

• steekproefmetodes te evalueer en die korrekte steekproefmetode vir ŉ spesifieke

situasie te kies.

• ŉ normaalverdeling gebruik om ŉ steekproefverspreiding te konseptualiseer.


Wegner, T. 2013. Applied Business Statistics. 3rd ed. Claremont: Juta.

Hoofstuk 4: Paragraaf 4.1 – 4.9

Hoofstuk 5: Paragraaf 5.1 – 5.10

Hoofstuk 6: Paragraaf 6.1 – 6.4, 6.6, 6.8






Gesamentlik

uitputbaar

Gebeurtenisse waarvan die waarskynlikhede, indien dit

bymekaar getel word, 1 is.

Normaalverdeling ŉ Klokvormige verdeling van waarskynlikhede. Vir ŉ

standaard-normaalverdeling is die gemiddeld 0 en die

standaardafwyking 1.

Onderling

uitsluitend

Twee gebeurtenisse wat nie tegelyktydig kan plaasvind nie.

Samevoeging Die waarskynlikheid dat ten minste een van twee

gebeurtenisse sal plaasvind.

Snyding Die waarskynlikheid dat twee gebeurtenisse beide sal

plaasvind.

Statisties

onafhanklik

Een gebeurtenis beïnvloed nie die waarskynlikheid dat ŉ

ander gebeurtenis sal plaasvind nie.

Vlak van sekerheid Die sekerheid waarmee die navorser ŉ gevolgtrekking oor die

populasie wil maak, gebaseer op data wat deur ŉ steekproef

verkry is. Die vlak van sekerheid is gewoonlik 90%, 95% of

99%.

Voorwaardelike

waarskynlikheid

Die waarskynlikheid dat een gebeurtenis sal plaasvind,

gegewe dat ŉ ander (statisties afhanklike) gebeurtenis wel

plaasgevind het.

2.4 Inleiding

ŉ Navorser wil dikwels voorspellings maak: Wat is die kans dat verkope gaan toeneem? Wat

is die waarskynlikheid dat die aandelemark gaan daal? Om hierdie vrae te beantwoord, moet

waarskynlikhede bereken word. Praktiese voorspellings soos hierdie is egter nie die enigste

rede waarom waarskynlikhede in die sillabus ingesluit is nie. Dit vorm ook die basis waarop

hipotesetoetsing, ŉ onderwerp wat in Studie-eenheid 3 en 4 bespreek word, gedoen word.



Hierdie studie-eenheid gaan ŉ agtergrond oor waarskynlikhede bied. Daar gaan gekyk word

na verskillende beginsels en reëls van waarskynlikhede. Daarna gaan na spesifieke

waarskynlikheidsverspreidings gekyk word.

Laastens, word steekproewe in meer detail bespreek. ŉ Steekproef is ŉ kleiner versameling

van elemente (mense, produkte, ensovoorts) wat uit die groter populasie geneem word. ŉ

Steekproef word dan gebruik om gevolgtrekkings ten opsigte van die populasie te maak. Die

rasionaal onderliggend aan die gebruik van ŉ steekproef vir hierdie gevolgtrekkings, word in

hierdie studie-eenheid bespreek.

2.5 Waarskynlikhede


Waarskynlikhede vorm, tot ŉ mate, die grondslag vir statistiese afleidings. Die volgende

vraag word dikwels gevra: "Met hoeveel sekerheid kan ek ŉ afleiding, ten opsigte van ŉ

populasie op ŉ resultaat van ŉ steekproef, baseer?"

Voorbeeld

Navorsing word gedoen om werknemers van Maatskappy X se mening oor ŉ nuwe reël te

toets. Omdat daar 30 000 werknemers is, word ŉ steekproef gebruik om die gevolgtrekkings

te maak. Die steekproef bestaan uit 1 000 personeellede. Uit hierdie 1 000 werknemers is

60% positief oor die nuwe reël. Die vraag ontstaan nou:

Met hoeveel sekerheid kan gesê word dat 60% van die 30 000 werknemers ook positief oor

die nuwe reël is? Met ander woorde, met hoeveelheid sekerheid kan die 60% op die hele

populasie van toepassing gemaak word?

Ten opsigte van waarskynlikhede kan die vraag herfraseer word na: "Wat is die

waarskynlikheid dat ek ŉ fout gaan maak, indien ek dieselfde (60%) aanname oor die

populasie maak?" In die meeste gevalle probeer statistici hierdie waarskynlikheid onder 0.05

(of 5%) hou.

Om hierdie vraag konsekwent te kan beantwoord, is dit belangrik om ŉ goeie agtergrond oor

waarskynlikhede te verkry.

2.5.1 Basiese beginsels en konsepte van waarskynlikhede


Woord van waarskuwing:

Die student word weer daaraan herinner dat die begeleidingsgids bloot ŉ hulpmiddel is



om die handboek deur te werk. Dit is egter van uiterste belang om die handboek deur te

werk en alles in die genoemde paragrawe te lees.

Daar word onderskei tussen subjektiewe en objektiewe waarskynlikhede. Subjektiewe

waarskynlikheid kan nie statisties gestaaf word nie en word nie in statistiese berekeninge

gebruik nie. Byvoorbeeld, een vriend sê aan ŉ ander "daar is ŉ baie goeie waarskynlikheid

dat ek aan die slaap gaan raak as ons daardie film kyk". Die kanse dat daar statistiese data

bestaan vir hierdie stelling is skaars.

Vir die doel van hierdie vak word na objektiewe waarskynlikheid verwys. Dit is

waarskynlikhede wat deur statistiek bereken kan word. Die formule van ŉ basiese

waarskynlikheid word deur Formule 4.1 in die handboek voorgestel.

Doen Voorbeeld 4.1 in die handboek om te verseker dat jy die formule wel kan gebruik.

ŉ Waarskynlikheid word as getal tussen 0 en 1 voorgestel (met 0 en 1 ingesluit). Hierdie

waarskynlikheid kan op drie wyses bereken word. Figuur 2.1 stel hierdie wyses grafies voor:

Figuur 2. 1: Wyses om waarskynlikhede af te lei

(Wegner, 2013:102)

Waarskynlikhede het ook spesifieke eienskappe. Om hierdie eienskappe bloot te

memoriseer gaan nutteloos wees. Elkeen van hierdie eienskappe maak sin. Dit help dus om

hierdie eienskappe aan die hand van die voorbeelde in die handboek te leer. Hierdie

eienskappe word in paragraaf 4.3 in die handboek bespreek. Die eienskappe is:

•Die uitkomste is vooraf bekend

•Bv. as ŉ munt gegooi word, is dit bekend dat die uitkoms slegs een van twee kan

wees. Die waarskynlikheid is dus altyd 0.5

A priori

•Die waardes van r en n is nie bekend nie (sien Formule 4.1 in die handboek),

maar kan deur dataversameling wel gevind word

•Bv. Voorbeeld 4.2 in die handboek

Empiries

•Deur die gebruik van sekere waarskynlikheidsverspreidings kan waarskynlikhede

vir spesifieke geleenthede bepaal word.

•Sien Hoofstuk 5.

Wiskundig



• ŉ Waarskynlikheid is altyd tussen 0 en 1, met 0 en 1 ingesluit. (Bv. die

waarskynlikheid dat dit volgende week gaan reën is 0.7; die waarskynlikheid dat ek

die Lotto gaan wen is 0.00000002.)

• Indien iets onmoontlik is, is die waarskynlikheid dat dit gaan gebeur, 0. (Bv. die

waarskynlikheid dat ek vanaand op Mars gaan beland, is 0).

• As iets definitief gaan gebeur, is die waarskynlikheid 1. (Bv. die waarskynlikheid dat

ek eendag sal doodgaan, is 1.)

• As die waarskynlikhede van alle moontlik gebeurtenisse bymekaar getel word, is die

antwoord 1. (Die handboek verskaf ŉ kort voorbeeld onder paragraaf 4.3 in die

handboek om hierdie reël beter te illustreer.)

• Die waarskynlikheid dat iets nie gaan gebeur nie, is dieselfde as 1, minus die

waarskynlikheid dat dit wel gaan gebeur.

Bestudeer hierdie eienskappe in die handboek. Maak ook seker dat jy die Wiskundige

formules vir elk van hierdie reëls ken voordat jy verder gaan.

Doen nou Voorbeeld 4.2 in die handboek om te sien hoe hierdie eienskappe toegepas

kan word.

Paragraaf 4.4 verduidelik vyf belangrike basiese statistiese konsepte. Hierdie konsepte is

afkomstig van algemene versamelingsleer (set theory). Die vyf begrippe is:

• Snyding (intersection) van gebeurtenisse (events)

• Samevoeging (union) van gebeurtenisse

• Onderling uitsluitend (mutually exclusive) gebeurtenisse

• Gesamentlik uitputbare (Collectively exhaustive) gebeurtenisse

• Statisties-onafhanklike gebeurtenisse.

Werk baie noukeurig deur Voorbeeld 4.3 in die handboek. Hierdie voorbeeld verskaf ŉ

datastel waarmee elk van die bogenoemde begrippe wiskundig, sowel as grafies

voorgestel word.



2.5.2 Berekening van waarskynlikhede


In paragraaf 4.5 word drie waarskynlikhede bereken:

• Marginale waarskynlikhede. Hierdie is die waarskynlikheid dat ŉ enkele

gebeurtenis sal plaasvind. Byvoorbeeld: Die waarskynlikheid dat dit volgende week

gaan reën, is 0.4. Daar is slegs een waarskynlikheid wat bereken moet word. Die

formule hiervoor is reeds in die handboek as Formule 4.1 gegee.

Doen Voorbeeld 4.4 (Vraag (a) en (b)) in die handboek om te verstaan hoe ŉ

marginale waarskynlikheid bereken word.

• Gesamentlike waarskynlikheid (joint probability). In hierdie geval word die

waarskynlikheid dat twee gebeurtenisse gelyktydig plaasvind, bereken. Bv. wat is

die waarskynlikheid dat dit volgende week tegelyktydig gaan reën en gaan hael?

(Hierdie waarskynlikheid word ook voorgestel deur die snyding-beginsel hierbo

genoem.)

Nota: Hoewel die gesamentlike waarskynlikheid in die tabel verkry kon word (sien

Voorbeeld 4.4), is daar ook ŉ formule om hierdie waarskynlikheid te bereken. Die

gesamentlike waarskynlikheid van geleentheid A en B se formule is:

P(A∩B) = P(A) x P(B)

Doen Voorbeeld 4.4 (Vraag (c)) in die handboek om te verstaan hoe ŉ

gesamentlike waarskynlikheid verkry kan word.

• Voorwaardelike waarskynlikheid (conditional probability) is die waarskynlikheid dat

ŉ spesifieke gebeurtenis (A) sal plaasvind, gegewe dat ŉ ander gebeurtenis (B) wel

plaasgevind het. Dit beteken dat die feit dat B wel plaasgevind het, die steekproef in

so ŉ mate verminder dat dit A se waarskynlikheid sal beïnvloed. Die formule om ŉ

voorwaardelike waarskynlikheid te meet, word as Formule 4.2 in die handboek

verskaf.

Voorbeeld

Uit ŉ groep van 100 personeellede, is 30 ingenieurs, 20 administratiewe personeel

en 50 verkoopspersoneel. Uit dieselfde groep personeellede is 25 in Johannesburg,



50 in Pretoria en 25 in Kaapstad. Gegewe dat ŉ spesifieke personeellid in

Johannesburg is, wat is die kans dat sodanige personeellid ook ŉ ingenieur is?

Oplossing:

Gestel A: Die personeellid is ŉ ingenieur.

Gestel B: Die personeellid is in Johannesburg.

Die formule vir die voorwaardelike waarskynlikheid, vereis dat P(A∩B) bereken moet

word:

P(A∩B)

= P(A) x P(B)

= 30/100 x 25/100

= 0.075

Die formule vereis ook dat P(B) bereken moet word:

P(B)

= 25/100

= 0.25

Vervang hierdie nou in Formule 4.2 in die handboek in:

P(A/B) = 3�4∩5 3�5

= �.�67�.�7

= 0.3

Daar is dus ŉ 0.3 waarskynlikheid (of 30% kans) dat ŉ werknemer ŉ ingenieur is, as

dit bekend is dat hierdie werknemer wel in Johannesburg is.

Doen nou Voorbeeld 4.4 (Vraag (d)) in die handboek. Hierdie voorbeeld vereis nie

van jou om P(A∩B) te bereken nie, omdat dit bloot van die tabel afgelees kan

word.



2.5.3 Waarskynlikheidsreëls


Om P(A∪B) en P(A∩B) te bereken is nie moeilik nie.

P(A∪B)

Om hierdie statistiek te bereken moet die vraag gevra word:

Is die gebeurtenisse onderling uitsluitend? Met ander woorde, is dit moontlik dat A en B

gelyktydige kan plaasvind of nie? Indien dit nie moontlik is vir twee gebeurtenisse om tegelyk

plaas te vind nie (onderling uitsluitend), dan is die formule ŉ eenvoudige optelsom:

P(A∪B) = P(A) + P(B)

Indien dit egter wel moontlik is dat die twee geleenthede tegelyk kan plaasvind, moet die

gedeelte waar snyding plaasvind, afgetrek word. Dan is die formule:

P(A∪B) = P(A) + P(B) - P(A∩B)

Om laasgenoemde formule beter te verstaan, kan daar na die Venn-diagram gekyk word.

Verwys na Figuur 2.2 hieronder:

Figuur 2. 2: ŉ Venn-diagram om die optelreël te verduidelik

Wanneer P(A) bereken word, word die hele linkerkantste "sirkel" in berekening gebring.

Wanneer P(B) bereken word, word die hele regterkantse "sirkel" in berekening gebring. Die

gedeelte wat in die wit spasie in die middel lê, word dus twee keer in berekening gebring.

Om te verhoed dat daardie gedeelte (wat voorgestel word deur P(A∩B)) twee keer in ag

geneem word, word P(A∩B) dus weer afgetrek.

Hierdie formules word as Formule 4.3 en Formule 4.4 in die handboek verskaf.

Voltooi nou Voorbeeld 4.5 (Vraag (a) en (b)) in die handboek om die bogenoemde optelreëls

beter te verstaan.



P(A∩B)

Die formule om hierdie waarskynlikheid te bereken, is reeds gegee. Die formule wat vroeër

gegee is (naamlik P(A∩B) = P(A) x P(B)) kan slegs gebruik word, indien A en B statisties

onafhanklik is. Dit beteken dat A en B mekaar nie kan beïnvloed nie.

Die vermenigvuldigingsreël is dus:

• Indien A en B statisties onafhanklik is:

P(A∩B) = P(A) x P(B)

• Indien A en B nie statisties onafhanklik is nie:

P(A∩B) = P(A/B) x P(B)

Doen nou Voorbeeld 4.5 (Vraag (c) en (d)) in die handboek om die

vermenigvuldigingsreël beter te verstaan.

Nog ŉ wyse om waarskynlikhede te bereken en grafies voor te stel, is deur middel van

waarskynlikheidsboomdiagramme (probabilities trees).

Lees deur Paragraaf 4.7 en voltooi Voorbeeld 4.6 om waarskynlikheidsboomdiagramme

te verstaan.

2.5.4 Telreëls: Permutasies en kombinasies


In Paragraaf 4.8 in die handboek word twee telreëls verduidelik. Die eerste behels

permutasies en die tweede, kombinasies.

Om die verskil tussen permutasies en kombinasies te verstaan, kan Voorbeeld 4.7

(permutasies) en Voorbeeld 4.8 (kombinasies) in die handboek voltooi word. Belangrik:

Kyk ook na die formule vir n faktor (n!) verskaf as Formule 4.8 in die handboek.

Die grootste verskil tussen permutasies en kombinasies, is die belangrikheid van volgorde

by eersgenoemde, terwyl volgorde nie van toepassing is by laasgenoemde nie.

Om hierdie verskil te verduidelik, kyk na die volgende twee datastelle:

Datastel A: 2, 4, 6, 8, 10

Datastel B: 4, 6, 8, 10, 2



Hierdie is twee verskillende permutasies (omdat die volgorde verskil, selfs al is die waardes

dieselfde), maar slegs een kombinasie (omdat die volgorde nie saak maak nie).

� Permutasiereël

Kyk dan na die volgende voorbeeld:

ŉ Onderwyser laat tien kinders daagliks in ŉ ry staan. Om dit interessant te maak, moet die

kinders elke dag ŉ nuwe volgorde vorm. Hoeveel dae gaan dit neem voordat die kinders

elke moontlike volgorde gebruik het?

Dag Plek

1

Plek

2

Plek

3

Plek

4

Plek

5

Plek

6

Plek

7

Plek

8

Plek

9

Plek

10

1 Jan Sarie Jessy Karin Willem Petra Bossie Barry Rian Juan

2 Sarrie Jessy Karin Willem Petra Bossie Barry Rian Juan Jan

3 Jessy Karin Willem Petra Bossie Barry Rian Juan Jan Sarie

4 ... ... ... ... ... ... ... ... ... ...

n!

In hierdie geval is n = 10. Dit is dus die hoeveelheid kinders wat in die ry sorteer word.

Omdat daar nie ŉ subgroep van kinders uit die 10 geneem word nie, is die formule redelik

eenvoudig.

Die hoeveelheid permutasies (wyses waarop die kinders in die ry sorteer kan word), is n!

Omdat n = 10 kinders:

n! = 10 x 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1 (Sien Formule 4.8 in die handboek)

= 3 628 800

Dus, sal die kinders meer as 3.5 miljoen dae neem om al die moontlike kombinasies op te

gebruik!

Gestel nou dat die onderwyser besluit om drie kinders uit die groep te kies. Een word as die

klaskaptein gekies, ŉ ander word as die klassekretaris gekies en die derde word as die

klastesourier gekies. Hierdie drie persone word uit 10 totale leerders gekies. Hoeveel

verskillende kombinasies is moontlik?



Dag Klaskaptein Sekretaris Tesourier

1 Jan Jessy Willem

2 Jan Jessy Rian

3 Willem Jessy Rian

4 Willem Jan Bessie

... ... ... ...

?

Omdat daar nou ŉ subset uit die groter groep leerders gekies word, word Formule 4.10 in

die handboek gebruik. Die volgorde is ook belangrik (kaptein, sekretaris, tesourier), dus is dit

ŉ permutasie.

Die formule is:

nPr = �!

��: !

= ��!

�� !

= �;�<<��

6=;=7=�=�=�=�

= 720

Daar is dus 720 moontlike samestellings van die leierskapkomitee vir die klas van tien

leerders.

Doen nou Voorbeeld 4.9 om permutasies onder die knie te kry.

� Kombinasiereël

Waar ŉ kombinasie ter sprake is, is die volgorde nie van toepassing nie. Daar word dus

meer na versamelings gekyk. Kyk weer na die klas-van-tien voorbeeld hierbo genoem:

Die onderwyseres besluit om nie portefeuljes (klaskaptein, sekretaris en tesourier) aan die

kinders toe te ken nie. Daar word bloot drie kinders gekies om op die komitee te dien. Daar

is dus nou ŉ groep kinders (n) waaruit drie kinders gekies moet word (r). As die onderwyser

elke dag ŉ ander komitee uit die tien kinders wil aanstel, hoeveel dae sal sy kan aanhou

totdat alle moontlike unieke kombinasies gebruik is?



Die volgorde waarin die kinders gekies word, is nie belangrik nie (almal se plekke op die

komitee is dieselfde). Dus word daar nie van permutasies gebruik gemaak nie, maar

kombinasies.

Gebruik Formule 4.11 in die handboek:

nCr = �!

:!��: !

= ��!�!�6!

= �;�<<��; �7��

= 120

Na 120 dae, sal die onderwyser alle moontlik kombinasies van kinders op die komitee gehad

het.


Daar is 21 vrae aan die einde van Hoofstuk 4. Beantwoord al hierdie vrae. Dit is baie werk

en gaan heelwat tyd in beslag neem, maar dit sal jou help om te verseker dat jy die werk

onder die knie het.

2.6 Waarskynlikheidsverspreidings

Bestudeer die handboek: Paragraaf 5.1 tot 5.10.

In Hoofstuk 4 in die handboek is waarskynlikhede bereken deur data te versamel (empiries).

Waarskynlikhede kan ook wiskundig bereken word deur sogenaamde waarskynlikheids-

verspreidings. Hoofstuk 5 bespreek drie verskillende waarskynlikheidsverspreidings. Die

normaalverspreiding is veral belangrik, omdat hierdie verspreiding die grondslag vorm vir

statistiek wat in die res van die vak bespreek word.

ŉ Waarskynlikheidsverspreiding is ŉ lys van alle moontlike uitkomste van ŉ ewekansige

(random) veranderlike met elk se waarskynlikhede. Byvoorbeeld, ŉ eenvoudige

waarskynlikheidsverspreiding is dié van ŉ muntstuk wat gegooi word. Die uitkomste wanneer

ŉ muntstuk gegooi word, kan kop of stert wees. Daar is dus slegs twee moontlike

uitkomstes. Die waarskynlikheid van beide is 0.5. Dus sal die waarskynlikheidsverspreiding

vir ŉ muntstuk wat gegooi wees, soos volg lyk:



Moontlike uitkoms Waarskynlikheid

Kop 0.5

Stert 0.5

Tabel 2. 1: Waarskynlikheidsverspreiding vir ŉ muntstuk wat gegooi word

Hierdie is natuurlik ŉ eenvoudige voorbeeld. Daar is slegs twee moontlike uitkomste. In

ander gevalle kan daar meer moontlike uitkomste wees. Die uitkomste hoef ook nie

noodwendig heelgetalle te behels nie. Byvoorbeeld, wanneer na salarisse verwys word, is

daar ŉ sekere waarskynlikheid dat iemand R1 000.00 salaris kry. Daar is ŉ ander

waarskynlikheid dat iemand R1 000.01 salaris kry en nog ŉ ander waarskynlikheid dat

iemand R1 000.02 salaris kry. Laasgenoemde is ŉ tipiese voorbeeld van ŉ kontinue

waarskynlikheidsverspreiding.

Waarskynlikheidsverspreidings word in twee kategorieë verdeel. Hierdie kategorieë, asook

die verskillende verspreidings wat in elk voorkom, word in Figuur 2.3 grafies voorgestel. (Let

wel: Die paragraafnommers wat in die figuur aangedui word, verwys na die paragrawe in die

handboek.)

Figuur 2. 3: Kategorieë van waarskynlikheidsverspreidings

(Bron: Wegner, 2013:125 – 142)

Waarskynlikheids-

verspreidings

Diskreet (par 5.3)

Binominaal

(par 5.4)

Poisson (par 5.5)

Kontinue (par 5.6)

Normaal (par 5.7)



2.6.1 Diskrete waarskynlikheidsverspreidings


ŉ Diskrete veranderlike is enige veranderlike wat slegs spesifieke waardes kan aanneem.

Hierdie waardes is gewoonlik heelgetalle. Waardes soos A, B, C, D en E kan egter ook as

diskrete waardes gesien word. Die vraag wat gevra word om te toets of ŉ waarde diskreet is,

is: "Is dit bekend watter waarde hierdie spesifieke waarde voorafgaan?". Byvoorbeeld, dit is

bekend dat 4 voor 5 is, en dat 6 na 5 is (as daar van heelgetalle gepraat word). Dit is ook

bekend dat C na B kom en dat D na C is (as daar van die alfabet gepraat word). Vir nog ŉ

voorbeeld kan daar na Paragraaf 5.3 in die handboek verwys word.

Die tweede kategorie van verspreidings, is kontinue verspreidings. In hierdie geval is daar ŉ

oneindige hoeveelheid waardes tussen enige twee waardes. Byvoorbeeld, watter waarde is

tussen 1 en 3 as daar na kontinue getalle verwys word? Die waarde 2 is wel tussen 1 en 3,

maar die waarde 2.5 ook; en die waarde 2.501 en die waarde 2.000000015 ook. Daar is dus

ŉ oneindige hoeveelheid waardes wat tussen 1 en 3 is. ŉ Beskrywing van kontinue

verspreidings word in Paragraaf 5.6 in die handboek verskaf.

Die diskrete waarskynlikheidsverspreidings sluit die binominale en poisson-verspreidings

in. Elk word kortliks hieronder bespreek.

� Binominale waarskynlikheidsverspreiding

Die binominale verspreiding word gebruik vir enige gebeurtenisse wat slegs een van twee

uitkomste kan hê. ŉ Voorbeeld is reeds hierbo genoem: ŉ Muntstuk wat gegooi word. Die

waarskynlikheid vir ŉ spesifieke uitkoms is egter nie altyd 0.5 nie. Dit mag gebeur dat die

twee uitkomste se waarskynlikhede onderskeidelik 0.3 en 0.7 is. ŉ Diskrete veranderlike volg

ŉ binominale verspreiding as dit aan die vereistes voldoen wat in Paragraaf 5.4 in die

handboek verskaf word.

Voorbeeld

(Hierdie voorbeeld dien as voorbereiding vir Voorbeeld 5.1 in die handboek.)

ŉ Maatskappy verhuur motors. Onder hierdie motors is Opel motors beskikbaar. Uit

ondervinding weet die bestuur van die maatskappy dat 1 uit elke 4 kliënte, ŉ Opel verkies.

Dus is die waarskynlikheid van ŉ “sukses” (ŉ Opel word gehuur) 0.25. (Dit word bereken

deur p(sukses) = 1/4)

Vraag 1: Wat is die waarskynlikheid dat ŉ enkele kliënt wat by die maatskappy instap, ŉ

Opel sal verkies?



Die antwoord op hierdie vraag is eenvoudig. Hierdie waarskynlikheid is reeds bekend en is

0.25.

Vraag 2: Wat is die waarskynlikheid dat ŉ enkele kliënt wat by die maatskappy instap, nie ŉ

Opel gaan kies nie?

Die antwoord is weer eens redelik eenvoudig:

p(mislukking) = 1 – p (sukses)

= 1 - 0.25

= 0.75

Vraag 3: Wat is die waarskynlikheid dat, as vyf kliënte by die winkel instap, twee van hierdie

kliënte elk ŉ Opel gaan huur?

Dit is op hierdie stadium dat die antwoord nie so ooglopend is nie en ŉ formule benodig

word. Hierdie formule word as Formule 5.1 in die handboek verskaf. Die formule bestaan uit

ŉ aantal elemente. In hierdie geval is dit:

• n = die grootte van die steekproef (in hierdie geval kyk ons na 5 kliënte)

• x = die hoeveelheid suksesvolle uitkomste (in hierdie geval, is ons op soek na die

waarskynlikheid dat daar twee suksesvolle uitkomste sal wees, met ander woorde,

dat twee van die vyf kliënte wel ŉ Opel sal huur)

• p = die waarskynlikheid van ŉ sukses (met ander woorde, die waarskynlikheid dat

een kliënt ŉ Opel sal huur)

• (1-p) = die waarskynlikheid van ŉ mislukking

• nCx = Hier word ŉ kombinasie bereken. Verwys na paragraaf 2.6.4 hierbo om jou

geheue te verfris. In hierdie geval, word die kombinasie met n = 5 en x = 2 gevind,

dus 5C2.


Vraag 3 hierbo is dieselfde vraag wat in Voorbeeld 5.1 in die handboek gevra word. Die

inligting wat hierbo verskaf word, behoort vir jou ŉ idee te gee hoe om hierdie voorbeeld te

voltooi. Hou in gedagte:

• Jy moet eers die vier voorwaardes vir ŉ binominale verspreiding toets, voordat

Formule 5.1 in die handboek toegepas kan word.

• ŉ Goeie idee sal wees om eers die kombinasie (nCx) te bereken en dan die res van



die formule te bepaal.

Uitdaging:

Gestel die vraag in Voorbeeld 5.1 het gelees:

Wat is die waarskynlikheid dat ten minste twee van die vyf kliënte ŉ Opel sou kies? Hoe

sou ŉ mens dan te werk gaan? Die antwoord lê daarin om die vraag in diskrete eenhede op

te breek. Indien ten minste twee kliënte wel ŉ Opel kies, beteken dit dat twee, drie, vier of vyf

kliënte ŉ Opel kies. In hierdie geval moet die waarskynlikheid vir:

• x = 2,

• x = 3,

• x = 4 en

• x = 5,

bereken word en bymekaar getel word.

Dus: Wanneer die woorde "ten minste", "meer as", "minder as", ensovoorts gebruik word,

moet die waarskynlikhede vir alle moontlike waardes van x wat aan daardie vereiste

voldoen, bepaal word.

Doen nou Voorbeeld 5.2 in die handboek. Hierdie voorbeeld maak gebruik van woorde

soos "ten minste" of "meer as". Omdat daar met diskrete waardes gewerk word, is dit

maklik om die verskillende x-waardes te bepaal.

� Poisson-verspreiding

Die poisson-verspreiding verwys na die hoeveelheid keer wat iets binne-in ŉ spesifieke

tydperk of spasie, of volume, plaasgevind het. Byvoorbeeld, die hoeveelheid kere wat ŉ

masjien in ŉ agt-uurskof gebreek het. Die vraag wat dus gevra word, is soos volg: Wat is die

waarskynlikheid dat iets x keer sal gebeur in ŉ spesifieke tyd, as dit bekend is dat dit

gemiddeld a keer in dieselfde tydperk gebeur? Byvoorbeeld, as ŉ masjien gemiddeld vier

keer per dag breek (a = 4), wat is die waarskynlikheid dat ŉ masjien drie keer per dag sal

breek (x = 3, bereken p(3))? Of, wat is die waarskynlikheid dat ŉ masjien ten minste twee

keer per dag sal breek (x>= 2). Of, wat is die waarskynlikheid dat ŉ masjien ten minste vier

keer in ŉ twee-dag periode sal breek?

Dit is belangrik dat die tydsperiode in ag geneem moet word. As a (die gemiddelde

hoeveelheid kere wat die gebeurtenis plaasvind) per dag bepaal word, maar die vraag dui op

ŉ tweedag-periode, moet die nodige aanpassing gedoen word. Die formule om ŉ



waarskynlikheid in ŉ poisson-verspreiding te bepaal, word in die handboek as Formule 5.3

weergegee.


• Vraag (a) is bloot ŉ toepassing van die formule met a = 5 en x = 3.

• Vraag (b) vereis van jou om drie waarskynlikhede met die formule te bereken en

bymekaar te tel. Hierdie waarskynlikhede is p(0), p(1) en p(2).

• Vraag (c) is ŉ uitdaging. Hier word van jou verwag om die waarskynlikheid vir alle

waardes bo 4 te bereken. Maar daar is ŉ oneindige hoeveelheid waardes bo 4! Die

antwoord is eintlik eenvoudig. Ons weet dat, as al die waarskynlikhede van ŉ

poisson-verspreiding bymekaar getel word, die getal 1 verkry sal word. Dus, as die

waarskynlikhede van alle x-waardes van 4 en minder bereken word, en dan van 1

afgetrek word, sal die waarskynlikheid van alle x-waardes bo 4 verkry word.

• Vraag (d) verander aan die tydsperiode. Dus, moet a aangepas word. Omdat a = 5

per dag, sal a = 10 vir twee dae. Verder kan die formule gewoonweg gebruik word.

� Beskrywende statistiek vir poisson en binominale waarskynlikheidsverspreidings

Die gemiddeld en standaardafwyking kan ook vir hierdie verspreidings bereken word.

(Onthou: Die verspreiding is bloot ŉ versameling van waarskynlikhede, met ander woorde, ŉ

groep getalle tussen 0 en 1).

Die gemiddeld en standaardafwyking vir die binominale verspreiding word bereken deur

Formule 5.2 in die handboek. Die gemiddeld en standaardafwyking vir poisson-verspreidings

word verskaf in Formule 5.4 in die handboek.

2.6.2 Die normaalverdeling

Bestudeer die handboek: Paragraaf 5.6 en 5.7

Die normaalverdeling word gebruik om enige waardes (nie slegs heelgetalle nie) voor te stel.

In Paragraaf 5.7 in die handboek word die eienskappe van ŉ normaalverdeling verskaf.

Alle data wat versamel word, sal natuurlik nie ŉ normaalverdeling hê nie. Een datastel kan ŉ

gemiddeld van 10 000 hê, terwyl ŉ ander ŉ gemiddeld van -17 kan hê (ŉ normaalverdeling

se gemiddeld is 0). Die normaalverdeling vorm egter die basis. Dit is belangrik om eers te

verstaan hoe die normaalverdeling werk en hoe om waarskynlikhede vanaf ŉ

normaalverdeling te verkry. Daarna kan hierdie metode aangepas word vir datastelle met

ander gemiddelde en standaardafwykings.



Vir Voorbeeld 5.4 kan daar aangeneem word dat data perfek normaal versprei is, met ander

woorde, die verdeling het ŉ gemiddeld van 0 en ŉ standaardafwyking van 1. Vanaf

Voorbeeld 5.5 word die data meer realisties voorgestel. Die gemiddelde en

standaardafwykings verander en daar word gekyk na wyses om steeds die waarskynlikhede

te meet.

ŉ Tipiese vraag wat met ŉ normaalverdeling beantwoord kan word, is:

Data is normaal versprei met ŉ gemiddeld van 0 en standaardafwyking van 1. Indien ŉ

spesifieke waarde ewekansig uit die data geneem word, wat is die waarskynlikheid dat

hierdie waarde tussen 0 en 2.33 sal wees?

Hoe om ŉ waarskynlikheid uit ŉ normaalverdeling te kry:

• Teken die normaalverdeling om ŉ beter oorsig te kry.

• Maak ŉ kruisie op die x-as om vir jouself ŉ aanduiding te gee waar die spesifieke

waarde sal voorkom. Merk hierdie waarde as z (met ander woorde, vir die voorbeeld

hierbo genoem, sal z, 2.33 wees).

• Kleur die oppervlakte tussen 0 en z in.

• Bereken nou die oppervlakte.

Vind die oppervlakte

Om die oppervlakte te bereken, is kompleks. Om hierdie rede is daar aan die einde van die

handboek ŉ tabel opgestel met die oppervlaktes tussen 0 en ŉ groot verskeidenheid z-

waardes. Om die oppervlakte in die z-tabel (Tabel 1, Aanhangsel 1 in die handboek) te vind,

kan jy die volgende stappe volg:

• Neem die z-waarde (byvoorbeeld 2.35).

• Soek die syfers voor die desimaal, asook die eerste syfer na die desimaal in die

linkerkantste kolom van die tabel (in hierdie geval, vind 2.3).

• Soek nou die tweede desimaal (in hierdie geval 0.05) in die eerste ry van die tabel.

• Vind nou die plek waar hierdie ry (2.3) en kolom (0.05) kruis. Die waarde wat op

daardie kruising voorkom, is die oppervlakte tussen 0 en 2.35 (in hierdie geval is dit

0.49061.

• Interpretasie: Die waarskynlikheid dat ŉ waarde in ŉ normaalverdeling tussen 0 en



2.35 sal wees, is 0.49061

Jy kan dus bloot die z-waarde neem (Tabel 1, Aanhangsel A in die handboek)


Wenke:

• Vraag (a) is redelik eenvoudig en kan bloot van die tabel afgelees word.

• Vraag (b) werk met ŉ negatiewe getal. Maar omdat die twee helftes van die

normaalverdeling presies simmetries is, is die waarskynlikheid om ŉ getal tussen 0

en -2.3 te kry, presies dieselfde as die waarskynlikheid om ŉ getal tussen 0 en 2.3

(positief) te kry. Dus kan die oppervlakte tussen 0 en 2.3 bepaal word – dit sal

presies dieselfde wees vir die oppervlakte tussen 0 en -2.3.

• Vraag (c) vereis nie die oppervlakte tussen 0 en ŉ getal nie, maar van die

oppervlakte aan die regterkant van ŉ getal. Dit is egter bekend dat die totale

oppervlakte onder die normaalverdeling 1 is (alle moontlike waarskynlikhede) en,

omdat die twee helfte simmetries is, is die oppervlakte aan die regtekant 0.5 (en die

linkerkant is ook 0.5). Vir hierdie voorbeeld kan die oppervlakte tussen 0 en 1.82

bereken word, en dan afgetrek word van 0.5 om die oppervlakte aan die regterkant

van 1.82 te bepaal.

• Vraag (d) is nog ŉ bietjie moeiliker. Die oppervlakte tussen -2.1 en 1.32 moet

bereken word. Omdat die twee helftes simmetries is, kan die oppervlakte aan die

linkerkant van 0 bereken word. Dan kan die oppervlakte aan die regterkant van 0

bereken word. As die twee oppervlaktes bymekaar getel word, word die totale

oppervlakte gevind.

• Vraag (e) verskil van Vraag (d) omdat die oppervlakte nie aan 0 raak nie. Die

oppervlakte tussen 1.24 en 2.075 moet bereken word. Hierdie oppervlakte is egter

die verskil tussen twee oppervlaktes:

o 0 tot 1.24 se oppervlakte en

o 0 tot 2.075 se oppervlakte

Deur hierdie twee oppervlaktes van mekaar af te trek, sal die oppervlakte tussen

1.24 en 2.075 bereken word.



Belangrik: Uit hierdie voorbeeld kan gesien word hoe belangrik dit is om eers die

normaalverdeling te teken voordat enige berekenings gedoen word.

Gestel die gemiddeld van ŉ verspreiding getalle is 20 (en nie 0 nie) en die

standaardafwyking is 4 (en nie 1 nie). Gestel ons wil weet wat die waarskynlikheid is dat ŉ

waarde tussen 20 en 22 sal voorkom. Daar is nie ŉ 20 of 22 in die z-tabel nie! Die getal 20

en 22 is nie z-waardes nie, omdat die verdeling nie ŉ standaard-normaalverdeling is nie.

Die voorwaarde vir ŉ standaard-normaalverdeling is ŉ gemiddeld van 0 en

standaardafwyking van 1. Hoe kan ŉ mens dan die oppervlak bereken?

Hoewel daar nie ŉ z-waarde gegee word nie, is dit moontlik om die z-waarde te bereken.

Wanneer ŉ z-waarde bereken is, is dit maklik om die oppervlak, en dus die waarskynlikheid

te bereken. Die formule vir ŉ z-waarde (as die gemiddeld en standaardafwyking nie 0 en 1

onderskeidelik is nie) word in Formule 5.6 in die handboek gegee.

Lees die verduideliking direk na Voorbeeld 5.4 in die handboek. Doen dan Voorbeeld 5.5

in die handboek. Onthou, sodra die z-waarde gevind is, word die oefeninge presies

dieselfde as in Voorbeeld 5.4 gedoen.

Vind nou die x-waarde vir ŉ waarskynlikheid

In bogenoemde voorbeelde is ŉ waarde (z of x) gegee en die waarskynlikheid (p) is bepaal

deur die oppervlakte te bereken. (Met ŉ standaard-normaalverdeling is die z-waarde

gebruik, maar indien die gemiddeld nie 0 is en/of die standaardafwyking nie 1 is nie, word ŉ

x-waarde gegee en die z-waarde word eers bereken.)

Vir die volgende voorbeelde, word die waarskynlikhede (p) gegee en daar word van jou

verwag om die z-waarde of x-waarde te vind.


In hierdie voorbeeld word daar van jou verwag om die z-waarde te vind. Om dit te doen,

word die oppervlakte in die z-tabel gevind, en dan word die ooreenkomstige z-waarde in

die ry en kolom bloot afgelees.

Om die x-waarde te vind, vereis ŉ bykomende stap. Eerstens, word die z-waarde gevind, en

dan word die z-waarde, die gemiddeld en die standaardafwyking in Formule 5.6 (in die

handboek) ingelees. Sodoende kan die x-waarde gevind word.




Hierdie voorbeeld is soortgelyk aan Voorbeeld 5.6, maar dit maak nie gebruik van ŉ

standaard-normaalverdeling (met ŉ gemiddeld van 0 en standaardafwyking van 1) nie.


Daar is 26 vrae aan die einde van Hoofstuk 5 in die handboek. Doen al hierdie vrae om te

verseker dat jy ŉ behoorlike grondslag het vir verdere werk wat behandel gaan word.

2.7 Steekproewe

Bestudeer die handboek: Paragraaf 6.1 – 6.4, 6.6, 6.8

Nota: Hoewel die berekening en interpretasie van steekproefproporsies ŉ baie belangrike

deel van die wetenskap van Statistiek uitmaak, is dit nie in hierdie sillabus ingesluit nie.

Soos reeds genoem, is dit nie altyd moontlik om ŉ spesifieke statistiek vir ŉ hele populasie

te bereken nie. Om hierdie rede word ŉ steekproef geneem. Onthou dat ŉ steekproef ŉ

kleiner groepering is van waardes wat uit die populasie kom. ŉ Steekproef moet ook sover

as moontlik verteenwoordigend van die populasie wees.

2.7.1 Steekproefmetodes


Daar is ŉ verskeidenheid metodes waarop steekproewe gevind kan word. Die aard van die

steekproefmetode het ŉ groot invloed op die wyse waarop die steekproef die populasie

verteenwoordig. Ewekansige (random) steekproefmetodes lewer meer verteenwoordigende

steekproewe as nie-ewekansige metodes. Ongelukkig is ewekansige steekproewe dikwels

moeiliker om in die hande te kry. Die verskillende metodes word in paragraaf 6.2 in die

handboek verduidelik en kortliks in Tabel 2.2 hieronder opgesom.

Ewekansige steekproefneming

Elke lid van die populasie het ŉ ewe groot

kans om deel van die steekproef uit te maak.

Nie-ewekansige steekproefneming

Elke lid van die populasie het nie dieselfde

kans om deel van die steekproef uit te maak

nie.

Eenvoudige ewekansige streekproefneming

(Simple random sampling)

Sistematiese steekproefneming (Systematic

Geriefsteekproefneming (Convenience

sampling)

Oordeelsteekproefneming (Judgement



random sampling)

Gestratifiseerde steekproefneming (Stratified

random sampling)

Trossteekproefneming (Cluster random

sampling)

Sampling)

Kwotasteekproefneming (Quota sampling)

Sneeubalsteekproefneming (Snowball

sampling)

Tabel 2. 2: Steekproefmetodes

(Bron: Wegner, 2013:153 – 157)

Aan die einde van Paragraaf 6.2 in die handboek, word die voordele van ewekansige

steekproefneming uiteengesit. Die skrywer gaan selfs so ver om te sê dat data wat op ŉ nie-

ewekansige wyse versamel is, nie gebruik kan word om afleidende statistiek te bereken nie.

Dit is egter nie waar nie. In die praktyk word afleidings dikwels op grond van data wat op

hierdie wyse versamel is, gemaak. Die navorser moet egter in hierdie gevalle deeglik bewus

wees van die feit dat die data – en dus, die afleidings – met groot sorg geïnterpreteer word,

veral wanneer besluite ten opsigte van die populasie op grond van hierdie data gemaak

word.

2.7.2 Die steekproefverspreiding

Handboek, paragraaf 6.3 – 6.4 en 6.6.

Hoewel daar nie berekeninge in hierdie paragraaf ingesluit word nie, word daar in diepte

verduidelik waarom die steekproef se gemiddeld en standaardafwyking as benadering tot dié

van die populasie gebruik word. Die belangrikheid van die standaardfout (standard error)

word ook beskryf.

Wanneer ŉ navorser ŉ statistiek uit die steekproef bereken, kan hy of sy nooit ten volle seker

wees dat die populasiestatistiek presies dieselfde sal wees nie. Daar bestaan egter metodes

om te bepaal met watter mate van sekerheid hierdie steekproefstatistiek op die populasie

van toepassing gemaak kan word. Die rasionaal wat die grondslag hiervoor lê, word in

Paragraaf 6.4 bespreek. Paragraaf 6.6 beskryf hoe hierdie beginsels op die verskil tussen

twee steekproewe van toepassing gemaak word.

Belangrik vir die pad vorentoe

Hoewel die volgende terminologie later weer aangeraak word, sal dit nuttig wees om op

hierdie stadium daarvan bewus te wees:

• Vlak van sekerheid: Hierdie is ŉ persentasie tussen 0 en 100. In die meeste gevalle



sal die vlak van sekerheid 90%, 95% of 99% wees. Hierdie getal word vooraf deur

die navorser bepaal en beantwoord die vraag: Hoe seker wil ek wees dat die

resultate wat ek gekry het, werklik op die populasie van toepassing gemaak kan

word? Indien akkuraatheid van kritieke belang is (en foute katastrofiese gevolge kan

hê), sal die vlak van sekerheid hoër wees as wanneer, byvoorbeeld, marknavorsing

gedoen word.

• p-waarde. Hierdie is ŉ statistiek wat die betroubaarheid van die berekende statistiek

aandui. Die p-waarde is ŉ getal tussen 0 en 1. Hoe nader die getal aan 0 is, hoe

meer betroubaar is die statistiek wat bereken is. Die p-waarde word ook saam met

die vlak van betroubaarheid geïnterpreteer. Indien die vlak van betroubaarheid 95%

is, moet die p-waarde kleiner as 0.05 (5%) wees. In die geval van ŉ 99% vlak van

betroubaarheid, moet die p-waarde kleiner as 0.01 wees.

Voorbeeld

ŉ Maatskappy wil weet of daar ŉ verskil is tussen die inkomste van mans en van vroue

onder sy moontlike kliënte. Uit ŉ steekproef word die volgende data verkry:

x̄mans = R23 500

x̄vroue = R19 300

x̄mans - x̄vroue = R4 200

p = 0.043

Vraag: Is daar ŉ verskil tussen die salarisse van mans en vroue?

Antwoord: Die navorser moes vooraf besluit het hoe seker die maatskappy van die

resultate wil wees. In die meeste gevalle sal die navorser ŉ vlak van sekerheid van 95%

kies. Dit beteken dat die resultate slegs aanvaar kan word, indien p kleiner as 0.05 is. In

hierdie geval is dit wel so en die maatskappy kan aanvaar dat, vir die populasie, mans ŉ

groter salaris as vroue kry.

Indien die vlak van sekerheid op 99% bepaal is, moet die p-waarde kleiner as 0.01 wees. Dit

is nie die geval nie en die resultate kan dus nie aanvaar word nie.

Is dit ŉ slegte ding as die p-waarde te groot is?

Sommige beginner-navorsers glo dat die navorsing misluk het, indien die p-waarde groter is



as wat toelaatbaar is. Dit is natuurlik nie waar nie. In die tweede geval hierbo genoem (vlak

van sekerheid = 99%), sal die navorser se gevolgtrekking wees:

Daar is nie voldoende bewyse om 99% of meer seker te wees dat daar ŉ noemenswaardige

verskil tussen die salarisse van mans en vroue bestaan nie. Dus sal daar aangeneem word

mans en vroue se salarisse gelyk is.

Die volgende hoofstukke in die handboek sal die tema van hipotesetoetsing in meer detail

bespreek.


Daar is geen selfevalueringsvrae vir Hoofstuk 6 nie.

2.8 Samevatting

Hierdie studie-eenheid het die beginsels van waarskynlikhede en steekproewe bespreek.

Daar word onderskei tussen subjektiewe en objektiewe waarskynlikhede – statistiek word

gebruik om laasgenoemde te bereken op een van drie wyses: 1) a priori, 2) empiries en 3)

wiskundig.

Vyf belangrike konsepte betrokke by stelteorie wat vir waarskynlikhede gebruik kan word is

1) snyding, 2) samevoeging, 3) onderling uitsluitend, 4) gesamentlik uitputbare en 5)

statisties onafhanklike gebeure. Daar word onderskei tussen twee belangrike konsepte waar

telreëls van toepassing is, naamlik permutasies en kombinasies. Elk kan nuttig wees om

waarskynlikhede te bereken. Die grootste verskil tussen hierdie twee, is die feit dat volgorde

belangrik is by permutasies, maar nie by kombinasies nie.

Daar word tussen twee kategorieë van waarskynlikheidverspreidings onderskei: 1) Diskrete

verspreidings, wat die binominale en poisson-verspreidings insluit en 2) kontinue

verspreiding waarvan die normaalverdeling die bekendste is. Die normaalverdeling vorm ook

die grondslag van z-toetse en t-toetse, wat later in die vak bespreek word.

Steekproefmetodes word in twee kategorieë verdeel. Die eerste kategorie, ewekansige

steekproefneming, bevat 1) eenvoudige ewekansige steekproefneming, 2) sistematiese

steekproefneming, 3) gestratifiseerde steekproefneming, en 4) trossteekproefneming. Die

tweede kategorie, naamlik nie-ewekansige steekproefneming, bestaan uit 1)

geriefsteekproefneming, 2) oordeelsteekproefneming, 3) kwotasteekproefneming, 4)

sneeubalsteekproefneming. Ewekansige steekproefneming lei gewoonlik tot steekproewe

wat meer verteenwoordigend van die populasie is. Die steekproefverspreiding verduidelik

waarom steekproewe as benaderings vir die populasie gebruik kan word.


Studie-eenheid 3: Vertrouensintervalle en hipotesetoetsing: Deel I Bladsy 75

Studie-eenheid 3: Vertrouensintervalle en hipotesetoetsing: Deel I


Kennis en begrip



• Vertrouensintervalle

• Hipotesetoetsing van ŉ enkele populasie se gemiddeld

Vaardighede


• ŉ vertrouensinterval en die faktore wat die grootte daarvan beïnvloed, te bespreek.

• ŉ vertrouensinterval vir ŉ populasiegemiddeld op te stel, indien die

populasiestandaardafwyking bekend is (z-limiete).

• ŉ vertrouensinterval vir ŉ populasiegemiddeld op te stel, indien die

populasiestandaardafwyking nie bekend is nie (t-limiete).

• die vyf stappe van hipotesetoetsing te identifiseer en toe te pas.

• hipotesetoetsing vir ŉ populasiegemiddeld te doen as die

populasiestandaardafwyking bekend is (z-toets).

• hipotesetoetsing vir ŉ populasiegemiddeld te doen as die

populasiestandaardafwyking nie bekend is nie (t-toets).

• ŉ p-waarde te interpreteer en vir hipotesetoetsing te gebruik.



Vir die doeleindes van hierdie studie-eenheid moet jy die volgende afdelings bestudeer:

Hoofstuk 7: Paragraaf 7.1 – 7.8 en 7.10, 7.11

Hoofstuk 8: Paragraaf 8.1 – 8.4 en 8.6 – 8.8






Alternatiewe

hipotese

Die stelling wat aanvaar sal word, indien die nulhipotese

verwerp word.

Hipotesetoets ŉ Statistiese toets wat bepaal of ŉ spesifieke stelling (ŉ

hipotese) waar is. Hierdie toets word op data vanaf ŉ

steekproef gedoen en word gebruik om aannames ten opsigte

van die populasie te maak.

Nulhipotese Die hipotese wat statisties getoets is en aanvaar dat die status

quo waar is. Hierdie hipotese bevat gewoonlik die = teken.

Peil van betekenis ŉ Waarde tussen 0 en 1 wat aandui teen watter sekerheid die

navorser gevolgtrekkings oor die populasie wil maak. Hierdie

waarde word vanaf die vlak van sekerheid verkry.

Puntberaming Die beraming van ŉ spesifieke getal (statistiek), soos ŉ

gemiddeld of standaardafwyking van die populasie. Hierdie

beraming word gedoen met data wat vanaf ŉ steekproef

verkry word.

Vertrouensinterval ŉ Ondergrens en bogrens wat die area waarin ŉ spesifieke

getal (byvoorbeeld, ŉ populasiegemiddeld) met die grootste

waarskynlikheid sal voorkom.

3.4 Inleiding

Een van die belangrikste gebruike van Statistiek is om steekproefdata te gebruik om

gevolgtrekkings ten opsigte van die populasie te maak. Hierdie tipe berekeninge word

inferensiële/afleidende statistiek (inferential statistics) genoem. Statistiese afleidings word

verdeel tussen hipotesetoetsing en vooruitskatting. Laasgenoemde is nie deel van die

omvang van hierdie vak nie en sal dus nie behandel word nie. Die res van hierdie vak sal

dus aan vertrouensintervalle en hipotesetoetsing gewy word.

Vertrouensintervalle is een manier om ŉ beraming te maak ten opsigte van die gemiddeld

van ŉ populasie. Dit behels die stel van ŉ onderste en boonste grens van ŉ interval waarin

die populasiegemiddeld sal voorkom. Die data wat vir die stel van hierdie grense gebruik



word, word deur ŉ steekproef gevind. Vertrouensintervalle word eerste bespreek en kan

gevind word in Hoofstuk 7 in die handboek.

Hipotesetoetsing behels die toets van ŉ stelling, wat ŉ hipotese genoem word. Die eerste

tipe hipotese wat getoets word, is ŉ beraming van die gemiddeld van ŉ enkele populasie.

Hierdie tipe hipotesetoets word in Hoofstuk 8 in die handboek bespreek.

3.5 Vertrouensintervalle

Bestudeer die handboek: Paragraaf 7.1 – 7.8 en 7.10 – 7.11

3.5.1 Puntberamings en vertrouensintervalle


Voordat vertrouensintervalle bereken kan word, is dit belangrik om eerstens, te onderskei

tussen twee begrippe: Puntberaming en beraming van ŉ vertrouensinterval.

ŉ Puntberaming word gemaak wanneer ŉ spesifieke statistiek (byvoorbeeld ŉ gemiddeld) vir

ŉ steekproef bereken word, en dan as beraming vir populasie gebruik word. (Verwys na

Paragraaf 7.2 in die handboek vir voorbeelde.)

Wanneer ŉ vertrouensinterval bereken word, word twee grense vir ŉ spesifieke statistiek

bereken. Die populasiestatistiek sal dan, teen ŉ vasgestelde sekerheid, in hierdie interval

voorkom. (Verwys na Paragraaf 7.3 in die handboek vir ŉ volledige definisie.)

3.5.2 Vertrouensinterval vir µ: � bekend


Die eerste formule wat gebruik word, neem aan dat die populasiegemiddeld �$ bekend is.

Dit is egter nie altyd die geval nie. Paragraaf 7.7 en 7.8 bespreek hoe vertrouensintervalle

bereken kan word as $ nie bekend is nie en die steekproefstandaardafwyking (s) gebruik

moet word.

Soos vroeër genoem, is µ die simbool vir die populasiegemiddeld, byvoorbeeld, die

gemiddelde salaris van alle kliënte, die gemiddelde ouderdom van studente en die

gemiddelde hoeveelheid keer ŉ persoon van ŉ spesifieke pad gebruik maak. Om µ te

beraam, word ŉ steekproef uit die populasie getrek en die gemiddeld van die steekproef, x̄,

word bereken. Laasgenoemde (x̄) word dan gebruik om µ te beraam.



Vraag:

x̄ = 78

Kan ek dus aanneem dat µ ook 78 is?

Antwoord:

Die antwoord is nie so eenvoudig nie. ŉ Meer korrekte antwoord sal wees:

"Ek kan met 95% sekerheid sê dat µ tussen 75.624 en 80.376 sal wees".

Vir hierdie rede word vertrouensintervalle gebruik.

Dit is dus nie altyd moontlik om die presiese populasiegemiddeld te bepaal nie, veral nie

wanneer ŉ groot mate van sekerheid nodig is nie. Om hierdie rede word die

steekproefstatistieke gebruik om ŉ interval op te stel waarin die populasiegemiddeld sal

voorkom. ŉ Tipiese gevolgtrekking wat met ŉ vertrouensinterval gemaak kan word, is: "daar

kan met 95% sekerheid gesê word dat die gemiddelde salaris van alle kliënte tussen

R10 000 en R15 000 is".


Die doel van ŉ vertrouensinterval is om, met die hulp van steekproefstatistieke, ŉ bogrens

en ondergrens te bepaal waarin die populasiegemiddeld sal val.

Die formule wat gebruik word, is Formule 7.2 in die handboek

Die waarde wat benodig word, word soos volg verkry:

• Vlak van sekerheid (%): Hierdie word deur die navorser besluit. (In Voorbeeld 7.1

word hierdie waarde verskaf.)

• x̄: Hierdie is die steekproefgemiddeld. Dit word bereken deur alle waardes bymekaar

te tel en dit dan deur die hoeveelheid waardes (n) te deel. (In hierdie voorbeeld word

x̄ gegee.)

• z: Die z-waarde word uit die z-tabel aan die einde van die handboek verkry.

• $: Hierdie is die populasiestandaardafwyking. Vir Voorbeeld 7.1 word aangeneem

dat die populasiestandaardafwyking bekend is. Hierdie waarde word gegee.

• n: Hierdie is die hoeveelheid waardes wat gebruik is om x̄ te bereken – dit is die



steekproefgrootte.

Paragraaf 7.5 bespreek drie belangrike faktore wat die grootte van ŉ vertrouensinterval kan

beïnvloed. Hulle is:

• Die vlak van sekerheid verlang: Hoe hoër die vlak van vertroue is, hoe groter sal

die vertrouensinterval wees.

• Die steekproefgrootte: ŉ Groter steekproef sal (indien alle ander veranderlikes

konstant bly) meer verteenwoordigend wees van die populasie. Dus sal die

vertrouensinterval kleiner kan wees vir dieselfde vlak van sekerheid.

• Die populasie se standaardafwyking. Hoe kleiner ŉ standaardafwyking is, hoe

nader is die meeste waardes aan die gemiddeld. Dit beteken dat die

vertrouensinterval kleiner sal wees.

Doen Voorbeeld 7.2 in die handboek

Hierdie voorbeeld dui aan hoe die vlak van sekerheid die vertrouensinterval kan

beïnvloed.



Voorbeeld 7.4 dui aan hoe groot ŉ vertrouensinterval word as die standaardafwyking van

die populasie groot is. Probeer hierdie voorbeeld en verander die

populasiestandaardafwyking na 250. Kyk hoe die vertrouensintervalle verskil.

Waarom bereken ons vertrouensintervalle? Paragraaf 7.6 in die handboek verduidelik die

rasionaal waarop vertrouensintervalle gebaseer is. Lees deur hierdie paragraaf om ŉ beter

oorsig oor die gebruik van vertrouensintervalle te verkry.

3.5.3 Vertrouensinterval vir µ: � bekend

Dit gebeur dikwels in praktyk dat geen statistieke van die populasie bekend is nie, dus, is $

nie beskikbaar nie. In so ŉ geval moet die steekproef se standaardafwyking (s) gebruik

word.

Wat is die verskil?

Die formule en prosedure om die vertrouensinterval te bereken, bly dieselfde. Al wat

verander is dat t- in plaas van z-waardes gebruik word.



Om ŉ t-waarde te bereken

Die t-waarde word ook van ŉ tabel afgelees. Hierdie tabel is in die handboek as Tabel 2 in

Aanhangsel A verskaf. Die tabel vereis twee waardes wat gebruik moet word:

• df: Die grade van vryheid (degrees of freedom) word bereken deur n-1, waar n die

steekproefgrootte is.

• ∝ word van die vlak van sekerheid verkry. Vir 95% is ∝ = 0.05.

Die t-waarde sal dan verkry word deur die kolom met die ∝-waarde en die ry met die df-

waarde te kruis.

Doen Voorbeeld 7.5

Gebruik formule 7.3 in die handboek om die vraag te voltooi, en die t-tabel om die t-

waardes te vind.


Doen die volgende vrae aan die einde van Hoofstuk 7 in die handboek:

• Vraag 2

• Vraag 4

• Vraag 5 (a)

• Vraag 6 (a) en (d)

• Vraag 7 (a), (b) en (e)

• Vraag 8 (a) en (b)

• Vraag 9 (a)

• Vraag 10 (a), (b), (c) en (e)

• Vraag 11 (a)


• Vraag 13 (a), (b) en (c)



3.6 Hipotesetoetsing vir een populasie

Bestudeer die handboek: Paragraaf 8.1 – 8.4, en 8.6 – 8.8

3.6.1 Hipotesetoetsing


ŉ Hipotese is ŉ stelling wat deur statistiese berekening aanvaar of verwerp kan word. Die

res van die handboek wat in hierdie vak behandel gaan word (Hoofstuk 8 tot 11) behels

hipotesetoetsing.

Elke hipotese wat getoets word, kan (en moet) op twee wyses weergegee word:

• Nulhipotese: Hierdie hipotese behels die formulering wat statisties getoets of

verwerp gaan word. Die nulhipotese het altyd ŉ = teken (of ≤ of ≥ teken). Die

nulhipotese word normaalweg as die status quo aanvaar, tensy die statistiese toets

(hipotesetoets) genoegsame bewyse lewer om die nulhipotese te verwerp – ten

gunste van die alternatiewe hipotese.

• Alternatiewe hipotese: Die alternatiewe hipotese is die formulering van die hipotese

wat die teenoorgestelde van die nulhipotese voorstel. As die nulhipotese verwerp

word, word die bewoording in die alternatiewe hipotese in die gevolgtrekking gebruik.

Voorbeeld

ŉ Maatskappy wil bepaal of die gemiddelde ouderdom (A) van hul teikenmark bo 18 is.

Die nul (H0) en alternatiewe (H1) hipoteses sal soos volg voorgestel word:

H0: A ≤ ��

H1:A > ��

Belangrik: Die twee hipotese mag onder geen omstandighede dieselfde stelling maak nie;

daarom word slegs die > teken vir die alternatiewe hipotese gegee.

As die statistiese toets H0 verwerp, sal die bestuur tot die gevolgtrekking kom dat die

gemiddelde ouderdom van hul teikenmark groter as 18 is. Indien die statistiese toets H0 nie

verwerp nie, sal die bestuur tot die gevolgtrekking kom dat die gemiddelde ouderdom van

hul teikenmark 18 of jonger is.

Daar word ook tussen drie tipes hipoteses onderskei. Dit is belangrik om die regte tipe te

kies, omdat dit ŉ invloed op die statistiese berekeninge sal hê. Hierdie tipes word in meer



detail onder Stap 1, Paragraaf 8.2 in die handboek, beskryf en word in Figuur 3.1 hieronder

opgesom:

Figuur 3. 1: Tipes hipoteses

(Bron: Wegner, 2013: 188 – 189)

Om ŉ hipotese te toets, word vyf stappe gevolg. Hierdie stappe word in Paragraaf 8.2 in die

handboek in detail beskryf. Hierdie stappe vorm die grondslag vir alle werk wat in die res van

hierdie vak behandel word. Dit is dus belangrik om alles wat in Paragraaf 8.2 in die

handboek bespreek word, ten volle te verstaan.

Stap 1 beskryf die tipes hipoteses, asook die nul- en alternatiewe hipoteses, soos hierbo

bespreek.

Stap 2 bespreek die kriteria waarvolgens die nulhipotese verwerp sal word. Die vlak van

sekerheid word gebruik om die area, waar die hipotese nie verwerp sal word nie, uit een te

sit. Die betekenispeil (level of significance) word dan gebruik om die area (oppervlakte) waar

die nulhipotese verwerp sal word, te spesifiseer. Hierdie statistiek, voorgestel deur die C-

teken, word vanaf die vlak van sekerheid verkry en is gewoonlik 0.01, 0.05 of 0.1.

Dit is ook belangrik om na die grafiese voorstelling van hierdie areas te kyk. Vir hipoteses

wat nie rigting (> en <) aandui nie, word C se waarde in twee gedeel om beide "sterte" van

die normaalverdeling in te sluit. Die z- of t-statistieke wat gebruik word, sal dus verskil vir die

twee tipes hipotese. Vir oefening is dit ŉ goeie idee om die normaalverdeling hier te

teken en die toetsstatistiek (in Stap 3 bereken) daarop aan te dui.

Die derde stap behels die berekening van die toetsstatistiek. Hierdie is die statistiek wat met

die C vergelyk moet word om te bepaal of H0 verwerp gaan word. Die toetsstatistiek word

bereken met data wat van die steekproef verkry word en, afhangende van of die

populasiegemiddeld bekend is, $ of s.

In Stap 4 word die toetsstatistiek met die C en die areas van aanvaarding en verwerping

vergelyk. Indien die toetsstatistiek binne die area van aanvaarding (90%, 95% of 99% van

Tweekantige (Two sided) hipotese

•Gebruik nie groter of kleiner as tekens nie. Toets slegs of ŉ populasieveranderlike gelyk of

ongelyk is aan ŉ spesifieke waarde

Regskantige (One-sided upper tailed) hipotese

•Bepaal of die populasieveranderlike groter as ŉ spesifieke waarde is

Linkskantige (One-sided lower tailed) hipotese

•Bepaal of die populasieveranderlike kleiner is as ŉ spesifieke waarde



die totale area) val, word H0 nie verwerp nie. Indien dit egter in die area van verwerping val,

word H0 verwerp.

In die vyfde stap word gevolgtrekkings gemaak. ŉ Tipiese gevolgtrekking is: Die gemiddelde

ouerdom van ons teikenmark is hoër as 18.

3.6.2 Hipotesetoetsing vir ŉ populasiegemiddeld (slegs een � en � is bekend)


Die eerste hipotesetoetse wat gedoen word, is vir ŉ enkele populasiegemiddeld. Daar sal

later na meer gemiddelde en die verskille tussen gemiddelde gekyk word. Soos met

vertrouensintervalle, word daar gekyk na populasies waar $ bekend is en dié waar $ nie

bekend is nie. Vir alle hipotesetoetse sal dieselfde vyf stappe gebruik word.

Doen nou Voorbeeld 8.1 in die handboek

Hierdie voorbeeld pas die vyf stappe van hipotesetoetsing toe op data waar die

populasiestandaardafwyking (A) bekend is.

Onthou: dit is belangrik om altyd die normaalverdeling te teken en die areas van

aanvaarding en verwerping te teken en dan die betrokke z-waardes en toetsstatistieke

daarop aan te dui. Sodoende is dit baie makliker om te bepaal of die hipotese verwerp

kan word.

3.6.3 Hipotesetoetsing vir ŉ populasiegemiddeld (slegs een � en � is onbekend)


Soos met vertrouensintervalle word die t-statistiek gebruik wanneer $ onbekend is. Verder

bly die hipotesetoets dieselfde.


Hier word van jou verwag om self s te bereken. Verwys weer na Hoofstuk 3 in die handboek

hiervoor.

3.6.4 Hipotesetoetsing deur die p-waarde te gebruik


Die p-waarde is in Studie-eenheid 2 reeds bespreek. Waar Studie-eenheid 2 die

interpretasie van die p-waarde beskryf het, word daar in Paragraaf 8.6 in die handboek



aangedui hoe hierdie waarde bereken kan word. Hierdie is dus ŉ alternatiewe wyse om ŉ

hipotesetoets te doen.

Hoofstuk 8 in die handboek het reeds beskryf hoe C gevind kan word. Die p-waarde word

met C vergelyk. Indien die p-waarde kleiner is as C, word H0 verwerp.

Waar die C-waarde die oppervlak van die verwerparea voorstel, word die toetsstatistiek (z-

of t-waarde) gebruik om p te bereken – p is dus ook ŉ oppervlakte.

p-waardes word in die praktyk gebruik wanneer statistiese ontledings deur programmatuur

gedoen word. Dit is dus belangrik om hiervan bewus te wees en ŉ p-waarde te kan

interpreteer.


Doen die volgende vrae aan die einde van Hoofstuk 8 in die handboek

• Vraag 5

• Vraag 6 (a) en (b) vir (i) tot (v)

• Vraag 7 (a) – (c)

• Vraag 8 (a) – (c)


• Vraag 10 (a) – (c)

• Vraag 11 (a) en (c)

• Vraag 12 (a)

• Vraag 13 (a)

• Vraag 14 (a)

3.7 Samevatting

ŉ Puntberaming word gemaak wanneer ŉ spesifieke statistiek (byvoorbeeld ŉ gemiddeld) vir

ŉ steekproef bereken word, en dan as beraming vir populasie gebruik word. Wanneer ŉ

vertrouensinterval bereken word, word twee grense vir ŉ spesifieke statistiek bereken. Die

populasiestatistiek sal dan, teen ŉ vasgestelde sekerheid, in hierdie interval voorkom.

Vertrouensintervalle kan onder verskeie omstandighede bereken word: 1) As die

populasiestandaardafwyking bekend is en 2) as die populasiestandaardafwyking nie bekend

is nie.



ŉ Hipotese is ŉ stelling wat deur statistiese berekening aanvaar of verwerp kan word. Deur

hipotesetoetsing wat met data uit die steekproef gedoen word, word bepaal of die hipotese

verwerp word al dan nie. Daar word tussen die volgende hipoteses onderskei:

1) tweekantige hipotese, 2) regskantige hipotese en 3) linkskantige hipotese.

Wanneer ŉ hipotese vir ŉ enkele populasiegemiddeld bereken word, word verskillende

toetse gebruik afhangende van of die populasiestandaardafwyking bekend is. Indien hierdie

standaardafwyking bekend is, word die z-toets gebruik. Indien nie, word die t-toets gebruik.

Enige hipotesetoets bestaan uit 5 stappe. Hierdie stappe is 1) formuleer die hipotese,

2) bepaal die areas van aanvaarding en verwerping (en dus die kritieke waarde), 3) bereken

die toetsstatistiek (in hierdie geval die z- of t-statistiek), 4) vergelyk die toetsstatistiek met die

areas van aanvaarding en verwerping en 5) maak bestuursgevolgtrekkings.



Notas


Studie-eenheid 4: Hipotesetoetsing: Deel II Bladsy 87

Studie-eenheid 4: Hipotesetoetsing: Deel II


Kennis en begrip



• Hipotesetoetsing: Die verskil tussen die gemiddelde van twee populasies

• Hipotesetoetsing: Die D�- toets

• Hipotesetoetsing: Die verskil tussen gemiddeldes van meer as twee populasies

Vaardighede


• ŉ hipotesetoets te doen om die verskil tussen twee onafhanklike

populasiegemiddelde te bepaal, as die populasiestandaardafwyking bekend is (z-

toets).

• ŉ hipotesetoets te doen om die verskil tussen twee onafhanklike

populasiegemiddelde te bepaal, as die populasiestandaardafwyking nie bekend is

nie (t-toets).

• ŉ hipotesetoets te doen om die verskil tussen twee afhanklike populasiegemiddelde

te bepaal (gepaarde t-toets).

• die D�- toets te doen om sodoende te toets of twee faktore afhanklik of onafhanklik

van mekaar is.

• ŉ ANOVA toets te doen deur die F-statistiek te bereken



• Hoofstuk 9,

• Hoofstuk 10

• Hoofstuk 11






D� ŉ Statistiek wat gebruik word om die afhanklikheid tussen

waargeneemde frekwensies en verwagte frekwensies te toets.

ANOVA ŉ Statistiese toets wat die verskil tussen die gemiddelde van

meer as twee populasies vergelyk.

F-statistiek Die statistiek wat gebruik word om ŉ ANOVA toets uit te voer.

Gepaarde t-toets ŉ Toets wat gebruik word om die verskil tussen gemiddelde uit

twee afhanklike steekproewe te meet.

4.4 Inleiding

In Studie-eenheid 3 is die eerste tipe hipotesetoets bekendgestel: Die gemiddeld van ŉ

enkele populasie. In Studie-eenheid 4 word nog drie hipotesetoetse bespreek: Die verskil

tussen gemiddelde van twee populasies (byvoorbeeld manlike en vroulike kliënte), die D�-

toets (uitgespreek Chi-squared) en die ANOVA toets (Analise van variansie).

Wanneer die verskil tussen twee gemiddeldes bereken word, moet die aard van die data ook

in ag geneem word. Die twee steekproewe kan afhanklik of onafhanklik van mekaar wees. ŉ

Hipotesetoets van onafhanklike data moet ook in ag neem of die

populasiestandaardafwyking bekend is of nie. Daar sal dus drie verskillende hipotesetoetse

in hierdie studie-eenheid bespreek word.

Die D�-toets vergelyk individuele frekwensies: waargeneemde waardes word vergelyk met

verwagte waardes. Die hipotesetoets sal dan bepaal of data ŉ verwagte patroon volg.

Die ANOVA toets word gebruik om die verskil tussen gemiddelde van meer as twee

populasies te toets. Hierdie toets bepaal slegs of alle gemiddeldes van die verskeie

populasies gelyk is.

4.5 Hipotesetoets: Vergelyking van twee populasies

Bestudeer die handboek: Paragraaf 9.1 – 9.4 en 9.7 – 9.8

In Hoofstuk 8 in die handboek was die gemiddeld van een populasie se gemiddeld met ŉ

getal vergelyk. In Hoofstuk 9 word daar na twee verskillende gemiddeldes gekyk. Die

hipotese bepaal dan of daar ŉ verskil tussen hierdie twee gemiddeldes bestaan. Daar word

na drie verskillende gevalle gekyk. Hierdie drie gevalle word in Figuur 4.1 opgesom:



Figuur 4. 1: Verskillende omstandighede waar twee populasiegemiddeldes vergelyk word

(Bron: Wegner: Hoofstuk 9)

4.5.1 Verskil tussen die gemiddelde in onafhanklike steekproewe, σ bekend


Die eerste geval behels die vergelyking van twee gemiddeldes waar die

populasiestandaardafwyking bekend is (en die z-statistiek gebruik kan word). Die

steekproewe is ook nie afhanklik van mekaar nie (die gemiddelde word nie van dieselfde

groep bereken nie.)

Dieselfde stappe vir hipotesetoetsing word gevolg (verwys na Studie-eenheid 3).

Stap 1 behels die formulering van ŉ nul- en alternatiewe hipotese. Hierdie is dieselfde as in

Hoofstuk 8 in die handboek, hoewel die µ met µ1 - µ2 vervang sal word, omdat daar na die

verskil verwys word. (Onthou dat die verskil tussen hierdie twee gemiddeldes ook ŉ enkele

getal is en dus maklik in ŉ vergelyk gebruik kan word: Bv. H0: µ1 - µ2>0 of µ1 - µ2<0.

In Stap 2 word die areas van aanvaarding en verwerping bereken. Hierdie is dieselfde as in

Hoofstuk 8 waar die z-statistiek gebruik is.

Stap 3 behels die berekening van die toetsstatistiek. Die toetsstatistiek word volgens

Formule 9.1 in die handboek bereken. Hoewel hierdie formule anders is as by ander

hipotesetoetsing, word die z-statistiek op dieselfde wyse geïnterpreteer. Stap 4 en 5 sal dus

dieselfde wees as vorige hipotesetoetse.

• Bv, die verskil tussen gemiddelde verkope by tak 1 en tak 2.

• Paragraaf 9.2 in die handboek

Steekproewe is onafhanklik van mekaar, σσσσ is bekendis bekendis bekendis bekend


Steekproewe is onafhanklik van mekaar, σσσσ is onbekendis onbekendis onbekendis onbekend

• Bv, die verskil tussen werknemers se afwesighede in maand 1 en maand 2

• Die werknemers bly dieselfde, maar die tyd of omstandighede verander


Steekproewe is nie onafhanklik nie



Vir die z-statistiek in hierdie geval, word die volgende waardes benodig (sien Formule 9.1 in

die handboek):

• x̄1 en x̄2: Hierdie is die gemiddelde van die twee, onafhanklik steekproewe wat

gevind is.

• n1 en n2: Hierdie is die groottes van die twee verskillende steekproewe

• σ1 en σ2: Die standaardafwyking van die twee populasies van waar die steekproewe

verkry is.

• α: Die alfa-waarde word verkry vanaf die vlak van sekerheid en kan 0.01, 0.05 of 0.1

wees.


Vraag (a) behels ŉ tweekantige hipotesetoets.

Vraag (b) behels ŉ eenkantige hipotesetoets.

Stap 2 en stap 4 sal veral deur hierdie verskil beïnvloed word.

4.5.2 Verskil tussen twee gemiddeldes: Onafhanklike steekproewe en σ is onbekend


Wanneer die populasiestandaardafwyking nie bekend is nie, word die t-statistiek in plaas

van die z-statistiek gebruik. Vir hierdie tipe hipotese word ŉ ander formule (as vir een

populasie) gebruik. Die stappe van hipotesetoetsing word gevolg:

Stap 1 is dieselfde as in Paragraaf 4.5.2 hierbo.

Stap 2 verskil van die hipotese wat in Paragraaf 4.5.2 hierbo getoets is. Omdat die t-

statistiek gebruik word as toetsstatistiek, sal die kritieke waarde ook ŉ t-statistiek wees (en

nie ŉ z-statistiek nie). Om die kritieke waarde te kry, word die grade van vryheid (df) en C

gebruik.

• α is reeds verkry vanaf die vlak van sekerheid.

• df word verkry deur die formule n1 + n2 - 2 (n1 en n2 stel onderskeidelik die eerste en

tweede steekproewe se groottes voor).

In Stap 3 word die toetsstatistiek bereken. Hiervoor word Formule 9.2 in die handboek

gebruik. Hierdie formule mag dalk intimiderend voorkom, maar al die waardes wat daarvoor

benodig word, is reeds bekend:



• x̄1 en x̄2: Hierdie word uit die steekproewe bereken.

• µ1 en µ2: Die nulhipotese aanvaar dat die twee populasies se gemiddelde dieselfde

is. Dus is die verskil tussen hierdie twee waardes 0 en kan buite rekening gelaat

word.

• n1 en n2: Die groottes van die twee steekproewe.

• s1 en s2: Die standaardafwykings van die twee steekproewe.

In Stap 4 en Stap 5 word die toetsstatistiek met die kritieke waarde vergelyk en ŉ

gevolgtrekking word gemaak. Hierdie is dieselfde as in Paragraaf 4.5.1 hierbo.


4.5.3 Die verskil tussen twee gemiddeldes: Steekproewe is nie onafhanklik nie


Hierdie tipe hipotese word gebruik wanneer ŉ steekproef twee maal uit dieselfde populasie

verkry word, maar op verskillende tye, of onder verskillende omstandighede. Soos by

Paragraaf 4.5.1 en 4.5.1 hierbo, word die verskil tussen die twee gemiddeldes ook gebruik.

Daar word egter van die t-statistiek gebruik gemaak, met ŉ nuwe formule. (Hierdie statistiese

toets word die gepaarde t-toets, of matched-pair t-test genoem.) Die verskil tussen hierdie

twee gemiddelde word as µd voorgestel.

Die stappe vir hipotesetoetsing kan soos volg beskryf word:

Stap 1 behels die formulering van die hipotesestellings. Hierdie stap word soos in alle vorige

gevalle uitgevoer, met die uitsonder dat µd in die hipotesestellings gebruik word,

byvoorbeeld:

H0: µd = 0

In Stap 2 word die areas van aanvaarding en verwerping weer uiteengesit. Omdat daar met

die t-statistiek gewerk gaan word, sal die t-tabel hiervoor gebruik word. Verder is hierdie stap

dieselfde as vorige hipotesetoetse waar die t-statistiek as kritieke waarde gebruik is.

Om die t-statistiek in Stap 3 te bereken, word Formule 9.5 in die handboek gegee. Hiervoor

word die volgende benodig:

• x̄d: Hierdie statistiek kan bereken word deur Formule 9.3 in die handboek te gebruik.

Dit word bepaal deur die verskil tussen elke stel waardes (bv. werknemer A se

afwesighede in Maand 1, minus dieselfde werknemer se afwesighede in Maand 2)



bymekaar te tel, en dan te deel deur die hoeveelheid observasies (bv. hoeveelheid

werknemers).

• µd: Die populasiegemiddeld van die verskille is nie bekend nie, maar word gelyk

gestel aan nul, omdat dit so deur die nulhipotese bepaal word.

• sd: Hierdie statistiek word deur middel van Formule 9.4 in die handboek bereken.

• n is die hoeveelheid elemente in die steekproef.

Stap 4 en Stap 5 is weer eens dieselfde as vorige hipotesetoetse.



Voltooi die volgende vrae aan die einde van Hoofstuk 9:

• Vraag 1

• Vraag 2

• Vraag 6

• Vraag 7 (a) – (d)

• Vraag 8 (a) – (c)

• Vraag 9

• Vraag 10


• Vraag 12

• Vraag 13 (a) – (c)

• Vraag 14

4.6 Hipotesetoets: ��

4.6.1 Die ��-toets


Die N�-statistiek word gebruik om die onafhanklikheid van ŉ spesifieke veranderlike te toets

deur waarneembare en verwagte frekwensies met mekaar te vergelyk. Dieselfde vyf

stappe vir hipotesetoetsing word gebruik, terwyl die formule vir N� (Chai squared) as



Formule 10.1 in die handboek gegee word. Die data wat vir hierdie toets verskaf word, sal in

tabelvorm voorkom, waar r die hoeveelheid rye en c die hoeveelheid kolomme in hierdie

tabel sal voorstel.

Die vyf stappe vir hipotesetoetsing word gevolg:

Tydens Stap 1 word die nul- en alternatiewe hipotesestellings geformuleer. Omdat twee

stelle data (waarvan slegs een stel fisies versamel is) met mekaar vergelyk word, sal die

hipotesestellings anders voorkom. In die voorbeeld wat gedoen gaan word (Voorbeeld 10.1),

sal die nulhipotese aandui dat geen verwantskap tussen geobserveerde en verwagte

waardes bestaan nie. Dit beteken dat hierdie twee stelle data onafhanklik is. Die

alternatiewe hipotese sal aandui dat die twee stelle data wel verwant is.

Stap 2: Die areas van aanvaarding en verwerping van die nulhipotese sal anders bereken

word as vir vorige hipotesetoetse. In hierdie geval word die N�-tabel gebruik (Tabel 3,

Aanhangsel A in die handboek).

Om die kritieke waarde in die N�-tabel te vind, is die volgende nodig:

• df: (grade van vryheid, of degrees of freedom): Die formule vir df word as

Formule 10.2 in die handboek verskaf. Die hoeveelheid rye en kolomme word vir

hierdie formule benodig.

• α-waarde: Hierdie word verkry deur die voorafbepaalde vlak van sekerheid en sal

tipies 0.01, 0.05 of 0.1 wees.

Waar die df-kolom en die α-ry kruis, sal die kritieke waarde vir N� gevind word.

Om die toetsstatistiek in Stap 3 te bereken, is ŉ redelike omslagtige proses, maar nie moeilik

nie. Om die berekening te vergemaklik word N� deur middel van ŉ tabel bepaal. Elke stap in

die formule word dan as ŉ kolom weergegee (sien Voorbeeld 10.1, Tabel 10.5 in die

handboek vir verwysing). Die volgende kolomme kom in die tabel wat hiervoor gebruik word,

voor:

• Kolom 1: Die waarneembare waardes word hier uiteengesit. Hierdie data is deur ŉ

steekproef versamel en stel die frekwensies voor. Die waarneembare waardes word

deur die simbool fo voorgestel.

• Kolom 2: Die verwagte waardes. Hierdie waardes moet bereken word deur

Formule 10.3 in die handboek en die waarneembare waardes as grondslag te

gebruik. Die verwagte waardes word deur die simbool fe voorgestel.



• Kolom 3: Hierdie kolom behels die deel van die D�-formule aan die bokant van die

breuk, naamlik (fo-fe)�. Die verskil tussen die twee waardes word gekwadreer om

moontlike negatiewe getalle, positief te maak.

• Kolom 4: Al die waardes wat in die vorige kolomme bereken is, word nou

saamgevoeg in die formule vir D�. Die Σ-teken in die formule beteken dat al die

waardes in die laaste kolom bymekaar getel moet word om die D�-toetsstatistiek te

verkry.

Stap 4 en 5 behels weer eens die interpretasie van die toetsstatistiek (D�).

Om die berekening van die toetsstatistiek N� beter te verstaan, moet bostaande beskrywing

saam met Voorbeeld 10.1 in die handboek deurgewerk word.




• Vraag 5



• Vraag 8 (a) – (c)

4.7 Hipotesetoets: ANOVA

4.7.1 ANOVA en die F-statistiek


Die t-toets en z-toets is vroeër gebruik om die verskil tussen twee populasies se

gemiddeldes te bereken. ANOVA (Analysis of Variance) word gebruik om die verskille

tussen meer as twee populasiegemiddeldes te toets.

Die toetsstatistiek word die F-statistiek genoem. Om hierdie statistiek te bereken neem tyd,

omdat dit deur ŉ groot aantal ander berekeninge voorafgegaan moet word. Dit is egter nie

ingewikkelde formules nie. Die beste manier om ŉ F-statistiek te bereken, is om by die

formule (Formule 11.10 in die handboek) te begin. Die formule lyk eenvoudig, omdat dit

bloot uit twee veranderlikes bestaan: MST en MSE, maar MSE en MST moet ook bereken

word en die veranderlikes wat vir elk van hierdie benodig word, vereis ook ŉ aantal



berekeninge. Die volgende terminologie sal by die berekening van die F-statistiek gevind

word (die terminologie sal aan die hand van Tabel 11.1 in die handboek bespreek word):

• Grade van vryheid (degrees of freedom): Hier word verwys na d1 en d2:

o d1 is die grade van vryheid vir elkeen van die kleiner steekproewe.

Voorbeeld 11.1 in die handboek het drie kleiner steekproewe wat onderskeidelik

uit 6, 4 en 5 waardes bestaan.

o d2 is die grade van vryheid vir die totale steekproef (dus A, B en C saamgevoeg)

wat in hierdie geval uit 15 waardes bestaan.

o SST: Formule 11.4 in die handboek word gebruik om dit te bereken. Die verskil

tussen die totale gemiddeld en die gemiddeld van elke steekproef word bepaal,

gekwadreer en met die hoeveelheid waardes in daardie kategorie

vermenigvuldig, en dan bymekaar getel.

o SSE: Formule 11.5 word gebruik om dit te bereken. Hier word die verskil tussen

elke steekproef se gemiddeld en elke waarde van die steekproef bereken,

gekwadreer en bymekaar getel. Die waardes wat sodoende vir die drie

steekproewe gevind word, word dan ook bymekaar getel om SSE te verkry.

o MST: MST word verkry deur Formule 11.8 in die handboek te gebruik. Dit deel

SST deur df1.

o MSE: MSE word verkry deur Formule 11.9 in die handboek te gebruik. Dit deel

SSE deur df2.

o F-statistiek: Hierdie is die kritieke waarde wat bereken word vir

hipotesetoetsing. Die formule hiervan word as Formule 11.10 in die handboek

weergegee.

Die F-statistiek kan dus stelselmatig bereken word deur die volgende stappe te volg:

• Bereken SST (Formule 11.4 in die handboek)

• Bereken SSE (Formule 11.5)

• Bepaal k-1

• Bepaal N-k

• Bereken MST (Formule 11.8)

• Bereken MSE (Formule 11.9

• Bereken die F-statistiek



Moet ek hierdie stappe onthou?

Dit is nie nodig om hierdie stappe te memoriseer nie. Hierdie stappe kan van die F-statistiek

se formule afgelei word. Byvoorbeeld, om die F-statistiek te bereken, word ŉ waarde vir

MSE en MST benodig. Uit MSE se formule word dit duidelik dat ŉ waarde vir SSE benodig

word. Net so, sal uit MST se formule duidelik word dat ŉ waarde vir SST benodig word. As

SST en SSE bereken is, kan jy voortgaan met die berekening van MSE en MST en as MSE

en MST bereken is, kan die waardes in die F-statistiek se formule geplaas word.

Om leesbaarheid te vergemaklik, word die verskillende waardes wat bereken moet word, in

ŉ sogenaamde ANOVA tabel geplaas. Hierdie tabel se formaat en struktuur word in

Tabel 11.4 in die handboek verskaf. Die tabel word toepas op Voorbeeld 11.1 in Tabel 11.3

in die handboek.

Doen nou Voorbeeld 11.1 om te verseker dat jy die F-statistiek kan bereken.



• Vraag 4

• Vraag 5

• Vraag 7 (a) – (d)



• Vraag 10

• Vraag 11 (a) – (c)

• Vraag 12 (a) – (c)

• Vraag 13 (a) – (e)

• Vraag 14 (a) – (d)

• Vraag 15 (a) – (d)



4.8 Samevatting

Om die verskil tussen die gemiddelde van twee populasies te toets, moet ŉ besluit tussen

die z-toets, t-toets of die gepaarde t-toets gemaak word. Vir onafhanklike populasies waar

die populasiestandaardafwyking bekend is, word die z-toets gebruik. Vir onafhanklike

populasies waar die populasiestandaardafwyking nie bekend is nie, word die t-toets gebruik.

Vir afhanklike populasies (byvoorbeeld dieselfde respondente en dieselfde veranderlikes

word getoets onder verskillende omstandighede) word die gepaarde t-toets gedoen.

Die D�- toets word hoofsaaklik gebruik om waarneembare frekwensies te vergelyk met dié

van ŉ verwagte verspreiding. Met hierdie toets kan bepaal word of data ŉ sekere patroon

(soos ŉ normaalverdeling) volg.

Die F-statistiek word gebruik om die ANOVA toets te doen. Hierdie toets bepaal slegs of alle

gemiddeldes (van die onderskeie populasies) dieselfde is. Indien die nulhipotese (dat alle

gemiddelde dieselfde is) verwerp word, is dit steeds moontlik om met ŉ t-toets of z-toets

(sien Hoofstuk 8) te bepaal of enige twee pare gemiddelde dieselfde is.



Afrikaans/Engelse terme

Afrikaans Engels

Alternatiewe hipotese Alternative hypothesis

Analise van variansie (ANOVA) Analysis of variance

Beskrywende statistiek Descriptive statistics

Betekenispeil Level of significance

Houer-en-punt-stipping Box plot

Ewekansige veranderlike Random variable

Gepaarde t-toets Matched pair t-test

Gesamentlik uitputbaar Collectively exhaustive

Gesamentlike waarskynlikhede Joint probabilities

Hipotese (meervoud: Hipoteses) Hypothesis (Meervoud: Hypotheses)

Inferensiële/Afleidende statistiek Inferential statistics

Kolomgrafiek Bar chart

Kombinasie Combination

Kwalitatief Qualitative

Kwantiel Quartile

Kwantitatief Quantitative

Mediaan Median

Meervoudige kolomgrafiek Multiple bar chart

Modus Mode

Normale verdeling Normal distribution

Nulhipotese Null/Zero hypothesis

Onderling uitsluitend Mutually exclusive



Permutasie Permutation

Populasie Population

Puntberaming Point estimate

Reikwydte Range

Rekenkundige gemiddeld Arithmetic mean

Samevoeging Union

Sirkelgrafiek Pie chart

Skeefheid Skewness

Snyding Intersection

Standaardafwyking Standard deviation

Steekproef Sample

Steekproef-eenheid Sampling unit

Uitskieters Outliers

Variansie Variance

Vertrouensinterval Confidence interval

Vlak van sekerheid Level of confidence

Voorwaardelike waarskynlikheid Conditional probabilities

Vraelyste Surveys / Questionnaires

Waarskynlikheidsboomdiagram Probability tree

Elementêre Kwantitatiewe Metodes (GQM105)Handboek: Wegner, T. 2013. Applied business statistics. 3rd Ed. Claremont: Juta.

Elementêre kwantitatiewe metodes behels ’n aantal statistiese tegnieke wat die interpretasie van ’nverskeidenheid data vergemaklik. Die tipes en volumes van data wat deur organisasies versamel word,maak dit soms moeilik of onmoontlik om hierdie data deur blote observasies te interpreteer. ’nVerskeidenheid statistieke en statistiese berekeninge maak hierdie interpretasie moontlik en makliker.

Hierdie vak word hoofsaaklik in vier afdelings verdeel. Eerstens, word ’n inleiding verskaf oor die aardvan, en behoefte aan, statistiese berekeninge.

Wanneer data versamel word, moet die aard van die data op ’n beskrywende manier voorgestelword. Hierdie statistieke, wat beide grafieke en numeriese berekeninge insluit, word beskrywendestatistiek genoem. Studie-eenheid 1 bespreek onderskeidelik die grafiese en numeriese voorstellingvan data.

Die derde afdeling verskaf ’n grondslag vir inferensiële of afleidende statistiek (inferential statistics)– die berekeninge wat gebruik word om ’n kleiner groep data (steekproef) op ’n groter groep(populasie) van toepassing te maak. Waarskynlikhede, waarskynlikheidsverspreidings, en steekproeween steekproefverspreidings word in Studie-eenheid 2 bespreek. Die laaste afdeling wat in hierdie vakbehandel word, is hipotesetoetsing. Hier word sekere stellings oor eienskappe van die populasie (ofpopulasies) statisties getoets.

Studie-eenheid 3 verskaf ’n grondslag vir hipotesetoetsing. Die wyse waarop hipotese, wat met ’nenkele populasiegemiddeld te doen het, getoets word, word ook hier bespreek.

Studie-eenheid 4 bou hierop voort deur ander gevalle van hipotesetoetsing te bespreek. Dit sluit,onder andere, hipotesetoetsing ten opsigte van gemiddelde oor twee of meer populasies in.

a k a d e m i aAkademia MSW (Maatskappyregistrasienommer: 2005/024616/08) is voorwaardelik by die Departement van Hoër Onderwys en Opleiding tot

31 Desember 2016 as privaat hoëronderwysinstelling geregistreer ingevolge die Wet op Hoër Onderwys, 1997, Registrasienommer: 2011/HE08/005.

Akademia is deel van die Solidariteit Beweging

w w w. a k a d e m i a . a c . z a

elementere kwantitatiewe metodes gqm105 (b.com)

Documents