![Page 1: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/1.jpg)
Verjetnost in statistika
FRI – 2006/07
Aleksandar Jurišić
II. del:II. del:
StatistikaStatistika
![Page 2: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/2.jpg)
Pogled od zunaj
Števila so me pogosto begala, še posebej, če sem se imel pred seboj neko njihovo razvrstitev, tako da je tem primeru obveljala misel, ki so jo pripisali Diaraeliju, z vso pravico in močjo: "Obstajajo tri vrste laži: laži, preklete laži in statistika."
Autobiography of Mark Twain
Figures often beguile me, particularly when I have the arranging of them myself; in which case the remark attributed to Disraeli would often apply with justice and force: "There are three kinds of lies: lies, damned lies and statistics."
- Autobiography of Mark Twain
![Page 3: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/3.jpg)
Načrt (za II. del)
• Opisna statistika– ena spremenljivka
• Mere centralne tendence• Mere razpršenosti• Mere oblike
– dve spremenljivki• Mere asociacije
• Inferenčna (analitična) statistika– točkovno in intervalno ocenjevanje– ena- in dva- vzorčno testiranje hipotez– kontingenčne tabele– regresija
![Page 4: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/4.jpg)
Statistikapreučuje podatke, jih
zbira,
klasificira,
povzema,
organizira,
analizira in
interpretira.
![Page 5: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/5.jpg)
Dve glavni veji statistike
Opisna statistika se ukvarja z organiziranjem, povzemanjem in opisovanjem zbirk podatkov
(reduciranje podatkov na povzetke)
Analitična statistika jemlje vzorce podatkov in na osnovi njih naredi zaključke (inferenčnost) o populaciji (ekstrapolacija).
![Page 6: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/6.jpg)
Tipi podatkovnih množic
• Populacija– vsi objekti, ki jih
opazujemo
– Primer: vsi registrirani glasovalci
• Vzorec– podmnožica populacije
– Primer: 100 registriranih glasovalcev
![Page 7: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/7.jpg)
Populacija je podatkovna množica, ki ji je namenjena naša pozornost.
Vzorec je podmnožica podatkov, ki so izbrani iz Polulacije (po velikosti bistveno manjši od populacije).
![Page 8: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/8.jpg)
populacija vzorec
verjetnost
inferenčna statistika
![Page 9: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/9.jpg)
Tipi podatkov - kvantitativni
(numerični)
predstavljajo kvantiteto
ali količino nečesa.
- kvalitativni (kategorije)
ni kvantitativnih interpretacij.
![Page 10: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/10.jpg)
Kvantitativni (numerični)
• interval– poljubna ničla– enaki intervali predstavljajo enake količine
• razmerje– smiselna točka nič– operacije seštevanje, odštevanje, množenje
in deljenje so smiselne
![Page 11: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/11.jpg)
Kvalitativni (kategorični)
• nominalni– kategorije brez odgovarjajočega
vrstnega reda – urejenosti
• ordinalni/številski– kategorije z urejenostjo
![Page 12: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/12.jpg)
Oddelek sistemskih inženirjev
relativnakategorija frekvenca frekvenca
vrsta število zaposlenih zaposlenih delež
učitelji 16 0,8421skupne službe 3 0,1579
skupaj 19 1,0000
![Page 13: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/13.jpg)
Grafična predstavitev kvalitativnih podatkov
• stolpčni graf,
poligonski diagram
• strukturni krog
pogača, kolač
![Page 14: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/14.jpg)
oddelek sistemskih inženirjev
0
2
4
6
8
10
12
14
16
18
štev
ilo z
apos
leni
h
Stolpčni graf
sk.službe učitelji
![Page 15: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/15.jpg)
oddelek sistemskih inženirjev
0
2
4
6
8
10
12
14
16
18
štev
ilo z
apos
leni
hPareto diagram (po italijanskem ekonomistu)
učitelji sk. službe
![Page 16: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/16.jpg)
Strukturni krog (pogača, kolač)
oddelek sistemskih inženirjev
sk. službe
16%učitelji84%
![Page 17: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/17.jpg)
Grafična predstavitev kvantitativnih podatkov
• runs plot (X,Y plot)• zaporedje (dot plot)• steblo-list predstavitev
(angl. stem-and-leaf)• histogrami• škatla z brki (box plot)
0
4
8
12
16
20
24
28
32
![Page 18: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/18.jpg)
Runs Chart
Z
Observation Number (Statistics Grades)
-0.5
-1.0
-1.5
-2.0
-2.5
0.0
0.5
1.0
1.5
0 10 20
![Page 19: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/19.jpg)
Dot Plot
Statistics Grades
45 55 65 75 85 95 105
![Page 20: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/20.jpg)
Urejeno zaporedje/ranžirana vrsta
Urejeno zaporedje je zapis
podatkov v vrsto po
njihovi numerični
velikosti (ustreznemu
mestu pravimo rang).
![Page 21: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/21.jpg)
Primer zaporedja podatkov (nal. 2.48, str.64)
a. Konstruiraj
urejeno
zaporedje.
e. Nariši
steblo-list
diagram.
i. Naredi
histogram.
88 103 113 122 132 92 108 114 124 133 95 109 116 124 133 97 109 116 124 135 97 111 117 128 136 97 111 118 128 138 98 112 119 128 138 98 112 120 131 142100 112 120 131 146100 113 122 131 150
![Page 22: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/22.jpg)
Koraki za konstrukcijo steblo-list predstavitve
1. Razdeli vsako opazovanje-podatke na dva dela, stebla (angl. stem) in listi (angl. leaf).
2. Naštej stebla po vrsti v stolpec, tako da začneš pri najmanjšem in končaš pri največjem.
![Page 23: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/23.jpg)
Koraki za konstrukcijo steblo-list predstavitve
1. Upoštevaj vse podatke in postavi liste
za vsak dogodek/meritev v ustrezno
vrstico/steblo.
4. Naštej frekvence za vsako steblo.
![Page 24: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/24.jpg)
Steblo-list diagramstebla/listi frekvenca relativna frekvenca
08 8 1 2%09 2 5 7 7 7 8 8 7 14%10 0 0 3 8 9 9 6 12%11 1 1 2 2 2 3 3 4 6 6 7 8 9 13 26%12 0 0 2 2 4 4 4 8 8 8 10 20%13 1 1 1 2 3 3 5 6 8 8 10 20%14 2 6 2 4%15 0 1 2%
50 100%
![Page 25: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/25.jpg)
Histogrami
• kako zgradimo histogram• število razredov• frekvenca• procenti
![Page 26: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/26.jpg)
Kako zgradimo histogram
1. Izračunaj razpon podatkov.
2. Razdeli razpon na 5 do 20 razredov
enake širine.
4. Za vsak razred preštej število vzorcev,
ki spadajo v ta razred.
To število imenujemo frekvenca razred.
8. Izračunaj vse relativne frekvence
razredov.
![Page 27: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/27.jpg)
Pravilo za določanje števila razredov v histogramu
število vzorcev število
v množici podatkov razredov
manj kot 25 5 ali 6
25 - 50 7 - 14
več kot 50 15 - 20
![Page 28: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/28.jpg)
Frekvenčna porazdelitev interval relativna razred razreda frekvenca frekvenca
1 80 - 90 1 2%2 90 - 100 7 14%3 100 - 110 6 12%4 110 - 120 13 26%5 120 - 130 10 20%6 130 - 140 10 20%7 140 - 150 2 4%8 150 - 160 1 2%
50 100%
![Page 29: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/29.jpg)
Frekvenčni histogram
0
2
4
6
8
10
12
14
16
frek
ven
ca
80 90 100 110 120 130 140 150 160
število delovnih ur
![Page 30: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/30.jpg)
Procentni histogram
0
4
8
12
16
20
24
28
32
proc
ent
80 90 100 110 120 130 140 150 160
število delovnih ur
![Page 31: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/31.jpg)
Mere za lokacijo in razpršenost
• srednje vrednosti• razpon (min./max)• centili, kvartili• varianca• standardni odklon• Z-vrednosti
![Page 32: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/32.jpg)
Modus (Mo)
Modus množice podatkov je tista vrednost, ki se pojavi z največjo frekvenco.
![Page 33: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/33.jpg)
Mediana (Me)
Da bi prišli do mediane za neko množico podatkov, naredimo naslednje:
1. podatke uredimo po velikosti v naraščujočem vrstnem redu,
2. če je število podatkov liho, potem je mediana podatek na sredini,
12.če je število podatkov sodo, je mediana enaka povprečju dveh podatkov na sredini.
![Page 34: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/34.jpg)
Mediana
populacije: µ
vzorca: m
![Page 35: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/35.jpg)
Povprečje
μ = ∑i =1
n
y i
npopulacije:
vzorca: y = ∑i =1
n
y i
n
![Page 36: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/36.jpg)
Povprečje in mediana
.5 .5
x
f (x)
-1 0 +1
τµ
0,5
![Page 37: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/37.jpg)
Razpon ali variacijski razmik
Razpon je razlika med največjo in
najmanjšo meritvijo v množici podatkov.
![Page 38: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/38.jpg)
Centili
100p-ti centil (p je med 0 in 1)
je definiran kot število,
od katerega ima 100p
procentov meritev
manjšo ali enako
numerično vrednost.
![Page 39: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/39.jpg)
Določanje 100p-tega centila
Izračunaj vrednost i = p (n+1)
in jo zaokroži na najbližje celo število.
To število je enako i.
Izmerjena vrednost z i-tim rangom
je 100p-ti centil.
![Page 40: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/40.jpg)
• 25. centil se imenuje tudi 1. kvartil.
• 50. centil se imenuje 2. kvartil ali mediana.
• 75. centil se imenuje tudi 3. kvartil.
![Page 41: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/41.jpg)
Škatla z brki (angl. box plot)
Statistics Grades
45 55 65 75 85 95 105
![Page 42: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/42.jpg)
Mere razpršenosti
• varianca– kvadrat pričakovanega odklona (populacije)– vsota kvadratov odklonov deljena s stopnjo prostosti (vzorec)
• standardni odklon (deviacija)– pozitivni kvadratni koren variance
• koeficient variacije– standardni odklon deljen s povprečjem
![Page 43: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/43.jpg)
Mere razpršenosti
populacija vzorec
varianca σ2 S2,s2
standardniodklon
σ S, s
![Page 44: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/44.jpg)
Za vzorec smo vzeli osebje na FRI.
Zabeležili smo naslednje
število otrok:
1 2 2
1 2 5
1 2
![Page 45: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/45.jpg)
Varianca
populacije:
(končne populacije z
n meritvami).
σ 2 = ∑i=1
n
y i−μ 2
n
![Page 46: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/46.jpg)
Varianca
vzorca:
(z n meritvami).
s2 = ∑i =1
n
y i− y 2
n−1
= ∑i =1
n
yi2−
∑i=1
n
y i2
n
n−1
![Page 47: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/47.jpg)
Standardni odklon
Standardni odklon je pozitivno
predznačen kvadratni koren variance.
σ = σ 2
s = s2
![Page 48: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/48.jpg)
Empirična pravila
Če ima podatkovna množica porazdelitev
približno zvonaste oblike (unimodalna oblika –
ima en sam vrh), potem veljajo naslednja pravila
(angl. rule of thumb), ki jih lahko uporabimo za
opis podatkovne množice:
7. Približno 68,3% vseh meritev leži na razdalji
1 x standardnega odklona od njihovega povprečja.
![Page 49: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/49.jpg)
1. Približno 95,4% meritev leži na razdalji do 2 x standardnega odklona od njihovega povprečja.
3. Skoraj vse meritve (99,7%) ležijo na razdalji 3 x standardnega odklona od njihovega povprečja.
Empirična pravila
![Page 50: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/50.jpg)
Mere oblike
Če je spremenljivka približno normalno porazdeljena, potem jo statistični karakteristiki povprečje in standardni odklon zelo dobro opisujeta.
V primeru unimodalne porazdelitve spremenljivke, ki pa je bolj asimetrična in bolj ali manj sploščena (koničasta), pa je potrebno izračunati še stopnjo asimetrije in sploščenosti (koničavosti).
![Page 51: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/51.jpg)
Centralni momenti
l-ti centralni moment je
m1 = 0, m2 = σ2
ml = ∑i =1
n
y i−μ l
n
![Page 52: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/52.jpg)
Mere asimetrije
Razlike med srednjimi vrednostimi so temvečje, čim bolj je porazdelitev asimetrična:
KAMo = (µ −Μο)/σ
KAMe = 3(µ −Μe)/σKoeficient asimetrije (s centralnimi momenti):
g1 = m3/m23/2
![Page 53: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/53.jpg)
Mera sploščenosti (kurtosis)
Koeficient sploščenosti
(s centralnimi momenti)
K = g2 = m4/m22 – 3
![Page 54: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/54.jpg)
Mera sploščenosti (kurtosis)
• K = 3 (ali 0)– normalna porazdelitev zvonaste-oblike (mesokurtic)
• K < 3 (ali negativna)– bolj kopasta kot normalna porazdelitev, s krajšimi
repi (platykurtic)
• K > 3 (ali pozitivna)– bolj špičasta kot normalna porazdelitev, z daljšimi
repi (leptokurtic)
![Page 55: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/55.jpg)
Normalna porazdelitevNormal Distribution: Mu = 0, Sigma = 1
f(z)
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
-4 -3 -2 -1 0 1 2 3 4
asimetričnost = 0, sploščenost = 3 (mesokurtic)
![Page 56: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/56.jpg)
Asimetrična v desnoProbability Distribution
-25 -15 -5 5 15 25x
Rela
tiv
e F
requency
0.4
0.2
0.0
asimetričnost = 1,99, sploščenost = 8,85 (leptokurtic)
![Page 57: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/57.jpg)
Kopasta porazdelitev
Probability Distribution
-25 -15 -5 5 15 25x
Rela
tive F
requency
0.4
0.2
0.0
asimetričnost = 0, sploščenost = 1,86 (platykurtic)
![Page 58: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/58.jpg)
Špičasta porazdelitev
asimetričnost = −1,99, sploščenost = 8,85 (leptokurtic)
Probability Distribution
-25 -15 -5 5 15 25x
Rela
tive F
requency
0.4
0.2
0.0
![Page 59: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/59.jpg)
Standardizacija
Vsaki vrednosti xi spremenljivke X
odštejemo njeno povprečje µ in delimo z njenim standardnim odklonom σ:
zi = (xi – µ)/ σZ imenujemo standardizirana
spremenljivka, zi pa standardizirana vrednost.
Potem je µ(Z)=0 in σ(Z)=1.
![Page 60: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/60.jpg)
Frekvenčni histogram
fIncome Per Capit a05101512000 14000 16000 18000 20000 22000 24000 26000
f
Income Per Capita
0
5
10
15
12000 14000 16000 18000 20000 22000 24000 26000
![Page 61: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/61.jpg)
Relativni frekvenčni histogram
f/n
Income Per Capita
0.00
0.05
0.10
0.15
0.20
0.25
0.30
12000 14000 16000 18000 20000 22000 24000 26000
![Page 62: II. del: Statistikalkrv.fri.uni-lj.si/~ajurisic/vis06/folije/stat01opisna.pdf · Načrt (za II. del) • Opisna statistika – ena spremenljivka • Mere centralne tendence • Mere](https://reader033.vdocuments.mx/reader033/viewer/2022041814/5e59eeb8b5f5f763884102bc/html5/thumbnails/62.jpg)
Histogram standardiziranih Z-vrednosti
f
Z Values for Income Per Capita
0
5
10
15
20
25
-4 -3 -2 -1 0 1 2 3 4