osnove prikaza podatkov – statistiČna grafika
DESCRIPTION
OSNOVE PRIKAZA PODATKOV – STATISTIČNA GRAFIKA. Gaj Vidmar 17. 12. 2008. Chu Shi Chieh (1303). KAKŠNI SO LAHKO PODATKI?. Nominalni kvalitativni brez vrstnega reda vrednosti barva oči/las, diagnoza, ... dihotomni = binarni (spol) Ordinalni semikvantitativni - PowerPoint PPT PresentationTRANSCRIPT
OSNOVE PRIKAZA PODATKOV – STATISTIČNA
GRAFIKA
Gaj Vidmar17. 12. 2008
Chu Shi Chieh (1303)
Osnove prikaza podatkov (G. Vidmar)
Nominalni kvalitativni brez vrstnega reda vrednosti
• barva oči/las, diagnoza, ...• dihotomni = binarni (spol)
Ordinalni semikvantitativni vrstni red brez stalnosti enote
• šolske ocene, stopnja izobrazbe, ... Intervalni
enota; ničelna vrednost poljubna smiselne le razlike
• oC, IQ, ... Razmernostni
absolutna ničla smiselna tudi razmerja
• fizikalne količine, starost, ...
KAKŠNI SO LAHKO PODATKI?
opisni =
kategorialni
številski =
numerični
Osnove prikaza podatkov (G. Vidmar)
Kaj je graf?(Kosslyn, kogn.-psih./rač.-inf.) prikaz enega ali več odnosov med entitetami priročen način posredovanja podatkov
Vrste prikazov podatkov(v praksi prehodi, kombinacije, ...) grafi (ožje, matematično) diagrami zemljevidi skice, sheme} grafike, diagrami (širše)
KAKO JIH LAHKO PRIKAŽEMO?
Šef
Tajnica Inženir Nikdo
Osnove prikaza podatkov (G. Vidmar)
STATISTIČNI PRIKAZI PODATKOV Sestavni deli
okvir diagrama, okvir osi, podatkovni okvir, meje naslovi osi, razdelki na oseh, oznake na oseh črte, ploskve, simboli, oznake vrednosti
Vrste prikazov ena spremenljivka
• za izbor prikaza bistven merski nivo (NOM, ORD, NUM) dve spremenljivki
• odnos = skupna porazdelitev• pogosto prikaz kot niz pogojnih porazdelitev• kombinacije merskih nivojev (NUM-NUM idr.)
več spremenljivk• kodiranje z grafičnimi elementi• dinamičnost doda čas• predstavitve ≥3D in za druge čute redko smiselne
Osnove prikaza podatkov (G. Vidmar)
pomen predzavestnega procesiranja poteka hkrati z očesnimi gibi (~250 ms) točnost in hitrost zaznavanja vidnih lastnosti grafa
primeri
IZ PSIHOLOGIJE ZAZNAVANJA
Osnove prikaza podatkov (G. Vidmar)
zakonitosti Gestalta celota presega sestavne dele z. podobnosti; z. bližine; z. skupne usode (inter.) lik in ozadje; subjektivne konture
vidne iluzije
pri prikazu podatkov jih lahko koristno uporabimo ali namenoma zlorabimo prezremo in tako nenamenoma zavajamo
IZ PSIHOLOGIJE ZAZNAVANJA
Osnove prikaza podatkov (G. Vidmar)
IZ ZGODOVINE najstarejši graf zbranih podatkov ~2000 pnš. v renesansi skice, modeli – idiografski pristop družbeni vzgibi za množične podatke
£ kapitalizem (industrijska revolucija)§ imperializem (vojne)
“zlata doba” 19. stoletje: pionirji W. Playfair (1759-1823) C.J. Minard (1780-1870) F. Nightingale (1820-1910) Snow, Galton, Venn idr.
sodobna teorija že predračunalniška (J.Bertin, 1918-) velikani statistike (J.W.Tukey, 1915-2000)
Osnove prikaza podatkov (G. Vidmar)
točnost pri količinskih zaznavnih nalogah(Cleveland & McGill)
psihofizika grafov(FechnerjevStevensov model zastarel, a uporaben)
TEMELJNE ŠTUDIJE
položaj na isti osi
položaj na razl.oseh
dolžina
kot, naklon
ploščina
prostornina
barva
int. dražljaja log I
int.
zazn
.
log Z
Osnove prikaza podatkov (G. Vidmar)
interpretacija vidnih lastnosti(Kosslyn idr.) kar bolje razločujemo, lahko brez “intrinzičnega pomena”
• dolžina, ploščina, prostornina: večje več• položaj: levo prvo/manj; zgoraj prvo/več• nasičenost (~sivin): temneje več• kot, naklon, barvni ton ?
uporabnost barv usmerjenje pozornosti na izjemo razločevanje med razredi kodiranje dodatne razsežnosti nekatere lestvice splošno sprejete (semafor, višine na zem.)
v splošnem prepogosta raba (veliko kiča) pozabljanje na znaten delež “barvno slepih”
TEMELJNE ŠTUDIJE
Osnove prikaza podatkov (G. Vidmar)
J.W. TUKEY (1915-2000)
Eksploratorna analiza podatkov (1971-1975)
zaboj z ročaji
→ Andrews, Chernoff, Everitt idr. Anscombe (enaki povprečji, var, VKO, regresija, korelacija)
6211127N =
genotip
MT/MTWT/MTWT/WT
odm
erek
zdr
avila
[m
g/da
n]
16
14
12
10
8
6
4
2
0
30
45
60
75
90
Setosa Versicolor Virginica
Osnove prikaza podatkov (G. Vidmar)
E. TUFTE (1942-)
grafična odličnost vs. risbosmetje (chartjunk) kompleksne zamisli sporočiti jasno, natančno in učinkovito
faktor lažnjivosti (naj bo čim bližje 1)= velikost učinka na grafu / v podatkih
razmerje podatki-črnilo (naj bo čim večje)= črnila za podatke / vsega črnila na grafu
FL = 2,8
Osnove prikaza podatkov (G. Vidmar)
N.B. ROBBINS (IZD. UČINKOVITEJŠE GRAFE)
Naj podatki izstopajo – opustimo nepotrebno (~mrežne črte) Če prekrivanje, primerni simboli; nadomestimo ga s paneli Jasnost osi in oznak na oseh Jasnost naj se ohrani pri pomanjševanju Skladnost z besedilom (tudi slike preglejmo) Vedno rišimo v merilu Spremembe ene razsežnosti ne prikazujmo s plošč. ali prostorn. Če se le da, skupno izhodišče Če se le da, oznake pri vrednostih Med več načeli izberi tisto, ki bo najmanj verjetno zavajalo Potrebna iterativnost, eksperimentiranje, trud in čas Posebej pomembna so vprašanja osi
ničla? prekinitve? logaritmi? (ne pozabimo na osnovo 2) dve različni? če je pomembna razlika, narišemo razliko! vse osi naj imajo razdelke, pazimo na razmike med njimi
Osnove prikaza podatkov (G. Vidmar)
1990 INTERAKTIVNOST od prvih mikroračunalnikov do najsodobnejših
spletnih aplikacij! izrezovanje in povečevanje! premazovanje in povezovanje
OLAP, DM=PR, KDD=OZPZ! vrtanje in združevanje! vodeni ogledi
Osnove prikaza podatkov (G. Vidmar)
TOREJ: KAJ IN KAKO PRIKAZATI?
Vso resnicoin nič drugega
kot resnico!
GOVORITIRESNICO
PRIKAZATIRESNICO
MISLITIRESNICO