osnove prikaza podatkov – statistiČna grafika

14
OSNOVE PRIKAZA PODATKOV – STATISTIČNA GRAFIKA Gaj Vidmar 17. 12. 2008 Chu Shi Chieh (1303)

Upload: honey

Post on 02-Feb-2016

84 views

Category:

Documents


0 download

DESCRIPTION

OSNOVE PRIKAZA PODATKOV – STATISTIČNA GRAFIKA. Gaj Vidmar 17. 12. 2008. Chu Shi Chieh (1303). KAKŠNI SO LAHKO PODATKI?. Nominalni kvalitativni brez vrstnega reda vrednosti barva oči/las, diagnoza, ... dihotomni = binarni (spol) Ordinalni semikvantitativni - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: OSNOVE PRIKAZA PODATKOV – STATISTIČNA GRAFIKA

OSNOVE PRIKAZA PODATKOV – STATISTIČNA

GRAFIKA

Gaj Vidmar17. 12. 2008

Chu Shi Chieh (1303)

Page 2: OSNOVE PRIKAZA PODATKOV – STATISTIČNA GRAFIKA

Osnove prikaza podatkov (G. Vidmar)

Nominalni kvalitativni brez vrstnega reda vrednosti

• barva oči/las, diagnoza, ...• dihotomni = binarni (spol)

Ordinalni semikvantitativni vrstni red brez stalnosti enote

• šolske ocene, stopnja izobrazbe, ... Intervalni

enota; ničelna vrednost poljubna smiselne le razlike

• oC, IQ, ... Razmernostni

absolutna ničla smiselna tudi razmerja

• fizikalne količine, starost, ...

KAKŠNI SO LAHKO PODATKI?

opisni =

kategorialni

številski =

numerični

Page 3: OSNOVE PRIKAZA PODATKOV – STATISTIČNA GRAFIKA

Osnove prikaza podatkov (G. Vidmar)

Kaj je graf?(Kosslyn, kogn.-psih./rač.-inf.) prikaz enega ali več odnosov med entitetami priročen način posredovanja podatkov

Vrste prikazov podatkov(v praksi prehodi, kombinacije, ...) grafi (ožje, matematično) diagrami zemljevidi skice, sheme} grafike, diagrami (širše)

KAKO JIH LAHKO PRIKAŽEMO?

Šef

Tajnica Inženir Nikdo

Page 4: OSNOVE PRIKAZA PODATKOV – STATISTIČNA GRAFIKA

Osnove prikaza podatkov (G. Vidmar)

STATISTIČNI PRIKAZI PODATKOV Sestavni deli

okvir diagrama, okvir osi, podatkovni okvir, meje naslovi osi, razdelki na oseh, oznake na oseh črte, ploskve, simboli, oznake vrednosti

Vrste prikazov ena spremenljivka

• za izbor prikaza bistven merski nivo (NOM, ORD, NUM) dve spremenljivki

• odnos = skupna porazdelitev• pogosto prikaz kot niz pogojnih porazdelitev• kombinacije merskih nivojev (NUM-NUM idr.)

več spremenljivk• kodiranje z grafičnimi elementi• dinamičnost doda čas• predstavitve ≥3D in za druge čute redko smiselne

Page 5: OSNOVE PRIKAZA PODATKOV – STATISTIČNA GRAFIKA

Osnove prikaza podatkov (G. Vidmar)

pomen predzavestnega procesiranja poteka hkrati z očesnimi gibi (~250 ms) točnost in hitrost zaznavanja vidnih lastnosti grafa

primeri

IZ PSIHOLOGIJE ZAZNAVANJA

Page 6: OSNOVE PRIKAZA PODATKOV – STATISTIČNA GRAFIKA

Osnove prikaza podatkov (G. Vidmar)

zakonitosti Gestalta celota presega sestavne dele z. podobnosti; z. bližine; z. skupne usode (inter.) lik in ozadje; subjektivne konture

vidne iluzije

pri prikazu podatkov jih lahko koristno uporabimo ali namenoma zlorabimo prezremo in tako nenamenoma zavajamo

IZ PSIHOLOGIJE ZAZNAVANJA

Page 7: OSNOVE PRIKAZA PODATKOV – STATISTIČNA GRAFIKA

Osnove prikaza podatkov (G. Vidmar)

IZ ZGODOVINE najstarejši graf zbranih podatkov ~2000 pnš. v renesansi skice, modeli – idiografski pristop družbeni vzgibi za množične podatke

£ kapitalizem (industrijska revolucija)§ imperializem (vojne)

“zlata doba” 19. stoletje: pionirji W. Playfair (1759-1823) C.J. Minard (1780-1870) F. Nightingale (1820-1910) Snow, Galton, Venn idr.

sodobna teorija že predračunalniška (J.Bertin, 1918-) velikani statistike (J.W.Tukey, 1915-2000)

Page 8: OSNOVE PRIKAZA PODATKOV – STATISTIČNA GRAFIKA

Osnove prikaza podatkov (G. Vidmar)

točnost pri količinskih zaznavnih nalogah(Cleveland & McGill)

psihofizika grafov(FechnerjevStevensov model zastarel, a uporaben)

TEMELJNE ŠTUDIJE

položaj na isti osi

položaj na razl.oseh

dolžina

kot, naklon

ploščina

prostornina

barva

int. dražljaja log I

int.

zazn

.

log Z

Page 9: OSNOVE PRIKAZA PODATKOV – STATISTIČNA GRAFIKA

Osnove prikaza podatkov (G. Vidmar)

interpretacija vidnih lastnosti(Kosslyn idr.) kar bolje razločujemo, lahko brez “intrinzičnega pomena”

• dolžina, ploščina, prostornina: večje več• položaj: levo prvo/manj; zgoraj prvo/več• nasičenost (~sivin): temneje več• kot, naklon, barvni ton ?

uporabnost barv usmerjenje pozornosti na izjemo razločevanje med razredi kodiranje dodatne razsežnosti nekatere lestvice splošno sprejete (semafor, višine na zem.)

v splošnem prepogosta raba (veliko kiča) pozabljanje na znaten delež “barvno slepih”

TEMELJNE ŠTUDIJE

Page 10: OSNOVE PRIKAZA PODATKOV – STATISTIČNA GRAFIKA

Osnove prikaza podatkov (G. Vidmar)

J.W. TUKEY (1915-2000)

Eksploratorna analiza podatkov (1971-1975)

zaboj z ročaji

→ Andrews, Chernoff, Everitt idr. Anscombe (enaki povprečji, var, VKO, regresija, korelacija)

6211127N =

genotip

MT/MTWT/MTWT/WT

odm

erek

zdr

avila

[m

g/da

n]

16

14

12

10

8

6

4

2

0

30

45

60

75

90

Setosa Versicolor Virginica

Page 11: OSNOVE PRIKAZA PODATKOV – STATISTIČNA GRAFIKA

Osnove prikaza podatkov (G. Vidmar)

E. TUFTE (1942-)

grafična odličnost vs. risbosmetje (chartjunk) kompleksne zamisli sporočiti jasno, natančno in učinkovito

faktor lažnjivosti (naj bo čim bližje 1)= velikost učinka na grafu / v podatkih

razmerje podatki-črnilo (naj bo čim večje)= črnila za podatke / vsega črnila na grafu

FL = 2,8

Page 12: OSNOVE PRIKAZA PODATKOV – STATISTIČNA GRAFIKA

Osnove prikaza podatkov (G. Vidmar)

N.B. ROBBINS (IZD. UČINKOVITEJŠE GRAFE)

Naj podatki izstopajo – opustimo nepotrebno (~mrežne črte) Če prekrivanje, primerni simboli; nadomestimo ga s paneli Jasnost osi in oznak na oseh Jasnost naj se ohrani pri pomanjševanju Skladnost z besedilom (tudi slike preglejmo) Vedno rišimo v merilu Spremembe ene razsežnosti ne prikazujmo s plošč. ali prostorn. Če se le da, skupno izhodišče Če se le da, oznake pri vrednostih Med več načeli izberi tisto, ki bo najmanj verjetno zavajalo Potrebna iterativnost, eksperimentiranje, trud in čas Posebej pomembna so vprašanja osi

ničla? prekinitve? logaritmi? (ne pozabimo na osnovo 2) dve različni? če je pomembna razlika, narišemo razliko! vse osi naj imajo razdelke, pazimo na razmike med njimi

Page 13: OSNOVE PRIKAZA PODATKOV – STATISTIČNA GRAFIKA

Osnove prikaza podatkov (G. Vidmar)

1990 INTERAKTIVNOST od prvih mikroračunalnikov do najsodobnejših

spletnih aplikacij! izrezovanje in povečevanje! premazovanje in povezovanje

OLAP, DM=PR, KDD=OZPZ! vrtanje in združevanje! vodeni ogledi

Page 14: OSNOVE PRIKAZA PODATKOV – STATISTIČNA GRAFIKA

Osnove prikaza podatkov (G. Vidmar)

TOREJ: KAJ IN KAKO PRIKAZATI?

Vso resnicoin nič drugega

kot resnico!

GOVORITIRESNICO

PRIKAZATIRESNICO

MISLITIRESNICO