eindpresentatie masterproef
TRANSCRIPT
Visualiseren van tijdsafhankelijke datasets
______________________________________________________________________________________________________________________
Ward Cools@WardCools wardcools.wordpress.com
Promotoren: Prof. dr. ir. Erik Duval, Dr. Joris KlerkxBegeleider: Dr. Joris Klerkx
Overzicht
• Inleiding/doelstelling• Literatuur• Onderzoek• Evaluatie• Technologie/implementatie• Besluit• Statistieken
Probleem- en doelstelling
• 70% visualisaties bevat tijdsparameter• Tijd lang behandeld als gewone parameter
• Verschillende oplossingen, bruikbaarheid vaak beperkt
=> Techniek voor ruime, duidelijk gedefinieerde collectie tijdsgebonden datasets
Overzicht
• Inleiding/doelstelling• Literatuur• Onderzoek• Evaluatie• Technologie/implementatie• Besluit• Statistieken
Categorisatie parameter tijd
Door Aigner [1], gebaseerd op Frank [2]:• Discrete tijdspunten vs tijdsintervals
[1] W. Aigner, S. Miksch, W. Muller, H. Schumann, and C. Tominski, “Visualizing time-oriented data—A systematic view,” Comput. Graph., vol. 31, no. 3, pp. 401–409, 2007.[2] A. U. Frank. Different types of time in gis. In R. G. G. Max J. Egenhofer, editor, Spatial and temporal reasoning in geographic information systems, pages 40-62. Oxford University Press, 1998.
Categorisatie parameter tijd
Door Aigner [1], gebaseerd op Frank [2]:• Lineaire vs cyclische tijd
[1] W. Aigner, S. Miksch, W. Muller, H. Schumann, and C. Tominski, “Visualizing time-oriented data—A systematic view,” Comput. Graph., vol. 31, no. 3, pp. 401–409, 2007.[2] A. U. Frank. Different types of time in gis. In R. G. G. Max J. Egenhofer, editor, Spatial and temporal reasoning in geographic information systems, pages 40-62. Oxford University Press, 1998.
Categorisatie parameter tijd
Door Aigner [1], gebaseerd op Frank [2]:• Geordende tijd vs ‘branching time’ vs tijd met
meerdere perspectieven
• Meest voorkomende: lineair, geordende tijdspunten
[1] W. Aigner, S. Miksch, W. Muller, H. Schumann, and C. Tominski, “Visualizing time-oriented data—A systematic view,” Comput. Graph., vol. 31, no. 3, pp. 401–409, 2007.[2] A. U. Frank. Different types of time in gis. In R. G. G. Max J. Egenhofer, editor, Spatial and temporal reasoning in geographic information systems, pages 40-62. Oxford University Press, 1998.
Specifieke techniek
• ThemeRiver [1]
[1] S. Havre, E. Hetzler, P. Whitney, and L. Nowell, ThemeRiver: visualizing thematic changes in large document collections, vol. 8, no. 1. IEEE, 2002, pp. 9–20.
Geanimeerde scatterplot
• Door o.a. Few [1] en Rosling [2]:
• Lijngrafiek goede tijdsvoorstelling, maar beperkt # variabelen -> beter scatterplot
• Tijd voorstellen door beweging• Probleem: menselijk geheugen beperkt• Oplossing: – Tijd door gebruiker laten controleren– ‘Sporen’ achterlaten
[1] Few Stephen, “Visualizing Change - An Innovation in Time-Series Analysis,” 2007.[2] H. Rosling, “Hans Rosling shows the best stats you’ve ever seen,” Ted Conference, vol. 2009, no. 9/29. TED Conferences, 2006.
Overzicht
• Inleiding/doelstelling• Literatuur• Onderzoek• Evaluatie• Technologie/implementatie• Besluit• Statistieken
Dataset
• Techniek voor grote categorie tijdsgebonden datasets -> Lineaire, discrete en geordende tijd
• Dataset met alle matchen verschillende voetbalcompetities 1994-2014 in .csv formaat
• Resultaten, statistieken, odds• Parameter tijd = speeldag: discreet, geordend,
continue, lineair (eventueel cyclisch)
Iteratie 1 - Visualisatie 2
• Evolutie winst bij wedden op ploeg (gebaseerd op onder andere Few [1])
[1] Few Stephen, “Visualizing Change - An Innovation in Time-Series Analysis,” 2007.
Iteratie 1 - Evaluatie
• Gebaseerd op Seven Scenarios [1]
• Eerste tip: alle visualisaties van zelfde data• Visualisaties 2 en 3 aangepast
[1] H. Lam, E. Bertini, P. Isenberg, C. Plaisant, and S. Carpendale, “Empirical Studies in Information Visualization: Seven Scenarios.,” IEEE Trans. Vis. Comput. Graph., vol. 18, no. 9, pp. 1520–1536, 2011.
Iteratie 1 - Evaluatie
• Scenario 6: gebruikservaring evalueren• Via gebruikerstests met gerichte vragen• Bvb: Welk team stijgt het meest tussen speeldag
X en Y?• Ook algemene vragen: Wat valt u direct op?• Quotatie op 10 op basis van efficiëntie en
effectiviteit (mogelijk subjectief)
• 8 testgebruikers, gemengde achtergrond
Iteratie 1 - Evaluatie• Visualisatie 2 slechtst– Neg: slecht bij groot aantal ploegen– Pos: correlaties
Visualisatie 1 Visualisatie 3
Iteratie 1 - Conclusie
• Visualisatie 3 goed bij vragen over rangschikking
• Visualisatie 1 goed bij vragen over andere parameters
=> Voordelen 1 en 3 proberen combineren
Iteratie 2 – Evaluatie• 5 testgebruikers, homogene groep, zelfde
methode
Visualisatie 1 Visualisatie 2
Iteratie 2 – Conclusie• Visualisatie 1 verbetering tov iteratie 1, maar
scoort niet geweldig• Visualisatie 2 wel algemene verbetering
• Iteratie 3 -> nagaan hoe goed visualisatie 2 (minder logische) correlaties weergeeft
Iteratie 3 – Evaluatie• 6 testgebruikers, vragen naar gevonden
correlaties
• Zelfde correlaties gevonden bij de twee visualisaties
Conclusie• Scatterplot wordt genoemd als goede manier
om correlaties af te leiden• Visualisatie 1 toont evenveel correlaties als de
scatterplot van visualisatie 2
• Het rechtse deel van visualisatie 1 vormt dan ook een soort scatterplot
Overzicht
• Inleiding/doelstelling• Literatuur• Onderzoek• Evaluatie• Technologie/implementatie• Besluit• Statistieken
Dataset• Ditmaal geen rangschikking visualiseren
• Dataset met evolutie verschillende parameters over landen Europese Unie (datamarket.com)
• Meerdere hoofdparameters mogelijk• Tijd = jaartallen: lineair, discreet en geordend
Evaluatie• Face-to-face gebruikerstests en online
enquête op basis van visualisatie:
face-to-face online
Conclusie• Voor de gebruikte evaluatiemethode scoort de
visualisatie goed• Scores face-to-face en online evaluaties in
zelfde lijn• Zowel correlaties als evolutie doorheen de tijd
kunnen worden afgelezen• Positieve feedback van onbekende gebruiker
Overzicht
• Inleiding/doelstelling• Literatuur• Onderzoek• Evaluatie• Technologie/implementatie• Besluit• Statistieken
Overzicht
• Inleiding/doelstelling• Literatuur• Onderzoek• Evaluatie• Technologie/implementatie• Besluit• Statistieken
Besluit• Op iteratieve manier een techniek gevonden
voor een grote collectie tijdsafhankelijke datasets
• Geëvalueerd met nieuwe dataset
• => Scoorde goed op de evaluaties gebruikt tijdens het onderzoek
Besluit- moeilijkheden en toekomst• Evaluatiemethode mogelijk niet ideaal – Misschien Lickert-schaal beter– Efficiëntie/effectiviteit apart
• Interessant om de techniek te gebruiken voor andere dataset en op andere manier te evalueren
Overzicht
• Inleiding/doelstelling• Literatuur• Onderzoek• Evaluatie• Technologie/implementatie• Besluit• Statistieken
StatistiekenToggl Blogposts584h 22
0:00:00
24:00:00
48:00:00
72:00:00
96:00:00
120:00:00
144:00:00
168:00:00
192:00:00
216:00:00
Evaluatie
Implementatie
Lezen
Meetings
Ontwerp
Presentatie
Reflectie
Schrijven
Social network activiteiten